Finite state and Constraint Grammar based analysers, proofing tools and other resources
View the project on GitHub giellalt/lang-fkv
fkv-kokous 24.04.2020
Paikalla: Aili, Thomas, Trond
affixes/verbs.lexc
Esee
sitte se ette kuinka merkata viiva sannoin/nimmiin välissä ``` %- LEXICON RHyph +Cmp/Hyph#:0#- NounRoot ; +Cmp/Hyph#:0#- ProperNoun
+Use/Circ+Cmp/Hyph#:%-# NounRoot ; ! For Num Cmp Noun, vi vil ikke ha Num\ src/fst/stems/propernouns.lexc:Yli-Toornio:Yli-Toornio vanha_prop_x ; Yli-Tornio Yli-Tornio Ylinen+N+Prop+Cmp/Hyph#Tornio+N+Prop+Sg+Nom src/fst/stems/propernouns.lexc:Mallu-Pekkajärvi:Mallu-Pekkajärvi vanha_prop_x ;
Mallu-Pekkajärvi Mallu-Pekkajärvi Mallu-Pekkajärvi+N+Prop
1920-luvulla
- Lisäksi possisiivisuffiksit ei mene läpi (kultani, faarini)
- MitäGitHubiin siirtyminen tarkoittaa meille
(Saattaa piittäät kahela tavala) (minula oon keskus, sinula oon keskus, GitHubila oon keskus, pittää olla sekä core ette share)
(langs-hakemisto + giella-hakemistot siirtyvät githubiin)
- Kiinnostus puhelin-oikeinkirjoitusohjelmasta (?)
Piian toinen assii oli se ette mistä löyämä sanat mikkä saatama lisätä sanakirjhaan
9:52
(ei ole ollu niin paljon uutta sanastoa korpustekstiissä)
9:54
Kieltingassa oli ehotus ette lissäämä sanat mikkä oon Paulaharjun kirjoissa (ja mikkä oon sammaa kvääniksi ja puuttuu sanakirjasta)
9:56
Lisäksi possisiivisuffiksit ei mene läpi
9:57
Lisäksi se jakkaa sanat ja nimet välilä ouosti: institutti-Kvensk
9:59
Systeemi ei ymmärä ette Kyrie eleison kuluthaan yhtheen
head config.log ⇒ vastauksessa pitää olla ./configure –with-hfst –enable-tokenisers make
echo Kyrie eleison | hfst-tokenise -cg tools/tokenisers/tokeniser-disamb-gt-desc.pmhfst |
Preprosessointi on uudistettu, ja läyttää nyt
“
Making check in morphology /Applications/Xcode.app/Contents/Developer/usr/bin/make check-TESTS ./tag_test.sh: Have a look at these: +CmpNP/First +Err7Orth ⇐== virhe (pitää korjata lexc-tiedostossa +N.prees ??!+TV
n u k k u u t +V + I V +Act +Ind +Prs +Sg1 = 15 (ja väärin, koska +IV puuttuu root.lexc:sta) n u k k u u t +V +IV +Act +Ind +Prs +Sg1 = 13
Oikein (ne pitää lisätä src/fst/root.lexc-tiedostoon Multichar_Symbolsina: +IV +Sem/Amount +Sem/Curr +Sem/Domain_Hum +Sem/Edu_Hum +Sem/Food-med +Sem/Lang +Sem/Part +Sem/State +Sem/Time
+Sg/Err/Orth ⇒ +Sg+Err/Orth
FAIL: tag_test.sh xfst - FAIL XFAIL: generate-verb-lemmas.sh
10:00 Kyrie ja eleison oon vieläki missinglistissä, mutta erillään