Kven Finnish NLP Grammar

Finite state and Constraint Grammar based analysers, proofing tools and other resources

View the project on GitHub giellalt/lang-fkv

Page Content

fkv-kokous 24.04.2020

Paikalla: Aili, Thomas, Trond

Asialista

Kysymykset ja vastaukset

Mallu-Pekkajärvi Mallu-Pekkajärvi Mallu-Pekkajärvi+N+Prop

1920-luvulla


- Lisäksi possisiivisuffiksit ei mene läpi (kultani, faarini) 

- MitäGitHubiin siirtyminen tarkoittaa meille
(Saattaa piittäät kahela tavala) (minula oon keskus, sinula oon keskus, GitHubila oon keskus, pittää olla sekä core ette share) 
(langs-hakemisto + giella-hakemistot siirtyvät githubiin) 

- Kiinnostus puhelin-oikeinkirjoitusohjelmasta (?) 

Piian toinen assii oli se ette mistä löyämä sanat mikkä saatama lisätä sanakirjhaan
9:52
(ei ole ollu niin paljon uutta sanastoa korpustekstiissä)
9:54
Kieltingassa oli ehotus ette lissäämä sanat mikkä oon Paulaharjun kirjoissa (ja mikkä oon sammaa kvääniksi ja puuttuu sanakirjasta)
9:56
Lisäksi possisiivisuffiksit ei mene läpi
9:57
Lisäksi se jakkaa sanat ja nimet välilä ouosti: institutti-Kvensk
9:59
Systeemi ei ymmärä ette Kyrie eleison kuluthaan yhtheen

head config.log ⇒ vastauksessa pitää olla ./configure –with-hfst –enable-tokenisers make

echo Kyrie eleison hfst-tokenise -cg tools/tokenisers/tokeniser-disamb-gt-desc.pmhfst

Preprosessointi on uudistettu, ja läyttää nyt

" "Kyrie eleison" Interj <W:0.0000000000> :\n "<>" "đ" Cmp"NP/First" N Sem/Sign ABBR"+Gram/TAbbr" Attr <W:0.0000000000> "đ" Cmp"NP/First" N Sem/Sign ABBR"+Gram/TAbbr" Sg Acc <W:0.0000000000> "đ" Cmp"NP/First" N Sem/Sign ABBR"+Gram/TAbbr" Sg Nom <W:0.0000000000> Tuomas:fkv thomas$

Making check in morphology /Applications/Xcode.app/Contents/Developer/usr/bin/make check-TESTS ./tag_test.sh: Have a look at these: +CmpNP/First +Err7Orth ⇐== virhe (pitää korjata lexc-tiedostossa +N.prees ??!+TV

n u k k u u t +V + I V +Act +Ind +Prs +Sg1 = 15 (ja väärin, koska +IV puuttuu root.lexc:sta) n u k k u u t +V +IV +Act +Ind +Prs +Sg1 = 13

Oikein (ne pitää lisätä src/fst/root.lexc-tiedostoon Multichar_Symbolsina: +IV +Sem/Amount +Sem/Curr +Sem/Domain_Hum +Sem/Edu_Hum +Sem/Food-med +Sem/Lang +Sem/Part +Sem/State +Sem/Time

+Sg/Err/Orth ⇒ +Sg+Err/Orth

FAIL: tag_test.sh xfst - FAIL XFAIL: generate-verb-lemmas.sh

10:00 Kyrie ja eleison oon vieläki missinglistissä, mutta erillään

Kuka tahi mikä oon mj? Vastaus: -Kattoa kaikki sanat ja sen perusteella päättäät -kattoot loggii -kyssyyt heiltä kekkä olthiin myötä, Pirjo, Mervi, Trond ``` 5207 ai 4668 ta 409 yr 340 mk 299 ia 236 es 169 ki 112 mj 73 oa 23 aili 14 gt 9 rk 6 grom 3 pirjo 2 t 1 ås 1 fb 1 anb ai aikamatka ta terje yr yr mk mari ia irene ? es eira ki kvensk inst rk = ruijan kaiku fb = facebook aili ``` 2298 ta;ai 397 yr 332 mk 268 ia 236 es 169 ki 77 mj 70 oa 25 ta;ai;mj 23 aili 15 ta;ai;ia 14 gt 9 rk 8 ta;ia 7 ta;ai;yr 6 grom 5 ai;ia 3 ta;mk 3 pirjo 3 oa;mj 3 mk;mj 3 ai;yr 2 ta;mj 2 ta;ai;mk 2 t 1 yr;ia 1 ta;ai;ås 1 ta;ai;yr:ia 1 ta;ai:mj 1 ta;ai:ia ``` # Priorisointi Sanakirja Lisää sanoja (fkv->nob + nob->fkv Kielipesien sanalistat Linus-kirjat Naamakirjan ja kielikahviloiden sanat Paulaharju Kainun instituutin tekstien sanat Norjan (eri tekstialueiden) taajuussanalistat Parempia (sana)artikkeleita Käyttöesimerkkejä rektio, jne. Eri merkitykset Lähdetieto Miten sana pääsi sanakirjaan Levikki Missä (kolmessa) murteessa sana käytetään Murteet Äänteelliset erot Muodolliset erot Sanastolliset erot Suurimman osan sanastosta on yhteinen Erot kolmen(?)laisia Sana löytyy vain murteesta a Merktyksellä m on sana s1, s2, .. murteisa mu1, mu2, … Samalla sanalla on eri merkitys / laajempi merkitys toisessa murteessa ``` LEXICON v1 !!= @CODE@ saađa:saa +V+Inf:%>đ^A K ; ! đ +V+Inf+Err/Orth:%>d^A K ; ! d +V+Inf+Err/Orth:%>h^A K ; ! h +V+Act+Ind+Prs: v12pers_short ; +V+Act+Ind+Prt:%>i3 v12pers_short ; +V+Act+Ind+Prs+Sg3:%>pi K ; +V+Act+Ind+Prs+Pl3:%>đh^A^An K ; ! đ +V+Act+Ind+Prs+Pl3+Err/Orth:%>dh^A^An K ; ! d +V+Act+Ind+Prt+Sg3:%>i3 K ; +V+Act+Ind+Prt+Pl3:%>thiin K ; +V+Pass+Ind+Prs:%>đh^A^An K ; ! đ +V+Pass+Ind+Prt:%>thiin K ; +V+Act+PrfPrc+Sg+Nom:%>^N^U K ; +V+Act+PrfPrc+Der/A+A+Sg+Nom:%>n^U K ; +V+Act+PrfPrc+Der/A:%>ne x_31_ee_oblique ; +V+Act+Ind+Prt+ConNeg+Sg:%>^N^U K ; +V+Pass+PrfPrc+Sg+Nom:%>t^U K ; +V+Pass+PrfPrc+Der/A+A:%>t^U x_21_odd ; ! ⇐= +V+Pass+PrfPrc+Pl+Nom:%>đ^U%>t K ; ! delete XXX ? ### +V+Act+PrfPrc:n%>hee PRFPRC_OBL ; +V+Act+PrfPrc:n%> PRFPRC_OBL ; saa-nU saa-tU Saanu kirja Saanheet kirjat Saanheelle kirjalle saan +V+Act+PrfPrc+Der/A:%>ne x_31_ee_oblique ; Löyttää vartalon (mitä halluuma) Astevaihtelu substantiiviitten kautta Oikkee taggi (?) olleevan olleevan olla+V+Act+PrsPrc+Der/A+A+Sg+Gen ``` # Seuraava kokous Möötti kahen viikon päästä