Kven Finnish NLP Grammar

Finite state and Constraint Grammar based analysers, proofing tools and other resources

View the project on GitHub giellalt/lang-fkv

Page Content

fkv-kokous 29.04.2020

Paikalla: Aili, Hilde, Thomas, Trond

Kva slags type ord? – Arbeidsfordeling?

cat linusbok preprocess ufkv cut -f2 cut -d”+” -f1 uniq sort uniq -c sort -nr cut -c6- fkvnob grep “+?”

Alle

  1. ta teksten i e-format
  2. rette den med hjelp av stavekontrollen <====== manuelt arbeid
  3. finne grunnformene med hjelp av analysatoren
  4. slå opp alle orda i ordboka
  5. få ut lista over orda som manglar
  6. legge til i ordboka <====== manuelt arbeid

9000 ord

Problemet blir illustrert av ordet “kumpula”, som stod på ei nettside men ikkje i ordboka. Kommentatoren sa “det må vere ein feil med teksten i nettsida, i og med at ordet ikkje står i ordboka”. Men feilen ligg i ordboka.

Levikki Missä (kolmessa) murteessa sana käytetään Murteet Äänteelliset erot Muodolliset erot Sanastolliset erot Suurimman osan sanastosta on yhteinen Erot kolmen(?)laisia Sana löytyy vain murteesta a Merktyksellä m on sana s1, s2, .. murteisa mu1, mu2, … Samalla sanalla on eri merkitys / laajempi merkitys toisessa murteessa

Alta N Alattio Bugøynes-væring N pykejäläinen Bygøynes N Pykejä Børselv N Pyssyjoki …