Kven Finnish NLP Grammar

Finite state and Constraint Grammar based analysers, proofing tools and other resources

View the project on GitHub giellalt/lang-fkv

Viikkokokous

Agenda

Tekniset ongelmat

Kannattaa ajoittain tehdä svn up main-kansiossa (tai svnup).

TEHTÄVÄT

Tilannepäivitykset

Tilannepäivitys Trondilta

Substantiivileksikot ovat nyt luokiteltu aiempaa yksityiskohtaisemmin Eira 2007:n mukaan. Trond on lisännyt Terjen sanakirjan loput substantiivit. Twolc-tiedostoa on korjattu, esim. enää ei voi geminoida linna:linnnaa. Sijapäätteitä lisätty ja konsonanttivartaloiset sanat (kieli, vuosi) omaan luokkaan.

Tilannepäivitys Leena, Kaisa

Verbit:

Ongelmia:

[[FAIL] kađota+V+Act+Ind+Prs+Sg1 => Missing results: kattoon [[FAIL] kađota+V+Act+Ind+Prs+Sg1 => Unexpected results: katoan

Geminaatio ei toimi kađota:kattoon ( kato>^Vn

Kysymys: milloin ennen diftongi tulee geminaatio.

Mervi

Pronominit, pääsemässä kärrylle. Suunnitelma edellisen kokouksen perusteella.

yaml-tiedostojen oikoluku

yaml-tiedostoissa on kaikki “oikeat vaastaukset”.

yaml-tiedostot

TEHTÄVÄT

Työtehtäviä

Morfofonologia

Miten -i-:llä menee? Pääasiallisesti oikein. Suurin ongelma preterit, mutta ei i:n takia.

Arvioidan tilannetta uudestaan Pirjon korjausten jälkeen.

Verbit

v-2-verbit

Geminaatio myös ennen diftongia (näkyi)? EI. Katsotaan uudestan yaml-korjausten jälkeen.

v_4-verbit (v_43…)

Testauskomento: (v43:n tilalle myös muita luokkia)

cat src/morphology/stems/verbs.lexc grep ‘v43’ cut -d”:” -f1 sed ‘s/$/+V+Act+Ind+Prs+Sg3/g;’ dfkv l

Puuttuvat muodot

Monet muodot puuttuvat, sekä yamlista että lexc:stä:

Pronominit

Yhdyspronominit ja uusimaalaiset vielä tekemättä. Ei ole enää monta :-)

Substantiivit

Uudet sanat on merkitty, riviltä 2497 eteenpäin. Ne pitää kuitenkin käydä läpi. Huom. erityisesti leksikko “x”, joka tarkoittaa “lajittelematon”, mutta muitakin virheitä on, kuten esim monikkosanat.

Tehtäviä:

Muut asiat

Eiran sanakirja

Tulossa.

Lainasanat

Kääntävätkö ne itse? Pitääkö ne ottaa kantaa periaatekysymyksiin?

Miten me laajennetaan sanastoa? Mikä on järkevä laajennus?

Mahdollisuus: otta kaikki norjan -ere-verbit ja tehdä niistä -eerata-verbejä.

assisteerata, assorteerata, assosieerata, assureerata, atomiseerata, attesteerata, attraheerata, attrappeerata, auksjoneerata, automatiseerata, autoriseerata, avanseerata, avbalanseerata, averteerata, avklareerata, avmagnetiseerata

Työryhmä pohtii, Trond ei vielä lisää mitään

Ruijan Kaiku-sanat.

Halutaan mukaan.

Korpus-asia

Tekstikokoelma:

Halutaan se Giellateknon korpus-järjestelmään.

Seuraava kokous