Kven Finnish NLP Grammar

Finite state and Constraint Grammar based analysers, proofing tools and other resources

View the project on GitHub giellalt/lang-fkv

Viikkokokous 15.3. 2013 klo 13

Agenda

Teknisiä ongelmia (ohjelmat)

see

installointi

Kompilointi

Uudet koneet

Teknisiä ongelmia? Taivas tietää.

Tarkkaile Retinan tyyppivikoja. Niitä on kuulemma ollut. Seurataan.

Sanakirja

Teknisiä ongelmia? Tunnettuja: Windows ja Internet Explorer 8. Kaikki muut ongelmat tervetulleita (raportin muodossa).

Esimerkkejä kirjoitustavasta

sanna => sannaa (jos a = a, aa)
callit => čállit (jos c = c, č, a = a, á)
tuli = "ild", "kom", "vind" (jos u = u, uu)

Työsuunnittelu

Morfofonologia

-i-

Päivän tilanne ja eteenpäin

Meidän i-valikoima:

[FAIL] meininki+N+Pl+Tra => Missing results: meiningiiksi
[FAIL] meininki+N+Pl+Tra => Unexpected results: meininkeiksi, meininkejksi

i-vartalojen i + i = meiningiiksi mutta posteiksi.

Leena ja Kaisa katsovat i-asioita tiistaina. Pirjo tarkistaa tiettyjä tapauksia.

Astevaihtelu

Päivän tilanne ja eteenpäin

Leena ja Kaisa katsovat puuttuvia.

Geminaatio

(Toimii, ehkä?)

Verbit:

Huonosti:

Pronominit: Ilmeisesti kaikki pronominit eivät ole tässä. Kvanttori lisätty.

“Det enkleste er ofte det beste”:

LEXICON se_pron
+Nom:se K ;
+Gen:sen K ;
+Ill:siiheen K ;
+Ela:siitä   K ;
+Ine:siinä K ;
+Par:sitä K ;
+Tra:siksi   K ;
+Ess:sinä   K ; 
+All:sille K ;
+Ade:sillä    K ;
+Abl:siltä     K ;

Ratkaisematta:

Yhdyspronominit

itte kukin, itte kullekin. Mutta eipäs!! Se onkin ittelle kullekin, ja siis erikseen.

Trond+N+Prop+Attr
Trosterudille+N+Prop+Sg+All
  1. Pitää ne erikseen kahtena sanana
  2. Laatia itte% kukin:itte% ku preprocess-tiedostoon

Nyt:

joka% ainua+Pron+Qu:joka% ainu          joka_ainu_kvant ; 
itte% kukin+Pron+Qu:itte% ku            itte_ku_kvant ; 
itte% kukanen+Pron+Qu:itte% kuka        itte_kuka_kvant ;

Parempi siis (leksikkonimet tässä vaan koristeena):

joka:jo JOKALEX ;
itte ITTELEX ;
ainua:ainu LEX1 ;
kukin:ku LEX2 ;

Uudenmaan pronominit

(kaksi sijapäätettä per vartalo)

Vastaus on Flag Diacritics.

Mervi laatii datat ja Mervi ja Trond katsovat ratkaisua.

Substantiivit:

Huonosti kaikki:

[PASS] meininki+N+Sg+Nom => meininki
[FAIL] meininki+N+Sg+Gen => Missing results: meiningin
[FAIL] meininki+N+Sg+Gen => Unexpected results: meininkin
[PASS] meininki+N+Sg+Par => meininkkii
[FAIL] meininki+N+Sg+Tra => Missing results: meiningiksi

[FAIL] meininki+N+Pl+Gen => Missing results: meiningiitten
[FAIL] meininki+N+Pl+Gen => Unexpected results: meininkeien, meininkejen, meininkkiien

Vartalotyypit

Vasen ryhmä dokumentista Nominien jaottelusta.

Mervi ja Pirjo muuttavat morphology/stems/nouns.lexc ja morphology/affixes/nouns.lexc sen mukaan.

Status quo:

Ehkä jotain näin: n11 > va21, n21 > va22, va21 > n21, va22 > n32

Tärkeä: Sama numerointi stems ja affixes-tiedostoissa.

Strategia: Numerointi vuodesta 2007 (“Kainun kielen krammatiikki”), muut datat myös 2013:stä.

i-vartalot:

LEXICON n11 !!= @CODE@  "poika", lyhyt vokali, yks vartalo
+N: strong-v-stem ;
+N:%^WG weak-v-stem ;

LEXICON n11ie   !!= @CODE@ on ove, ovi, nom

+N+Sg+Nom:%^E2I K ; ! %^E2I e to i
+N: short-par ;
+N: obl-strong ;   

+N:%^WG weak-v-stem ;

Huom: Puuttuu LNR-sääntö kieli : kielten.

kielen
kielen  kieli+N+Sg+Gen

kieltä
kieltä  kieltä  +?

hum-tf4-ans154:fkv ttr000$ dfkv
kieli+N+Sg+Par
kieli+N+Sg+Par  kiele^V

Puuttuvat päätteet

Mervi ja Pirjo puhdistavat substantiivi-yamlit.

[FAIL] suomi+N+Sg+Ill => Missing results: suomheen
[FAIL] suomi+N+Sg+Ill => Unexpected results: suomi+N+Sg+Ill+?

Näyttää siltä, että yksikön illatiivi puuttuu kokonaan.

[FAIL] linna+N+Pl+Gen => Missing results: linnojen
[FAIL] linna+N+Pl+Gen => Unexpected results: linna+N+Pl+Gen+? <== pääte!
[FAIL] linna+N+Pl+Par => Missing results: linnaita
[FAIL] linna+N+Pl+Par => Unexpected results: linna+N+Pl+Par+? <== pääte!

Ajankohta styyrin kokoukselle? – workshop

Alustavasti 8-9.4. Tromssassa. Katsotaan sitten.