Finite state and Constraint Grammar based analysers, proofing tools and other resources
Viikkokokous 15.3. 2013 klo 13
Teknisiä ongelmia? Taivas tietää.
Tarkkaile Retinan tyyppivikoja. Niitä on kuulemma ollut. Seurataan.
Teknisiä ongelmia? Tunnettuja: Windows ja Internet Explorer 8. Kaikki muut ongelmat tervetulleita (raportin muodossa).
Esimerkkejä kirjoitustavasta
sanna => sannaa (jos a = a, aa)
callit => čállit (jos c = c, č, a = a, á)
tuli = "ild", "kom", "vind" (jos u = u, uu)
Päivän tilanne ja eteenpäin
Meidän i-valikoima:
[FAIL] meininki+N+Pl+Tra => Missing results: meiningiiksi
[FAIL] meininki+N+Pl+Tra => Unexpected results: meininkeiksi, meininkejksi
i-vartalojen i + i = meiningiiksi mutta posteiksi.
Leena ja Kaisa katsovat i-asioita tiistaina. Pirjo tarkistaa tiettyjä tapauksia.
Päivän tilanne ja eteenpäin
Leena ja Kaisa katsovat puuttuvia.
(Toimii, ehkä?)
Huonosti:
“Det enkleste er ofte det beste”:
LEXICON se_pron
+Nom:se K ;
+Gen:sen K ;
+Ill:siiheen K ;
+Ela:siitä K ;
+Ine:siinä K ;
+Par:sitä K ;
+Tra:siksi K ;
+Ess:sinä K ;
+All:sille K ;
+Ade:sillä K ;
+Abl:siltä K ;
Ratkaisematta:
itte kukin, itte kullekin. Mutta eipäs!! Se onkin ittelle kullekin, ja siis erikseen.
Trond+N+Prop+Attr
Trosterudille+N+Prop+Sg+All
Nyt:
joka% ainua+Pron+Qu:joka% ainu joka_ainu_kvant ;
itte% kukin+Pron+Qu:itte% ku itte_ku_kvant ;
itte% kukanen+Pron+Qu:itte% kuka itte_kuka_kvant ;
Parempi siis (leksikkonimet tässä vaan koristeena):
joka:jo JOKALEX ;
itte ITTELEX ;
ainua:ainu LEX1 ;
kukin:ku LEX2 ;
(kaksi sijapäätettä per vartalo)
Vastaus on Flag Diacritics.
Mervi laatii datat ja Mervi ja Trond katsovat ratkaisua.
Huonosti kaikki:
[PASS] meininki+N+Sg+Nom => meininki
[FAIL] meininki+N+Sg+Gen => Missing results: meiningin
[FAIL] meininki+N+Sg+Gen => Unexpected results: meininkin
[PASS] meininki+N+Sg+Par => meininkkii
[FAIL] meininki+N+Sg+Tra => Missing results: meiningiksi
[FAIL] meininki+N+Pl+Gen => Missing results: meiningiitten
[FAIL] meininki+N+Pl+Gen => Unexpected results: meininkeien, meininkejen, meininkkiien
Vasen ryhmä dokumentista Nominien jaottelusta.
Mervi ja Pirjo muuttavat morphology/stems/nouns.lexc ja morphology/affixes/nouns.lexc sen mukaan.
Status quo:
Ehkä jotain näin: n11 > va21, n21 > va22, va21 > n21, va22 > n32
Tärkeä: Sama numerointi stems ja affixes-tiedostoissa.
Strategia: Numerointi vuodesta 2007 (“Kainun kielen krammatiikki”), muut datat myös 2013:stä.
LEXICON n11 !!= @CODE@ "poika", lyhyt vokali, yks vartalo
+N: strong-v-stem ;
+N:%^WG weak-v-stem ;
LEXICON n11ie !!= @CODE@ on ove, ovi, nom
+N+Sg+Nom:%^E2I K ; ! %^E2I e to i
+N: short-par ;
+N: obl-strong ;
+N:%^WG weak-v-stem ;
Huom: Puuttuu LNR-sääntö kieli : kielten.
kielen
kielen kieli+N+Sg+Gen
kieltä
kieltä kieltä +?
hum-tf4-ans154:fkv ttr000$ dfkv
kieli+N+Sg+Par
kieli+N+Sg+Par kiele^V
Mervi ja Pirjo puhdistavat substantiivi-yamlit.
[FAIL] suomi+N+Sg+Ill => Missing results: suomheen
[FAIL] suomi+N+Sg+Ill => Unexpected results: suomi+N+Sg+Ill+?
Näyttää siltä, että yksikön illatiivi puuttuu kokonaan.
[FAIL] linna+N+Pl+Gen => Missing results: linnojen
[FAIL] linna+N+Pl+Gen => Unexpected results: linna+N+Pl+Gen+? <== pääte!
[FAIL] linna+N+Pl+Par => Missing results: linnaita
[FAIL] linna+N+Pl+Par => Unexpected results: linna+N+Pl+Par+? <== pääte!
Alustavasti 8-9.4. Tromssassa. Katsotaan sitten.