Kven Finnish NLP Grammar

Finite state and Constraint Grammar based analysers, proofing tools and other resources

View the project on GitHub giellalt/lang-fkv

Kokous 18.8. 2017

Läsnä: Aili, Anna-Kaisa, , Mari, Sindre, Trond

Asialista

Uutisia

Luvattu on, mutta pitää hakea. Poliitikot ovat positiivisia.

Tilannekatsaus

Sanakirja

Kahvilasanoja

(googledocs) on lisätty sekä sanakirjaan että fst-hen.

Suuri osa on ollut yhdyssanoja.

Tarvitaan lisää työtä googledociin

Miten tarkistetaan kaikki sanat kerralla

rakenna fkvnob ja nobfkv:

make -f make-bildict SLANG=nob TLANG=fkv TNUM=all

aja lista sen läpi:

cat SANALISTA.txt | preprocess | nobfkv | grep '?' 
cat SANALISTA.txt | preprocess | fkvnob | grep '?' 

NDS-sanakirjan päivittäminen

(NDS = Nettidigisanat)

Viimeksi 1.4.17, nyt 18.8.17.

Uusi ohjelmoija

Giellateknolla on uusi ohjelmoija (Chiara Argese), joka tulee hoitamaan NDS:ää

Murre-asia

Miten hoidetaan murteet:

Lexc:ssä

valkkee+Dial/Por:valkke n_23   ;
valkkee+Dial/Var:valkia  n_23ia ;

pimmee+Dial/Por:pime^A jne ;
pimmee+Dial/Var:pime^V jne ;
.. ja sitten sama twolc:

"VH" ^A:a <=> [auo] _ ; ! = ^A
"pidenn" ^V:Vx <=> Vx _ ; where Vx in (aeiouyäö} ! ^V

Twolc:ssa

[ 1/75][PASS] uusi+A+Sg+Nom => uusi

[ 2/75][FAIL] uusi+A+Sg+Gen => Missing results: uuen
[ 2/75][FAIL] uusi+A+Sg+Gen => Unexpected results: uuđen
[ 4/75][FAIL] uusi+A+Sg+Tra => Missing results: uueksi
[ 4/75][FAIL] uusi+A+Sg+Tra => Unexpected results: uuđeksi
  1. 1 twolc-tiedosto x 3 (a. yhteiset x 3, b. erilliset omissa tiedostoissa)
  2. 2 tiedostoa: a. yhteinen b. murrekohtaiset tiedostot

Ks. Sjurin ja Trondin keskustelu tästä.

Sjur, Sindre, Trond pitävät kokouksen lähitulevaisuudessa.

yamlit

A-K + A ovat katselleet, Aili on tehnyt työtä.

Me tarvitaan:

Rapportti

Hakemuksia

Tilanne: Missä kveenin kieli tänään:

  1. Käännöstyö
  2. Opetus (UiT ja muualla)
  3. Kielipesät + peruskoulu
  4. Kveeninuoret (eli revitalisoijat)

Mahdollisia ohjelmia, tarpeen mukaan (?):

  1. Sanakirjat (fkvnob, nobfkv)
  2. Korjausohjelma
  3. Tekstikokoelma
  4. Tekstikokoelman syntaktinen analyysi
  5. Kielioppikorjausohjelma
  6. Konekäännös
  7. E-opetusohjelma (?)

Suunnitelmat

Perjantaikokoukset joka toinen viikko (parittomat viikot), seuraava kokous 1.9.

Ensi kokous

1.9. klo 1400 Norjan aika