Kven Finnish NLP Grammar

Finite state and Constraint Grammar based analysers, proofing tools and other resources

View the project on GitHub giellalt/lang-fkv

Sanakirjakokous 6.10.2023

Paikalla: Anna-Kaisa, Aili, Trond, Tobias, Thomas

Agenda:

  1. Kunka työtelemmä hyvän dokumentaation ja optimaalisen sanakirjan kans
    • Dokumentaatio ja sanakirjatyön kalttiit:
  2. Sanakirjatyön prinsiipit:
    • Mikä informaatio oon tärkkee sanankirjan käyttääjälle
    • Mikä oon sanalistan ja sanakirjan erotus
    • Kuka oon sanakirjan prototyyppinen käyttääjä
    • Sana-artikkeliitten sisälys
    • Mitä met häymä tiettäät sanasta: sanan meininki eli meiningit, kirjotusformu, sananpito, variaasuuni, sujjuutus, idiomit, kollokaatiot
  3. Abstrakti sanakirjasymposiumhiin - ja ideet artikkelhiin (katto-eposti lissäystieostona)

Kunka työtelemmä hyvän dokumentaation ja optimaalisen sanakirjan kans

Dokumentaatio ja sanakirjatyön kalttiit

Kveeninkielinen aineisto: sanalistat Eiralta, Terjeltä, koulusanakirja, Karinin sanakirja, fraasisanakirja, sanalistat, joista vailuu valmis korrektuuri (Reidulf, Paulaharju ja Salamonsen, Jan Daleng), kielikafean sanalista, sanat Irene Andreassenin maisteri- ja tohtorityöstä,bildetema, Merethen sanalista

Meile tullee (toivottavasti): Tore Høybakkenin sanalista, Alf Børsskogin romaanit

Joskus oon lisätty sanat ko ihmiset oon sanonheet ette jotaki vailuu.

Mitä tehemä sannoin kans jokka oon Kveenin sanat-roikassa.

Uuisanat - kunka uuissanat sanakirjhaan

Norjankielinen aineisto: Istitutin käänösten missinglistat , New Amigos missinglista,

Nauhoitearkisto

On olemassa 400 + x tuntia. Siitä on translitteroitu y.

Lichen-projektissa tehtiin työtä sen kanssa, tavoitteena Ruija-korpus. Oulussa translitteroittin. - Korrektuuri, puhetranskriptiosta kveeninkielen kielimallin läpi starndarditekstiksi, nykynormin mukaiset tekstit

Päätelmä

A-K tutkii, miten voidaan ottaa olemassa olevat kveeninkieliset lähteet käyttöön (tekstit, nauhoitteet, …).

Tehdään enemmän sanakirjaredaksjuunityötä

Voidaan käyttää Zulipia yhteistyökanavana. Dicts kohta siirtyy GitHubiin, mikä myös tekee työn dokumentaation näkyvämmäksi.

Sanakirjatyön prinsiipit:

Sana-artikkeliitten informaatio

  1. Mikä informaatio oon tärkkee sanankirjan käyttääjälle
    • Tärkein on käännösvastine. Jos on monta vastinetta: Niiden erot. Jossakin määrin tämä työ on tehty
    • Sitten tulee kieliopillinen tieto (esim. transitiivisuus).
  2. Mikä oon sanalistan ja sanakirjan erotus
    • Sanojen konteksti (polysemia), käyttö.
  3. Kuka oon sanakirjan prototyyppinen käyttääjä
    • Kielenoppija.

Sana-artikkeliitten sisälys

Mitä met häymä tiettäät sanasta:

  1. sanan meininki eli meiningit, Myös disambiguointi
  2. kirjotusformu, sananpito, variaasuuni, sujjuutus,
    • Tämä on kveenin kielen ortografia, normi, eli kielitingan asia.
  3. idiomit, kollokaatiot

Dokumentaatio ja sanakirjatyön kalttiit

Korpus - 628 tekstifiilii (avoin) Metadata: päättäät, tutki tilanne - mitä haluthaan

Abstrakti sanakirjasymposiumhiin - ja ideet artikkelhiin (katto-eposti lissäystieostona)

(vaikkee tehhä ja saaha nokko dokumentasuunii)