Pyssyjokiseminar 11.11.22
Saker
- Rettskrivingsprogram
- Grammatikkontroll
- Maskinomsetjing
- Korpusarbeid
- Ordboksarbeid
- Tekstar gjennom ordboka
- Forbetre ordboka
- Strategia
Rettskrivingsprogram
Tastatur
Trond har laga eit tastatur, som kanskje har ein syntaksfeil for Mac. For Windows fungerer det. Dermed er vi no (så vidt vi veit) i stand til å inkludere eit kvensk retteprogram i MS Word for Windows. Det fungerer ikkje (enno), men vi er optimistar.
Sjølve retteprogrammet
Ikkje noko nytt her. Arbeidet med språkmodellen går sakte framover.
Framleggsmekanisme
Den er ikkje optimal.
- Fokuspartiklar bør få straffepoeng.
- Stavekontrollkorpuset er på 140000 ord (sme har 3,9 mill). Bør vi auke?
Grammatikkontroll
Dette er nytt av i dag: Vi har ein fungerande grammatikkontroll med ein handfull reglar. Dermed er det mogleg å legge kvensk inn i grammatikkontrollen for MS Word og (når han fungerer att) for Google Docs.
- Inf Err/Ort => Inf ?
Spørsmål å ta stilling til: Skal vi prioritere dette?
Maskinomsetjing
Enten norsk > finsk > kvensk eller ikkje i det heile. det er 4500 ord i fin-fkv ordboka, det bør vere det tidoble.
Spørsmål å ta stilling til: Skal vi prioritere dette?
Korpusarbeid
Nye tekstar for korpuset
Her bør KI legge inn nye tekstar sjølv, kontinuerlig. Dette skjer allereie, og vi har rutiner for dette, sjølv om arbeidet ligg litt på etterskot akkurat no.
Korpusmetadata
Vi har mykje metadata, men også kategoriar med dårleg dekning.
- Årstall er meir eller mindre ok.
- Originaltekst vs. omsett tekst er i liten grad lagt til, men bør vere relativt lett å få til.
- Namn på omsetjar / forfattar: Her er mykje bra arbeid gjort, dette kan bli lagt til i Korp-grensesnittet (men vi bør gå over
- Andre kategoriar
Feilmelding
Parallellkorpuset nob-fkv inneheld teiknet “:” mellom alle ord og “:\n” i slutten av kvar setning.
Ordboksarbeid
Tekstar gjennom ordboka
Gå gjennom rutiner.
Forbetre ordboka
tja
Terminologi
Finnes
- Byggfag
- Verktøy
Strategi
Kva skal prioriterast