Møte om språkteknologi for resanderomska
Dato 1.3.23.
Dato 1.3.23.
Elina, Lina, Marie, Gunnar, Rickhard, Trond, Baki, Jacob, …
Same møte tok også opp arli og meänkieli, sjå separate referat
Saker
- Dette har skjedd
- Planar framover, resanderomska
- Korpus
Dette har skjedd
Trond har laga eit utkast til språkmodell basert på Rosengren si bok.
Resanderomska
Läget
Resanderomska: Standard a: Isof, Standard b: Rosengren.
I språkmodellen: 128 ord och basismorfologi.
Exempel på resanderomska:
Svedo-them honkar jekh demokrati. Lavet demokrati ashar ghana-pottopa. Dolle ashar te ghana an Svedo-themm fyser asha ninna ta pottot karna Svedo-themm fyser drejas glan ta tradras glan. ¶ Dre vorsnos telal-pattjnopa ster dova te sas-saroa soralopan an Svedo-themm avar fann manuschet ta te themmeske-dives honkar manuschets glanske rakkre-mosch. Savi star basht pottar manuschet savo beddo ta rani tjakke fyser rakkra palla ta glan dova an themmeske-dives, themmeske-tingen ta helko baroske-forothem en. ¶
Framöver
- Analysera texterna // Kolla felklassifierade texter
- Reda ut hur översättarna och språksamhället ser på saken
- Tja. Dra några konklutioner
Korpus
Proasedyrer
Vi kan bruke same prosedyre for fit, rmn og sju-x-sydlapska. Dei opne tekstane ligg på UiT sin svn-servar:
Det finst prosedyrer for dette:
Mål: Alla minortetsspråkliga texter publisert på ISOF bör inn i korpus, egentligen också andre offentliga myndigheter. Corpustools har rutiner för att laga parallellkorpusar.
På ISOF ser Jacob på dette. Den som har laga corpustools ved UiT er Børre Gaup.
Upphavsrätt
Texter från offentliga myndigheter i öppna korpusen, fri licens. Andra texter (tex. skönlitteratur) har UiT ett system med kontrakter för. Det finns prosedyrer för parallelltext.
UiT-korpuset är på veg från svn til git, jf. den preliminära korpussidan på git (länkarna är inte operativ, men det kommer).
Framåt:
- Trond diskuterer frågan om tilgang med Divvun-gruppa.
- Deretter diskusjon med Divvun og Isof (Jacob) om korpus.
romska
I dag har vi rmu (resanderomska) 38600 ord.