GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started and our Privacy document.
Dette dokumentet skisserer eit oppsett for CG-basert MT for sme-nob.
Vanlege filer frå giella-infrastrukturen Viss vi evt. skal ha spesielle versjonar må dei ned i tools/mt.
Lage ny mappe:
sme/tools/mt/cgbased
(evt. eit anna namn).
Filene som skal inn her gjev vi namn frå Eckhard sitt oppsett.
Her har vi eit par alternativ:
1. Hente inn nob direkte frå Apertium til tools/mt/cgmt
1. Hente nob frå apertium til `external-langs`, på linje med `spa` og `nno`.
1. Hente fst frå Ordbanken (jf. nno, og jf. mappa obt i langs/nob)
1. bruke langs/nob
Det beste er sannsynlegvis (2), men vi kan evt. eksperimentere med nokre av dei andre alternativa også.
Det enklaste vil vere å bruke giella-taggar og ikkje Apertium-taggar. Viss vi så skal ha nob frå apertium vil vi reversere mekanismene i mt/tags.