GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started, and our Privacy document.
sjekk at alle lemmaer (adjektiver, verb, substantiver, numeraler, pronIndef og propernouns) som genererer med enn en grunnform, merkes med v1 osv i fst og vmax i dict-filene. Eksempel på kommando for å sjekke dette. Pass på at isme-norm.fst er kompilert med at v1-taggene går til 0 i tag-not-save.regex før kommandoene:
sjekk at substantiver er i riktig fil (G3, Actor osv.)
sjekk gt/common/src/tag-not-save (oppdater til nyinfra)
genere lemmaer fra hver ordklasse med codes.txt-filene for å teste kodene
evt. legge til illpl="no" og pg="no" i leksikonfilene
evt. legge til l_ref
SJEKKLISTE for den nykompilerte VD-ordboka (gammel infra):
Minst 2-3 ord fra hver ordklassefil - og sjekk
hvordan ordklasse er presentert
entalls- og flertallsstedsnavn
flertallslemmaer
hvordan og er presentert
hvordan og er presentert
analysetaggene
nøkkelformer
at de er med for substantiv, stedsnavn, verb, adjektiv, numeraler og pron.indef
taggene
presentasjonstekst
sortering av variasjon (flere ordfomer med samme analyse)
lemmaer med flere skrivemåter, bør ha grunnformen med i nøkkelformer. F.eks. hvis man med tunealla-lemmaet genererer både tunealla og tunnealla. Alternativt kan man ha presentere hver grunnform med eget oppslag i ordboka. Sjekk da at det er riktige nøkkelformer til hver grunnform.
sjekke spesielle verb: hjelpeverb, værverb etc.
at eksempler er med, og hvordan de er presentert
at l_ref-linking fungerer
at illpl=”no” fungerer
at homonymer får rett bøyningsparadigme, feks beassi = never og beassi = reir
at ønskede ordformer er med i ordboka
at sublemmaer er med
at evt. spellrelax fungerer
Minst ett ord fra hver statisk fil
hvordan ordklasse er presentert
analysetaggene
at linking fungerer
at eksempler er med, og hvordan de er presentert
at det er en ryddig presentasjon av homonymer
vi ønsker ikke presentere homonymer hver for seg, med link til samme grunnord. De vil vi heller presentere med alternative analyse-stringer.