GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started, and our Privacy document.
Divvun og Giellatekno nyttar feiltaggane nedanfor, med dei definisjonane som står oppførte. Filtrering som gjeld alle feiltaggar:
+Err/
blir automatisk plukka ut og brukt som
grunnlag for automatisk genererte regulære uttrykk (xerox-typen).+Err/
-taggar (sjølve taggen blir fjerna, ingen lingvistiske
endringar) - i deskriptive fst-ar som ikkje treng desse taggane+Err/
- alle normative fst-arIkke-normativ ortografisk variant av et normativt lemma, for ord som har en normativ skrivemåte. => normativt lemma til venstre, den normative varianten står til venstre for kolon
Kategorien er vanskeleg definerbar, bruk taggen forsiktig.
Ikkje-normativ manglande bindestrek, t.d. ved akronym + ord -> må bruke bindestrek (CD-spiller, ikkje CDspiller)
Ord som bryter med vanlige derivasjonsregler (vanligvis analogier) Både morfologiske og semantiske brot blir dekte av denne taggen. Akseptable unnatak må leksikaliserast.
Døme:
(ikkje bruk denne - sjå konklusjonen)
For ord som er utafor vanlig sammensetning,
f.eks. davásguovlu
- davveguovlu:davásguovlu
, masseprodusierit
(masse kan brukes som førsteledd bare for subst), sesongdebutierit
.
For ordformer som iisápmelaš
istf ii-sápmelaš
bør lexc-oppføringa vera
ii-+Err/Hyph:ii
.
Eller: Sammensetninga følger ikke normative sammensetningsregler. Døme frå sma:
Maja: -> gå igjennom alle lemma som står til R -leksikon! gå gjennom data, legge til tagger! Gå gjennom alle deksriviptive sammensetningstaggene og sjekk om de er lagt til.
Det er endel åpne sp.mål om dette i sma, vanskelig å vite hva som er sammensettingsreglene i sma i noen tilfeller. Nom, Gen eller attr. Deskriptive sammensettingstagger aktuelle for sma. SgGenCmp SgNomCmp PlGenCmp
Andre døme frå sme
:
viesuviessu viessu+N+SgGenCmp+Cmp#viessu+N+Sg+Nom
viessoviessu viessu+N+SgNomCmp+Cmp#viessu+N+Sg+Nom
viesuidviessu viessu+N+Err/Sub+PlGenCmp+Cmp#viessu+N+Sg+Nom
Kategorien er for vanskeleg definerbar, vi bruker ikkje taggen +Err/Cmp. Men vi bør sjekka at alle samansetjingar får deskriptive samansetjingstaggar, slik at vi kan ta fram datagrunnlag for ei ev. normering av samansetjingar.
Korleis taggar vi kommuna, dvs ikkje-tilpassa låneord som har samiske alternativ? Til bruk i grammatikkontrollen for å fanga opp ord og uttrykk der vi kan gje forslag til samiske alternativ. Vi treng ein tagg for slike. Forslag:
+Style/Foreign
(også: +Style/Blog
, +Style/Sms
, osb.)