GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started and our Privacy document.
Akronym treng synkron handsaming i sme.fst, bidix og nob.dix
Pga. Divvun leksikaliserer vi alle akronym vi registerer.
Vi gjev akronym som fungerer som substantiv, taggen +N, og alle andre akronym +N+Prop.
Dynamiske (genererte) akronym får +N+Prop+Sem/Org, leksikaliserte akronym får ulike taggar.
Dagens output fra FST:
sme$ usmedis
ATV
ATV ATV+N+Sem/Veh+ACR+Sg+Nom <==== ATV "n"
ATV ATV+N+Sem/Veh+ACR+Sg+Gen
ATV ATV+N+Sem/Veh+ACR+Sg+Acc
ATV ATV+N+Prop+ACR+Sem/Org+Dyn+Sg+Nom
ATV ATV+N+Prop+ACR+Sem/Org+Dyn+Sg+Gen
ATV ATV+N+Prop+ACR+Sem/Org+Dyn+Sg+Acc
NTB
NTB NTB+N+Prop+ACR+Sem/Org+Dyn+Sg+Nom <===== NTB "np"
NTB NTB+N+Prop+ACR+Sem/Org+Dyn+Sg+Gen
NTB NTB+N+Prop+ACR+Sem/Org+Dyn+Sg+Acc
NTB NTB+N+ACR+Sg+Nom
NTB NTB+N+ACR+Sg+Gen
NTB NTB+N+ACR+Sg+Acc
Slik er dei no (utan
<e><p><l>AS<s n="n"/></l><r>AS<s n="n"/><s n="nt"/></r></p></e>
<e><p><l>ATV<s n="n"/></l><r>ATV<s n="n"/><s n="m"/></r></p></e>
<e><p><l>AUF<s n="np"/></l><r>AUF<s n="np"/></r></p></e>
<e><p><l>NTB<s n="np"/></l><r>NTB<s n="np"/></r></p></e>
Her har akronyma desse leksikona, litt tilfeldig tilordna:
PC__n (taggane n, m, sg/pl, ind/def, gen...)
NRK__n (taggane np, gen; samansetjing men ikkje bøying) (kommentert ut acr)
Wikipedia__np (taggane np, org; samansetjing men ikkje bøying)
Findus__np (s-finale akronym, og np, org)
Noreg__np (taggane np, top; samansetjing men ikkje bøying)
Dette er avklart:
Her er det opne spørsmål: