GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology.
Akronym treng synkron handsaming i sme.fst, bidix og nob.dix
Pga. Divvun leksikaliserer vi alle akronym vi registerer.
Vi gjev akronym som fungerer som substantiv, taggen +N, og alle andre akronym +N+Prop.
Dynamiske (genererte) akronym får +N+Prop+Sem/Org, leksikaliserte akronym får ulike taggar.
Dagens output fra FST:
sme$ usmedis
ATV
ATV ATV+N+Sem/Veh+ACR+Sg+Nom <==== ATV "n"
ATV ATV+N+Sem/Veh+ACR+Sg+Gen
ATV ATV+N+Sem/Veh+ACR+Sg+Acc
ATV ATV+N+Prop+ACR+Sem/Org+Dyn+Sg+Nom
ATV ATV+N+Prop+ACR+Sem/Org+Dyn+Sg+Gen
ATV ATV+N+Prop+ACR+Sem/Org+Dyn+Sg+Acc
NTB
NTB NTB+N+Prop+ACR+Sem/Org+Dyn+Sg+Nom <===== NTB "np"
NTB NTB+N+Prop+ACR+Sem/Org+Dyn+Sg+Gen
NTB NTB+N+Prop+ACR+Sem/Org+Dyn+Sg+Acc
NTB NTB+N+ACR+Sg+Nom
NTB NTB+N+ACR+Sg+Gen
NTB NTB+N+ACR+Sg+Acc
Slik er dei no (utan
<e><p><l>AS<s n="n"/></l><r>AS<s n="n"/><s n="nt"/></r></p></e>
<e><p><l>ATV<s n="n"/></l><r>ATV<s n="n"/><s n="m"/></r></p></e>
<e><p><l>AUF<s n="np"/></l><r>AUF<s n="np"/></r></p></e>
<e><p><l>NTB<s n="np"/></l><r>NTB<s n="np"/></r></p></e>
Her har akronyma desse leksikona, litt tilfeldig tilordna:
PC__n (taggane n, m, sg/pl, ind/def, gen...)
NRK__n (taggane np, gen; samansetjing men ikkje bøying) (kommentert ut acr)
Wikipedia__np (taggane np, org; samansetjing men ikkje bøying)
Findus__np (s-finale akronym, og np, org)
Noreg__np (taggane np, top; samansetjing men ikkje bøying)
Dette er avklart:
Her er det opne spørsmål: