GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology.
Berit Merete, Ciprian, Lene, Marja, Trond.
big/langs/nob/nowac/nowac-1-1.1.lemmas.freq
:
a, adv, n, v, prop, num, phrase, cs. (Cip)nobsme$ grep '<l ' src_non-vd/* | wc -l 12391
Tagen blir: usage=”vd”, og blir lagt til t-noden.
2 nivå i ordboka; mg og t, kan ha flere t i en tg. Flere tg i mg er forskjellige språk
Eksempler:
<e usage="vd">
<lg>
<l pos="N" nr="Pl">ruossalassánit</l>
</lg>
<mg>
<tg xml:lang="nob">
<t pos="N">kryssord</t>
</tg>
</mg>
</e>
<e usage="vd">
<lg>
<l pos="N" type="G3">váibmoášši</l>
</lg>
<mg>
<tg xml:lang="nob">
<t decl="1" gen="f" pos="n">hjertesak</t>
</tg>
</mg>
</e>
</e>
<e usage="vd" src="sk">
<lg>
<l pos="N" type="Prop" nr="Pl">Ivvárstádik</l>
</lg>
<mg>
<tg xml:lang="nob">
<t pos="Prop" subtype="Plc" reg="Ibestad">Ibestad</t>
</tg>
</mg>
</e>
<e usage="vd">
<lg>
<l pos="N" type="NomAg">sámegieloahppi</l>
</lg>
<mg>
<tg xml:lang="nob">
<t pos="n">samiskelev</t>
</tg>
</mg>
</e>
<e usage="vd">
<lg>
<l pos="N" type="Prop" nr="Pl" subtype="Obj">Gállábártnit</l>
<lsub>Gállabártnit</lsub>
</lg>
<mg>
<tg xml:lang="nob">
<re>stjernebilde</re>
<t pos="Prop" subtype="Obj">Orions belte</t>
</tg>
</mg>
</e>
Søskenbarn…
Alt dette kjem vi attende til seinare.
Lene og Trond ser på den.
Trond ser på den.
Alle testar frå og med onsdag
Bruk bugzilla
cat smefin/src/n_smefin.xml|grep ‘<l ‘|grep ‘t<’|tr ‘<’ ‘>’|cut -d”>” -f3|usme|grep ‘+N+Pl+Nom’|grep -v “#”|cut -f1|uniq|wc -l 80
basaldat - beassážat buvssat deajat doŋgeribuvssat duorastat - dálueamit - ealáhat - eamit - gaskabeaivvit guovssahasat guovssat - gáfet gávnnit heajat hellodagat hárjehallanbuvssat juovllat káfet liikebiktasat láttat - mihcamárat muođut málesheajat mállásat riegádanbeaivedearvvuođat sallit - sarrit - sisbuvssat skierat skárrit stereot suohkkobuvssat ságat teajat ustit čalbmelásat čalbmeláset čuoiganbuvssat behttosat birrasat brillat dánsejaččat hirssat lávežat muohttálagat riemut ristejaččat ráhkkásaččat silát suittet ustibaččat vuoigŋašat atnubiktasat gálojenežat Dávggát Oaggut borjadat dahpahat dovdosaččat dávggut dávttat galjot gearregat gáimmežat gártnit juogut luosat lágut muolddat ravddat ribat suorit suorpmahat uvssohat čearpmahat čeavllit čurrot badjosat njuorat varit guohtumat dálveguohtumat doalut Ođđasat bellodatustit
cat finsme/src/finsme.xml | grep ‘<l pos=”N”’ | grep ‘t<’ | tr ‘<’ ‘>’ | cut -d”>” -f3 | ufin | grep ‘+N+Pl+Nom’ | grep -v “#” | cut -f1 | uniq | l |
Uutiset aakkoset alkuperäisasukkaat alushousut alusvaatteet ansiot arkivaatteet bileet eväät farkut hiihtohousut housut hyvästit häät jauhot juhlat kaimakset kasvot kesävaatteet käräjät liivit makeiset myyjäiset neitsyt palkeet pidot pikkuhousut piparit portaat pukimet rasitukset reidet reisilihakset sadevaatteet sakset sarvet silmälasit stereot sukkahousut sänkyvaatteet talvivaatteet työvaatteet ulkovaatteet uutiset vaalit vaunut vehnäjauhot verhot viranomaiset vuodevaatteet