GiellaLT

GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started and our Privacy document.

View GiellaLT on GitHub

Møte for samordning av ordboksarbeid fram mot 9.2. 2013

Tilstede

Berit Merete, Ciprian, Lene, Marja, Trond.

Saksliste

Rydding i nobsme

  1. Fjerne alle ikke-vd fra nobsme, som kommer fra smenob. Dette er gjort: src_non-vd
  2. Sortere innen hver pos etter nob-frekvensliste big/langs/nob/nowac/nowac-1-1.1.lemmas.freq : a, adv, n, v, prop, num, phrase, cs. (Cip)
  3. Gå gjennom frå toppen og merke med merke (Márjá, Biret-M)
nobsme$ grep '<l ' src_non-vd/* | wc -l  12391

Tagen blir: usage=”vd”, og blir lagt til t-noden.

mg-rekkefølge i nobsme

2 nivå i ordboka; mg og t, kan ha flere t i en tg. Flere tg i mg er forskjellige språk

Pos og type osv

Eksempler:

 <e usage="vd">
      <lg>
         <l pos="N" nr="Pl">ruossalassánit</l>
      </lg>
      <mg>
         <tg xml:lang="nob">
            <t pos="N">kryssord</t>
         </tg>
      </mg>
   </e>
 <e usage="vd">
      <lg>
         <l pos="N" type="G3">váibmoášši</l>
      </lg>
      <mg>
         <tg xml:lang="nob">
            <t decl="1" gen="f" pos="n">hjertesak</t>
         </tg>
      </mg>
   </e>
</e>
      <e usage="vd" src="sk">
      <lg>
         <l pos="N" type="Prop" nr="Pl">Ivvárstádik</l>
      </lg>
      <mg>
         <tg xml:lang="nob">
            <t pos="Prop" subtype="Plc" reg="Ibestad">Ibestad</t>
         </tg>
      </mg>
   </e>
   <e usage="vd">
      <lg>
         <l pos="N" type="NomAg">sámegieloahppi</l>
      </lg>
      <mg>
         <tg xml:lang="nob">
            <t pos="n">samiskelev</t>
         </tg>
      </mg>
   </e>
    <e usage="vd">
      <lg>
         <l pos="N" type="Prop" nr="Pl" subtype="Obj">Gállábártnit</l>
         <lsub>Gállabártnit</lsub>
      </lg>
      <mg>
         <tg xml:lang="nob">
            <re>stjernebilde</re>
            <t pos="Prop" subtype="Obj">Orions belte</t>
         </tg>
      </mg>
   </e>

skje og skei

Søskenbarn…

Alt dette kjem vi attende til seinare.

sma

Lene og Trond ser på den.

fin

Trond ser på den.

Framover

Testing

Alle testar frå og med onsdag

Bruk bugzilla

Deadline

cat smefin/src/n_smefin.xml|grep '<l '|grep 't<'|tr '<' '>'|cut -d">" -f3|usme|grep '+N+Pl+Nom'|grep -v "#"|cut -f1|uniq|wc -l
80

basaldat -
beassážat
buvssat
deajat
doŋgeribuvssat
duorastat -
dálueamit -
ealáhat -
eamit -
gaskabeaivvit
guovssahasat
guovssat -
gáfet
gávnnit
heajat
hellodagat
hárjehallanbuvssat
juovllat
káfet
liikebiktasat
láttat -
mihcamárat
muođut
málesheajat
mállásat
riegádanbeaivedearvvuođat
sallit -
sarrit -
sisbuvssat
skierat
skárrit
stereot
suohkkobuvssat
ságat
teajat
ustit
čalbmelásat
čalbmeláset
čuoiganbuvssat
behttosat
birrasat
brillat
dánsejaččat
hirssat
lávežat
muohttálagat
riemut
ristejaččat
ráhkkásaččat
silát
suittet
ustibaččat
vuoigŋašat
atnubiktasat
gálojenežat
Dávggát
Oaggut
borjadat
dahpahat
dovdosaččat
dávggut
dávttat
galjot
gearregat
gáimmežat
gártnit
juogut
luosat
lágut
muolddat
ravddat
ribat
suorit
suorpmahat
uvssohat
čearpmahat
čeavllit
čurrot
badjosat
njuorat
varit
guohtumat
dálveguohtumat
doalut
Ođđasat
bellodatustit
cat finsme/src/finsme.xml|grep '<l pos="N"'|grep 't<'|tr '<' '>'|cut -d">" -f3|ufin|grep '+N+Pl+Nom'|grep -v "#"|cut -f1|uniq|l

Uutiset
aakkoset
alkuperäisasukkaat
alushousut
alusvaatteet
ansiot
arkivaatteet
bileet
eväät
farkut
hiihtohousut
housut
hyvästit
häät
jauhot
juhlat
kaimakset
kasvot
kesävaatteet
käräjät
liivit
makeiset
myyjäiset
neitsyt
palkeet
pidot
pikkuhousut
piparit
portaat
pukimet
rasitukset
reidet
reisilihakset
sadevaatteet
sakset
sarvet
silmälasit
stereot
sukkahousut
sänkyvaatteet
talvivaatteet
työvaatteet
ulkovaatteet
uutiset
vaalit
vaunut
vehnäjauhot
verhot
viranomaiset
vuodevaatteet