GiellaLT

GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology.

View GiellaLT on GitHub

Page Content

Møte for samordning av ordboksarbeid fram mot 9.2. 2013

Tilstede:

Berit Merete, Ciprian, Lene, Marja, Trond.

Saksliste:

Rydding i nobsme

  1. Fjerne alle ikke-vd fra nobsme, som kommer fra smenob. Dette er gjort: src_non-vd
  2. Sortere innen hver pos etter nob-frekvensliste big/langs/nob/nowac/nowac-1-1.1.lemmas.freq : a, adv, n, v, prop, num, phrase, cs. (Cip)
  3. Gå gjennom frå toppen og merke med merke (Márjá, Biret-M)
nobsme$ grep '<l ' src_non-vd/* | wc -l  12391

Tagen blir: usage=”vd”, og blir lagt til t-noden.

mg-rekkefølge i nobsme

2 nivå i ordboka; mg og t, kan ha flere t i en tg. Flere tg i mg er forskjellige språk

Pos og type osv

Eksempler:

 <e usage="vd">
      <lg>
         <l pos="N" nr="Pl">ruossalassánit</l>
      </lg>
      <mg>
         <tg xml:lang="nob">
            <t pos="N">kryssord</t>
         </tg>
      </mg>
   </e>
 <e usage="vd">
      <lg>
         <l pos="N" type="G3">váibmoášši</l>
      </lg>
      <mg>
         <tg xml:lang="nob">
            <t decl="1" gen="f" pos="n">hjertesak</t>
         </tg>
      </mg>
   </e>
</e>
      <e usage="vd" src="sk">
      <lg>
         <l pos="N" type="Prop" nr="Pl">Ivvárstádik</l>
      </lg>
      <mg>
         <tg xml:lang="nob">
            <t pos="Prop" subtype="Plc" reg="Ibestad">Ibestad</t>
         </tg>
      </mg>
   </e>
   <e usage="vd">
      <lg>
         <l pos="N" type="NomAg">sámegieloahppi</l>
      </lg>
      <mg>
         <tg xml:lang="nob">
            <t pos="n">samiskelev</t>
         </tg>
      </mg>
   </e>  
    <e usage="vd">
      <lg>
         <l pos="N" type="Prop" nr="Pl" subtype="Obj">Gállábártnit</l>
         <lsub>Gállabártnit</lsub>
      </lg>
      <mg>
         <tg xml:lang="nob">
            <re>stjernebilde</re>
            <t pos="Prop" subtype="Obj">Orions belte</t>
         </tg>
      </mg>
   </e>

skje og skei

Søskenbarn…

Alt dette kjem vi attende til seinare.

sma

Lene og Trond ser på den.

fin

Trond ser på den.

Framover

Testing

Alle testar frå og med onsdag

Bruk bugzilla

Deadline

cat smefin/src/n_smefin.xml|grep ‘<l ‘|grep ‘t<’|tr ‘<’ ‘>’|cut -d”>” -f3|usme|grep ‘+N+Pl+Nom’|grep -v “#”|cut -f1|uniq|wc -l 80

basaldat - beassážat buvssat deajat doŋgeribuvssat duorastat - dálueamit - ealáhat - eamit - gaskabeaivvit guovssahasat guovssat - gáfet gávnnit heajat hellodagat hárjehallanbuvssat juovllat káfet liikebiktasat láttat - mihcamárat muođut málesheajat mállásat riegádanbeaivedearvvuođat sallit - sarrit - sisbuvssat skierat skárrit stereot suohkkobuvssat ságat teajat ustit čalbmelásat čalbmeláset čuoiganbuvssat behttosat birrasat brillat dánsejaččat hirssat lávežat muohttálagat riemut ristejaččat ráhkkásaččat silát suittet ustibaččat vuoigŋašat atnubiktasat gálojenežat Dávggát Oaggut borjadat dahpahat dovdosaččat dávggut dávttat galjot gearregat gáimmežat gártnit juogut luosat lágut muolddat ravddat ribat suorit suorpmahat uvssohat čearpmahat čeavllit čurrot badjosat njuorat varit guohtumat dálveguohtumat doalut Ođđasat bellodatustit

cat finsme/src/finsme.xml grep ‘<l pos=”N”’ grep ‘t<’ tr ‘<’ ‘>’ cut -d”>” -f3 ufin grep ‘+N+Pl+Nom’ grep -v “#” cut -f1 uniq l

Uutiset aakkoset alkuperäisasukkaat alushousut alusvaatteet ansiot arkivaatteet bileet eväät farkut hiihtohousut housut hyvästit häät jauhot juhlat kaimakset kasvot kesävaatteet käräjät liivit makeiset myyjäiset neitsyt palkeet pidot pikkuhousut piparit portaat pukimet rasitukset reidet reisilihakset sadevaatteet sakset sarvet silmälasit stereot sukkahousut sänkyvaatteet talvivaatteet työvaatteet ulkovaatteet uutiset vaalit vaunut vehnäjauhot verhot viranomaiset vuodevaatteet