GiellaLT

GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology.

View GiellaLT on GitHub

Page Content

FAD-møte 6.3.2013

Tilstede:

Berit Merete, Ciprian, Marja, Trond.

Saksliste:

Oppsummering, Oslo

Berit Merete og Trond viste.

Status quo

$GTHOME/words/dicts/nobsme/src_non-vd

I denne katalogen har vi henta det som er å hente. Det som no står att er det for mykje arbeid å gjere noko med. Vi lar katalogen stå, men prioriterer ikkje desse orda.

TILTAK

Orda i nobsme-ordboka. $GTHOME/words/dicts/nobsme/src

Sjekke samiske ord mot usmeNorm:

cat src/*_nobsme.xml|grep '<t '|tr '<' '>' |cut -d">" -f3|tr ' ' '\n'|usmeNorm|grep '?'|wc -l
0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100%
      85

Merge ordene etter at FAD-ordene er på plass.

Mange samansette ord er ikkje leksikalisert

TILTAK

done-filene ($GTHOME/words/dicts/nobsme/terms/admin/src/)

TILTAK

gt-filene ($GTBIG/gt/sme/corp/forvaltningsordbok/second_run/)

dhcp422-ans:second_run ttr000$ cat gt-pl.20121213_0*|wc -l
   26365


second_run>grep -h '\$' gt-pl.20121213_0* | wc -l 
     147
second_run>grep -h '\$' to-filter_gt-pl.20121213_01_non-ap | wc -l 
     148

     


   2600	$14 0 -7.362 0.0 0.6 torskebestand<subst> dorskenálli<N>

Desse har prioritet over dei andre formene.

TILTAK

Framover

Som tiltakslistene.

gt-pipeline

done

nobsme/src

non_vd

Deadline:

gt-pipeline 18.3.

Neste møte

Mandag 18.3. kl. 13.00.