GiellaLT

GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started and our Privacy document.

View GiellaLT on GitHub

FAD-møte 6.3.2013

Tilstede:

Berit Merete, Ciprian, Marja, Trond.

Saksliste:

Oppsummering, Oslo

Berit Merete og Trond viste.

Status quo

$GTHOME/words/dicts/nobsme/src_non-vd

I denne katalogen har vi henta det som er å hente. Det som no står att er det for mykje arbeid å gjere noko med. Vi lar katalogen stå, men prioriterer ikkje desse orda.

TILTAK

Orda i nobsme-ordboka. $GTHOME/words/dicts/nobsme/src

Sjekke samiske ord mot usmeNorm:

cat src/*_nobsme.xml|grep '<t '|tr '<' '>' |cut -d">" -f3|tr ' ' '\n'|usmeNorm|grep '?'|wc -l
0%>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100%
      85

Merge ordene etter at FAD-ordene er på plass.

Mange samansette ord er ikkje leksikalisert

TILTAK

done-filene ($GTHOME/words/dicts/nobsme/terms/admin/src/)

TILTAK

gt-filene ($GTBIG/gt/sme/corp/forvaltningsordbok/second_run/)

dhcp422-ans:second_run ttr000$ cat gt-pl.20121213_0*|wc -l
   26365


second_run>grep -h '\$' gt-pl.20121213_0* | wc -l
     147
second_run>grep -h '\$' to-filter_gt-pl.20121213_01_non-ap | wc -l
     148




   2600	$14 0 -7.362 0.0 0.6 torskebestand<subst> dorskenálli<N>

Desse har prioritet over dei andre formene.

TILTAK

Framover

Som tiltakslistene.

gt-pipeline

done

nobsme/src

non_vd

Deadline:

gt-pipeline 18.3.

Neste møte

Mandag 18.3. kl. 13.00.