GiellaLT

GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started and our Privacy document.

View GiellaLT on GitHub

FAD-Møte 12.10.2012

Til stades: Børre, Ciprian, Marja, Trond, Berit Merete

Saker:

Setningsparallellisering

Alt er setningsparallellisert.

Ordparallellisering

Pipeline

ccat -l nob freecorpus/prestable/converted/nob/admin/depts/regjeringen.no/10.html_id=325913.xml | \
preprocess --abbr=main/st/nob/bin/abbr.txt | \
main/st/nob/obt/bin/mtag-osx64 | \
vislcg3 -g main/st/nob/obt/src/nob_morf-prestat.cg3 | \
less


ccat freecorpus/prestable/converted/sme/admin/depts/regjeringen.no/10.html_id\=634073.xml | \
preprocess --abbr=main/gt/sme/bin/abbr.txt | \
lookup main/gt/sme/bin/sme.fst | \
lookup2cg | \
vislcg3 -g main/gt/sme/src/sme-dis.rle | \
less

Ordparallellisert med apertium-pipeline er gjort.

Ordparallellisert med gt-pipeline til måndag.

Korpus

Bugzilla

Bug 1391 - Files declared in xsl meta file but missing in the converted corpus

Spørsmål er om det er dei korrekte 3 / 6 filene som er ordna. Børre og Ciprian ser på det., og deretter går det til BM og Marja.

Arbeid framover

Ordparallellisering med gt-pipeline til måndag (Ciprian)

Rette opp i 6+3 (the missing files).

Neste møte

Måndag 15.10. klokka 10:30.