GiellaLT

GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology.

View GiellaLT on GitHub

Page Content

Møte, FAD, 30.8.2012

Til stades: Børre, Ciprian, Marja, Sjur, Trond, Berit Merete

Saksliste

Status quo

Setningar

Ciprian kan køyre pipeline. Showstopper er Trond, som ikkje har retta nob/src/abbr.txt.

Børre har flytta tekstar frå språkkatalogane til mixed-katalogane. Vi har dermed ikkje same prestable som før.

Børre har laga ei bra pipeline for python.

Input frå Børre: Informasjon om metafiler til kvar fil: Det kan mangle peikarar i dei tilfella der fila er flytta frå katalog til katalog, og der det er dobbeltfiler.

Originalspråk: Metafiler manglar informasjon om retning, og om språk.

Ciprian køyrer setningsparallellisering på nytt, og genererer ein ny prestable. Den nye blir referanse for arbeidet med abbr.

TODO

Ord

Når tiltaka under setningsparallellisering er gjennomført (sjå ovafor) køyrer Ciprian ordparallellisering på nytt.

TODO

Forbetringar i prosessen

Arbeid framover

Bugar

Moment til ein neste fase

Manuelt arbeid med utgangspunkt i norskspråklege forvaltningsordbøker eller -ordlister.

Dependensanalyse og MWE i parallellisering.

Neste møte

Onsdag 5.9., kl. 1300.