South Sámi NLP Grammar

Finite state and Constraint Grammar based analysers, proofing tools and other resources

View the project on GitHub giellalt/lang-sma

Page Content

Korpusmøte for sma

Saker:

Formalitetar - innsamlingsprosess

  1. uformell kontakt, forklara prosjektet og kvifor vi treng tekst
    1. det er viktig at korpuset er ope med tanke på framtida og nye bruksområde
    2. vi vil gjerne ha parallelltekster på fleire språk
  2. formell kontakt med kontrakt, tekst i retur - både forfattar, forlag, ev omsetjingar, og SD; her kan det trengast personleg møte
  3. teksten inn i korpussamlinga, anten ved å lasta opp via nettsida, eller direkte (send fila til Børre eller Ciprian)
  4. teksten blir konvertert til XML, det gjer Børre eller Ciprian

No kan teksten brukast, med ccat -> missing list, m.m.

Vi manglar ei systematisk oversikt over korpusinnsamlingsarbeidet. Vi treng eit dokument som listar opp:

Kva har vi samla inn

Kontakta personar, men ikkje enno tekst

Potensielle kjelder

Vi bør koordinera med Fylkesmannen i Nordland, og innsamlinga deira for elektroniske læremiddel. Maja? Møte med dei på konferansen til Fylkesmannen i Trondheim 25.-26. mars.

Forfattarar og kjelder: