TTS-møte 2.12.2021
Til stades: Katri, Sjur, Inga, Flammie
Flammie
- ingen ting den siste veka
Sjur
Framover:
- byggja ut ipakonvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- definera ipa-alfabet for syntesen
- dela opp sme-tekst i setningar
- kontrakt og lisens
- konvertera tekst til Area/SWE?
- gjera teksten klar for å bli sendt til stemmegjevarane
- senda avtaleutkast til UiT-juristar
Katri
- jobbat med korpustekst
- korpusstatistikk, “balansering”
- verktøy før batch generate pdfs fra raw txt
- generert pdfs fra prioritert tekstkorpus
- LREC artikkel
Framover:
- Demonstrera prompter til stemmene i digitalt møte før innspelingar
- Testtekst for tekstprosessering: speech-smj-minicorpus/XXX/*Cleaned.txt
- Norsk/svensk variety: ortografi, lånord…
- normalizing of numbers (tekstprosessering)
Inga
- Sendt ut avtale og tekst til stemmer.
- ipa?
Framover:
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
- Översätt prompter till lulesamisk
Møte før jul med stemmegjevarane, for å gå gjennom detaljane kring innspelinga, visa prompter osb. Med Katri og Inga.
Om tekstkorpuset
Burde vi konvertera smj-tekst til Area/SWE med tanke på den eine stemmegjevaren? Burde vera mogleg å gjera automatisk.
Neste møte
9.12.2021 09.30 norsk tid