TTS-møte 16.12.2021
Til stades: Katri, Sjur, Flammie, Inga
Flammie
Sjur
- møte med NRK
- prata med Krister Lindén om datainnsamling for talegjenkjenning
Framover:
- byggja ut ipakonvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- dela opp sme-tekst i setningar
- kontrakt og lisens
- konvertera tekst til Area/SWE?
Katri
- eksperiment med Divvun ASR
- hentet mer materiale før å trena modellen vidare
- LREC, om tts
- prompter
- tts-tekster; fiksat hermetegn etc
- uppdatert doodle: fleire datoer i mars, april
- møte med NRK
- avlyst reise
Framover:
- Demonstrera prompter til stemmene i digitalt møte før innspelingar
- Testtekst for tekstprosessering: speech-smj-minicorpus/XXX/*Cleaned.txt
- Norsk/svensk variety: ortografi, lånord…
- normalizing of numbers (tekstprosessering)
- fortsette med IPA-konverteringa
Inga
- Sendt tekst til stemmene.
- Gitt beskjed om at det ikke blir opptak i uke 2 og spurt når det passer i mars/april.
Framover:
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
Om tekstkorpuset
Burde vi konvertera smj-tekst til Area/SWE med tanke på den eine stemmegjevaren? Burde vera mogleg å gjera automatisk.
Neste møte
5.1.2022 09.30 norsk tid