TTS-møte 3.2.2022
Til stades: Katri, Sjur, Flammie, Inga
Flammie
- har laga fyrste versjon av oppsett for å ta inn samiske namn frå sma og sme
- oppdatert modes-genereringa for divvun-phon
Framover:
- retta feil i sme- og sma-importen i lag med Inga
Katri
- venter på LIA Sápmi treningsdata for ASR
- e-post om Mozfest, blir Mon 7 Mar 2022
- plant en ny tts eksperiment (5 timme taledata) - lydfilene er klar
- litt txt2ipa regler
Framover:
- Demonstrera prompter til stemmene i digitalt møte før innspelingar
- Testtekst for tekstprosessering (årstal):
speech-smj-minicorpus/XXX/*Cleaned.txt
- Norsk/svensk variety: ortografi, lånord…
- fortsette med IPA-konverteringa
Inga
- Ordklassetagger i abbr-fil
Framover:
- svensk kvinnelig stemme
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
Sjur
- har skrive til SR/SVT
- har funne sme-dokumentasjon, samlar alt i nytt repo speech-sme
Framover:
- byggja ut ipakonvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- dela opp sme-tekst i setningar
- kontrakt og lisens
- konvertera tekst til Area/SWE?
- Minna Øystein på LIA-spørsmål
Om tekstkorpuset
Burde vi konvertera smj-tekst til Area/SWE med tanke på den eine stemmegjevaren? Burde vera mogleg å gjera automatisk.
Neste møte
10.2.2022 09.30 norsk tid