TTS-møte 17.2.2022
Til stades: Katri, Sjur
Katri
- venter på LIA Sápmi treningsdata for ASR – gått vidare
- plant en ny tts eksperiment (5 timmes taledata) - lydfilene er klar men trenger årstall for å kunde “force-align” og dela upp materialen i setningar
- e-mail med Maret Steinfjell
- lagat en skript som sjekkar tekstkorpusen har alle stämkonsonantväxlingar, basert på Spiik. Mangler i Spiik:
vmm
j'j
- og fleire, Inga sjekkar etter at Katri har laga fyrste versjon
- “fonologiske” instruksjoner for stemmene (jmf. https://giellalt.github.io/speech-sme/linguistics/ReadingInstructions.html)
- Mozfest 7.3.
Framover:
- Demonstrera prompter til stemmene i digitalt møte før innspelingar
- Testtekst for tekstprosessering (årstal):
speech-smj-minicorpus/XXX/*Cleaned.txt
- Norsk/svensk variety: ortografi, lånord…
- fortsette med IPA-konverteringa
- sortere konsonantlist
Sjur
- jobba meir med konverteringa
Framover:
- byggja ut ipakonvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- dela opp sme-tekst i setningar
- kontrakt og lisens
- konvertera tekst til Area/SWE?
Neste møte
24.2.2022 09.30 norsk tid