TTS-møte 9.9.2021
Til stades: Katri, Sjur, Inga, Flammie
Sidan sist
- Inga:
- Flammie:
- jobbat med
hfst-pmatch2fst
, optimisering
- Katri:
- Jobbat med experimental Tacotron tts för smj
- trent 135K steps (sme modell har 600K steps)
- Whistling noise frequencies med Waveglow vocoder https://github.com/NVIDIA/waveglow/issues/249 som försvinner inte med trening
- ser på andra vocoder (waveGAN, hifiGAN, griffin lim) som kanske fungerer bättre med low-resource setting
- jobbar med en presentation för PLM2021 (18.-19.9.) om tts för smj
- pilot experiment med Tacotron: genererer ca. 50 setningar och ser hur Tacotron lärer duration model och kvantitet från treningsdata, jämfört med original talmaterial
- planert detaljerna för inspelningarna
- text promting: en Praat script, log fil som kan användas med uppdelning av data
- pause marking: väldig viktigt för prosodi!
- microphone setting: en “lavalier microphone” är kanske bäst
- Kontaktperson för studio i Tromsø?
- e-post med Bruce
- Sjur:
- ingen ting nytt sidan sist
Neste steg
- Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- normalizing of numbers
- Sjur:
- byggja ut ipakonvertinga og testinga av henne
- starta tesktprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- definera ipa-alfabet for syntesen
- dela opp sme-tekst i setningar
- Tommi:
- IPA-konvertering i hfst-cg-pipeline
- Inga:
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
- undersøk om den finns lydstudio på UiT
- e-post til stemmetalenta: kan ikkje seia når det blir opptak pga korona, men vi satsar framleis på opptak i haust
- samle vanlige fraser
Neste møte
16.9.2021 09.30 norsk tid