TTS-møte 16.9.2021
Til stades: Katri, Sjur, Flammie
Sidan sist
- Flammie:
- jobbat med
hfst-pmatch2fst
, optimisering
- Katri:
- Jobbat med experimental Tacotron tts för smj
- ASR testing with manually checked data splitting:
Reference: ‘Älloulmutjijda l val låsep mälggadabbo älos ja váres.’
Prediction: ‘ällo ulmutjij dal val låsep mälggadabbo älos ja váres’
- ser på andra vocoder (waveGAN, hifiGAN, griffin lim) som kanske fungerer bättre med low-resource setting
- jobbar med en presentation för PLM2021 (18.-19.9.) om tts för smj
- pilot experiment med Tacotron: genererer ca. 50 setningar och ser hur Tacotron lärer duration model och kvantitet från treningsdata, jämfört med original talmaterial
- for example: fuolkke vs. fuolke, duration of [k] was 122 ms vs 119 ms -> not sufficient difference and probably affects the intelligibility of the synthesis!
- planert detaljerna för inspelningarna
- contract with the speech talents to allow open use of the corpus?
- Mozilla: CC-0 eller public domain
- Vi: CC-BY?
- Kielipankki?
- commercial use?
- Sjur:
- planlegg møte med referansegruppa 29.9. - hadde vore fint med ein demo :)
Neste steg
- Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- normalizing of numbers
- kontrakt og lisens
- tts demo till referansemøte
- Sjur:
- byggja ut ipakonvertinga og testinga av henne
- starta tesktprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- definera ipa-alfabet for syntesen
- dela opp sme-tekst i setningar
- kontrakt og lisens
- Tommi:
- IPA-konvertering i hfst-cg-pipeline
- Inga:
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
- undersøk om den finns lydstudio på UiT
- e-post til stemmetalenta: kan ikkje seia når det blir opptak pga korona, men vi satsar framleis på opptak i haust
- samle vanlige fraser
Neste møte
30.9.2021 09.30 norsk tid