TTS-møte 2.9.2021
Til stades: Katri, Sjur, Inga, Flammie
Sidan sist
- Inga:
- Språklabben på ISk har vorte lagt ned, har spurt på fakultetet
- jobba mykje med forkortingar
- Flammie:
- jobbat med
hfst-pmatch2fst
, optimisering
- Katri:
- Jobbar med Tacotron transfer learning (sme -> smj) med Liliia
- general debugging
- ändrat pre-processering (downsample) skript i lang-sme-ml-speech med Liliia
- testat tts-only branch (vs. tts & asr tillsammans)
- ska vi också utveckla asr (autom. speech recognition) för smj?
- trent sme tts modeller vidare med 3 timmar smj data -> 2.9.2021 trent från 30K steps to 70K steps (sme modellerna trent 430K steps):
| TTS MODEL (supervised training ): | Epoch: 902/5511 (17/49) | Mel Loss: 0.8121 | Dur Loss: 3.113 | 3.0 steps/s | Step: 74k | slurmstepd: error: *** JOB 3410819 ON c7-8 CANCELLED AT 2021-09-01T23:39:21 DUE TO TIME LIMIT ***
- generert smj tacotron “samples”
- förbereder en presentation för PLM2021 (i September) om tts för indigenous languages
- planert lite detaljerna för inspelningarna
- text promting script
- ska vi banda inn fraser, hälsningar, t.ex. http://sagdetpasamiska.yle.fi/ ?
- bra for prosodilæring
- ja + fraser frå Sametinget sin parlør
- har testat IPA-konvertering för smj - fungerer
- Sjur:
- litt e-post kring kontorleige for Katri
- elles ingen ting nytt sidan sist
Neste steg
- Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- normalizing of numbers
- Sjur:
- byggja ut ipakonvertinga og testinga av henne
- starta tesktprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- definera ipa-alfabet for syntesen
- dela opp sme-tekst i setningar
- Tommi:
- IPA-konvertering i hfst-cg-pipeline
- Inga:
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
- undersøk om den finns lydstudio på UiT
- e-post til stemmetalenta: kan ikkje seia når det blir opptak pga korona, men vi satsar framleis på opptak i haust
Neste møte
9.9.2021 09.30 norsk tid