TTS-møte 19.8.2021
Til stades: Katri, Sjur, Inga, Flammie
Sidan sist
- Inga
- Har samla norsk, engelsk, svensk korpus. Lese inn, og sjekka inn
- Flammie
- har retta ein inverteringsfeil, tretapesystemet funkar no
- Katri:
- Jobbar med Tacotron transfer learning (sme -> smj) med Liliia
- pre-processering etc. gjort
- train_forward i saga (sigma2-gpu)
- förbereder en presentation för PLM2021 (i September) om tts för indigenous languages
- lagt till en python skript (convert Praat Textgrid till .txt)
- tgt toolkit for python: https://textgridtools.readthedocs.io/en/stable/api.html
- testat lang-smj hfst:
"<Skåvlån>" "skåvllå" N Sem/Edu_Org Sg Ine <W:0.0> @ADVL> #1->7 "skåvllå" N Sem/Edu_Org Sg Ine <W:0.0> @ADVL> #1->7 "Skåvlån"phon : "<hæhttuji>" "hæhttut" V IV Ind Prs Pl3 <W:0.0> @FAUX #2->0 "hæhttut" V IV Ind Prs Pl3 <W:0.0> @FAUX #2->0 "hæhttuji"phon "hæhttut" V IV Ind Prt Sg2 <W:0.0> @FAUX #2->0 "hæhttut" V IV Ind Prt Sg2 <W:0.0> @FAUX #2->0 "hæhttuji"phon : "<juohkka>" "juohkka" Pron Indef Attr <W:0.0> @>Num #3->4 "juohkka" Pron Indef Attr <W:0.0> @>Num #3->4 "juohkka"phon
- Jobbar med Tacotron transfer learning (sme -> smj) med Liliia
- Sjur:
- har jobba litt med testing av ipa-kkolnvertering, ingen ting ferdig enno
Neste steg
- Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- kontorleigekontrakt: skickade en påminnelse!
- normalizing of numbers
- Sjur:
- byggja ut ipakonvertinga og testinga av henne
- starta tesktprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- definera ipa-alfabet for syntesen
- dela opp sme-tekst i setningar
- Tommi:
- IPA-konvertering i hfst-cg-pipeline
- Inga:
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
- språklabben ved UiT, undersøk om den er aktuell for opptak
Neste møte
2.9.2021 09.30 norsk tid