TTS-møte 15.4.2021
Til stades: Katri, Sjur, Inga, Tommi
Sidan sist
- Katri:
- Abstrakt till fonologikonferensen sendt inn (konferens i 16.9.-19.9.2021)
- smj-espeak publikasjon i GitHub: pull request gjort men en lite cleaning må ennå gøres
- faced some more issues when I converted the whole experimental data from text2ipa: list file produces error bc of duplicates -> cleaning!!!
- Trening av Ossian/Merlin DNN TTS med Lule Saami, prøver å trena med IPA tekster direkt (possibly better label alignment/better front-end performance)
- Møte med AnttiS før att debugga & trena DNN modeller igen
- Eksperimentera med pre-trained modellen (engelsk + saami)?
- Sjur:
- meir tekstprosessering/normalisering for sme & smj
- Inga:
- Lagt til tekster produsert av det svenske Sametinget og Länsstyrelsen.
- Tommi:
- ikkje noko vesentleg sidan sist
Neste steg
- Katri:
- avsluta utvikling av första versionen av espeak
- list till Inga - kort ord problem
- Merlin/Ossian TTS träning
- dela upp sme-inspelningarna i filer med en mening pr fil
- se på https://github.com/NVIDIA/tacotron2/issues/321 (pre-trained model + train more with a new language)
- ta kontakt med Bruce om samarbet?
- Sjur:
- tekstprosessering i lag med Tommi
- spørsmål til juristen: kan vi publisera tekstar som er gjevne ut av forlag, men der forfattaren har sagt at tekstane kan bli frie?
- NRK
- dela opp sme-tekst i setningar
- Tommi:
divvun-normaliser
- Inga:
- begynne med pressemelding, samle tekst fra vårt boundcorpus og se mer på det vi har i freekorpus
- undersøk om det er mogleg å få tak i CD til lydbok
- retta på korpustekst slik at den blir mest mogleg rett i høve til norma
Andre ting:
- konverter smj tekst frå norsk side til smj-tekst etter svensk norm, gjeld særleg nye låneord.
- bruka Katri sine espeak-regler for IPA-konvertering i pipeline etter disambigueringa?
Neste møte
Vi flyttar møta fast frå onsdagar til torsdagar kl 09.15.
22.4.2021 09.15 norsk tid