TTS-møte 10.6.2021
Til stades: Katri, Sjur
Sidan sist
- Inga
- Har lett etter norsk og engelsk tekst. Fant ikke.
- Har ordnet transcriptor-filer
- klokken 2200 blir nå til “ti”, endre dette.
- Kasus på datoer? Nå er det genitiv på “biejvve”: Festen er 6.10. => gålgådismáno gudát biejve (gen), “Tidsfristen er satt til 06.10” (illativ på b.), ellativ, kanskje akkusativ, kan knapt stå i nominativ, kanskje ikkje i det heile?
- Årstall? Må leggjast til, men vi ventar med kasusbøyinga.
Datoar med årstal må kløyvast i to kohortar (som MWE) allereie av hfst-tokenise, lexc må oppdaterast tilsvarande.
- Tommi
- hjelpte / fiksade litt med espeak-konvertert
- mindre fikser till pipeline
- Katri:
- text2IPA från espeak med Tommi
- dokumenterat lite hur jag har fått giella tools/hfst fungera med Ubuntu (shell script)
- IPA rules need to be edited a lot; different order than in espeak etc
- Tacotron 2: prepared the pre-trained models in my setup but Liliia is still changing something in the implementation
- Sigma 2 ok
- försöker att göra transfer learning, använda sme pre-trained för att trena vidare med smj data (wip)
- fortsätter med python verktyg för (pre-)prosessering och uppdelning av taldata
- följat två MA thesis defenses av studentena från Göteborg
- delar upp nya ljudfiler för att eksperimentera mera med speech ML (male voice)
- numbers need to be normalized
- some partitions of speech that are not in the text file (“govvateaksta”)
- nature sounds, singing…
- abstrakt till PLM2021 blev akseptert och konferensen ska bli i nettet
- Sjur:
- meir jobb med pipeline, transkriptorfiler
Neste steg
- Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- fortsätter med nytt data
- ta kontakt med Bruce om samarbete: authorship of a paper about synthesis evaluation
- kontorleigekontrakt
- Sjur:
- NRK! Viktig!
- dela opp sme-tekst i setningar
- byggja ut ipakonvertinga og testinga av henne
- definera ipa-alfabet for syntesen
- starta tesktprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- Tommi:
- IPA-konvertering i hfst-cg-pipeline
- konvertera espeak-reglar automatisk?
- Inga:
- begynne med pressemelding
- 30 min svensk, norsk og engelsk
- leggja til smj-forkortingar
- dato skal til nominativ
- klokken 2200 skal ikke bli “lågen”
Neste møte
17.6.2021 09.30 norsk tid