TTS-møte 17.6.2021
Til stades: Katri, Sjur, Inga, Flammie
Sidan sist
- Inga
- Har fått løyve til å bruka Giella fábmo låhkåmgirjje, korrekturlest og lagt til
- Skal vi forsøke å erstatte alle Area/NO med Area/SE variant? Vi prøver.
- 24-timers klokke
- Flammie
- Katri:
- text2IPA script
- IPA rules need to be edited a lot; different order than in espeak etc
- syllable rules not working properly
-
example input:
Skåvlån hæhttuji juohkka akta sierra skåvllåbiktasijt adnet. Eskilin li tjáhppis båvså, tjáhppis jali bieddjis skirtto ja alek slippsa. Næjtsojn li sæmmi skåvllåbiktasa, valla sij máhtti aj vuolppuj tjágŋat.
and output:
Skɔvlɔːn hɛæːtːuji juːokːɑ ɑktɑ siːɛrːɑ skɔvlːɔːpiktɑsijt ɑtnɛt. Eskilin li tʃɑːpːis pɔvsɔː, tʃɑːpːis jɑli piːɛɟːis skirtːuo jɑ ɑlɛk slipːsɑ. Nɛæːjtsojn li sɛæːmːi skɔvlːɔːpiktɑsɑ, vɑlːɑ sij mɑːtːi ɑj vuːoləbuj tʃɑːkŋɑt.
- Tacotron 2: prepared the pre-trained models in my setup but Liliia is still changing something in the implementation
- försöker att göra transfer learning, använda sme pre-trained för att trena vidare med smj data (wip)
- rengöring och uppdeling av nya ljudfiler för att eksperimentera mera med speech ML (male voice)
- numbers need to be normalized
- some partitions of speech that are not in the text file (“govvateaksta”); måste lyssna på hela ljudbok for att dokumentera allt, men halv är gjort!
- clean nature sounds, singing…
- Sjur:
- prata med Pål Hivand på NRK Sápmi:
- har dei ressursar av typen arkiv av radiosendingar på lulesamisk med tekstmanus?
- kan vi få tilgang til studio i Tromsø for opptak i haust
- anna samarbeid
Neste steg
- Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- fortsätter med nytt data
- ta kontakt med Bruce om samarbete: authorship of a paper about synthesis evaluation
- kontorleigekontrakt
- docker image från Ossian setup så att andra (i Divvun) kunde testa tts?
- Sjur:
- dela opp sme-tekst i setningar
- byggja ut ipakonvertinga og testinga av henne
- definera ipa-alfabet for syntesen
- starta tesktprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- Tommi:
- IPA-konvertering i hfst-cg-pipeline
- konvertera espeak-reglar automatisk?
- Inga:
- begynne med pressemelding
- 30 min svensk, norsk og engelsk
- leggja til smj-forkortingar
- dato skal til nominativ
- Ta kontakt med aktuell stemme
- språklabben ved UiT, undersøk om den er aktuell for opptak
Neste møte
24.6.2021 09.30 norsk tid