TTS-møte 24.6.2021

Til stades: Katri, Sjur, Inga, Flammie

Sidan sist

Inga
- Har snakket med stemme nr 2. Personen var også positiv.
  - Inga tek fram prøve på stemme nr 2.
Flammie
- fiksade ipa skript i smj med
- fiksade divvun-phon bug med tom resultater
  - neste: leggja til funksjonalitet for å handtera input på andre språk (OLang/-tagga ord)
Katri:
- text2IPA script: edited with Sjur and Flammie
  - example output (from previous version):
    
    Skåvlån hæhttuji juohkka akta sierra skåvllåbiktasijt adnet. Eskilin li tjáhppis båvså, tjáhppis jali bieddjis skirtto ja alek slippsa. Næjtsojn li sæmmi skåvllåbiktasa, valla sij máhtti aj vuolppuj tjágŋat.
    
    Skɔvlɔːn hɛæːtːuji juːokːɑ ɑktɑ siːɛrːɑ skɔvlːɔːpiktɑsijt ɑtnɛt. Eskilin li tʃɑːpːis pɔvsɔː, tʃɑːpːis jɑli piːɛɟːis skirtːuo jɑ ɑlɛk slipːsɑ. Nɛæːjtsojn li sɛæːmːi skɔvlːɔːpiktɑsɑ, vɑlːɑ sij mɑːtːi ɑj vuːoləbuj tʃɑːkŋɑt.
- rengöring och uppdeling av nya ljudfiler för att eksperimentera mera med speech ML (male voice)
  - gått igenom hela materialen, tatt bort 1 timme från ljud som var inte i tekst = 4:30 timmar “paired” data (både ljud och tekst)
  - textfilerna är lagt till i speech-smj-privat/…/MSA; (*_Cleaned.txt)
  - normalisert volum
  - denoised -> numbers need to be normalized
- jobbat med en dockerfile/image av Ossian; nästan färdig.
  - docker image är en fullständig kopia av hela systemen: OS, python dependencies, speech tools; innehåller också modeller som jag har trenat. Så i teorin kan man bara installera docker image och använda en kommando som syntetiserar tts.
Sjur:
- oppdatert pipeline, rensa i kjeldefilene
- oppdatert dokumentasjon
- jobba med txt2ipa i lag med Katri, Flammie. Døme på output frå Sjur sitt oppsett (nyaste txt2ipa):
  
  Skåvlån hæhttuji juohkka akta sierra skåvllåbiktasijt adnet. Eskilin li tjáhppis båvså, tjáhppis jali bieddjis skirtto ja alek slippsa. Næjtsojn li sæmmi skåvllåbiktasa, valla sij máhtti aj vuolppuj tjágŋat
  
  skɔvlɔːn heætːuji juokːaː ɑktaː siɛrːaː skɔvlːɔːphiktaːsijht ɑtnɛht . ɛskilin li tʃɑːpːis pɔvsɔː , tʃɑːpːis jɑli phiɛɟːis skirtːuo ja ɑlɛk slipːsaː . neæjtsuojn li sæmːi skɔvlːɔːphiktaːsaː , vɑlːaː sij mɑːtːi ɑj vuoləbuj tʃɑːkŋaːht .
- problem:
  - p framfor vokal

Neste steg

Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- fortsätter med nytt data
- ta kontakt med Bruce om samarbete: authorship of a paper about synthesis evaluation
- kontorleigekontrakt
- docker image från Ossian setup så att andra (i Divvun) kunde testa tts?
Sjur:
- byggja ut ipakonvertinga og testinga av henne
- starta tesktprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- definera ipa-alfabet for syntesen
- dela opp sme-tekst i setningar
Tommi:
- IPA-konvertering i hfst-cg-pipeline
  - neste: leggja til funksjonalitet for å handtera input på andre språk (OLang/-tagga ord)
Inga:
- ta fram prøve på stemme nr 2.
- begynne med pressemelding
- 30 min svensk, norsk og engelsk
- leggja til smj-forkortingar
- dato skal til nominativ
- språklabben ved UiT, undersøk om den er aktuell for opptak

Neste møte

12.8.2021 09.30 norsk tid

Julev Sámi Text-to-Speech

Page Content

TTS-møte 24.6.2021

Sidan sist

Neste steg

Neste møte

Sitemap