TTS-møte 3.6.2021
Til stades: Katri, Sjur
Sidan sist
- Katri:
- flytter kontoret neste onsdag
- text2IPA från espeak med Tommi (hfst etc)
giella tools build:
not available in the documentation, maybe should be added:
- when cloned by the configuration of lang-smj, giella-core and giella-shared’s
./autogen.sh
is not called which leads to lang-smj not being able to find some key tools. So, giella-core and giella-shared on their own and BEFORE configuring lang-smj
- to use the tts options, when configuring, you need to add the following
flags: --enable-phonetic --enable-tokenizers --enable-tts
. If you don’t the lookup.hfst files won’t be generated
- Tacotron 2
- run inference ok (generert tts syntes med sme text men också med smj text…)
- Sigma 2 ok men out of quota i Saga <- löst!
- försöker att göra transfer learning, använda sme pre-trained för att trena vidare med smj data
- fortsatt med python verktyg för (pre-)prosessering och uppdelning av taldata
- laddat ner nytt material (5:34 timmar)
- Sjur:
- litt jobb med pipeline, ikkje sjekka inn
Neste steg
- Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- ta kontakt med Bruce om samarbete: authorship of a paper about synthesis evaluation
- kontorleigekontrakt
- Sjur:
- NRK! Viktig!
- dela opp sme-tekst i setningar
- byggja ut ipakonvertinga og testinga av henne
- definera ipa-alfabet for syntesen
- starta tesktprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- Tommi:
- IPA-konvertering i hfst-cg-pipeline
- konvertera espeak-reglar automatisk?
- Inga:
- begynne med pressemelding
- 30 min svensk, norsk og engelsk
- leggja til smj-forkortingar
- gå gjennom transcriptor-filer
Neste møte
10.6.2021 09.30 norsk tid