TTS-møte 29.4.2021
Til stades: Inga, Katri, Sjur, Tommi
Sidan sist
- Katri:
- markdown, lexc
- var bort en halv dag pga migri
- pre-processerar ny taldata (speech-smj-private)
- espeak diskussion med developers men jag jobbar inte aktivt med espeak ännu
- har sett på Tacotron 2 saker och liten på hardware (eGPU)
- t.ex. https://developer.nvidia.com/blog/accelerating-machine-learning-on-a-linux-laptop-with-an-external-gpu/
- samarbeid med Antti
- Forslag/idé: Tacotron 2: train “base model” with e.g. 10 hrs of “neutral data” and then add to pre-trained with other styles/voices?
- Sjur:
- har skrive til jurist og fått svar
- Inga:
- Lagt til mer tekst i TTS-korpus.
- Nå litt over 74000 ord pluss 42 000 ord fra NT, dvs langt over 10 timar med 100 ord/minutt, og ca ti timar ved 200 o/m når NT er inkludert:
- News
- Blogg
- Pressemeldinger fra departementene
- Litt tekst fra det svenske Sametinget
- populærvitenskapelige artikler
- skjønnlitteratur
- noen faktatekster
- to taler
- tradisjonellkunnskapstekster fra SME-tts
- læreplaner
- infobrosjyrer: valg og covid
- sammendrag av offentlige rapporter
- NT: Matteus, Lukas og Markus
- Manglar:
- stillingsannonser?
- Læremiddel?
- Norsk og svensk tekst? Engelsk? Omtrent 1/2 time pr språk.
- Tommi:
- nytt verktöy i libdivvun:
divvun-phon
Neste steg
- Katri:
- se på https://github.com/NVIDIA/tacotron2/issues/321 (pre-trained model + train more with a new language)
- ta kontakt med Bruce om samarbet?
- Sigma 2?
- Sjur:
- NRK
- dela opp sme-tekst i setningar
- Tommi: IPA-konvertering i hfst-cg-pipeline
- Inga:
- begynne med pressemelding
- læremiddel, ta kontakt me forlag.
- 30 min svensk, norsk og engelsk
Neste møte
6.4.2021 09.30 norsk tid