TTS-møte 21.10.2021
Til stades: Katri, Sjur, Inga, Flammie
Sidan sist
- Inga: ikke gjort noe tts-arbeid
- Flammie:
- först version av per-tag analysator i divvun-phon
- Sjur:
- kontakt med NRK
- testet Flammies arbeid
- Katri:
- Jobbat med experimental Tacotron tts för smj
- aligner for smj -> better duration modeling
- text corpus statistics sheet: https://docs.google.com/spreadsheets/d/1XTB5v67pMfQ-bqeDODHgwFFqrY1bpT2w72Hj6qzNw8Q/edit?usp=sharing
- more different styles:
- Parlament
- Wikipedia (best articles from Wiki)
- Rich text (Magazines, movie lines, independent sentences?)
- Prose (e.g. Project Gutenberg, children’s books for they are meant to be read aloud)
- Forums
- Misc (food recipes, wikihow, everyday situations)
- Blog
- Facts
- Educational texts (language learning books)
- News texts
- Single sentences to cover all diphones in a language – also rarer consonant clusters etc. should be included here
- more different styles:
- Prompter testing
- add manual line break character, e.g.:
Divvun, sáme duollatjállemvædtsak, |le dal ásaduvvam stuoves årnigin Tråmså universitiehtan. - left alignment
- 50 chars / row
- add manual line break character, e.g.:
- Evaluation of test rec quality, filtering techniques (noise reduction, high pass etc.)
- Jobbat med experimental Tacotron tts för smj
Neste steg
- Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- normalizing of numbers
- kontrakt og lisens
- Sjur:
- byggja ut ipakonvertinga og testinga av henne
- starta tesktprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- definera ipa-alfabet for syntesen
- dela opp sme-tekst i setningar
- kontrakt og lisens
- Inga:
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
Neste møte
28.10.2021 09.30 norsk tid