TTS-møte 12.8.2021
Til stades: Katri, Sjur, Inga
Sidan sist
- Inga
- Har samla norsk, engelsk, svensk korpus. Wikipedia, Sametingstekstar, m.m.
- Flammie
- har laga fake-tretape-fst i hfst-pmatch/hfst-tokenise. No ser analysen slik ut:
"<almulattjat>"
"almulasj" A Der/AAdv Adv "almulattja>t"MIDTAPE <W:0.0>
"almulasj" A Sg Nom PxSg2 "almulattja>X4X8t"MIDTAPE <W:0.0>
"almulattjat" Adv "almulattjat>"MIDTAPE <W:0.0>
For å testa:
echo gahperattjan | hfst-tokenise -g -q tokeniser-tts-cggt-desc.pmhfst
UNCOMPOSE LEFT inmorphology
UNCOMPOSE RIGHT outmorphology
"<gahperattjan>"
"gahper" N Sem/Clth Der/Dimin N Ess "gahper»attjan"MIDTAPE <W:0.0>
"gahper" N Sem/Clth Der/Dimin N Sg Ine "gahper»attjaQ1n"MIDTAPE <W:0.0>
:\n
- Katri:
- Lule Saami espeak pull request again, to fix some problems from previous version
- Docker image of Ossian tts of Lule Saami, in speech-smj-private
- docker image är en fullständig kopia av hela systemen: OS, python dependencies, speech tools; innehåller också modeller som jag har trenat. Så i teorin kan man bara installera docker image och använda en kommando som syntetiserar tts.
- Got further with using txt2IPA-xfst
- Discussed Tacotron transfer learning with Brendan again
- Worked on PLM2021 paper/presentation on tts for indigenous languages
- sent an email to Bruce about possible collaboration
- lyssnat på stemme nr 2, väldigt bra röst för tts!
- rengöring och uppdeling av nya ljudfiler för att eksperimentera mera med speech ML (male voice) -> numbers need to be normalized
- Sjur:
- har testa ut tretapesystemet til Flammie
Neste steg
- Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- kontorleigekontrakt: skickade en påminnelse!
- Sjur:
- byggja ut ipakonvertinga og testinga av henne
- starta tesktprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- definera ipa-alfabet for syntesen
- dela opp sme-tekst i setningar
- Tommi:
- IPA-konvertering i hfst-cg-pipeline
- Inga:
- begynne med pressemelding
- 30 min svensk, norsk og engelsk
- leggja til smj-forkortingar
- dato skal til nominativ
- språklabben ved UiT, undersøk om den er aktuell for opptak
Neste møte
19.8.2021 09.30 norsk tid