TTS-møte 3.3.2022
Til stades: Katri, Sjur, Flammie
Flammie
Framover:
- retta feil i sme- og sma-importen i lag med Inga
- divvun-phon med –trace og mer jobb med underlesingsfonematiserings
Test:
echo "åhpadusradiojda" | modes/trace-smj-txt2ipa.mode
echo "tæksta-TV" | modes/trace-smj-txt2ipa.mode
Katri
- venter på LIA Sápmi treningsdata for ASR – signaturer mangler
- delt upp 5 timme lydmaterial, begynte å bygge en ny stemme
- lagat en skript som gjør en liste av alle trigrammer i tekstkorpusen og freqdist (Frequency Distribution) av disse
- første versjon av listen lagt til speech-smj-private
- Mozfest 7.3.: What are some of the ways that communities that speak low-resourced languages can get support and what resources can they use to digitise their language in voice technology?
Framover:
- Demonstrera prompter til stemmene i digitalt møte før innspelingar
- Norsk/svensk variety: ortografi, lånord…
- fortsette med IPA-konverteringa
- Kanskje en plot av trigram freqdist?
Inga
Framover:
- svensk kvinnelig stemme
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
Sjur
- lagt inn at vi disambiguerer vekk leksikaliserte samansetjingar når det finst dynaiske med OLang/xxx-taggar i.
Det trengst avlusingsverkty i divvun-phon, slik at ein kan sjå kva som skjer:
- namn på brukt fst
- fonetisk string for kvar underlesing separat (no er alt samla i alle underlesingar)
Framover:
- skriv til Gustav og be om underskrift på LIA-avtale
- byggja ut ipakonvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- dela opp sme-tekst i setningar
- kontrakt og lisens
- konvertera tekst til Area/SWE?
Neste møte
10.3.2022 09.30 norsk tid