TTS-møte 27.1.2022
Til stades: Katri, Sjur, Flammie, Inga
Flammie
- har byrja arbeidet med å ta inn samiske namn frå sma og sme
<phon>
<text2ipa n="txt2ipa.lookup.hfstol"/>
<alttext2ipa s="ACR" n="acro2ipa.lookup.hfstol"/>
</phon>
Blir konvertert til:
divvun-phon -p 'txt2ipa.lookup.hfstol'
dvs utan alttext2ipa
-prosesseringa.
Framover:
- oppdatera modes-genereringa for divvun-phon
Katri
- eksperimentert med Divvun ASR
- presentert resultaten til Paadar og foreslo samarbeid om treningsdata for ASR
- LIA Sápmi: dataoverføringsavtale – avtaleutkast, venter på svar
- e-post om Mozfest: Impact of Voice technology on Language Diversity
- testet text2ipa konvertering og lagt till noen regler med Q3 “consonant clusters”
Framover:
- Demonstrera prompter til stemmene i digitalt møte før innspelingar
- Testtekst for tekstprosessering (årstal):
speech-smj-minicorpus/XXX/*Cleaned.txt
- Norsk/svensk variety: ortografi, lånord…
- fortsette med IPA-konverteringa
Inga
- Har lett etter kvinnestemme
Framover:
- svensk kvinnelig stemme
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
Sjur
- taleteknologiseminar utsett til seinare pga koronaen
- har skrive til SR/SVT
- jobba med txt2ipa, datoar med årstal, funne fleire problem som må rettast
Framover:
- byggja ut ipakonvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- dela opp sme-tekst i setningar
- kontrakt og lisens
- konvertera tekst til Area/SWE?
- Minna Øystein på LIA-spørsmål
Om tekstkorpuset
Burde vi konvertera smj-tekst til Area/SWE med tanke på den eine stemmegjevaren? Burde vera mogleg å gjera automatisk.
Neste møte
3.2.2022 09.30 norsk tid