TTS-møte 20.1.2022
Til stades: Katri, Sjur, Flammie, Inga
Flammie
- har byrja arbeidet med å ta inn samiske namn frå sma og sme
Katri
- eksperimentert med Divvun ASR
- fått best resultat med en modell (Acapela + Giellagas) og testet den med lest og spontan tale
- LIA Sápmi: dataoverføringsavtale – avtaleutkast
- LREC: submitted
Framover:
- Mozfest?
- Demonstrera prompter til stemmene i digitalt møte før innspelingar
- Testtekst for tekstprosessering (årstal):
speech-smj-minicorpus/XXX/*Cleaned.txt
- Norsk/svensk variety: ortografi, lånord…
- fortsette med IPA-konverteringa
Inga
- Propernounsopprydding
- Snakket med stemme
Framover:
- svensk kvinnelig stemme
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
Sjur
- litt planlegging av taleteknologiseminar i byrjinga av januar - det blir truleg på nett til planlagt tid
- omorganiseringa av sme- og sma-namn i smj starta ein heil snøball av omorganisering, har byrja på arbeidet
Framover:
- byggja ut ipakonvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- datoprosessering med årstal
- dela opp sme-tekst i setningar
- kontrakt og lisens
- konvertera tekst til Area/SWE?
- ta kontakt med SR/SVT om mogleg innspeling i Luleå
- minn Øystein på e-post om LIA
Om tekstkorpuset
Burde vi konvertera smj-tekst til Area/SWE med tanke på den eine stemmegjevaren? Burde vera mogleg å gjera automatisk.
Neste møte
27.1.2022 09.30 norsk tid