TTS-møte 13.4.2022
Til stades: Katri, Sjur, Flammie
Flammie
- divvun-phon kan bruke underlesingspesifikk phon men midtape mangler på eksempler här
Framover:
- retta feil i sme- og sma-importen i lag med Inga
- multisymbol på falske tape
- filtrere og cg-regler
- divvun-phon med –trace og mer jobb med underlesingsfonematisering
Test for underlesingsfonematiseringa:
echo "åhpadusradiojda" | modes/trace-smj-txt2ipa.mode
Katri
- trent sme ASR med ny data: prøver en gång til med større test batch
- artikkel til SIGUL
- forbereding til opptak
- fortsatt med txt to pdf script - lagt til “running title”
- checklist!
Framover:
- Markdown: dokumentering av txt2ipa xfscript
- Demonstrera prompter til stemmene i digitalt møte før innspelingar
- Norsk/svensk variety: ortografi, lånord…
- fortsette med IPA-konverteringa
- Kanskje en plot av trigram freqdist?
- Møte med en av panelisten i Mozfest?: “Dewi Jones, Chief Software Engineer at Canolfan Bedwyr, has developed a voice assistant mobile app for speakers of a lesser resourced language – Welsh, called Macsen.”
- Møte med Aalto ASR folk
- skriv ut innlesingskorpus på onsdag, frå pdf - hugs sidenummer!
Inga
Borte
Framover:
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
- skriv ut innlesingskorpus på onsdag, frå pdf
Sjur
- Prata med Sander
- Sander veldig positiv :)
- viktige avklaringar og oppklaringar i høve til opptaka neste veke
- laga ferdig kontrakt, ligg i repositoriet (utan namn)
Framover:
- byggja ut ipakonvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- dela opp sme-tekst i setningar
- lisens
- konvertera tekst til Area/SWE?
- ta kontakt med SVT og SR på nytt
Innlesingsprioriteringar
- faste tekstar: andre språk (norsk, engelsk), tal, bokstavar og symbolar (% og § som frittståande ord, kanskje andre?)
- nyheiter og lærebøker
- resten så mykje som vi får tid til
- Lukas-evangeliet
Neste møte
28.4.2022 10.00 norsk tid