TTS-møte 28.4.2022
Til stades: Katri, Sjur, Flammie, Inga
Flammie
- divvun-phon kan bruke underlesingspesifikk phon men midtape mangler på eksempler här
- retta feil i hfst og libdivvun for å få tilbake midtape-teksten
Framover:
- retta feil i sme- og sma-importen i lag med Inga
- multisymbol på falske tape
- filtrere og cg-regler
- divvun-phon med –trace og mer jobb med underlesingsfonematisering
Test for underlesingsfonematiseringa:
echo "åhpadusradiojda" | modes/trace-smj-txt2ipa.mode
Katri
- opptak i Bodø
- lyttet på lydfilene fra Bodø og plant/testet filtrering, konsultert mine Helsinki kolleger om kvalitet
- støy kan fjernes men med ekko det er vanskelig!!! det finns en program som kanskje kan brukes men det koster
- voicefixer er før mye for pre-prosessering til syntes
- sortert tekster osv
- raport om opptak
- LREC møte: artikkel og presentasjon
- avspasert på onsdag
Framover:
- trener sme ASR en gång til med større test batch
- Markdown: dokumentering av txt2ipa xfscript
- Norsk/svensk variety: ortografi, lånord…
- fortsette med IPA-konverteringa
- Møte med en av panelisten i Mozfest?: “Dewi Jones, Chief Software Engineer at Canolfan Bedwyr, has developed a voice assistant mobile app for speakers of a lesser resourced language – Welsh, called Macsen.”
- Møte med Aalto ASR folk
Inga
Framover:
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
Sjur
- omsette Bodø-rapport til norsk
- testa og jobba med txt2ipa-konverting og normalisering
Framover:
- byggja ut ipa-konvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- dela opp sme-tekst i setningar
- lisens
- konvertera tekst til Area/SWE?
- ta kontakt med SVT og SR på nytt
Neste møte
28.4.2022 10.00 norsk tid