TTS-møte 12.5.2022
Til stades: Katri, Sjur, Flammie, Inga
Flammie
- hfst-tokenise - divvun-normalise - divvun-phon kan bruke nå en underlesings surface form i “<…>” analyse
- shared lang-sma og lang-sme
Framover:
- retta feil i sme- og sma-importen i lag med Inga
- multisymbol på falske tape
- filtrere og cg-regler
- divvun-phon med –trace og mer jobb med underlesingsfonematisering
Test for underlesingsfonematiseringa:
echo "åhpadusradiojda" | modes/trace-smj-txt2ipa.mode
echo "1800-lågon" | modes/trace-smj-txt2ipa.mode
Katri
- OneDrive - la til “cuttet” audiofilene uten deler som kan ikke brukes til syntes for at Inga kunne retta tekstene – kanskje gjort halv av audiofilene nå
- registrert til LREC og SIGUL
- bestillt reise til Marseille
- møte med Sametinget
- syk 1,5 dager
Framover:
- trener sme ASR en gång til med større test batch
- Markdown: dokumentering av txt2ipa xfscript
- Norsk/svensk variety: ortografi, lånord…
- fortsette med IPA-konverteringa
- Møte med en av panelisten i Mozfest?: “Dewi Jones, Chief Software Engineer at Canolfan Bedwyr, has developed a voice assistant mobile app for speakers of a lesser resourced language – Welsh, called Macsen.”
- Møte med Aalto ASR folk
Inga
- Begynt med å rette tekst etter lyd. Markerer ting som må fjernes fra lydfilene slik:
Transkriberingen:
- Transkriberer ut alt, også når stemmen begynner på nytt:
Den lingvi. Den lingvistiske filosofien vår er at analyseprogramma...
- Transkriberer alle tall som bokstaver.
- Transkriberer også samisk tale under opplesning av norsk tekst og motsatt.
Framover:
- Ringer svensk stemme i dag
- tilpasse tekst til lyd
- leggja til smj-forkortingar
- dato skal til nominativ
Sjur
- diskusjonar med NRK, nytt møte 18. mai
- litt smj-tekstprosessering
Framover:
- byggja ut ipakonvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- dela opp sme-tekst i setningar
- lisens
- konvertera tekst til Area/SWE?
- ta kontakt med SVT og SR på nytt
Opptak med svensk røyst
- må planleggjast
- helst før sommaren - berre 13.-17.6., 27.-31.6 går bra for Katri, 27.-31.6. passar for Inga (kan òg 13.-15.6, men ikkje resten av veka pga Svonni-seminar).
- Alternativt: i Helsingfors til hausten, om det er mogleg for stemmen.
Neste møte
19.5.2022 09.30 norsk tid