TTS-møte 7.4.2022
Til stades: Katri, Sjur, Flammie, Inga
Flammie
- divvun-phon kan bruke underlesingspesifikk phon men midtape mangler på eksempler här
- importering har olangs nu og filtrerer +Err og +Olang bort
Framover:
- retta feil i sme- og sma-importen i lag med Inga
- multisymbol på falske tape
- filtrere og cg-regler
- divvun-phon med –trace og mer jobb med underlesingsfonematisering
Test for underlesingsfonematiseringa:
echo "åhpadusradiojda" | modes/trace-smj-txt2ipa.mode
Katri
- trent sme ASR med ny data (5777 steps, 1 dag - skal trenast meir):
NEW Prediction:
[‘ja de bosui davvebiegga nu garrosiid go sáhii muhto mađii eanes son bosui dađii čávga deappo vánddardeadji gieasaid jáhka eižas birra’, ‘de beaivváš báitiigođii hui liekkasiid nu lieggasiid ahte vánddar dadji ovttat mános nuolaid jáhka’, ‘ja nie šattai davvebiegga mieđit ahte beaivváš lei sutnos ge hievrrate’]
OLD Prediction:
[‘ja de bohsui davvebiegga nu garrosiidgo sáhtii muhto mađii eanes son bossui dađii čavgade appo vánddardeaddji giesai jáhkaidas birrara’, ‘de beaivváš baitigođii hui jiekkasid nu liegasit ahte vándardeaddji ovtdameanášnuolai jáhka’, ‘ja nie šattai davvebiegga mieđit ja de beaivváš lei sudnosge hievrrat’,
Reference:
[‘Ja de bosui davvebiegga nu garrasit go sáhtii, muhto mađi eanet son bosui, dađi čavgadeappot vánddardeaddji giesai jáhka iežas birra.’, ‘De beaivváš báitigođii hui lieggasit, nu lieggasit ahte vánddardeaddji ovttatmanos nuolai jáhka.’, ‘Ja nie šattai davvebiegga mieđihit ahte beaivváš lei sudnos gievrrat.’]
- ny statistikk med stammekonsonanten
- møte om opptak i Bodø
- forelesning om samisk taleteknologi på Tronds kurs
- kanskje en artikkel til SIGUL 2022 Workshop (a post-Conference Workshop of LREC 2022
Marseille (FR), 24-25 June 2022 paper submission deadline: 11 April 2022)
Framover:
- Markdown: dokumentering av txt2ipa xfscript
- Demonstrera prompter til stemmene i digitalt møte før innspelingar
- Norsk/svensk variety: ortografi, lånord…
- fortsette med IPA-konverteringa
- Kanskje en plot av trigram freqdist?
- Møte med en av panelisten i Mozfest?: “Dewi Jones, Chief Software Engineer at Canolfan Bedwyr, has developed a voice assistant mobile app for speakers of a lesser resourced language – Welsh, called Macsen.”
- Møte med Aalto ASR folk
- skriv ut innlesingskorpus på onsdag, frå pdf - hugs sidenummer!
Inga
- Lett setninger med manglende stammekonsonanter i korp
- Kjørt Gramchecker på TTS-korpus og rettet feil
Framover:
- begynne med pressemelding
- leggja til smj-forkortingar
- dato skal til nominativ
- skriv ut innlesingskorpus på onsdag, frå pdf
Sjur
- møte med NRK x 2
- laga ferdig kontrakt, ligg i repositoriet (utan namn)
Framover:
- byggja ut ipakonvertinga og testinga av henne
- starta tekstprosessering av heile TTS-korpuset, trekkja ut ABBR m.m. som ikkje blir normalisert
- dela opp sme-tekst i setningar
- lisens
- konvertera tekst til Area/SWE?
- ta kontakt med SVT og SR på nytt
Innlesingsprioriteringar
- faste tekstar: andre språk (norsk, engelsk), tal, bokstavar og symbolar (% og § som frittståande ord, kanskje andre?)
- nyheiter og lærebøker
- resten så mykje som vi får tid til
- Lukas-evangeliet
Neste møte
13.4.2022 10.00 norsk tid