TTS-møte 24.3.2021
Til stades: Inga, Katri, Tommi, Sjur
Sidan sist
- Inga:
- samlet deler av tekster fra boundkorpus.
- en fagbeskrivelse fra L97, vil vi ha flere læreplaner?
- det finst lydbok, med bra kvalitet på både tekst og lyd (frå svensk side)
- Katri:
- jobbar med abstrakten till fonologikonferensen (deadline i 9. April) om samisk fonologi/quantity och om att utvickla tts før lulesamisk språk
- fortsättar espeak-tts – lagt till längre testljudfiler
- espeak-tts: fixat buggar och fel med talord, jobbar med G3 ord som är ortografisk homonymer i nom&gen (se estnisk reglar?)
- experimentell taldata från Inga är processert för Merlin-tts (DNN parametric speech synthesis)
- speech split to sents, boundaries estimated automatically but were manually checked for mistakes: a full table of filenames and their .txt contents can be found in: /home/hiovain/speech-smj-private/speech-smj-minicorpus/processed/exp_training_data/lule-saami-training-datatable.xlsx: 526 sentences!
- lagt till dokumentering av skripter etc. för pre-processering av taldata
- Merlin-TTS configuration, setting up python dependencies… tar ganska mycket tid att ha allt fungera men jag får hjelp från synthesis kollegarna :) – Första testen att träna Merlin med tensorflow har fungerat men datorn använder bara CPU :(
- Små saker: lagt till arbetstid, møte med Beathe, webinar “Working with Norwegians”
- Tommi:
- divvun-normaliser debugging
- Sjur:
- meir tekstprosessering/normalisering for sme & smj
Neste steg
- Katri: fortsättar med utvikling av espeak; phonology abstract, Merlin TTS experimenting/träning
- Sjur: ta kontakt med Bruce, tekstprosessering i lag med Tommi, fleire spørsmål til juristen (sjå over), NRK
- Tommi:
divvun-normaliser
- Inga:
- begynne med pressemelding, samle tekst fra vårt boundcorpus og se mer på det vi har i freekorpus
- lag ei liste over eksisterande bound-filer, automatisk med hjelp av Børre
- undersøk om det er mogleg å få tak i CD til lydbok
Neste møte
31.3.2021 09.30 norsk tid