TTS-møte 20.5.2021
Til stades: Katri, Sjur, Inga, Tommi
Sidan sist
- Katri:
- korpussökkurs
- lagt till mera python skripter för prosessering av taldata (uppdelning, konvertering etc…) till speech-smj-private/scripts
- samarbete med Göteborg:
- Tacotron 2 inställning: divvun/lang-sme-ml-speech debugging – ASR fungerar inte än
- Liliia’s avhandling om Tacotron
- försökt att testa hfst-tokenise
- datum för ferie: 28.6.-11.7.
- Sjur:
- konverteringa frå rå tekst til ipa fungerer no!
echo Naima kloahkka 10:14 | modes/trace-smj-analyser.mode \ | divvun-phon -p text2ipa-smj.lookup.hfstol \ | ../../../../../giella-core/scripts/vislcg-convert.py -t phon -1 | cut -f1-2 Naima nɑimɑ : kloahkka kʰluɑhkːɑ : 10:14 ɲeælːjənʉpːəluhkái bɑdjəl lugi :\nDet er delvis nordsamisk, men det er fordi nokre av filene er kopi av nordsamisk som enno ikkje er endra til lulesamisk.
- Døpme frå espeak:
ˈunnɑvɪ ˌɛljaʃ stˈɔvlɔːs ˈɑːnuoj ˈɑːntɑɡɪːs ja tˌi ɛ tʃˈɔkːɪːdɪːj - Vi må definera alfabetet som vi vil gje til TTS-motoren, dvs detaljnivået på transkriberinga.
- konverteringa frå rå tekst til ipa fungerer no!
- Inga:
- ordenstall
- Abbr
- Tommi:
- divvun-phon er ferdig for testing igjen og har en test-system
Neste steg
- Katri:
- fortsätter med Tacotron (lang-sme-ml-speech)
- ta kontakt med Bruce om samarbet?
- Sjur:
- NRK
- dela opp sme-tekst i setningar
- svara Bruce
- byggja ut ipakonvertinga og testinga av henne
- definera ipa-alfabet for syntesen
- Tommi:
- IPA-konvertering i hfst-cg-pipeline
- konvertera espeak-reglar automatisk?
- Inga:
- begynne med pressemelding
- 30 min svensk, norsk og engelsk
- leggja til smj-forkortingar
- gå gjennom transcriptor-filer
Neste møte
27.5.2021 09.30 norsk tid