North Sami Text-to-Speech

Finite state and Constraint Grammar based Text-to-Speech processing

View the project on GitHub giellalt/speech-sme

Page Content

TTS-møte

Tomi’s work needs to be done only when the Divvun II work is done (the release is in only 4 weeks), but if time permits before that.

Handteringa av ukjende ord

Det finst ingen ukjende ord. Alt blir konvertert direkte frå løpande tekst til IPA, utan leksikon.

Burde vi bruka leksikonet? Nokre fordelar:

Steps to compile a lexicon-based text2IPA transducer:

  1. compile lexical transducer
  2. remove upper (analysis) side
  3. compile twolc transducer
  4. compose the two - interim result: lexical transducer with digraphs (X1 etc)
  5. compose this lexical transducer with an adjusted text2ipa transducer, where the X1’s are used to guide the ipa rules

Handteringa av namn og in-situ-lån frå norsk/svensk/finsk

Svensk

Vi behandlar svensk som norsk, dvs med norsk uttale (dei er så like). Vi treng framleis visse ortografi-til-IPA-reglar for svensk (t.d. -ck-).

Finsk

Eigentleg irrelevant - teksten bestemmer:

Lengre sitat eller metatekst på majoritetsspråket inni ein samisk tekst

Vi treng ein stemme som kan lesa slike tekstbitar med ein akseptabel uttale. Ideelt sett burde vi ha ein stemme pr majoritetsspråk, men det blir for mykje no. Så vi prøver å få til ein ok uttale med utgangspunkt i dei norske stemmene.

Den kvinnelege røysta har ein del vane med å prata svensk. Det kunne vera aktuelt å prøva å gjera opptak med svensk òg, dersom ho er villig.

Det er mogleg at den mannlege røysta kan finsk. Tilsvarande spørsmål til han.

Vi treng:

Expansion of abbreviations and numeral expressions

Abbreviations

jna. - ja nu ain e.e - earret eará

These should be expanded to their full text equivalent.

Numbers

Problematic issue:

Explicit case (123:s) should be easy

Acronyms

NRK:s

Covert cases do not have separate pronounciation? An :a to mark genitive is not compulsatory, so leaving it out is fine.

They need to be expanded letter by letter, and the last letter is case inflected as explicitly marked.

Longer acronyms are treated like words as long as there is a reasonable syllable structure (beware cases like RSFU, which does NOT have a syllable structure, and is thus pronounced letter by letter).

Disambiguation

Still open: where and how to fit disambiguation into the processing pipeline.