TTS-møte
Saker:
- Frå førre møte
- Trykkplassering
- andre problemsekvensar
- andre saker
- Neste møte
Frå førre møte
- (over)lange vokalar (og konsonantar) - fiksa
- bindestrek i utdata - fiksa
Låneord og namn (spørsmål til Acapela)
Bøying
Låneord blir delt inn i tre:
- vokalfinale - inga ending i acc/gen, -a- før konsonantinitiale kasus
- Nystø, Nystø-as
- konsonantfinal, trykktung sistestaving: -a- i acc/gen, -a- før kons.init.
- Iphone-a Iphone-as
- konsonantfinal, trykklett sistestaving: -a- i acc/gen, -i- før kons.init.
- Sommer-a Sommer-is Sommer-at
Er det nok med å generera nom, acc/gen, og bøyingsstamme for resten? Eller heile paradigmet?
kor går skiljet mellom samisk og ikkje-samisk?
Sihkkel (sykkel) - går rett inn i samisk fonotaks og oppfører seg heilt som samiske ord.
Det største problemet er ord som har samiske teikn med ikkje-samisk uttale: pizza, cup, osb. Desse må vi handtera med IPA-stammar i lexc-leksikonet.
Vi får tre grupper:
- samisk fonotaks
- ikkje-samisk fonotaks med ikkje-samiske teikn (sykkel)
- kan identifiserast automatisk? Sjå etter ikkje-samiske teikn
- Sommer - oppfører seg heilt samisk, går i den fyrste gruppa
- Vietnam - -tn- skal ikkje uttalast samisk - må ha IPA-stamme => siste gr
- kan identifiserast automatisk? Sjå etter ikkje-samiske teikn
- ikkje-samisk fonotaks med samiske teikn (pizza, cup)
- IPA-stamme i lexc
- alle / dei fleste engelske ord og namn - har Acapela ei liste over slike ord? Kan vi bruka dei? Dersom dei har trykkplassering, kan vi laga rett bøyingsstamme.
- tilsvarande for norske, svenske og finske ord og namn
- IPA-stamme i lexc
Spørsmål til Acapela:
- kan vi bruka dei listene dei alt har over norske, svenske, finske og engelske ord og namn? Ev ta snittet av våre lister og deira lister? Men helst alle, slik at TTS-listene blir mest mogleg dekkjande.
Vi har ca 30 500 namn i smi-leksikonet, der ein stor del må få lagt til IPA-stamme (i alle fall dersom vi ikkje får noko frå Acapela).
Spørsmål til Acapela:
- må desse listene leverast 1. oktober eller kan unnataka leverast seinare?
Final t og d
define FinalLightT1 t -> h | _ .#. ;
define FinalLightT2 t -> h | _ [ %# ]( %- ) ;
define FinalLightT3 t -> h | _ [ %» ]( %- ) ;
define FinalLightD1 d -> h | Vow j _ .#. ;
define FinalLightD2 d -> h | Vow j _ [ %# ]( %- ) ;
Kan skrivast om til:
define FinalLightT t -> h | _ [ .#. | %# | %- ]( %» ) ;
define FinalLightD d -> h | Vow j _ [ .#. | %# ]( %- ) ;
Trykkplassering
Testdata no:
neu^ro#fy^sio^lo^ga^lač^ča>
psy^ko#so^si^á^la^laž^ža>n
gra^nih^ta»la^mos>iid
gu^la^hal^la^ma
giel^la#gu^la^hal^la^ma
rái^da^ra^sa^žiid^dis^guin
giel^la#gu^la^hal^la^mea^set
giel^la#rái^da^ra^sa^žiid^dis^guin
neu^ro#fy^sio^lo^ga^lač^ča> neu^ro#fy^sio^lo^ga^lač^ča>+? inf
psy^ko#so^si^á^la^laž^ža>n psy^ko#so^si^á^la^laž^ža>n+? inf
gra^nih^ta»la^mos>iid grˈɑ.nih.tɑ»lˌɑ.mosijh 0,000000
gu^la^hal^lan kˈu.lɑː.hˌɑl.lɑn 0,000000
rái^da^ra^sa rˈɑːjː.tɑ.rɑ.sɑ 0,000000
gu^la^hal^la^ma kˈu.lɑː.hˌɑl.lɑ.mɑ 0,000000
gu^la^hal^la^mea^set kˈu.lɑː.hˌɑl.lɑ.mĕæ.seh 0,000000
rái^da^ra^sa»žiid^dis^guin rˈɑːjː.tɑ.rɑ.sɑ»dʃˌijtː.tis.gujn 0,000000
giel^la#gu^la^hal^la^ma kˈiel.lɑ#kˌu.lɑ.hˌɑl.lɑ.mɑ 0,000000
giel^la#gu^la^hal^la^mea^set kˈiel.lɑ#kˌu.lɑ.hˌɑl.lɑ.mĕæ.seh 0,000000
giel^la#rái^da^ra^sa»žiid^dis^guin kˈiel.lɑ#rˌɑːjː.tɑ.rɑ.sɑ»dʃˌijtː.tis.gujn 0,000000
Fasit for dei to fyrste:
neu^ro#fy^sio^lo^ga^lač^ča> nˈeu.ro#fˌy.si.o.lˌo.gɑ.lˌɑt.tʃɑ 0,000000
psy^ko#so^si^á^la^laž^ža>n psˈy.ko#sˌo.si.ˌɑː.lɑ.lˌɑdː.tʃɑn 0,000000
Forkortingar
utsett
Andre problemsekvensar
utsett
andre saker
utsett
Neste møte
Torsdag kl. 9.30