North Sami Text-to-Speech

Finite state and Constraint Grammar based Text-to-Speech processing

View the project on GitHub giellalt/speech-sme

Page Content

This document is a list of the most infrequent consonant centres, and possible words to be added to the texts for recording.

The parentheses give the number of centres found in the text assembled so far. For unit-selection synthesis, each combination should occur at least 3 times.

c:c:    gaccun, gaccut, njaccui, ruccistit, giccui (3)
dn:     eadnebealli, gudneáŋgir, ladnedoardna (3)


đ:bm:   lieđbmi, gieđbmi, čáđbmi (3)
đbm:    lieđbmečoarvi, gieđbmeravda (3)
đmm:    liđmmiid, giđmmiid, meađmmagit, (3)
đm:m:   lieđmmi, gieđmmi (3)
đb:     beađbedákti, beađbelađas (3)
đbb:    beađbbi, šođbbodit (3)
đb:b:   šođbbut (3)
đg:g:   bieđgguid (3)


đ:j:    guđju, viđji, várreviđji (3)
đjj:    viđjjiid (3)


đ:gŋ    jađgŋat, beađgŋát, siđgŋat, vuođgŋit (3)
đgŋ:    siđgŋebiktasat, vuođgŋebivdu (3)
đŋŋ:    beađŋŋis, (3)
đŋ:ŋ:   vuođŋŋán, (3)


đ:v:    njoađvut, báđva, bađvi (3)
đvv:    njoađvvui, báđvva (3)
đv:v:   bađvvi, bađvvis (3)


f:f:    suffá - suffái, Juffá-Juffái (3)


hl:     gihligiisá, guhlit, gihládeaddji, cuhladit, cuhlai (3)
hll:    cuhllen, cuhllen, cuhllat (3)
hl:l:   cuhllá  (3)


hrr:    čahrrat, cihrrat, skuhrrat, snuhrrat, čahrret, cihrret, skuhrret (3)
hr:r:   čahrrá, cihrrá, skurrá, snuhrrá (3)


hm:     liehmu, ruhmut, liehmudit (3)


i:b:    ruibut, Eibo, Eibos, suoibut (3) 
ib:b:   ruibbui, ruibbu, niibbi, niibbit (3)


i:c:    buici, luoicat, soica (3)
icc:    gáicca, luoiccai, luoiccas, soiccas, baicca (3)
ic:c:   buicci (3)


i:f:    gaifát, (3)
iff:    náiffa (3)
if:f    riiffu (3)


i:l:    huilát, luoilá (3)
il:l:   giillu, fiillu, (3)


ihl:    máihledahkki (3)
ihll:   máihlli (3)
i:hm:   duihmi, duihmut (3)
ihm:    duihmesorta (3)
ihmm:   duihmmiid (3)
ihm:m:  duihmmi (3)
i:hn:   čuihnut (3)
ihn:n:  čuihnnui (3)


i:p:    cuipát, cuipi, duipi, duipet (3)
ip:     fáiput, duipe-, cuipe- (3)
ipp:    fáippui, duippas, cuippas (3)
ip:p:   duippidit, cuippihit (3)


i:r:    guoirudit, guoirat (3)
ir:r:   guoirruhit (3)


i:s:    nuoisulit, guoisut, nuoisut (3)


i:sk:   duiska, guiski (3)
iskk:   báiskki, beaiskku, duiskka (3)
isk:k:  guiskki (3)


i:st:   luistet, goistet, (3)
ist:    báiste, máistit (3)
istt:   máisttii, luisttat (3)


iv:v:   moivvi, moivváskit, ruivvi, (3)
izz:   máizzai, máizzas (3)


ldn:    gáldnat, gáldnadit, suoldnečalbmi (3)
lnn:    gálnnai (3)
ln:n    suolnni (3)


lnnj/lŋŋ: goalŋŋai, alŋŋa (3)
ln:nj/lŋ:ŋ: jalŋŋis (3)


l:lj:   duollji, šillju, viellja, gallji (3)


lb:     holberavda, galbarihcci, silbarávdi (3)
lb:b:   holbbi, guolbbi (3)


l:c:    spalca, njoalci, culci, hilcu (3)
lc:     spalcamuotki, njoalcebivttas (3)
lc:c:   culcci, hilccu (3)


l:č:    čoalčát, šnjilča, vealči, čoalči, smilči (3)
lč:     šnjilčeborggit, čoalčejuolgi (3)
lčč:    čoalččas, čelččen, mulččehit (3)
lč:č:   smilčči (3)


l:f:    spálfu, skuolfi, bolfát, bolfi (3)
lf:     bolfebeana, bolfeoaivi, skuolfeloddi, (3)
lf:f    skuolffi, bolffi (3)


lp:     stoalpodiagrámma, vuolpominsttar, vuolporássi (3)


ls:     goalsemális, bálseráktu, soalselurvu (3)
ls:s:   molssun, molssut, molssui (3)
lšš:    álššaiduvvat, álššat, vulššiid (3)
lš:š:   vuolšši, vuolššit, šulšši, vuolššui (3)


l:t:    boltut, filtet, vielti (3)
lt:t:   bolttun, bolttut, vielttis (3)


l:ž:    skilži, buolža, skilžut, buolžái (3)
lž:ž:   skilžži (3)
l:sk    hilsku, hilsket (3)
lskk:   fálskkár (3)


m:b:    bumbá, rumbu (3)
mb:b:   bumbbá, rumbbu (3)
mp:p:   gimppu, gimppun (3)


m:s:    himsi, rimsi, romsa, himsasaddat (3)
ms:     himsesorta, rimsobivttas, rámsoloavdda (3)
ms:s:   himssi, rimssi (3)


m:š:    rumšu, lumšu (3)
mš:     rámšu, roamšejierit (3)
mšš:    rámššas, rumššagit (3)
mš:š:   rumššu, limššuhit (3)
m:sk:   limski, limsku (3)
msk:    rámsket (3)
mskk:   rámskkagit, rámskkil (3)
msk:k:  limskki, limskku (3)
m:šk:   limški, limškut (3)
mšk:    rámškut         (3)
mškk:   rámškkui, rimškkas (3)
mšk:k:  limškkui (3)


n:šk:   rinški, (3)
nšk:    ránšku, ránškut (3)
nškk:   ránškkui (3)
nšk:k   rinškki (3)


n:c:    bunci, buncut, gincut (3)
nc:     roanci, vuoncáváris (3)


n:č:    rinčát, rinči, rinčut, sinčut (3)
nč:     ránčát, ránči, ránčut (3)
nčč:    ránččagit, rinččagit (3)
nč:č:    rinčči, rinččun (3)


n:s:    linsa, rinsi, bronsa (3)
ns:     dánsut, balánsa, sekveansa (3)
ns:s:   rinssi (3)


n:š:    vinša, vinšet (3)
nš:     vinšabiila (3)
nšš:    vinšša (3)


n:t:    prentet, ánte, lunta, kontu, gintala (3)
nt:t:   konttu, ginttál (3)
n:z:    rinzi, šlinzi, runzi (3)
nz:     goanzi, leanzi, reanzi, veanzi (3)
nzz:    goanzzi, leanzzi, reanzzi (3)
nz:z:   rinzzi, šlinzzi, runzzi (3)
n:ž:    stunžet, bunžalit (3)
nž:     stánži, steanži (3)
nžž:    stánžži, steanžži, steanžžehit (3)
nž:ž:   bunžžuhit (3)


ŋ:k:    reŋko, faŋkut, faŋkát, boŋkit (3)
ŋk:     beaŋka, báŋku, beaŋkaravda, báŋkokontu (3)
ŋk:k:   boŋkkihit, bonkkuhit (3)


rt:n:   gortnit, girtnut, vuortnun (3)


r:dnj(r:gŋ):  gardnjil, skurdjnát, goargŋut, gorgŋet (3)
rdnj/rgŋ: skurdnje-sorta, gardnjil-lađas (3)
rtnj:   goarkŋui, gorkŋodit, eartnjehas (3)
rt:nj   skurtnjui, skurtnjun (3)


rb:b:   čuorbbášit, čuorbbit, vuorbbi (3)


r:c:    bircu, vierca, harcet, garcut (3)
rc:     bircospeallu, harcabáddi (3)
rcc:    fiercca, birccostallat, garccastit (3)
r:z:    birzi, (3)
rz:     birzediŋga (3)
rzz:    birzziid bárzziid, birzzas, birzzet (3)
rz:z:   birzzi, birzzit (3)


r:č:    skurču,hárči, hárčát, dirči (3)
rč:     dirčediŋga, morčesuotna (3)
rčč:    hárčči, hárččui, (3)
rč:č:   skurčču, vuorččis, dirčči (3)
r:ž:    gárži, gorži, guoržu (3)
rž:     gorženiski (3)
ržž:    gáržžádus, gáržžášit (3)
rž:ž:   goržži, guoržžu (3)


rd:d:   sirddášit, sirddán, murddán (3)
rf:f:   lurffi, lurffuhit, darffit (3)
rk:k:   nurkkis, nurkkit, vuorkkás (3)
rp:     soarpečáhci, árporulla (3)
rp:p:   gurppun, gurpput, gurppi (3)


rs:s:   jurssán, jurssát, (3)
r:š:    boršut, buršasa, duorši, duoršu (3)
rš:     buršemánná, duoršočivga (3)
ršš:    burššas, duorššagit, duorššas (3)
rš:š:   borššui, borššu, duoršši, duorššu (3)


rt:     čurtebuvssat, jortamovra, nuortasuopman (3)
rt:t:   fierttut, gurtti, virttis (3)


rsk:    herskobiebmu,herskostallat, dorskebivdu (4)
rskk:   herskkot (3)


r:st:   horsta, kirste (3)
rst:    horstaseahkka (3)
rstt:   horsttat, kirstte (3)


t:m:    fitmat, (3)
tmm:    fátmmastit, fátmi (3)
s:p:    luspi, vispil, vispet (3)
sp:     lusppi, bisppa (3)
š:m:    šušmi, došmi (3)
šmm:    šušmmi, lášmat, lášmmohallat (3) 
št:     meaštir, (3)


š:v:    gišvarasmáhtu (3)
šv:     gišvvardit (3)


vn:nj:  savnnján, savnnját, suovnnji (3)


vg:g:   šlivggun, šlivggui, šluvggán (3)


v:hl:   čivhli, skoavhli, guvhli (3)
vhl:    čivhle-, guvhlegállu, skoavhle (3)
vhll:   skoavhlli, skoavhllagit (3)
vhl:l:  guvhlli, guvhllár, čivhllit (3)


v:p:    lovpet, lovpár (3)
v:z:    givzat, guovzat (3)
vz:z:   livzzi, rivzzi, livzzistit (3)
vž:ž:   livžžui, livžžádit (3)


v:sk:   livsku, luvsku (3)
vsk:    hávski, heavskái (3)
vskk:   hávskkui, heavskkálaš (3)
vsk:k:  livskku, luvskku (3)
v:st:   hevste, hevstet (3)
vst:    návstu (3)


kc:     lákcagáhkku, (3)
vc:c    ovccis (3)


k:st:   tekstet, tekstii (3)
kst:    teakstabihttá, tákstareive (3)


ŧŧ:     ruoŧŧa, muoŧŧá, ruŧŧii, muoŧŧái (3)
ŧ:ŧ:    muoŧ:ŧái (3)

Infrequent onsets:

sr:  srubistit, srukta, sroba (3)
sv:  Svein, Sválla (3)
skr: skriidna, skrinet, skruvva (3)
gl:  glássa, gluovva, glottála (3)
gn:  gneaisa (3)
bl:  bliánta, bláđet, bláđđi (3)
br:  bráhkka, breahtta, bronsa, bruvsa (3)
dr:  dronnet, drámá (3)
fl:  flágga, flásku (3)
kn:  knáhppa, knáhppá, knihppet, kneakta (3)


sl:  variant of šl-, not represented in text
snj: variant of šnj-, not represented in text

Clusters in the Consonant margin:

st:  bonjastit, oamastit: more than 3
ld:  buđaldit, oaivvildit: more than 3
sk:  dájáskit, ealáskit, ovttaskas: more than 3
lm:  mihtilmas, vuorddálmas, čájálmas: 3
lv:  buozalvas: (mentioned in KN): (3)
lg:  jámálgit, gájálgit, deanjalgit (3)
št:  beroštit, gáđaštit, mátkkoštit (more than 3)
rd:  guokkardit, bulljardit, mulljardit, vizardit (more than 3)
rs:  vuobirsat (3)
jm:  manaimet, viegaimet (more than 3)
jd:  bohccuidan, mánáidan, gižaidit (more than 3)
jg:  mánáiguin, boraiga: (more than 3)
jn:  mánáinan, muitalusainis (3)
sm:  boarásmit, hejosmit (3)
sl:  dievaslaš, ollislaš (3)
šl:  bearašlaš, dárbbašlaš, dearvvašlaš (more than 3)
tl:  heahpatlaš, ustitlaš, geavatlaš (3)
rm:  sihkarmit, ealjármit (constructed for this purpose) (3)


jst: guoldduistit (variant of guolddustit) - not represented in text

Clusters in Word final position:

jn: more than 3
jt: more than 3
rs: vuobirs (3)