GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started and our Privacy document.
Mii leat jorgalan teavsttaid main lea su 6100 sáni. Dán tabealla logut muitalit man ollu leat missing-sánit. Oassi teavsttain leat čállojuvvon Norgga bealde, oassi leat čállojuvvon Suoma bealde.
Teaksta | Riika | sme-smn | pros | list | sme-sma | pros | list | sme-smj | pros | list |
---|---|---|---|---|---|---|---|---|---|---|
Sámediggi | Norggas | 124 | 2 % | (76) | 188 | 3 % | (102) | 282 | 5 % | (138) |
Dieđahus | Norggas | 158 | 3 % | (109) | 91 | 1 % | (77) | 211 | 3 % | (148) |
Vars | Norggas | 235 | 4 % | (188) | 406 | 7 % | (300) | 588 | 10 % | (388) |
Saara | Norggas | 245 | 4 % | (185) | 500 | 8 % | (351) | 685 | 11 % | (449) |
IMA | Suomas | 654 | 11 % | (386) | 1079 | 18 % | (646) | 1193 | 20 % | (724) |
Vest | Suomas | 379 | 6 % | (327) | 719 | 12 % | (585) | 972 | 16 % | (734) |
filosofi | Norggas | 263 | 4 % | (240) | 436 | 7 % | (387) | 567 | 7 % | (476) |
Historjá | Suomas | 442 | 7 % | (364) | 836 | 14 % | (674) | 899 | 16 % | (720) |
uno info | Ruoŧas | 550 | 9 % | (383) | 914 | 15 % | (609) | 960 | 16 % | (608) |
Tanapioner | Norggas | 263 | 4 % | (399) | 555 | 9 % | (478) | 664 | 10 % | (539) |
matematihkka | Norggas | 612 | 10 % | (180) | 1243 | 20 % | (341) | 1118 | 18 % | (325) |
==> dev/Sámed.txt <== 76 sáni
5 *eanedit (eanet A)
4 *vuoruhuvvo
4 *hállansyntesa
4 *eahpeoiddolaš
3 *majoritehta
2 *čalmmustahttit
2 *čalmmustahttimis
2 *áin
2 *válljenmunni
2 *tearpmat
2 *rávnnjáldagat
2 *rekrutteremiin
2 *registreren
2 *registrerema
2 *registrerejuvvon
2 *ovttaskasaid
2 *ovttaskasa
2 *ovttaidlogus
2 *ovddasguvlui
2 *oaivadit
==> dev/dieđahus.txt <==
5 *mielddisbuktá
4 *tearpmaid
4 *oktiiheiveheami
4 *mandáhta
3 *čalmmustahttin
3 *čalmmustahttima
3 *nubbegiellan
3 *mielddisbuktet
3 *lagat
3 *lagasbirrasis
3 *guovttesuorat
2 *čalmmustahttit
2 *váste
2 *vuoruhuvvot
2 *tearpmat
2 *tearbmaráhkadeapmi
2 *sámástit
2 *rekrutterema
2 *oktiiheivehit
2 *oktiiheiveheamis
==> dev/Vars.txt <==
17 *Busi
4 *analyseret
3 *šluvggii
3 *njávkkai
3 *lulás
3 *gaikkihii
3 *dálle
3 *bláđegođii
2 *susttašii
2 *stávet
2 *oktovuođa
2 *láidii
2 *lihkastagaid
2 *jurdilii
2 *heahpat
2 *fanahalai
2 *duollet
2 *dievá
2 *algebra
2 *Njáv
==> dev/Saara.txt <==
11 *tuneallas
6 *tunellii
6 *tunealla
5 *mahkáš
4 *tunnealla
4 *iđđedis
4 *biffan
3 *sihkkelastit
3 *huošši (ii leat smeFST:s)
3 *gillára
3 *Hm
2 -*Gea
2 *čurvejin
2 *čierru☹ (☹ ii leat smeFST:s)
2 *very (ii leat smeFST:s)
2 *vampyra (ii leat smeFST:s)
2 *tuneallanjálmmis
2 *termosa
2 *skurdnjasat
2 *savkkástalle
==> dev/IMA.txt <== 386 sáni
48 *Aurelia (ii leat smeFST:s)
47 *Čárrá (ii leat smeFST:s)
31 *Čárá (ii leat smeFST:s)
14 *goittot
10 *ah’ (ii leat smeFST:s)
7 *čárre (ii leat smeFST:s)
6 *ču (ii leat smeFST:s)
6 *allelii
5 *vuoktaráidalasa
5 *njeaigga
5 *Gea
4 *ruive
4 *mohtičázi (ii leat smeFST:s)
4 *luŋka
4 *biškkanas
4 *Ráidalas
4 *Máttaráhkká
4 *Biškkanas
3 *Čárás
3 *váiddui
==> dev/Vest.txt <==
5 *guovllos (ii leat smeFST:s, = guovllus)
4 *čoakkalmasaide
4 *moanaid
4 *gávastalai
3 *čoakkalmasat
3 *oktovuođa
3 *margarin (ii leat smeFST:s)
3 *luoddanit
3 *goittot
3 *gitára
3 *geasehii
2 *čájetmat (ii leat smeFST:s)
2 *čoakkalmasain
2 *čivttii
2 *stovus (ii leat smeFST:s)
2 *sreaŋggaid
2 *sorrás (ii leat smeFST:s)
2 *rásken
2 *rándahis
2 *ruvtto
==> historia <==
18 *goittot
9 *OKr
6 *ladni
5 *gávnnus
5 *gávdnosis
4 *čuohte
4 *váinniid
4 *omiid
4 *cm
4 *bázahusat
4 *Ammal
3 *saddjon
3 *oaivámučča
3 *gurat
3 *goardagis
3 *davásguvlui
3 *bázahusaid
2 *čorpmamahtosaš
2 *čehpet
2 *Ötzi
==> filosofiija <==
8 *guottuid
6 *morála
3 *ekologalaš
3 *OEE
3 *Antirasisttalaš
2 *áiccut
2 *sekuleara
2 *oktagaslaš
2 *norbma
2 *lihkulašvuođadovddu
2 *filosofat
2 *etnisitehta
2 *Parmenides
2 *ML06S?
2 *ML06S
1 *šáŋŋer
1 *čuozahussátni
1 *čuozahussániin
1 *čuoldit
1 *čanastagat
==> uno.se <==
16 *p-pillara
13 *geavtit
13 *fáhkkatlaš
8 *kondoma
8 *Fáhkkatlaš
7 *anašeami
6 *vardá
6 *p-pillar
6 *ovttaskasas
6 *ovttaskasa
6 *nala
6 *Kondoma
5 *leaboheapmin
5 *cummástallá
5 *apotehkas
4 *ng
4 *losesmielas
4 *gárremiin
4 *geavtá
4 *geardu
==> Tanapioner <==
8 *internáhta
6 *og
6 *Heimen
4 *til
4 *samiske
4 *oarbinaččas
4 *med
4 *internáhtas
4 *fra
3 *Čiestti
3 *ánsomedáljja
3 *skuvlastivrrárin
3 *lulás
3 *for
3 *evakuerejuvvui
3 *eksámena
3 *b
3 *Soffa
3 *Ravne
3 *Lile
==> apertium-sme-smn/dev/matematihkka.txt <== 180 sáni
32 *govvosiid
28 *logežiidda
25 *ruvttu
25 *logežiid
21 *ruvttuid
21 *rieggá
21 *logeža
19 *govvosa
18 *ruvttuide
16 *lohkolinnjái
12 *ruvttus
11 *kr
11 *govvosis
8 *guovttesiffar
8 *govvosii
7 *symmetralaččat
7 *speadjalaston
6 *sirkeliidda
6 *sirkeliid
6 *sihkoniin
==> dev/Sámed.txt <==
9 *geatnegahttojuvvon
5 *eanedit (eanet A)
4 *ulbmillaš
4 *máhtolašvuohta
4 *muddui
4 *hállansyntesa
4 *gielddalaš
4 *eahpeoiddolaš
4 *deattasta
4 *dakko
3 *ulbmilolahusa
3 *makkárge
3 *majoritehta
3 *eanemus
2 *áin
2 *Ággan
2 *váttásmahttá
2 *válljenmunni
2 *váldesuorggis
2 *ulbmileamos
==> dev/dieđahus.txt <==
3 *čovdosat
3 *makkárge
3 *guovttesuorat
2 *čavga
2 *gustovaš
2 *govttolaš
2 *giellalávgun
2 *dárkilis
2 *bálvalusfálu
2 *buoremuddui
2 *beaktilis
1 *čovdosiid
1 *čiekŋudit
1 *árvvolaš
1 *válljejupmin
1 *válljejupmi
1 *válljejumiid
1 *vuođđoelemeanttain
1 *vuolláičállán
1 *vuollelis
==> dev/Vars.txt <==
12 *Na
10 *gillen
7 *šuohkehii
6 *gille
5 *Vuoi
4 *litna
4 *jávohaga
4 *dievva
4 *diekkár
3 *šluvggii
3 *suoli
3 *njávkkai
3 *láiki
3 *lulás
3 *jur
3 *juohkelágan
3 *jitnosit
3 *gaikkihii
3 *feara
3 *dakkaviđe
==> dev/Saara.txt <==
17 *han
11 *tuneallas
10 *sihkkela
7 *Mánnodaga
6 *tunellii
6 *tunealla
6 *bat
5 *mahkáš
5 *feara
4 *váivvida
4 *tunnealla
4 *ribahin
4 *iđđedis
4 *fáhkka
4 *biffan
4 *Buoska
3 *vulos
3 *ulda
3 *njávgá
3 *huošši (ii leat smeFST:s)
==> dev/IMA.txt <==
48 *Aurelia (ii leat smeFST:s)
47 *Čárrá (ii leat smeFST:s)
31 *Čárá (ii leat smeFST:s)
23 *Na
15 *jo
14 *goittot
10 *ah’ (ii leat smeFST:s)
9 *Viimmat
8 *čáhcerávgga
8 *illá
7 *čárre (ii leat smeFST:s)
7 *masá
6 *ču (ii leat smeFST:s)
6 *Čirre
6 *vulos
6 *trampoliinna
6 *allelii
6 *Fáhkka
5 *Gea
4 *čáhcerávga
==> dev/Vest.txt <==
10 *vuot
10 *Na
7 *vehá
5 *vilppastii
5 *guovllos (ii leat smeFST:s, = guovllus)
4 *čoakkalmasaide
4 *čoahkis
4 *velohallat
4 *hoahkalii
4 *gámmárii
4 *gaskkohagaid
3 *čoakkalmasat
3 *olus
3 *oktovuođa
3 *maŋit
3 *margarin (ii leat smeFST:s)
3 *jámma
3 *gámmáris
3 *goittot
3 *geasehii
==> historia <==
18 *goittot
9 *OKr
8 *áigásaš
7 *duhát
7 *dolin
6 *ladni
5 *valjis
5 *ruhkuid
5 *duháhiid
4 *čuohte
4 *váinniid
4 *suopmelaččat
4 *ruhkku
4 *hárvenaš
4 *guhku
4 *dávttis
4 *duohkai
4 *cm
4 *bronsaáiggi
4 *arkeologa
==> filosofiija <==
8 *guottuid
6 *morála
5 *filosofalaš
3 *áinnas
3 *sorjavaš
3 *rasisttalaš
3 *máilmmálaččat
3 *fámolaš
3 *ekologalaš
3 *OEE
3 *Filosofalaš
3 *Antirasisttalaš
2 *áššáskuhttui
2 *álgoálbmotnuoraid
2 *áiccut
2 *vuoluštit
2 *vuoiŋŋalaš
2 *servodatlaš
2 *sekuleara
2 *seksuála
==> uno.se <==
16 *p-pillara
15 *áŧestusa
14 *iešdovdu
13 *geavtit
13 *fáhkkatlaš
12 *áŧestus
9 *Áŧestus
9 *riska
8 *ládje
8 *kondoma
8 *Fáhkkatlaš
7 *ila
7 *iešdovddu
7 *got
7 *anašeami
7 *alkohola
6 *p-pillar
6 *ovttaskasas
6 *ovttaskasa
6 *Kondoma
==> tanapioner <==
6 *og
6 *Heimen
5 *ee
4 *til
4 *samiske
4 *oarbinaččas
4 *med
4 *fra
4 *eatnasat
3 *Čiestti
3 *ánsomedáljja
3 *skuvlastivrrárin
3 *sadjásaš
3 *lulás
3 *goappašagat
3 *for
3 *evakuerejuvvui
3 *Soffa
3 *Ravne
3 *Lile
==> apertium-sme-sma/dev/matematihkka.txt <==
69 *Tevdne
38 *supmi
35 *lohkolinjjás
33 *ovttežiidda
32 *govvosiid
28 *logežiidda
25 *ruvttu
25 *logežiid
24 *oktiibuot
21 *ruvttuid
21 *ovttežiid
21 *logeža
21 *kruvnna
19 *govvosa
18 *ruvttuide
16 *lohkolinnjái
15 *ovtteža
14 *goappáge
12 *ruvttus
12 *rehketbihtá
==> dev/Sámed.txt <==
12 *vuođul
9 *geatnegahttojuvvon
9 *fuones
8 *váilot
6 *olmmošlaš
5 *stivret
4 *váilevašvuohta
4 *vealtameahttun
4 *oktage
4 *máinnašuvvo
4 *hállansyntesa
4 *gáhttemii
4 *eahpeoiddolaš
4 *deattasta
4 *dakko
3 *ulbmilolahusa
3 *ođđaáigásaš
3 *ollašuhttit
3 *gosa
3 *einnostan
==> dev/dieđahus.txt <==
7 *váilot
6 *rávisolbmuide
5 *lihkostuvvan
4 *rávisolbmot
4 *oktiiheiveheami
4 *návccat
4 *hálddašanmodealla
4 *hábmet
4 *dovdomassii
3 *vuođul
3 *stivret
3 *olmmošlaš
3 *guovttesuorat
3 *einnostahtti
2 *váste
2 *seailut
2 *ovttastahttit
2 *ovttagielat
2 *oktiiheivehit
2 *oktiiheiveheamis
==> dev/Vars.txt <==
11 *oktage
10 *goassege
9 *čáppa
7 *ártegis
7 *ruoktot
7 *oba
7 *dal
6 *folkefiende (ii leat smeFST:s)
6 *Stockmann
6 *En
5 *rukses
5 *málet
5 *measta
5 *ges
5 *fitnat
5 *deike
4 *álás
4 *váccii
4 *sihkkarit
4 *oanehaš
==> dev/Saara.txt <==
17 *han
12 *goit
12 *deike
11 *aiddo
10 *ges
9 *luhtte
8 *measta
7 *ruoktot
7 *rukses
7 *issoras
6 *fitnat
6 *bat
5 *ártet
5 *smiehttan
5 *mahkáš
5 *goassige
5 *fitnan
5 *Sotnabeaivve
4 *speadjalis
4 *oktage
==> dev/IMA.txt <==
48 *Aurelia (ii leat smeFST:s)
47 *Čárrá (ii leat smeFST:s)
31 *Čárá (ii leat smeFST:s)
15 *jo
14 *goittot
10 *ah’ (ii leat smeFST:s)
9 *goassige
9 *Viimmat
8 *illá
7 *čárre (ii leat smeFST:s)
7 *masá
7 *dal
6 *ču (ii leat smeFST:s)
6 *čoavjjis
6 *Čirre
6 *vulos
6 *trampoliinna
6 *oktage
6 *Fáhkka
5 *vuoktaráidalasa
==> dev/Vest.txt <==
10 *vuot
9 *čáppa
9 *finai
7 *vehá
7 *moadde
7 *luhtte
6 *áidna
6 *aiddo
5 *vilppastii
5 *ruoktot
5 *guovllos (ii leat smeFST:s, = guovllus)
5 *Hemmo-guoktá
4 *čoakkalmasaide
4 *váccii
4 *velohallat
4 *rehkenasttii
4 *máhcai
4 *moanaid
4 *láhttestii
4 *hoahkalii
==> historia <==
18 *goittot
9 *OKr
7 *fierbmi
6 *hervejuvvon
6 *fierpmi
5 *ártegis
5 *vuođul
5 *valjis
5 *ruhkuid
5 *gávnnus
5 *gávdnosis
5 *goas
5 *Fierbmi
4 *čuohte
4 *váinniid
4 *vearjjut
4 *sihkkarit
4 *seilon
4 *ruhkku
4 *lagabui
==> filosofiija <==
8 *smiehttat
7 *olmmošlaš
7 *heive
6 *morála
5 *Váldooassi
4 *ságastii
4 *boastut
3 *áinnas
3 *ságastit
3 *ságasteapmi
3 *ságasteami
3 *sorjavaš
3 *rasisttalaš
3 *rahčet
3 *oskkoldagaid
3 *máilmmálaččat
3 *jápmán
3 *gillájit
3 *bissovaš
3 *OEE
==> uno.se <==
15 *áŧestusa
14 *iešdovdu
13 *geavtit
13 *fáhkkatlaš
12 *áŧestus
12 *mot
11 *áhpeheapmin
10 *veadjá
9 *Áŧestus
9 *riska
8 *kondoma
8 *Fáhkkatlaš
7 *somá
7 *ráhkástallá
7 *ilgadis
7 *ila
7 *iešdovddu
7 *got
6 *veadjit
6 *vardá
==> tanapioner <==
7 *váccii
7 *oktage
6 *og
6 *jámii
6 *Heimen
5 *goassege
5 *ee
4 *áidna
4 *til
4 *samiske
4 *ovdaolmmoš
4 *oarbinaččas
4 *moadde
4 *med
4 *fra
4 *Duiskalaččat
3 *Čiestti
3 *ásaiduvve
3 *ánsomedáljja
3 *vázze
==> apertium-sme-smj/dev/matematihkka.txt <==
69 *Tevdne
50 *Rehkenastte
46 *sárgáid
35 *Ivdne
33 *ovttežiidda
28 *logežiidda
25 *logežiid
21 *rieggá
21 *ovttežiid
21 *logeža
19 *sárgá
18 *guoros
17 *váilot
15 *ovtteža
11 *áinnas
11 *rehkenastte
11 *kr
10 *leaskaloguid
10 *Speallu
9 *minstara
cat apertium-sme-sma.sme-sma.dix |grep '<e>'|grep -v '"np"'|tr '<' '>'|cut -d">" -f7|sort|uniq|wc -l
cat apertium-sme-smj.sme-smj.t?x|grep '^ *<rule'|wc -l
cat apertium-sme-sma.sme-sma.lrx|grep '^ *<rule'|wc -l
Sisdoallu | sme-smn | sme-sma | sme-smj |
---|---|---|---|
Bidix | 7897 | 4384 | 12208*) |
Transfer | 67 | 69 | 32 |
Lexsel | 139 | 322 | 9 |
(*) Stuorra oassi sme-smj-bidixas lea genererejuvvon