GiellaLT provides rule-based language technology aimed at minority and indigenous languages
Mii leat jorgalan teavsttaid main lea su 6100 sáni. Dán tabealla logut muitalit man ollu leat missing-sánit. Oassi teavsttain leat čállojuvvon Norgga bealde, oassi leat čállojuvvon Suoma bealde.
Teaksta | Riika | sme-smn | pros | list | sme-sma | pros | list | sme-smj | pros | list |
---|---|---|---|---|---|---|---|---|---|---|
Sámediggi | Norggas | 124 | 2 % | (76) | 188 | 3 % | (102) | 282 | 5 % | (138) |
Dieđahus | Norggas | 158 | 3 % | (109) | 91 | 1 % | (77) | 211 | 3 % | (148) |
Vars | Norggas | 235 | 4 % | (188) | 406 | 7 % | (300) | 588 | 10 % | (388) |
Saara | Norggas | 245 | 4 % | (185) | 500 | 8 % | (351) | 685 | 11 % | (449) |
IMA | Suomas | 654 | 11 % | (386) | 1079 | 18 % | (646) | 1193 | 20 % | (724) |
Vest | Suomas | 379 | 6 % | (327) | 719 | 12 % | (585) | 972 | 16 % | (734) |
filosofi | Norggas | 263 | 4 % | (240) | 436 | 7 % | (387) | 567 | 7 % | (476) |
Historjá | Suomas | 442 | 7 % | (364) | 836 | 14 % | (674) | 899 | 16 % | (720) |
uno info | Ruoŧas | 550 | 9 % | (383) | 914 | 15 % | (609) | 960 | 16 % | (608) |
Tanapioner | Norggas | 263 | 4 % | (399) | 555 | 9 % | (478) | 664 | 10 % | (539) |
matematihkka | Norggas | 612 | 10 % | (180) | 1243 | 20 % | (341) | 1118 | 18 % | (325) |
==> dev/Sámed.txt <== 76 sáni
5 *eanedit (eanet A)
4 *vuoruhuvvo
4 *hállansyntesa
4 *eahpeoiddolaš
3 *majoritehta
2 *čalmmustahttit
2 *čalmmustahttimis
2 *áin
2 *válljenmunni
2 *tearpmat
2 *rávnnjáldagat
2 *rekrutteremiin
2 *registreren
2 *registrerema
2 *registrerejuvvon
2 *ovttaskasaid
2 *ovttaskasa
2 *ovttaidlogus
2 *ovddasguvlui
2 *oaivadit
==> dev/dieđahus.txt <==
5 *mielddisbuktá
4 *tearpmaid
4 *oktiiheiveheami
4 *mandáhta
3 *čalmmustahttin
3 *čalmmustahttima
3 *nubbegiellan
3 *mielddisbuktet
3 *lagat
3 *lagasbirrasis
3 *guovttesuorat
2 *čalmmustahttit
2 *váste
2 *vuoruhuvvot
2 *tearpmat
2 *tearbmaráhkadeapmi
2 *sámástit
2 *rekrutterema
2 *oktiiheivehit
2 *oktiiheiveheamis
==> dev/Vars.txt <==
17 *Busi
4 *analyseret
3 *šluvggii
3 *njávkkai
3 *lulás
3 *gaikkihii
3 *dálle
3 *bláđegođii
2 *susttašii
2 *stávet
2 *oktovuođa
2 *láidii
2 *lihkastagaid
2 *jurdilii
2 *heahpat
2 *fanahalai
2 *duollet
2 *dievá
2 *algebra
2 *Njáv
==> dev/Saara.txt <==
11 *tuneallas
6 *tunellii
6 *tunealla
5 *mahkáš
4 *tunnealla
4 *iđđedis
4 *biffan
3 *sihkkelastit
3 *huošši (ii leat smeFST:s)
3 *gillára
3 *Hm
2 -*Gea
2 *čurvejin
2 *čierru☹ (☹ ii leat smeFST:s)
2 *very (ii leat smeFST:s)
2 *vampyra (ii leat smeFST:s)
2 *tuneallanjálmmis
2 *termosa
2 *skurdnjasat
2 *savkkástalle
==> dev/IMA.txt <== 386 sáni
48 *Aurelia (ii leat smeFST:s)
47 *Čárrá (ii leat smeFST:s)
31 *Čárá (ii leat smeFST:s)
14 *goittot
10 *ah’ (ii leat smeFST:s)
7 *čárre (ii leat smeFST:s)
6 *ču (ii leat smeFST:s)
6 *allelii
5 *vuoktaráidalasa
5 *njeaigga
5 *Gea
4 *ruive
4 *mohtičázi (ii leat smeFST:s)
4 *luŋka
4 *biškkanas
4 *Ráidalas
4 *Máttaráhkká
4 *Biškkanas
3 *Čárás
3 *váiddui
==> dev/Vest.txt <==
5 *guovllos (ii leat smeFST:s, = guovllus)
4 *čoakkalmasaide
4 *moanaid
4 *gávastalai
3 *čoakkalmasat
3 *oktovuođa
3 *margarin (ii leat smeFST:s)
3 *luoddanit
3 *goittot
3 *gitára
3 *geasehii
2 *čájetmat (ii leat smeFST:s)
2 *čoakkalmasain
2 *čivttii
2 *stovus (ii leat smeFST:s)
2 *sreaŋggaid
2 *sorrás (ii leat smeFST:s)
2 *rásken
2 *rándahis
2 *ruvtto
==> historia <==
18 *goittot
9 *OKr
6 *ladni
5 *gávnnus
5 *gávdnosis
4 *čuohte
4 *váinniid
4 *omiid
4 *cm
4 *bázahusat
4 *Ammal
3 *saddjon
3 *oaivámučča
3 *gurat
3 *goardagis
3 *davásguvlui
3 *bázahusaid
2 *čorpmamahtosaš
2 *čehpet
2 *Ötzi
==> filosofiija <==
8 *guottuid
6 *morála
3 *ekologalaš
3 *OEE
3 *Antirasisttalaš
2 *áiccut
2 *sekuleara
2 *oktagaslaš
2 *norbma
2 *lihkulašvuođadovddu
2 *filosofat
2 *etnisitehta
2 *Parmenides
2 *ML06S?
2 *ML06S
1 *šáŋŋer
1 *čuozahussátni
1 *čuozahussániin
1 *čuoldit
1 *čanastagat
==> uno.se <==
16 *p-pillara
13 *geavtit
13 *fáhkkatlaš
8 *kondoma
8 *Fáhkkatlaš
7 *anašeami
6 *vardá
6 *p-pillar
6 *ovttaskasas
6 *ovttaskasa
6 *nala
6 *Kondoma
5 *leaboheapmin
5 *cummástallá
5 *apotehkas
4 *ng
4 *losesmielas
4 *gárremiin
4 *geavtá
4 *geardu
==> Tanapioner <==
8 *internáhta
6 *og
6 *Heimen
4 *til
4 *samiske
4 *oarbinaččas
4 *med
4 *internáhtas
4 *fra
3 *Čiestti
3 *ánsomedáljja
3 *skuvlastivrrárin
3 *lulás
3 *for
3 *evakuerejuvvui
3 *eksámena
3 *b
3 *Soffa
3 *Ravne
3 *Lile
==> apertium-sme-smn/dev/matematihkka.txt <== 180 sáni
32 *govvosiid
28 *logežiidda
25 *ruvttu
25 *logežiid
21 *ruvttuid
21 *rieggá
21 *logeža
19 *govvosa
18 *ruvttuide
16 *lohkolinnjái
12 *ruvttus
11 *kr
11 *govvosis
8 *guovttesiffar
8 *govvosii
7 *symmetralaččat
7 *speadjalaston
6 *sirkeliidda
6 *sirkeliid
6 *sihkoniin
==> dev/Sámed.txt <==
9 *geatnegahttojuvvon
5 *eanedit (eanet A)
4 *ulbmillaš
4 *máhtolašvuohta
4 *muddui
4 *hállansyntesa
4 *gielddalaš
4 *eahpeoiddolaš
4 *deattasta
4 *dakko
3 *ulbmilolahusa
3 *makkárge
3 *majoritehta
3 *eanemus
2 *áin
2 *Ággan
2 *váttásmahttá
2 *válljenmunni
2 *váldesuorggis
2 *ulbmileamos
==> dev/dieđahus.txt <==
3 *čovdosat
3 *makkárge
3 *guovttesuorat
2 *čavga
2 *gustovaš
2 *govttolaš
2 *giellalávgun
2 *dárkilis
2 *bálvalusfálu
2 *buoremuddui
2 *beaktilis
1 *čovdosiid
1 *čiekŋudit
1 *árvvolaš
1 *válljejupmin
1 *válljejupmi
1 *válljejumiid
1 *vuođđoelemeanttain
1 *vuolláičállán
1 *vuollelis
==> dev/Vars.txt <==
12 *Na
10 *gillen
7 *šuohkehii
6 *gille
5 *Vuoi
4 *litna
4 *jávohaga
4 *dievva
4 *diekkár
3 *šluvggii
3 *suoli
3 *njávkkai
3 *láiki
3 *lulás
3 *jur
3 *juohkelágan
3 *jitnosit
3 *gaikkihii
3 *feara
3 *dakkaviđe
==> dev/Saara.txt <==
17 *han
11 *tuneallas
10 *sihkkela
7 *Mánnodaga
6 *tunellii
6 *tunealla
6 *bat
5 *mahkáš
5 *feara
4 *váivvida
4 *tunnealla
4 *ribahin
4 *iđđedis
4 *fáhkka
4 *biffan
4 *Buoska
3 *vulos
3 *ulda
3 *njávgá
3 *huošši (ii leat smeFST:s)
==> dev/IMA.txt <==
48 *Aurelia (ii leat smeFST:s)
47 *Čárrá (ii leat smeFST:s)
31 *Čárá (ii leat smeFST:s)
23 *Na
15 *jo
14 *goittot
10 *ah’ (ii leat smeFST:s)
9 *Viimmat
8 *čáhcerávgga
8 *illá
7 *čárre (ii leat smeFST:s)
7 *masá
6 *ču (ii leat smeFST:s)
6 *Čirre
6 *vulos
6 *trampoliinna
6 *allelii
6 *Fáhkka
5 *Gea
4 *čáhcerávga
==> dev/Vest.txt <==
10 *vuot
10 *Na
7 *vehá
5 *vilppastii
5 *guovllos (ii leat smeFST:s, = guovllus)
4 *čoakkalmasaide
4 *čoahkis
4 *velohallat
4 *hoahkalii
4 *gámmárii
4 *gaskkohagaid
3 *čoakkalmasat
3 *olus
3 *oktovuođa
3 *maŋit
3 *margarin (ii leat smeFST:s)
3 *jámma
3 *gámmáris
3 *goittot
3 *geasehii
==> historia <==
18 *goittot
9 *OKr
8 *áigásaš
7 *duhát
7 *dolin
6 *ladni
5 *valjis
5 *ruhkuid
5 *duháhiid
4 *čuohte
4 *váinniid
4 *suopmelaččat
4 *ruhkku
4 *hárvenaš
4 *guhku
4 *dávttis
4 *duohkai
4 *cm
4 *bronsaáiggi
4 *arkeologa
==> filosofiija <==
8 *guottuid
6 *morála
5 *filosofalaš
3 *áinnas
3 *sorjavaš
3 *rasisttalaš
3 *máilmmálaččat
3 *fámolaš
3 *ekologalaš
3 *OEE
3 *Filosofalaš
3 *Antirasisttalaš
2 *áššáskuhttui
2 *álgoálbmotnuoraid
2 *áiccut
2 *vuoluštit
2 *vuoiŋŋalaš
2 *servodatlaš
2 *sekuleara
2 *seksuála
==> uno.se <==
16 *p-pillara
15 *áŧestusa
14 *iešdovdu
13 *geavtit
13 *fáhkkatlaš
12 *áŧestus
9 *Áŧestus
9 *riska
8 *ládje
8 *kondoma
8 *Fáhkkatlaš
7 *ila
7 *iešdovddu
7 *got
7 *anašeami
7 *alkohola
6 *p-pillar
6 *ovttaskasas
6 *ovttaskasa
6 *Kondoma
==> tanapioner <==
6 *og
6 *Heimen
5 *ee
4 *til
4 *samiske
4 *oarbinaččas
4 *med
4 *fra
4 *eatnasat
3 *Čiestti
3 *ánsomedáljja
3 *skuvlastivrrárin
3 *sadjásaš
3 *lulás
3 *goappašagat
3 *for
3 *evakuerejuvvui
3 *Soffa
3 *Ravne
3 *Lile
==> apertium-sme-sma/dev/matematihkka.txt <==
69 *Tevdne
38 *supmi
35 *lohkolinjjás
33 *ovttežiidda
32 *govvosiid
28 *logežiidda
25 *ruvttu
25 *logežiid
24 *oktiibuot
21 *ruvttuid
21 *ovttežiid
21 *logeža
21 *kruvnna
19 *govvosa
18 *ruvttuide
16 *lohkolinnjái
15 *ovtteža
14 *goappáge
12 *ruvttus
12 *rehketbihtá
==> dev/Sámed.txt <==
12 *vuođul
9 *geatnegahttojuvvon
9 *fuones
8 *váilot
6 *olmmošlaš
5 *stivret
4 *váilevašvuohta
4 *vealtameahttun
4 *oktage
4 *máinnašuvvo
4 *hállansyntesa
4 *gáhttemii
4 *eahpeoiddolaš
4 *deattasta
4 *dakko
3 *ulbmilolahusa
3 *ođđaáigásaš
3 *ollašuhttit
3 *gosa
3 *einnostan
==> dev/dieđahus.txt <==
7 *váilot
6 *rávisolbmuide
5 *lihkostuvvan
4 *rávisolbmot
4 *oktiiheiveheami
4 *návccat
4 *hálddašanmodealla
4 *hábmet
4 *dovdomassii
3 *vuođul
3 *stivret
3 *olmmošlaš
3 *guovttesuorat
3 *einnostahtti
2 *váste
2 *seailut
2 *ovttastahttit
2 *ovttagielat
2 *oktiiheivehit
2 *oktiiheiveheamis
==> dev/Vars.txt <==
11 *oktage
10 *goassege
9 *čáppa
7 *ártegis
7 *ruoktot
7 *oba
7 *dal
6 *folkefiende (ii leat smeFST:s)
6 *Stockmann
6 *En
5 *rukses
5 *málet
5 *measta
5 *ges
5 *fitnat
5 *deike
4 *álás
4 *váccii
4 *sihkkarit
4 *oanehaš
==> dev/Saara.txt <==
17 *han
12 *goit
12 *deike
11 *aiddo
10 *ges
9 *luhtte
8 *measta
7 *ruoktot
7 *rukses
7 *issoras
6 *fitnat
6 *bat
5 *ártet
5 *smiehttan
5 *mahkáš
5 *goassige
5 *fitnan
5 *Sotnabeaivve
4 *speadjalis
4 *oktage
==> dev/IMA.txt <==
48 *Aurelia (ii leat smeFST:s)
47 *Čárrá (ii leat smeFST:s)
31 *Čárá (ii leat smeFST:s)
15 *jo
14 *goittot
10 *ah’ (ii leat smeFST:s)
9 *goassige
9 *Viimmat
8 *illá
7 *čárre (ii leat smeFST:s)
7 *masá
7 *dal
6 *ču (ii leat smeFST:s)
6 *čoavjjis
6 *Čirre
6 *vulos
6 *trampoliinna
6 *oktage
6 *Fáhkka
5 *vuoktaráidalasa
==> dev/Vest.txt <==
10 *vuot
9 *čáppa
9 *finai
7 *vehá
7 *moadde
7 *luhtte
6 *áidna
6 *aiddo
5 *vilppastii
5 *ruoktot
5 *guovllos (ii leat smeFST:s, = guovllus)
5 *Hemmo-guoktá
4 *čoakkalmasaide
4 *váccii
4 *velohallat
4 *rehkenasttii
4 *máhcai
4 *moanaid
4 *láhttestii
4 *hoahkalii
==> historia <==
18 *goittot
9 *OKr
7 *fierbmi
6 *hervejuvvon
6 *fierpmi
5 *ártegis
5 *vuođul
5 *valjis
5 *ruhkuid
5 *gávnnus
5 *gávdnosis
5 *goas
5 *Fierbmi
4 *čuohte
4 *váinniid
4 *vearjjut
4 *sihkkarit
4 *seilon
4 *ruhkku
4 *lagabui
==> filosofiija <==
8 *smiehttat
7 *olmmošlaš
7 *heive
6 *morála
5 *Váldooassi
4 *ságastii
4 *boastut
3 *áinnas
3 *ságastit
3 *ságasteapmi
3 *ságasteami
3 *sorjavaš
3 *rasisttalaš
3 *rahčet
3 *oskkoldagaid
3 *máilmmálaččat
3 *jápmán
3 *gillájit
3 *bissovaš
3 *OEE
==> uno.se <==
15 *áŧestusa
14 *iešdovdu
13 *geavtit
13 *fáhkkatlaš
12 *áŧestus
12 *mot
11 *áhpeheapmin
10 *veadjá
9 *Áŧestus
9 *riska
8 *kondoma
8 *Fáhkkatlaš
7 *somá
7 *ráhkástallá
7 *ilgadis
7 *ila
7 *iešdovddu
7 *got
6 *veadjit
6 *vardá
==> tanapioner <==
7 *váccii
7 *oktage
6 *og
6 *jámii
6 *Heimen
5 *goassege
5 *ee
4 *áidna
4 *til
4 *samiske
4 *ovdaolmmoš
4 *oarbinaččas
4 *moadde
4 *med
4 *fra
4 *Duiskalaččat
3 *Čiestti
3 *ásaiduvve
3 *ánsomedáljja
3 *vázze
==> apertium-sme-smj/dev/matematihkka.txt <==
69 *Tevdne
50 *Rehkenastte
46 *sárgáid
35 *Ivdne
33 *ovttežiidda
28 *logežiidda
25 *logežiid
21 *rieggá
21 *ovttežiid
21 *logeža
19 *sárgá
18 *guoros
17 *váilot
15 *ovtteža
11 *áinnas
11 *rehkenastte
11 *kr
10 *leaskaloguid
10 *Speallu
9 *minstara
cat apertium-sme-sma.sme-sma.dix |grep '<e>'|grep -v '"np"'|tr '<' '>'|cut -d">" -f7|sort|uniq|wc -l
cat apertium-sme-smj.sme-smj.t?x|grep '^ *<rule'|wc -l
cat apertium-sme-sma.sme-sma.lrx|grep '^ *<rule'|wc -l
Sisdoallu | sme-smn | sme-sma | sme-smj |
---|---|---|---|
Bidix | 7897 | 4384 | 12208*) |
Transfer | 67 | 69 | 32 |
Lexsel | 139 | 322 | 9 |
(*) Stuorra oassi sme-smj-bidixas lea genererejuvvon