GiellaLT

GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started and our Privacy document.

View GiellaLT on GitHub

Šáŋŋertest

Mii leat jorgalan teavsttaid main lea su 6100 sáni. Dán tabealla logut muitalit man ollu leat missing-sánit. Oassi teavsttain leat čállojuvvon Norgga bealde, oassi leat čállojuvvon Suoma bealde.

Teaksta Riika sme-smn pros list sme-sma pros list sme-smj pros list
Sámediggi Norggas 124 2 % (76) 188 3 % (102) 282 5 % (138)
Dieđahus Norggas 158 3 % (109) 91 1 % (77) 211 3 % (148)
Vars Norggas 235 4 % (188) 406 7 % (300) 588 10 % (388)
Saara Norggas 245 4 % (185) 500 8 % (351) 685 11 % (449)
IMA Suomas 654 11 % (386) 1079 18 % (646) 1193 20 % (724)
Vest Suomas 379 6 % (327) 719 12 % (585) 972 16 % (734)
filosofi Norggas 263 4 % (240) 436 7 % (387) 567 7 % (476)
Historjá Suomas 442 7 % (364) 836 14 % (674) 899 16 % (720)
uno info Ruoŧas 550 9 % (383) 914 15 % (609) 960 16 % (608)
Tanapioner Norggas 263 4 % (399) 555 9 % (478) 664 10 % (539)
matematihkka Norggas 612 10 % (180) 1243 20 % (341) 1118 18 % (325)

Juohke teavstta dábáleamos missing-sánit:

sme-smn

==> dev/Sámed.txt <== 76 sáni
   5 *eanedit (eanet A)
   4 *vuoruhuvvo
   4 *hállansyntesa
   4 *eahpeoiddolaš
   3 *majoritehta
   2 *čalmmustahttit
   2 *čalmmustahttimis
   2 *áin
   2 *válljenmunni
   2 *tearpmat
   2 *rávnnjáldagat
   2 *rekrutteremiin
   2 *registreren
   2 *registrerema
   2 *registrerejuvvon
   2 *ovttaskasaid
   2 *ovttaskasa
   2 *ovttaidlogus
   2 *ovddasguvlui
   2 *oaivadit


==> dev/dieđahus.txt <==
   5 *mielddisbuktá
   4 *tearpmaid
   4 *oktiiheiveheami
   4 *mandáhta
   3 *čalmmustahttin
   3 *čalmmustahttima
   3 *nubbegiellan
   3 *mielddisbuktet
   3 *lagat
   3 *lagasbirrasis
   3 *guovttesuorat
   2 *čalmmustahttit
   2 *váste
   2 *vuoruhuvvot
   2 *tearpmat
   2 *tearbmaráhkadeapmi
   2 *sámástit
   2 *rekrutterema
   2 *oktiiheivehit
   2 *oktiiheiveheamis


==> dev/Vars.txt <==
  17 *Busi
   4 *analyseret
   3 *šluvggii
   3 *njávkkai
   3 *lulás
   3 *gaikkihii
   3 *dálle
   3 *bláđegođii
   2 *susttašii
   2 *stávet
   2 *oktovuođa
   2 *láidii
   2 *lihkastagaid
   2 *jurdilii
   2 *heahpat
   2 *fanahalai
   2 *duollet
   2 *dievá
   2 *algebra
   2 *Njáv


==> dev/Saara.txt <==
  11 *tuneallas
   6 *tunellii
   6 *tunealla
   5 *mahkáš
   4 *tunnealla
   4 *iđđedis
   4 *biffan
   3 *sihkkelastit
   3 *huošši (ii leat smeFST:s)
   3 *gillára
   3 *Hm
   2 -*Gea
   2 *čurvejin
   2 *čierru☹ (☹ ii leat smeFST:s)
   2 *very (ii leat smeFST:s)
   2 *vampyra (ii leat smeFST:s)
   2 *tuneallanjálmmis
   2 *termosa
   2 *skurdnjasat
   2 *savkkástalle


==> dev/IMA.txt <== 386 sáni
  48 *Aurelia (ii leat smeFST:s)
  47 *Čárrá (ii leat smeFST:s)
  31 *Čárá (ii leat smeFST:s)
  14 *goittot
  10 *ah’ (ii leat smeFST:s)
   7 *čárre (ii leat smeFST:s)
   6 *ču (ii leat smeFST:s)
   6 *allelii
   5 *vuoktaráidalasa
   5 *njeaigga
   5 *Gea
   4 *ruive
   4 *mohtičázi (ii leat smeFST:s)
   4 *luŋka
   4 *biškkanas
   4 *Ráidalas
   4 *Máttaráhkká
   4 *Biškkanas
   3 *Čárás
   3 *váiddui


==> dev/Vest.txt <==
   5 *guovllos (ii leat smeFST:s, = guovllus)
   4 *čoakkalmasaide
   4 *moanaid
   4 *gávastalai
   3 *čoakkalmasat
   3 *oktovuođa
   3 *margarin (ii leat smeFST:s)
   3 *luoddanit
   3 *goittot
   3 *gitára
   3 *geasehii
   2 *čájetmat (ii leat smeFST:s)
   2 *čoakkalmasain
   2 *čivttii
   2 *stovus (ii leat smeFST:s)
   2 *sreaŋggaid
   2 *sorrás (ii leat smeFST:s)
   2 *rásken
   2 *rándahis
   2 *ruvtto


==> historia <==
  18 *goittot
   9 *OKr
   6 *ladni
   5 *gávnnus
   5 *gávdnosis
   4 *čuohte
   4 *váinniid
   4 *omiid
   4 *cm
   4 *bázahusat
   4 *Ammal
   3 *saddjon
   3 *oaivámučča
   3 *gurat
   3 *goardagis
   3 *davásguvlui
   3 *bázahusaid
   2 *čorpmamahtosaš
   2 *čehpet
   2 *Ötzi


==> filosofiija <==
   8 *guottuid
   6 *morála
   3 *ekologalaš
   3 *OEE
   3 *Antirasisttalaš
   2 *áiccut
   2 *sekuleara
   2 *oktagaslaš
   2 *norbma
   2 *lihkulašvuođadovddu
   2 *filosofat
   2 *etnisitehta
   2 *Parmenides
   2 *ML06S?
   2 *ML06S
   1 *šáŋŋer
   1 *čuozahussátni
   1 *čuozahussániin
   1 *čuoldit
   1 *čanastagat


==> uno.se <==
  16 *p-pillara
  13 *geavtit
  13 *fáhkkatlaš
   8 *kondoma
   8 *Fáhkkatlaš
   7 *anašeami
   6 *vardá
   6 *p-pillar
   6 *ovttaskasas
   6 *ovttaskasa
   6 *nala
   6 *Kondoma
   5 *leaboheapmin
   5 *cummástallá
   5 *apotehkas
   4 *ng
   4 *losesmielas
   4 *gárremiin
   4 *geavtá
   4 *geardu


==> Tanapioner <==
   8 *internáhta
   6 *og
   6 *Heimen
   4 *til
   4 *samiske
   4 *oarbinaččas
   4 *med
   4 *internáhtas
   4 *fra
   3 *Čiestti
   3 *ánsomedáljja
   3 *skuvlastivrrárin
   3 *lulás
   3 *for
   3 *evakuerejuvvui
   3 *eksámena
   3 *b
   3 *Soffa
   3 *Ravne
   3 *Lile


==> apertium-sme-smn/dev/matematihkka.txt <== 180 sáni
  32 *govvosiid
  28 *logežiidda
  25 *ruvttu
  25 *logežiid
  21 *ruvttuid
  21 *rieggá
  21 *logeža
  19 *govvosa
  18 *ruvttuide
  16 *lohkolinnjái
  12 *ruvttus
  11 *kr
  11 *govvosis
   8 *guovttesiffar
   8 *govvosii
   7 *symmetralaččat
   7 *speadjalaston
   6 *sirkeliidda
   6 *sirkeliid
   6 *sihkoniin


sme-sma

==> dev/Sámed.txt <==
   9 *geatnegahttojuvvon
   5 *eanedit (eanet A)
   4 *ulbmillaš
   4 *máhtolašvuohta
   4 *muddui
   4 *hállansyntesa
   4 *gielddalaš
   4 *eahpeoiddolaš
   4 *deattasta
   4 *dakko
   3 *ulbmilolahusa
   3 *makkárge
   3 *majoritehta
   3 *eanemus
   2 *áin
   2 *Ággan
   2 *váttásmahttá
   2 *válljenmunni
   2 *váldesuorggis
   2 *ulbmileamos


==> dev/dieđahus.txt <==
   3 *čovdosat
   3 *makkárge
   3 *guovttesuorat
   2 *čavga
   2 *gustovaš
   2 *govttolaš
   2 *giellalávgun
   2 *dárkilis
   2 *bálvalusfálu
   2 *buoremuddui
   2 *beaktilis
   1 *čovdosiid
   1 *čiekŋudit
   1 *árvvolaš
   1 *válljejupmin
   1 *válljejupmi
   1 *válljejumiid
   1 *vuođđoelemeanttain
   1 *vuolláičállán
   1 *vuollelis


==> dev/Vars.txt <==
  12 *Na
  10 *gillen
   7 *šuohkehii
   6 *gille
   5 *Vuoi
   4 *litna
   4 *jávohaga
   4 *dievva
   4 *diekkár
   3 *šluvggii
   3 *suoli
   3 *njávkkai
   3 *láiki
   3 *lulás
   3 *jur
   3 *juohkelágan
   3 *jitnosit
   3 *gaikkihii
   3 *feara
   3 *dakkaviđe


==> dev/Saara.txt <==
  17 *han
  11 *tuneallas
  10 *sihkkela
   7 *Mánnodaga
   6 *tunellii
   6 *tunealla
   6 *bat
   5 *mahkáš
   5 *feara
   4 *váivvida
   4 *tunnealla
   4 *ribahin
   4 *iđđedis
   4 *fáhkka
   4 *biffan
   4 *Buoska
   3 *vulos
   3 *ulda
   3 *njávgá
   3 *huošši (ii leat smeFST:s)


==> dev/IMA.txt <==
  48 *Aurelia (ii leat smeFST:s)
  47 *Čárrá (ii leat smeFST:s)
  31 *Čárá (ii leat smeFST:s)
  23 *Na
  15 *jo
  14 *goittot
  10 *ah’ (ii leat smeFST:s)
   9 *Viimmat
   8 *čáhcerávgga
   8 *illá
   7 *čárre (ii leat smeFST:s)
   7 *masá
   6 *ču (ii leat smeFST:s)
   6 *Čirre
   6 *vulos
   6 *trampoliinna
   6 *allelii
   6 *Fáhkka
   5 *Gea
   4 *čáhcerávga


==> dev/Vest.txt <==
 10 *vuot
  10 *Na
   7 *vehá
   5 *vilppastii
   5 *guovllos (ii leat smeFST:s, = guovllus)
   4 *čoakkalmasaide
   4 *čoahkis
   4 *velohallat
   4 *hoahkalii
   4 *gámmárii
   4 *gaskkohagaid
   3 *čoakkalmasat
   3 *olus
   3 *oktovuođa
   3 *maŋit
   3 *margarin (ii leat smeFST:s)
   3 *jámma
   3 *gámmáris
   3 *goittot
   3 *geasehii


==> historia <==
  18 *goittot
   9 *OKr
   8 *áigásaš
   7 *duhát
   7 *dolin
   6 *ladni
   5 *valjis
   5 *ruhkuid
   5 *duháhiid
   4 *čuohte
   4 *váinniid
   4 *suopmelaččat
   4 *ruhkku
   4 *hárvenaš
   4 *guhku
   4 *dávttis
   4 *duohkai
   4 *cm
   4 *bronsaáiggi
   4 *arkeologa


==> filosofiija <==
   8 *guottuid
   6 *morála
   5 *filosofalaš
   3 *áinnas
   3 *sorjavaš
   3 *rasisttalaš
   3 *máilmmálaččat
   3 *fámolaš
   3 *ekologalaš
   3 *OEE
   3 *Filosofalaš
   3 *Antirasisttalaš
   2 *áššáskuhttui
   2 *álgoálbmotnuoraid
   2 *áiccut
   2 *vuoluštit
   2 *vuoiŋŋalaš
   2 *servodatlaš
   2 *sekuleara
   2 *seksuála


==> uno.se <==
  16 *p-pillara
  15 *áŧestusa
  14 *iešdovdu
  13 *geavtit
  13 *fáhkkatlaš
  12 *áŧestus
   9 *Áŧestus
   9 *riska
   8 *ládje
   8 *kondoma
   8 *Fáhkkatlaš
   7 *ila
   7 *iešdovddu
   7 *got
   7 *anašeami
   7 *alkohola
   6 *p-pillar
   6 *ovttaskasas
   6 *ovttaskasa
   6 *Kondoma


==> tanapioner <==
   6 *og
   6 *Heimen
   5 *ee
   4 *til
   4 *samiske
   4 *oarbinaččas
   4 *med
   4 *fra
   4 *eatnasat
   3 *Čiestti
   3 *ánsomedáljja
   3 *skuvlastivrrárin
   3 *sadjásaš
   3 *lulás
   3 *goappašagat
   3 *for
   3 *evakuerejuvvui
   3 *Soffa
   3 *Ravne
   3 *Lile


==> apertium-sme-sma/dev/matematihkka.txt <==
  69 *Tevdne
  38 *supmi
  35 *lohkolinjjás
  33 *ovttežiidda
  32 *govvosiid
  28 *logežiidda
  25 *ruvttu
  25 *logežiid
  24 *oktiibuot
  21 *ruvttuid
  21 *ovttežiid
  21 *logeža
  21 *kruvnna
  19 *govvosa
  18 *ruvttuide
  16 *lohkolinnjái
  15 *ovtteža
  14 *goappáge
  12 *ruvttus
  12 *rehketbihtá


sme-smj

==> dev/Sámed.txt <==
 12 *vuođul
   9 *geatnegahttojuvvon
   9 *fuones
   8 *váilot
   6 *olmmošlaš
   5 *stivret
   4 *váilevašvuohta
   4 *vealtameahttun
   4 *oktage
   4 *máinnašuvvo
   4 *hállansyntesa
   4 *gáhttemii
   4 *eahpeoiddolaš
   4 *deattasta
   4 *dakko
   3 *ulbmilolahusa
   3 *ođđaáigásaš
   3 *ollašuhttit
   3 *gosa
   3 *einnostan


==> dev/dieđahus.txt <==
  7 *váilot
   6 *rávisolbmuide
   5 *lihkostuvvan
   4 *rávisolbmot
   4 *oktiiheiveheami
   4 *návccat
   4 *hálddašanmodealla
   4 *hábmet
   4 *dovdomassii
   3 *vuođul
   3 *stivret
   3 *olmmošlaš
   3 *guovttesuorat
   3 *einnostahtti
   2 *váste
   2 *seailut
   2 *ovttastahttit
   2 *ovttagielat
   2 *oktiiheivehit
   2 *oktiiheiveheamis


==> dev/Vars.txt <==
  11 *oktage
  10 *goassege
   9 *čáppa
   7 *ártegis
   7 *ruoktot
   7 *oba
   7 *dal
   6 *folkefiende  (ii leat smeFST:s)
   6 *Stockmann
   6 *En
   5 *rukses
   5 *málet
   5 *measta
   5 *ges
   5 *fitnat
   5 *deike
   4 *álás
   4 *váccii
   4 *sihkkarit
   4 *oanehaš


==> dev/Saara.txt <==
  17 *han
  12 *goit
  12 *deike
  11 *aiddo
  10 *ges
   9 *luhtte
   8 *measta
   7 *ruoktot
   7 *rukses
   7 *issoras
   6 *fitnat
   6 *bat
   5 *ártet
   5 *smiehttan
   5 *mahkáš
   5 *goassige
   5 *fitnan
   5 *Sotnabeaivve
   4 *speadjalis
   4 *oktage


==> dev/IMA.txt <==
  48 *Aurelia  (ii leat smeFST:s)
  47 *Čárrá  (ii leat smeFST:s)
  31 *Čárá  (ii leat smeFST:s)
  15 *jo
  14 *goittot
  10 *ah’  (ii leat smeFST:s)
   9 *goassige
   9 *Viimmat
   8 *illá
   7 *čárre  (ii leat smeFST:s)
   7 *masá
   7 *dal
   6 *ču  (ii leat smeFST:s)
   6 *čoavjjis
   6 *Čirre
   6 *vulos
   6 *trampoliinna
   6 *oktage
   6 *Fáhkka
   5 *vuoktaráidalasa


==> dev/Vest.txt <==
  10 *vuot
   9 *čáppa
   9 *finai
   7 *vehá
   7 *moadde
   7 *luhtte
   6 *áidna
   6 *aiddo
   5 *vilppastii
   5 *ruoktot
   5 *guovllos (ii leat smeFST:s, = guovllus)
   5 *Hemmo-guoktá
   4 *čoakkalmasaide
   4 *váccii
   4 *velohallat
   4 *rehkenasttii
   4 *máhcai
   4 *moanaid
   4 *láhttestii
   4 *hoahkalii


==> historia <==
  18 *goittot
   9 *OKr
   7 *fierbmi
   6 *hervejuvvon
   6 *fierpmi
   5 *ártegis
   5 *vuođul
   5 *valjis
   5 *ruhkuid
   5 *gávnnus
   5 *gávdnosis
   5 *goas
   5 *Fierbmi
   4 *čuohte
   4 *váinniid
   4 *vearjjut
   4 *sihkkarit
   4 *seilon
   4 *ruhkku
   4 *lagabui


==> filosofiija <==
   8 *smiehttat
   7 *olmmošlaš
   7 *heive
   6 *morála
   5 *Váldooassi
   4 *ságastii
   4 *boastut
   3 *áinnas
   3 *ságastit
   3 *ságasteapmi
   3 *ságasteami
   3 *sorjavaš
   3 *rasisttalaš
   3 *rahčet
   3 *oskkoldagaid
   3 *máilmmálaččat
   3 *jápmán
   3 *gillájit
   3 *bissovaš
   3 *OEE


==> uno.se <==
  15 *áŧestusa
  14 *iešdovdu
  13 *geavtit
  13 *fáhkkatlaš
  12 *áŧestus
  12 *mot
  11 *áhpeheapmin
  10 *veadjá
   9 *Áŧestus
   9 *riska
   8 *kondoma
   8 *Fáhkkatlaš
   7 *somá
   7 *ráhkástallá
   7 *ilgadis
   7 *ila
   7 *iešdovddu
   7 *got
   6 *veadjit
   6 *vardá


==> tanapioner <==
   7 *váccii
   7 *oktage
   6 *og
   6 *jámii
   6 *Heimen
   5 *goassege
   5 *ee
   4 *áidna
   4 *til
   4 *samiske
   4 *ovdaolmmoš
   4 *oarbinaččas
   4 *moadde
   4 *med
   4 *fra
   4 *Duiskalaččat
   3 *Čiestti
   3 *ásaiduvve
   3 *ánsomedáljja
   3 *vázze


==> apertium-sme-smj/dev/matematihkka.txt <==
  69 *Tevdne
  50 *Rehkenastte
  46 *sárgáid
  35 *Ivdne
  33 *ovttežiidda
  28 *logežiidda
  25 *logežiid
  21 *rieggá
  21 *ovttežiid
  21 *logeža
  19 *sárgá
  18 *guoros
  17 *váilot
  15 *ovtteža
  11 *áinnas
  11 *rehkenastte
  11 *kr
  10 *leaskaloguid
  10 *Speallu
   9 *minstara


Jorgalanprográmmaid status

cat apertium-sme-sma.sme-sma.dix |grep '<e>'|grep -v '"np"'|tr '<' '>'|cut -d">" -f7|sort|uniq|wc -l
cat apertium-sme-smj.sme-smj.t?x|grep '^ *<rule'|wc -l
cat apertium-sme-sma.sme-sma.lrx|grep '^ *<rule'|wc -l
Sisdoallu sme-smn sme-sma sme-smj
Bidix 7897 4384 12208*)
 Transfer 67 69 32
 Lexsel 139 322 9

(*) Stuorra oassi sme-smj-bidixas lea genererejuvvon