Finite state and Constraint Grammar based analysers, proofing tools and other resources
View the project on GitHub giellalt/lang-kal
All doc-comment documentation in one large file.
This (part of) documentation was generated from src/cg3/dependency.cg3
Sem/Hunt = qinerlerpoq i modsætning til qinersivoq
The following tags: BOS, EOS, CLB, Symbol, iSymbol, PUNCT, LEFT, RIGHT, COMMONAFFSTRING, EXCLMARK
Gram/… and different specifications
Sg, Du, Pl, iSg, iDu, iPl, ALL_Sg, ALL_Pl, case forms, verbal inflection
LIST IP = IP (“IP”) ; =
LIST Dobbelttransitiv = NIRAR QQU SURE TIP ; =
SET POS = WORD - (
SET NOT-PROP = WORD - Prop ;
SET NOT-Abbr = WORD - Gram/Abbr ;
SET NUM = Num | iNum ; |
LIST NUMERAL = “ataaseq” “marluk” “pingasut” “sisamat” “tallimat” “arfineq” “arfineq marluk” “arfineq pingasut” “qulingiluat” “qulaaluat” “qulit” “aqqaneq” “fireogfyrre”;
LIST KLOKKESLET = (“ataaseq” NNGUR) (“marluk” NNGUR) (“pingasut” NNGUR) (“sisamat” NNGUR) (“tallimat” NNGUR) (“arfineq” NNGUR) (“arfineq-marluk” NNGUR) (“arfineq-pingasut” NNGUR) (“qulingiluat” NNGUR) (“qulaaluat” NNGUR) (“qulit” NNGUR) (“aqqaneq” NNGUR);
Ulike verbtyper.
TRANSVERB = 1SgO, 2SgO, 3SgO, 4SgO, 1PlO, 2PlO, 3PlO, 4PlO
**SET DOTR = Gram/Db | (/Gram/TV QQU/l) | (/Gram/TV TIP/l) | (/Gram/TV SAR/l) | (“ussersuup”) | (/Gram/TV UTE Gram/vv/l) ;** = |
*SET GAANNI = (/”<.[g | k | r]aanni.>”/r) + Par + 3Sg + 3SgO OR (/”<.[g | k | r]aanni.>”/r) + Par + 3Sg + 3PlO OR (/”<.[g | k | r]aanni.>”/r) + Par + 4Sg OR (/”<.[g | k | r]aanni.*>”/r) + Par + 3Sg ;** =#20180805: intransitiv GAANNI bliver 3Sg og ikke 4Sg som hidtil. |
SET MOOD = VFIN OR CONT OR Cau OR IteCau OR Con OR Par ; =
Set for kasus, possessum, appellativ, ulike nomentyper
SET ALL_OBLIQUE = OBLIQUE OR iOBLIQUE ; =
**SET POSSESSUM12 = (N 1SgPoss) OR (N 2SgPoss) OR (iN i1SgPoss) OR (iN i2SgPoss) | (N 1PlPoss) OR (N 2PlPoss) OR (iN i1PlPoss) OR (iN i2PlPoss) ;** = |
SET NOT-POSSESSUM = N - POSSESSUM ; =
SET iPOSSESSUM12 = (iN i1SgPoss) OR (iN i2SgPoss) OR (iN i1PlPoss) OR (iN i2PlPoss) OR (Hyb/1-2 1SgPoss) OR (Hyb/1-2 2SgPoss) OR (Hyb/1-2 1PlPoss) OR (Hyb/1-2 2PlPoss) ; =
SET iPOSSESSUM = iPOSSESSUM12 OR iPOSSESSUM3 OR iPOSSESSUM4 ; =
SET APPELLATIV = N - Prop ; =
SET PRON-REFL = Gram/Dem + Pron OR Gram/Int + Pron OR Gram/Indef + Pron OR DivPron OR Gram/Pers + Pron OR Adj ; = Gram/Coref + Pron har sine egne regler
LIST LIK_QAR = LIK QAR (“peqar”); =
SET NOMEN = N OR iN ; =
LIST ADVERBIAL_DERIVATIVES = (/VALLAAQ Der/vn N/l) ; =
SET IV_SUBJ& = IV1Sg OR IV2Sg OR IV3Sg OR IV4Sg OR IV1Pl OR IV2Pl OR IV3Pl OR IV4Pl; =
SET IV_PL_SUBJ& = IV1Pl OR IV2Pl OR IV3Pl OR IV4Pl;
LIST NUM34POSSPl = (Rel Num) (3PlPoss) ;
Objekts-set introduceret 20170416 - virkede ikke
Unification set til SUBJ med tilhørende TRANSVERB. Reformulering med objekter påbegyndt 20190519
SUBJTRANSVERB er alle ovenfor
LIST KOMPARATIV = NIRU (/”qanip” Gram/IV NIQ/l) (/NIQ Der/vn RUJUK Der/nn SUAQ Der/nn U/l) (/”amerla” Gram/IV NIQ Der/vn N/l);
LIST AGENS_NOUN = (“katersugaq”) ;
**SET IVTVSUBJ& = IV_SUBJ& | SUBJTRANSVERB& ;** |
Unification set til CONT og subjekter, kun for intransitive CONT.
Unification set til CONT og kongruente V ved intransitive V
!!! Partikler
Gram/… and different specifications
Judithes afsnit start ### påbegyndt 20231006: sorter umulige morfemkombinationer fra
GASAAR
#GIP #GISSAAR #IAR #IRNIAR #IRSIR #IRUTE #KIP #KILLI #LIR #LIRSUR #LUP #NIP #QAR
#IRNIAR #SI
#LIAR
This (part of) documentation was generated from src/cg3/disambiguator.cg3
W E S T G R E E N L A N D I C S Y N T A C T I C F U N C T I O N S
Ny indholdsfortegnelse påbegyndt 20201015
Begyndende udkommentering af REMOVE og SELECT, der kun skal stå i disambiguator. Vil blive udkommenteret med ‘#DATO’ fx ‘#20210704’. Færdiggjort 20230726. Begyndende sletning hvor REMOVE og SELECT står med #
Delimiter
This (part of) documentation was generated from src/cg3/functions.cg3
LEXICON ZseqZ qalaseq
LEXICON Num1morf nyt katalog tilføjet livm 20170505
LEXICON Num2morf
LEXICON Num3morf nyt katalog livm 20170505
LEXICON Num4morf nyt katalog livm 20170505
LEXICON Num6morf nyt katalog livm 20170505
LEXICON Num6likmorf nyt katalog livm 20170505
LEXICON Num10morf nyt katalog livm 20170505
LEXICON Numamorf nyt katalog livm 20170810
LEXICON Numumorf nyt katalog til hunnoruju som før fejlagtigt gik i pluralisformen til Numtmorf PL20200421
LEXICON Numimorf nyt katalog livm 20170810
LEXICON Numemorf nyt katalog livm 20170810: danske numeralier tre, fire, otte, ellee, tyve, tredive, fyrre, hundrede
LEXICON NumCmorf nyt katalog livm 20170917
LEXICON Numtmorf foorut
LEXICON IVschwa_stem angeqi
LEXICON IVschwa Derivativer der tilfoejes intransitive verber på schwa
LEXICON IVschwa2 Derivativer der tilfoejes intransitive verber på schwa
LEXICON IV_r_stem aallar, oqar
LEXICON IV_r
LEXICON IV_r_agentiv PL 20180726 type atuarpoq
LEXICON IV_r2
Uku qanoq IV-mod_C-imi ilanngunneqassappat?
LEXICON IV_k_stem
LEXICON IV_k_agentiv PL 20210111 type allappoq
LEXICON IV_k
LEXICON IV_k2
LEXICON IV_long_stem orraajusaar, orseruloor, paamaar
LEXICON IV_long
LEXICON IV_long2
LEXICON IV_voq_stem overgenererer dette for meget? Og er k også mulig? Qasoq
LEXICON IV_voq
LEXICON IV_voq_agentiv PL 20180726 type takuvoq
LEXICON IV_voq2 skal få 200 medl.
LEXICON XIi_voqXmorf_stem som tallivoq
LEXICON XIi_voqXmorf
LEXICON XIi_voqX_agentiv PL20210225 type utaqqivoq - jf. XIi_voqXmorf_stem for non-agentive
LEXICON XIi_voqXmorf2
LEXICON XIiXmorf_stem type tarrarippoq
LEXICON XIiXmorf
LEXICON XIiXmorf2 skal få 200 medl.
LEXICON XIiXmorf_UdenTIP som XIiXmorf, men uden TIP for at blokere rekursive TIP
LEXICON XIirXmorf_stem type taseqqerpoq
LEXICON XIirXmorf til iR såsom er
LEXICON XIirXmorf2 til iR såsom er
LEXICON XItX type imaappoq, kaavippoq (NB ikke kâvigpoĸ, men kâvípoĸ)
LEXICON XItX2
LEXICON XIitX_stem type katerippoq og alt på TIP
LEXICON XIitX
LEXICON XIitX2
LEXICON XIuteXmorf skal få 200 medl. type angumeqquppoq
LEXICON XIuteXmorf2 skal få 200 medl.
LEXICON XIi_uteXmorf som oqallipput
LEXICON XIi_uteXmorf2 som oqallipput
LEXICON XItsXmorf_stem type ippajaappoq
LEXICON XItsXmorf
LEXICON XItsXmorf2
PL 20180718. Følgende er et særligt lexicon til ip i stedet for tidligere LEXICON IV_k_stem med default flex-iv, der producerede enorm overgenerering. Samtidig er transitiv ip flyttet fra TV til flex-tv, men der skal nok tilføjes enkelte transitive ip som upper-under efterhånden som de dokumenteres.
LEXICON TV Forudsættes tagget via HTR
LEXICON TV_UdenTIP Forudsættes tagget via HTR
LEXICON TV_vaa Forudsættes tagget via HTR
LEXICON XTuteXmorf type oqalungusiuppaa. Forudsættes tagget via HTR
LEXICON XTiuteXmorf type annippaa, pitsippaa Forudsættes tagget via HTR
LEXICON XTirXmorf til stammer med ir
LEXICON TVi_vaa tuni forudsættes Gram-tagget via HTR
LEXICON TVschwa Forudsættes Gram-tagget via HTR
LEXICON XTtX nakappaa nunguppaa anippaa Forudsætter Gram-tag fra HTR
LEXICON flex-iv
LEXICON flex-iv2
LEXICON flex-iv_r
LEXICON flex-iv_r2
LEXICON flex-iv_long
LEXICON flex-iv_long2
LEXICON flex-iv_voq
LEXICON flex-iv_voq2
LEXICON pi_flex-iv_refl Et særligt lex til pivaa + Refl for at begrænse overgenerering. Udkommenteringer må fjernes efterhånden som formerne faktisk dokumenteres
LEXICON pi_flex-iv_voq et saerligt lexicon til dummy-pi, som ikke får derivationer
LEXICON pi_flex-iv_voq3 et saerligt lexicon til dummy-pi, som ikke får derivationer
LEXICON su_flex-iv_voq et saerligt lexicon til dummy-su, som ikke får derivationer
LEXICON su_flex-iv_voq3 et saerligt lexicon til dummy-su, som ikke får derivationer
LEXICON XIiX
LEXICON XIiX2
LEXICON XIiPX
LEXICON XIiPX2
LEXICON XIiPX3
LEXICON XIiX_fleksiver
LEXICON XIiX_fleksiver2
LEXICON XIiX_fleksiver3
LEXICON XIiPX_fleksiver
LEXICON XIiPX_fleksiver3
LEXICON XItsX
LEXICON XItsX2
LEXICON XItsX3
LEXICON gallar-iv
LEXICON gallar-iv2
LEXICON gallar-iv3
LEXICON flex-iv_ssa
LEXICON flex-iv_ssa2
LEXICON flex-iv_qina
LEXICON flex-iv_qina2 nyt liv 20170428. Kan ikke viderederiveres og kan danne sammentrukne former.
LEXICON flex-iv_nngit_stem
LEXICON flex-iv_nngit_k
LEXICON flex-iv_nngit
LEXICON flex-iv_nngit2
LEXICON flex-iv_schwa
LEXICON flex-iv_schwa2
LEXICON XIgujoqX
LEXICON XIgujoqX3
LEXICON XImioqX narratologisk stil som i nikutsinnguarsinnarmioq
LEXICON XImioqX2 narratologisk stil som i nikutsinnguarsinnarmioq
LEXICON flex-iv_ledsagemaade
LEXICON flex-iv_ledsagemaade2
LEXICON flex-tv
LEXICON flex-tv_ute !pga. titartaaTInnga
LEXICON flex-itv !!Ny gennemgang 20200106 til assibilerende refl. som ikioqqoreersut
LEXICON flex-tv2
LEXICON flex-tv_NIQAR=TUSSANNGUR PL20250121 LEX udelukkende til transitiv TUSSANNGUR efter passiv. Forekommer kun i Cont
LEXICON flex-tv2_ute
LEXICON flex-tv_NIQ_AJUR !PL20230706 kopi af flex-tv2 men uden derivativer
LEXICON flex-tv_fleksiver
LEXICON flex-tv_fleksiver2 NY 20100227. Til verber, der ikke maa viderederiveres (fx +NIR+Der/vv)
LEXICON flex-tvP_fleksiver
LEXICON flex-tvP_fleksiver2 NY 20170510. Til verber, der ikke maa viderederiveres (fx +NIR+Der/vv)
LEXICON flex-tv_it
LEXICON flex-tv_it2
LEXICON gallar-tv
LEXICON gallar-tv2
LEXICON gallar-tvP
LEXICON gallar-tvP2 tilføjet 20170526. Er det overflødigt?
LEXICON pi_flex-tv_vaa
LEXICON pi_flex-tv_vaa2 fleksiver helt uden derivativer specielt til pi-
LEXICON flex-tv_KunCont fleksiver helt uden derivativer specielt til TASSAA=GUNNAIR
LEXICON su_flex-tv_vaa
LEXICON su_flex-tv_vaa2 fleksiver helt uden derivativer specielt til pi-
LEXICON flex-tv_vaa
LEXICON flex-tv_vaa2
LEXICON flex-tv_ssa !pl20210729 nyt LEX for at tillade -ssua- isf. -ssava-
LEXICON flex-tv_ssa2
LEXICON flex-tvP_vaa
LEXICON flex-tvP_vaa2
LEXICON XTPX
LEXICON XTPX2
LEXICON XTuteX
LEXICON XTuteX2
LEXICON XTutePX
LEXICON XTutePX2
LEXICON flex-tv_nngit
LEXICON flex-tv_nngit2
LEXICON flex-tv_schwa
LEXICON flex-tv_schwa2
LEXICON XTPX_nngit
LEXICON XTPX_nngit2
LEXICON XTPX_schwa
LEXICON XTPX_schwa2
Et særligt leksikon til tilhæng som RIANNGUAR+Der/vv
LEXICON XTgujaaX
LEXICON XTgujaaX2
LEXICON tp_uden_derivativer
| —
| —
| —
| —
LEXICON tp obs 20200623: fleksionsmorfemgrænse er %< og ikke %>
LEXICON tpV obs 20200623: fleksionsmorfemgrænse er %< og ikke %> | —
| — | — | — | —
| — | — | — | —
LEXICON Z1+tZ !PL20210519 retableret og stammer fjernet fra GEMS
LEXICON tp_possessum3 Til “stammer” som inuup-normu
LEXICON nuliaq
| —
| —
| —
| —
LEXICON tp_speciel specialitet for at haandtere diatese ved NIQ=SSAQ | — | — | — | —
LEXICON Z1eZ
| —
LEXICON Z1tipeZ
LEXICON Z1nnguaqZ
| —
LEXICON Z1nnguaqSZ
| —
LEXICON tpP
LEXICON tip kuulti | — | — | —
LEXICON tiqp qimmeq | — | — | —
LEXICON tpt
LEXICON tptP
LEXICON Z1iZ taggit
LEXICON ZsikZ 170306 til ikusik og kiasik
LEXICON ZsukZ 170306 til pukusuk
LEXICON Z1+le_UdenPossessumZ
LEXICON tup-uuk nuuk, kuuk
| —
| —
| —
| —
| —
| —
| —
| —
| —
LEXICON tup-
| —
| —
| —
| —
| —
| —
| —
| —
LEXICON aak_infl !PL20250116 nyt LEX specielt til ‘aak’. Bør gennemgås og renses for umuligheder herunder alle pluralis-bøjninger
LEXICON tup-2
| —
| —
| —
| —
| —
| —
| —
| —
| —
LEXICON GIIT
| —
| —
| —
| —
| —
| —
| —
| —
LEXICON Z2aqZ
| —
LEXICON UGALUAQ
LEXICON GEGALUAQ
| —
LEXICON Z2+lZ
LEXICON tup
| —
| —
| —
| —
| —
| —
| —
| —
LEXICON tup_speciel Kun til brug for NIQ som passiv ved transitive stammer | — | — | — | — | — | — | — | —
LEXICON tup_k
| —
| —
| —
| —
| —
| —
| —
| —
| —
| —
| —
| —
| —
| —
| —
| —
| —
LEXICON tup_k_reduceret nalik
| — | —
LEXICON Z2+rZ
| —
| —
| —
| —
| —
| —
| —
| —
LEXICON Z2veqZ iliveq:ili
LEXICON Z2i2Z aleq, ateq
LEXICON Z2tupeqZ tupeq
LEXICON Zappellativ_possessumZ ulloqeqqa
LEXICON LokVb
LEXICON LokAeq
LEXICON TrmVb
LEXICON AblVb
LEXICON InsVb
LEXICON AeqVb
LEXICON ViaVb
LEXICON PronViaVb
LEXICON part
LEXICON timepart nyt leksikon til tidspartiker, der kan viderederiveres (ullumiummat)
LEXICON oqq
LEXICON oqq_q imaattoq
LEXICON conj
LEXICON adv_m
LEXICON adv
LEXICON K_VOK nyt leksion til enklitisk ARAQ og NNGUAQ efter verbal fleksion -vakkit
LEXICON K_TUQ nyt leksion til enklitisk TUQ for at undgå overgenerering
LEXICON K_TUQ_plur nyt leksion til enklitisk TUQ for at undgå overgenerering
LEXICON Krestr
LEXICON K
LEXICON restricted_indholds-K = klitika som kun bruges til pronomen, proprium og partikel.
LEXICON indholds-K 20170601 livm tilføjet = mellem morfemer
LEXICON K_plur 20170601 livm tilføjet = mellem morfemer
LEXICON ZoqsZ landsfoged
LEXICON ZoqseZ landslaege
LEXICON ZoqsieZ linolie
LEXICON ZkkutZ kkut og giit
LEXICON Num1
I Num2 til Num10 er flagging af NNGUR C-et pga. klokken
LEXICON Num2
LEXICON Num3
LEXICON Num4
LEXICON Num6
LEXICON Num6lik
LEXICON Num10
LEXICON Numa
LEXICON Numu PL20200421 nyt LEX til hunnoruju
LEXICON Numi
LEXICON Nume
LEXICON NumC loan numerals like fam
LEXICON Numt loan numerals ending in -t like foorut
LEXICON Num2Ord
LEXICON Num3Ord
LEXICON Num6Ord
LEXICON Num10Ord
LEXICON Naal
LEXICON Naalsuf livm 20171211 tilføjet pluralisbøjning
LEXICON web
LEXICON iGaq transitive r-stammer med i som stammevokal NY PL 20180416
LEXICON GaqP
LEXICON iGaqP transitive r-stammer med i som stammevokal NY PL 20230916
LEXICON Taq passivt nomen af transitive stammer på k
LEXICON iTaq passivt nomen af transitive stammer på k med vokal med strong i
LEXICON TaqP
LEXICON kTaq !PL20240426 Nyt LEX til k-stammer som NIRLUP med både gaq og taq
LEXICON Saq passivt nomen af transitive stammer på vokal PL revision 20180409
LEXICON iSaq passivt nomen af transitive stammer på vokal med strong i
LEXICON SaqP
LEXICON Saq_schwa gennemgangsleksikon for schwa-stammer uden derivativer
LEXICON Saq_schwaP gennemgangsleksikon for schwa-stammer uden derivativer - pluralis tantum
LEXICON uteSaqP passivt nomen af transitive stammer med UTE
LEXICON nngisaq passivt nomen af transitive stammer på NNGIT
LEXICON nngisaqP passivt nomen af transitive pluralis tantum stammer på NNGITLEXICON prae understreg
LEXICON HTR_V_SAQ_nnip 20100630 vokalstammer som asavaa med HTR på NNIP (asannippoq, takunnippoq)
LEXICON HTR_V_SAQ_si 20100630 vokalstammer som matuaa med HTR på SI (matusivoq)
LEXICON HTR_V_SAQ_i 20171022 vokalstammer som pitsaalivaa med HTR på I (pitsaaliivoq)
LEXICON HTR_V_SAQ_i_P 20171022 vokalstammer i pluralis med HTR på I (pitsaaliivoq)
LEXICON HTR_V_SAQ_ller (aavaa - aasaq - aallerpoq)
LEXICON HTR_i_SAQ_nnip 20100630 vokalstammer på i med HTR på NNIP (nerivaa - nerisaq - nerinnippoq)
LEXICON HTR_i_SAQ_si 20100630 vokalstammer på i med HTR på SI (tunivaa - tunisaq - tunisivoq)
LEXICON HTR_UTE_SSAQ_ssi 201000929 gennemgangsleksikon for ute stammer.(kingornuppaa - kingornussivoq - kingornussaq)
LEXICON HTR_UTE_SSAQ_tsi 20190309 ute-stammer på HTR=tsi som sioqquppaa
LEXICON HTR_iUTE_SSAQ_ssi 201000929 gennemgangsleksikon for fusionerede ute stammer med assibilering.(pitsippaa, annippaa). Den morfologiske usikkerhed meget generel ved disse stammer, så såvel t-stammers struktur som ute-stammers ditto medtaget
LEXICON HTR_schwa_SAQ_nnip 201000929 gennemgangsleksikon for schwa stammer.
LEXICON HTR_schwa_SAQ_nnip_P 201000929 gennemgangsleksikon for schwa stammer.
LEXICON HTR_schwa_SAQ_si gennemgangsleksikon for schwa stammer. (ilisarsivoq)
LEXICON HTR_C_TAQ_si (dvs. konsonantstammer men ikke med r (kingornuppaa - kingornussivoq - kingornutaq)
LEXICON HTR_C_TAQ_si_P 20100406 gennemgangsleksikon for pluralis tantum stammer med på ir-. (tallimakkaaqqippai - tallimakkaaqqitat - ??)
LEXICON HTR_k_TAQ_i_P 20180430 pluralis tantum stammer som kitserluppai
LEXICON HTR_r_TAQ_si (konsonantstammer med r (toqqorpaa - toqqorsivoq - toqqortaq)
LEXICON HTR_C_TAQ_nnip (malippaa –> malinnippoq)
LEXICON HTR_C_TAQ_i 20100406 gennemgangsleksikon for t-stammer og k-stammer
LEXICON HTR_C_TAQ_tsi 20101203 t-stammer som toqup med HTR på TSI (nipangersippaa - nipangersitaq - nipangersitsivoq)
LEXICON HTR_C_TAQ_tsi_P 20101203 t-stammer som toqup med HTR på TSI (nipangersippaa - nipangersitaq - nipangersitsivoq)
LEXICON HTR_iC_TAQ_i (stammer på iC)
LEXICON HTR_iC_TAQ_si 20101203 t-stammer som sullip med HTR på SI (sullippaa - sullitaq - sullissivoq)
LEXICON HTR_iC_TAQ_tsi 20101203 t-stammer som sullip med HTR på TSI (nangippaa - nangitaq - nangitsivoq)
LEXICON UDEN_HTR_r_GAQ 20180722 konsonantstammer som ilinniar uden HTR
LEXICON UDEN_HTR_r_TAQ 20190109 nassarpaa uden HTR
LEXICON UDEN_HTR_k_TAQ 20180722 konsonantstammer som sorsup uden HTR
LEXICON UDEN_HTR_C_TAQ konsonantstammer som alapernaap
LEXICON UDEN_HTR_V_SAQ vokalstammer som nakkaavaa uden HTR
LEXICON UDEN_HTR_iV_SAQ vokalstammer som nakkaavaa uden HTR
LEXICON UDEN_HTR_schwa_SAQ schwastammer som anneraa - amigaraa uden HTR
LEXICON HTR_r_GAQ_i 201000630 konsonantstammer som arsaartorpaa med HTR på I (arsaartuivoq)
LEXICON HTR_ir_GAQ_i 20161016 assibilerende konsonantstammer som aallarnerpaa med HTR i (aallarniivoq)
LEXICON HTR_r_GAQ_ller (ujarpaa - ujagaq - ujarlerpoq)
LEXICON HTR_ir_GAQ_si (qilerutaarpaa) IR
LEXICON HTR_r_GAQ_si (imaarpaa - imaarsivoq - imaagaq)
LEXICON HTR_longV_GAQ_i 20101216 særligt leksikon til lange vokaler som -oor (tusaqqoorpaa, tusaqquuivoq)
LEXICON HTR_longV_GAQ_addi 20101125 særligt leksikon til lange vokaler som -saar (naammattusaarivoq)
LEXICON HTR_longV_GAQ_si til lange vokaler som -naar (ikinaarsivoq)
LEXICON HTR_longi_GAQ_nnip 20101125 særligt leksikon til lange vokaler som -saar (arsaarinnippoq)
flex-tv ;
LEXICON HTR_k_GAQ_i til de faa stammer med fusionerende passivt nomen som atornerlugaq, atornerluppaa, atornerluivoq
LEXICON N_Loan_ACR_V = bøjelige acronymer med appellativ-betydning som en BMW, der skal have bindestreg, men ikke i før videredannelse
LEXICON N_Loan_ACR_C = bøjelige acronymer med appellativ-betydning som en SMS, der skal have bindestreg før videredannelse
LEXICON N_Loan nominal loanwords ending in consonants
LEXICON N_Loan_bindestreg låneord, der skal have bindestreg som Ph.d.
Ord som PFAS
LEXICON N_Loan_Num som bør have bindestreg omega% 3
LEXICON N_Loan_GEM_s test på ordet ‘gas’
LEXICON N_Loan_GEM nominal loanwords with geminating consonant
LEXICON N_Loan_t nominal loanwords ending in -t
LEXICON N_Loan_um nominal loanwords ending in -um
LEXICON N_Loan_morf nominal loanwords ending in vowels
LEXICON N_Loan_e nominal loanwords ending in e
LEXICON N_Loan_o nominal loanwords ending in o
LEXICON N_Loan_é café
LEXICON N_Loan_V nominal loanwords ending in a, u, y, æ, ø, å
LEXICON N_Loan_V_ObligatoriskBindestreg korte stammer som BA
LEXICON N_Loan_i nominal loanwords ending in i
LEXICON N_Loan_logi nominal loanwords ending in logi pl20201104 for at tvinge et ekstra i ind i teknologi+Imik modsat teknolog+Imik (via N_Loan_i)
LEXICON N_Loan_ie nominal loanwords ending in -ie
LEXICON N_Loan_Adj adjective loanwords
LEXICON N_Loan_Adj_e adjective loanwords
LEXICON N_Loan_Unit_e loanwords ending in -e, semantic: unit
LEXICON N_Loan_Unit loanwords ending in consonants, semantic: unit
LEXICON V_Loan verbal intransitive loanwords
LEXICON V_Loan_tr verbal transitive loanwords
Nye gennemgangsleksika specifikt for +UTE+Der/vv tilføjet 20180118 (PL)
Nye gennemgangsleksika specifikt for +UTE+Der/vv tilføjet 20180928 (PL)
Nye gennemgangsleksika specifikt for +UTE+Der/vv tilføjet 20180928 (PL)
Nye gennemgangsleksika for TAR med følgende morfemer
Gennemgangsleksikon for TAR m. fl.
Gennemgangsleksikon for TAR m. fl.
Kopi af IV-mod_C bortset fra default
Gennemgangsleksikon for TAR m. fl.
Gennemgangsleksikon for TAR m. fl. efter /i/ f.eks. GUMALLIR GUNNAIR LIR LLAQQIP PASIP QQAMMIR QQIP RIIR UMMIR VIP
Gennemgangsleksikon for TAR m. fl. efter /i/ f.eks. GUMALLIR GUNNAIR LIR LLAQQIP PASIP QQAMMIR QQIP RIIR UMMIR VIP
Gennemgangsleksikon for TAR m. fl.
Gennemgangsleksikon for TAR m. fl.
Gennemgangsleksikon for TAR m. fl. !tilføjet 20170501 !ikke til QE+Der/vv som kun kan få +NIR
Gennemgangsleksikon for TAR m. fl. !tilføjet 20170501 !ikke til QE+Der/vv som kun kan få +NIR
Gennemgangsleksikon for TAR m. fl. !tilføjet 20170501 !til QE+Der/vv som kun kan få +NIR
Gennemgangsleksikon for TAR m. fl. efter LAAR
Gennemgangsleksikon for TAR m. fl. efter NAR+Der/vv
Gennemgangsleksikon for TAR m. fl. !tilføjet 20170501
Gennemgangsleksikon for TAR m. fl.
Gennemgangsleksikon for TAR m. fl.
Gennemgangsleksikon RUJUUR+Der/vv
Gennemgangsleksikon RUJUUR+Der/vv
Gennemgangsleksikon for TAR m. fl. !tilføjet 20170501
efter GUMALLIR GUNNAIR LIR QQAMMIR RIIR UMMIR etc. !Ny default + post_-lexica PL 20180416
TIR og TITIR
Udkommenterede lexica - Flyttet til derivations-inflections.bak20200319 på Pers Mac
LEXICON Z1+qaZ !### udkommentererede gemineringsleksika, erstattet af GEMS (stop, klusil) og GEMC (kontinuant)
LEXICON Z1+qoZ
LEXICON Z1+qeZ
LEXICON ZsaqZ
LEXICON Z1+kaZ
LEXICON Z1+keZ
LEXICON Z1+koZ
LEXICON Z1+laZ
LEXICON Z1+loZ
LEXICON Z1+naZ
LEXICON Z1+noZ tilføjet livm 20170522 til nanoq med gemination af n
LEXICON Z1nujaqZ
LEXICON Z1joqZ nominer som i qajoq:qa
LEXICON Z1+ngaZ
LEXICON Z1+ngeZ iviangeq, ivianngit
LEXICON Z1+ssZ
LEXICON Z1+niuZ
LEXICON Z1+maZ
LEXICON Z1+meZ
LEXICON N_Loan_ACR_morf Derivationsmorfemer til akronymer som BMW, IT etc. som er nominale og kan bøjes
This (part of) documentation was generated from src/fst/morphology/affixes/derivations-inflections.lexc
0:^GEMS Z1Zmorf ;
LEXICON Z1eqZmorf Derivationsmorfemer til nominer på seq og leq * Z1eqZ ; … osv.
LEXICON nuliaqmorf derivationsmorfemer til typen nuliaq
LEXICON SEQgemin derivationsmorfemer til nominer
LEXICON SIKgemin derivationsmorfemer til nominer som ikusik:iku
LEXICON SUKgemin derivationsmorfemer til nominer som pukusuk:puku
LEXICON Z1+le_UdenPossessumZmorf derivationsmorfemer til nominer som kalaaleq, der ikke kan tage possessum
LEXICON Z1eZmorf derivationsmorfemer til nominer på udlydende schwa
LEXICON Z1tipeZmorf derivationsmorfemer til nominer på udlydende schwa
LEXICON Z1nnguaqZmorf derivationsmorfemer til nominer på nnguaq
LEXICON Z1iZmorf derivationsmorfemer til nominer med strong i
LEXICON Z1iqZmorf derivationsmorfemer til nominer med strong i som qimmeq
LEXICON Z1+tZmorf derivationsmorfemer til nominer som pisataq og nivaataq !PL20210519 retableret og stammer fjernet fra GEMS
LEXICON tptmorf
LEXICON ZtiZmorf taggit
LEXICON ZkkutZmorf derivativer til typen saki og sakikkut
LEXICON Z2Zmorf nominer som erneq
LEXICON Z2kZmorf nominer som eqik
LEXICON Z2veqZmorf derivationsmorfemer til aaveq-typen
LEXICON Z2i2Zmorf derivationsmorfemer til aleq, ateq
LEXICON Z2tupeqZmorf derivationsmorfemer tupeq
LEXICON Z2-Zmorf derivationsmorfemer til tup- paa K. Jf. Z2-qZmorf
LEXICON aak_morf PL20250116 kopi af Z2-Zmorf udelukkende til aak. Bør gennemgås og morfemer, der er utænkelige på ‘aak’ skal slettes !!!!
LEXICON Z2-uukZmorf derivationsmorfemer til tup- paa K. Jf. Z2-qZmorf
LEXICON Z2-qZmorf Nyt leksikon til tup- paa Q 7.9.2007 for at haandtere forskelle som ..fiksuaq vs. ..aqsuaq
LEXICON Z2-eqZmorf Nyt leksikon til tup-2, magen til Z2-qZmorf, men har andre fleksioner til tulleq og qiterleq
LEXICON Z2aqZmorf derivationsmorfemer til nominer
gennemgangskatalog for up-stammer, der kræver replaciv sandhi
LEXICON Z2+rZmorf derivationsmorfemer til nominer
LEXICON Z2-PZmorf derivationsmorfemer til tup-nominer pluralis tantum
LEXICON ZoqsZmorf2
LEXICON ZoqseZmorf
LEXICON ZoqsieZmorf
LEXICON Z1+ssZmorf derivationsmorfemer til nominer
LEXICON Z1+niuZmorf derivationsmorfemer til niu
LEXICON Z1+maZmorf derivationsmorfemer til nominer som isuma
LEXICON Z1+meZmorf derivationsmorfemer til nominer
LEXICON Z1+kaZmorf derivationsmorfemer til nominer
LEXICON Z1+keZmorf derivationsmorfemer til nominer atigeq
LEXICON Z1+koZmorf derivationsmorfemer til nominer
LEXICON ZsaqZmorf derivationsmorfemer til nominer
LEXICON Z1+qaZmorf derivationsmorfemer til nominer
LEXICON Z1+qoZmorf derivationsmorfemer til nominer
LEXICON Z1+qeZmorf derivationsmorfemer til nominer
LEXICON Z1+laZmorf derivationsmorfemer til nominer
LEXICON Z1+loZmorf derivationsmorfemer til nominer som nuloq
LEXICON Z1+naZmorf derivationsmorfemer til nominer med gemination af n
LEXICON Z1+noZmorf derivationsmorfemer til nanoq med gemination af n tilføjet 20170522
LEXICON Z1nujaqZmorf typen nujaq+Der/nn:nu
LEXICON Z1joqZmorf typen pujoq+Der/nn:pu
LEXICON Z1+ngaZmorf typen sapangaq+Der/nn:sapan
LEXICON Z1+ngeZmorf typen iviangeq+Der/nn:ivian
This (part of) documentation was generated from src/fst/morphology/affixes/noun_to_noun.lexc
** Lexicon num_C for numerusmorfologi for ord på konsonant
** Lexicon num_V for numerusmorfologi for ord på vokal
** Lexicon num_C_sub for numerusmorfologi for ord på konsonant, substandarformer
** Lexicon num_V_sub for numerusmorfologi for ord på vokal, substandarformer
** Lexicon ord_V for ordinalmorfologi for ord på vokal
** Lexicon ord_C for ordinalmorfologi for ord på konsonant
This (part of) documentation was generated from src/fst/morphology/affixes/numerals.lexc
Nyt 20210303: indsættelse af bindestreg og bindestreg+i ved proprier, der samtidig er akronymer ** Lexicon Vprop_connector DMI
** Lexicon Cprop_connector DHL
LEXICON ZxxxV steder og navne på vokal som ikke er i FST’en
LEXICON ZxxxC steder og navne på konsonant som ikke er i FST’en
Navnelexikon er i ateq-kal-lex.txt.
LEXICON Z1geoSZ-suf SUB
LEXICON Z1geoPZ Paamiut
Sisimiut+Prop+Abs+Pl
Sisimiut+Prop+Rel+Pl
Sisimiut+Prop+Trm+Pl
Sisimiut+Prop+Abl+Pl
Sisimiut+Prop+Abl+Pl
Sisimiuni: Sisimiut+Prop+Lok+Pl
LEXICON Z1geo_nnguaqPZ Kangilinnguit NY 20100319 (PL)
LEXICON Z1geo_nnguaqZ Quassunnguaq NY 20100410 (PL)
LEXICON Z1geo_tsSmorf Kangerluarsoruseq
LEXICON Z1geo+ssPZ Ilulissat
LEXICON Z1geo_oqsZ Finland
LEXICON Z1geo_oqsZ_MedPlur Langtbortistan
** Lexicon Z1geo_oqs-bestZ
LEXICON Z1geo_oqseZ Thule ** Lexicon Z1geo_oqseZ-suf
LEXICON Z2-geoSZ Ikerasaarsuk og Iqaluit
LEXICON Z2-geoSZ_TUQAQ Nuutoqaq
LEXICON Z2+lgeoSZ Nanortalik:Nanorta
LEXICON Z2-geo_uukSZ Nuuk
LEXICON Z2-geo_specielSZ Qinngorput – Qinngorpummi, Qinngorpumi
LEXICON Z2-geoqPZ Saqqarliit
LEXICON Z2-geolikPZ Kapisillit:Kapisi
LEXICON Z2geo_aqSZ Nuussuaq
** Lexicon ZcitationsformZ Et særligt lexicon til literals i citationstegn med placeholder QuotedHyphen (står i acronyms.lexc)
** Lexicon ZcitationsformZ_Num Copy of ZcitationsformZ, but yielding Num
** Lexicon Bogtitel Nyt lex til bogtitler uden citationstegn
** Lexicon Z1ateqZ_infl
** Lexicon Z1ateq_tptZ
** Lexicon Z1ateq_atZ
** Lexicon Z1ateq_gaqZ
** Lexicon Z1ateq_ngaqZ
** Lexicon Z1ateq_goqZ
** Lexicon Z1ateq_qoqZ
** Lexicon Z1ateq_taqZ
** Lexicon Z1ateq_seqZ
** Lexicon Z1ateq_leqZ
** Lexicon Z1ateq_saqZ
** Lexicon Z1ateq+qaZ
** Lexicon Z1ateq+ĸaZ
** Lexicon Zateq_tptZ Atassut
** Lexicon Z1ateqPZ
** Lexicon Z1ateqPZ-suf
** Lexicon Z2-ateqZ
** Lexicon Z2-ateqZ-suf
** Lexicon Z1ateqpropVZ
** Lexicon Z1instpropVZ
** Lexicon Z1ateqpropCZ
** Lexicon Z2ateq_niqZ
** Lexicon Z2ateq_neqZ
** Lexicon Z2suaq_ateqZ
** Lexicon Z2-ateq_specielSZ Siumut – Siumummi, Siumumi
** Lexicon Z1nnguaq_ateqZ
** Lexicon Z1nnguaq_possessumZ PL20220201 LEX til sekvensen UTE=NNGUAQ + POSSESSUM
** Lexicon Zateq_oqsZ
** Lexicon Zateq_oqsZ-suf
** Lexicon Zateq_oqsPZ PL20210224 til Kalaallit Airports o.lign. med usikker numerus. I første omgang uden derivation og personendelser
** Lexicon Zateq_iaqZ
** Lexicon Zateq_iaĸZ
** Lexicon Zateq_ioqZ
** Lexicon Zateq_naqZ
** Lexicon Zateq_noqZ
** Lexicon Zateq_meqZ
** Lexicon Z1geoSZmorf Narsaq
** Lexicon Z1geoPZmorf Paamiut og Ivittuut
** Lexicon Z1geo_nnguaqZmorf Quassunnguaq NY 20100410 (PL)
** Lexicon Z1geo_nnguaqPZmorf Kangilinnguit NY 20100319 (PL)
** Lexicon Z1geo+ssPZmorf Ilulissat
** Lexicon Z1geo_oqsZmorf Finland
** Lexicon Z1geo_oqsZmorf Finland
** Lexicon Z1geo_oqs-nbestZmorf Særlig katalog til lande i bestemt form som Spanien
** Lexicon Z1geo_oqs-tbestZmorf Særlig katalog til lande i bestemt form som Tyrkiet
** Lexicon Z1geo_oqseZmorf Thule
** Lexicon Z2-geoSZmorf Ikerasaarsuk; Korea% Kujalleq
** Lexicon Z2+lgeoSZmorf Nanortalik
** Lexicon Z2-geo_uukSZmorf un til Nuuk
** Lexicon Z2-geo_specielSZmorf til geografiske steder med fleksion såsom Qinngorput – Qinngorpummi, Qinngorpormiu
** Lexicon Z2geo_aqSZmorf Nuussuaq
** Lexicon Z2-geoqPZmorf Saqqarliit:Saqqarleq
** Lexicon Z2-geolikPZmorf Kapisillit:Kapisi
** Lexicon Z1ateqpropVZmorf
** Lexicon Z1instpropVZmorf
** Lexicon Z1ateqpropCZmorf
** Lexicon Z2-ateqZmorf
** Lexicon Z2ateq_niqZmorf
** Lexicon Z2ateq_neqZmorf
** Lexicon Z2suaq_ateqZmorf
** Lexicon Z1ateqZmorf_all
** Lexicon Z1ateq_tptZmorf
** Lexicon Z1ateq_atZmorf
** Lexicon Z1ateq_taqZmorf
** Lexicon Z1ateq_saqZmorf
** Lexicon Z1ateq_seqZmorf
** Lexicon Z1ateq_leqZmorf
** Lexicon Z1ateq_gaqZmorf
** Lexicon Z1ateq_ngaqZmorf
** Lexicon Z1ateq_goqZmorf
** Lexicon Z1ateq_qoqZmorf
** Lexicon Z1ateq+qaZmorf
** Lexicon Z1ateq+ĸaZmorf
** Lexicon Zateq_tptZmorf
** Lexicon Z1ateqPZmorf
** Lexicon Z2-ateq_specielSZmorf
** Lexicon Z1nnguaq_ateqZmorf
** Lexicon Zateq_oqsZmorf
** Lexicon Zateq_numCZmorf Ny 20191010 til proprier som DR1 og Peugeot 206. Sem/Hum fastholdt i første omgang, for DR og biler kan jo gøre noget aktivt???
** Lexicon Zateq_numVZmorf Ny 20191010 til proprier som DR2 og Peugeot 208
** Lexicon Z1ateq_iaqZmorf
** Lexicon Z1ateq_iaĸZmorf
** Lexicon Z1ateq_ioqZmorf
** Lexicon Z1ateq_naqZmorf
** Lexicon Z1ateq_noqZmorf
** Lexicon Z1ateq_meqZmorf
** Lexicon Z1geopropZ
** Lexicon Z1geopropPZ
** Lexicon Z1ateqpropZ
** Lexicon Z1ateqpropPZ De Konservative
** Lexicon Z1Fem_ateqZ Test af femininum tag med stamme på -e. Tidligere Z1ateqpropZ og Z1ateqZmorf
** Lexicon Z1Mask_ateqZ
** Lexicon Z1Mask_GrlateqZ
** Lexicon Z1Fem_tptZ
** Lexicon Z1Mask_tptZ
** Lexicon Z1Mask_atZ
** Lexicon Z1Mask_taqZ
** Lexicon Z1Fem_taqZ
** Lexicon Z1Mask_saqZ
** Lexicon Z1Mask_seqZ
** Lexicon Z1Mask_leqZ
** Lexicon Z1Fem_leqZ
** Lexicon ZMask_oqsZ
** Lexicon ZFem_oqsZ
** Lexicon Z1Fem_nnguaqZ
Test afkønsopdelte fornavne på NNGUAQ. Tidligere Z1nnguaq_ateqZmorf
** Lexicon Z1Mask_nnguaqZ
** Lexicon Z1Mask_araqZ
** Lexicon Z1Fem_araqZ
** Lexicon Z1Fem_araĸZ
** Lexicon Z1Mask_gaqZ
** Lexicon Z1Fem_ngaqZ
Tidligere Z2-ateqZmorf
Nyt lexicon 20180615 Z2suaq_ateqZmorf
LEXICON ZpossessumZ !Kalaallit% Nunaat flyttet til ZgeopossessumSZ
LEXICON ZpossessumSZ Nuup Kommunea
LEXICON ZpossessumPZ
LEXICON ZgeopossessumSZ !Kalaallit% Nunaat flyttet til ZgeopossessumPZ
LEXICON ZgeopossessumPZ Kalaallit% Nunaat
LEXICON ZPropKKUTZ kopieret fra ZkkutZ. Det meste af derivation udkommenteret, da usandsynlig ved proprier
LEXICON Z1Prop+qaZ kopieret ind fra Z1+qaZ (tp), hvis størstedel er slettet her
LEXICON Proptp
This (part of) documentation was generated from src/fst/morphology/affixes/propernouns.lexc
This (part of) documentation was generated from src/fst/morphology/affixes/symbols.lexc
Fil for at generere de centrale morfologiske processer i vor grønlandske analysator
anatomical. Adskiller qiteq+Sem/an+3SgPoss = qitia fra qiteq+3SgPoss = qeqqa
That is, they need special treatment in e.g. speech syntesis.
+4Du = Subject 4.person dual
Flag diacritics til pluralis tantum subjekter
Flag diacritics til verber med kun pluralis i objekterne
Test af boolsk variabel til ad hoc blokeringer
Test af boolsk variabel til ad hoc blokering af Gram/Exclm. stems sættes Off og derivation On
Off-flag sættes i verbs på transitive verber med usandsynlig Refl. On-flag på taggen Gram/Refl i gennemgangslexica
@C.Refl@
Off-flag på verber som akuaa, der ikke må lave metatese på NIQ
Nyt flag 20211214 for at forebygge *taakkuunngitsoq og *taannaanngitsut
Off-flag på nominer, der SKAL opføre sig replacive som pilersaarusiorpoq og aqqusinniorpoq
Off-flag i nouns og Off-flag i der-inf når TUR og TUGAQ ikke må assibileres og On-flag, når de skal assibileres. Også for at forebygge assibilering efter HTR på nnip
Flag specielt for at sikre additiv p-bøjning af ulloq i Trm@
Flag til forebyggelse af manglende assibilering. P sættes i stem-filerne og C i der-infl
Ad hoc til test af alternativ flag diacritics ved præfikser. Husk også den udkommenterede linie ‘Kingumoorutit ;’ i LEXICON Root
Test af P- og D-flag til forebyggelse af rekusivitet ved TIP
og blokeres af
Test 20210504 af P- og R-flag for at generere både takornariat og takornarissat+Err/Sub
Flags for loan words, which must not go to N+Abs+Sg without derivation.
@C.Loan.i@
@C.prop.norm@
@C.acro.norm@
30.10.23: Trond tok taggane som var deklarert fleire gonger (sannsynlegvis tidlegare taggstrengar A=B=C) ut desse og laga i staden ei liste der kvar tag sto ein gong (nedanfor): docs/tagstrings.md
« ()
í á ú î â û ê ô ĩ ã ũ vokaler i gammel retskrivning
We have manually optimised the structure of our lexicon using following flag diacritics to restrict morhpological combinatorics - only allow compounds with verbs if the verb is further derived into a noun again:
Flag | Explanation |
---|---|
@P.NeedNoun.ON@ | (Dis)allow compounds with verbs unless nominalised |
@D.NeedNoun.ON@ | (Dis)allow compounds with verbs unless nominalised |
@C.NeedNoun@ | (Dis)allow compounds with verbs unless nominalised |
For languages that allow compounding, the following flag diacritics are needed to control position-based compounding restrictions for nominals. Their use is handled automatically if combined with +CmpN/xxx tags. If not used, they will do no harm.
Flag | Explanation |
---|---|
@P.CmpFrst.FALSE@ | Require that words tagged as such only appear first |
@D.CmpPref.TRUE@ | Block such words from entering ENDLEX |
@P.CmpPref.FALSE@ | Block these words from making further compounds |
@D.CmpLast.TRUE@ | Block such words from entering R |
@D.CmpNone.TRUE@ | Combines with the next tag to prohibit compounding |
@U.CmpNone.FALSE@ | Combines with the prev tag to prohibit compounding |
@P.CmpOnly.TRUE@ | Sets a flag to indicate that the word has passed R |
@D.CmpOnly.FALSE@ | Disallow words coming directly from root. |
Use the following flag diacritics to control downcasing of derived proper nouns (e.g. Finnish Pariisi -> pariisilainen). See e.g. North Sámi for how to use these flags. There exists a ready-made regex that will do the actual down-casing given the proper use of these flags.
Flag | Explanation |
---|---|
@U.Cap.Obl@ | Allowing downcasing of derived names: deatnulasj. |
@U.Cap.Opt@ | Allowing downcasing of derived names: København > københavner. |
This (part of) documentation was generated from src/fst/morphology/root.lexc
De mest alminderlige nomenleksika:
…
Leksikonet Nomen inneholder nomenstammerne.
xxx 20170522 til former, som ikke kan læses men som har brug for en analyse i cg’en. Pluralis og singularis-kataloger er ikke medtaget.
Grundformen af ordet er den samme som i lånsproget (uden i): emblem N_Loan_GEM ; (og ikke emblemi) Er der alternative ikke godkendte stavemåder i endelsen, tilføjes de i næste katalog (fx emblemmi) Er der alternative ikke godkendte stavemåder andetsteds, tilføjes de med +OLang/xxx+Err/Sub roman+OLang/DAN+Err/Sub:romaani Z1VZmorf ; Er der en godkendt form af låneordet, er det også en grundform, og den får ikke +OLang/xxx:
septembari Z1VZmorf ;
septembari+Orth/Arch:sivtimpari Z1VZmorf ;
september N_Loan ;
enheder sendes til specielt unit-låneordskatalog
* aaffaffak Z2-Zmorf ;
* aaffaffak+N+Abs+Sg:aaffaffaq Krestr ;
* aaffaq Z2-qZmorf ;
* ...
* * *
<small>This (part of) documentation was generated from [src/fst/morphology/stems/nouns.lexc](https://github.com/giellalt/lang-kal/blob/main/src/fst/morphology/stems/nouns.lexc)</small>
---
# src-fst-morphology-stems-propernouns.lexc.md
xxx 20170522 til former, som ikke kan læses men som har brug for en analyse i cg'en..
* * *
<small>This (part of) documentation was generated from [src/fst/morphology/stems/propernouns.lexc](https://github.com/giellalt/lang-kal/blob/main/src/fst/morphology/stems/propernouns.lexc)</small>
---
# src-fst-morphology-stems-verbs.lexc.md
xxx 20170524 til verbalstammer, som ikke kan læses men som har brug for en analyse i cg'en. Pluralis tantum-kataloger er ikke medtaget. !er det nødvendigt også at medtage stammer fra derivationsleksika?
* * *
<small>This (part of) documentation was generated from [src/fst/morphology/stems/verbs.lexc](https://github.com/giellalt/lang-kal/blob/main/src/fst/morphology/stems/verbs.lexc)</small>
---
# src-fst-transcriptions-transcriptor-abbrevs2text.lexc.md
We describe here how abbreviations are in Kalaallisut are read out, e.g.
for text-to-speech systems.
For example:
* s.:syntynyt # ;
* os.:omaa% sukua # ;
* v.:vuosi # ;
* v.:vuonna # ;
* esim.:esimerkki # ;
* esim.:esimerkiksi # ;
* * *
<small>This (part of) documentation was generated from [src/fst/transcriptions/transcriptor-abbrevs2text.lexc](https://github.com/giellalt/lang-kal/blob/main/src/fst/transcriptions/transcriptor-abbrevs2text.lexc)</small>
---
# src-fst-transcriptions-transcriptor-numbers-digit2text.lexc.md
% komma% :, Root ;
% tjuohkkis% :%. Root ;
% kolon% :%: Root ;
% sárggis% :%- Root ;
% násti% :%* Root ;
* * *
<small>This (part of) documentation was generated from [src/fst/transcriptions/transcriptor-numbers-digit2text.lexc](https://github.com/giellalt/lang-kal/blob/main/src/fst/transcriptions/transcriptor-numbers-digit2text.lexc)</small>
---
# tools-grammarcheckers-grammarchecker.cg3.md
# G R E E N L A N D I C G R A M M A R C H E C K E R
In the catalogue for kal, do:
./autogen.sh
./configure –enable-grammarchecker –enable-spellers
make -j
cd tools/grammarcheckers
make dev
Then test as follows:
echo “e Nerisassiornermut soqutigisaqarpit?|sh modes/trace-kalgram.mode # from the terminal
Or eventually, write
make check
We import tag declaration from ../../src/cg3/disambiguator.cg3
add &SUGGESTWF to any spelling suggestion that we actually want to suggest to the user. The simplest is to just add it to all spelled words:
@OUTSIDE RULES@
@OUTSIDE RULES@
ADD:msyn-arg-ins-trm
ADD:msyn-arg-ins-trm
ADD:msyn-arg-abs-rel
ADD:msyn-arg-abs-rel
ADD:msyn-subj-rel-abs
ADD:msyn-subj-rel-abs
Rules for quotation marks.
This (part of) documentation was generated from tools/grammarcheckers/grammarchecker.cg3
MAPPING-PREFIX = & ;
LIST &typo = &typo ;
LIST &msyn-arg-abs-rel = &msyn-arg-abs-rel ;
&ADDED
This (part of) documentation was generated from tools/grammarcheckers/liststemplates.cg3
Usage:
$ make
$ echo "ja, ja" | hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
$ echo "Juos gorreválggain lea (dárbbašlaš) deavdit gáibádusa boasttu olmmoš, man mielde lahtuid." | hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
$ echo "(gáfe) 'ja' ja 3. ja? ц jaja ukjend \"ukjend\"" | hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
$ echo "márffibiillagáffe" | hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
Pmatch documentation: https://github.com/hfst/hfst/wiki/HfstPmatch
Characters which have analyses in the lexicon, but can appear without spaces before/after, that is, with no context conditions, and adjacent to words:
U+00AD
U+FEFF
.Whitespace contains ASCII white space and the List contains some unicode white space characters
Apart from what’s in our morphology, there are
hfst-tokenise -a
Unknowns are made of:
Unknowns are tagged ?? and treated specially with hfst-tokenise
hfst-tokenise –giella-cg will treat such empty analyses as unknowns, and
remove empty analyses from other readings. Empty readings are also
legal in CG, they get a default baseform equal to the wordform, but
no tag to check, so it’s safer to let hfst-tokenise handle them.
Finally we mark as a token any sequence making up a:
This (part of) documentation was generated from tools/tokenisers/tokeniser-disamb-gt-desc.pmscript
Requires a recent version of HFST (3.10.0 / git revision>=3aecdbc) Then just:
$ make
$ echo "ja, ja" | hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
More usage examples:
$ echo "Juos gorreválggain lea (dárbbašlaš) deavdit gáibádusa boasttu olmmoš, man mielde lahtuid." | hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
$ echo "(gáfe) 'ja' ja 3. ja? ц jaja ukjend \"ukjend\"" | hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
$ echo "márffibiillagáffe" | hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
Pmatch documentation: https://github.com/hfst/hfst/wiki/HfstPmatch
Characters which have analyses in the lexicon, but can appear without spaces before/after, that is, with no context conditions, and adjacent to words:
U+00AD
U+FEFF
.Whitespace contains ASCII white space and the List contains some unicode white space characters
Apart from what’s in our morphology, there are 1) unknown word-like forms, and 2) unmatched strings We want to give 1) a match, but let 2) be treated specially by hfst-tokenise -a
TODO: Could use something like this, but built-in’s don’t include šžđčŋ:
Simply give an empty reading when something is unknown: hfst-tokenise –giella-cg will treat such empty analyses as unknowns, and remove empty analyses from other readings. Empty readings are also legal in CG, they get a default baseform equal to the wordform, but no tag to check, so it’s safer to let hfst-tokenise handle them.
Finally we mark as a token any sequence making up a:
This (part of) documentation was generated from tools/tokenisers/tokeniser-gramcheck-gt-desc.pmscript
Requires a recent version of HFST (3.10.0 / git revision>=3aecdbc) Then just:
make
echo "ja, ja" \
| hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
More usage examples:
echo "Juos gorreválggain lea (dárbbašlaš) deavdit gáibádusa \
boasttu olmmoš, man mielde lahtuid." \
| hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
echo "(gáfe) 'ja' ja 3. ja? ц jaja ukjend \"ukjend\"" \
| hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
echo "márffibiillagáffe" \
| hfst-tokenise --giella-cg tokeniser-disamb-gt-desc.pmhfst
Pmatch documentation: https://kitwiki.csc.fi/twiki/bin/view/KitWiki/HfstPmatch
Characters which have analyses in the lexicon, but can appear without spaces before/after, that is, with no context conditions, and adjacent to words:
U+00AD
U+FEFF
.Whitespace contains ASCII white space and the List contains some unicode white space characters
Apart from what’s in our morphology, there are 1) unknown word-like forms, and 2) unmatched strings We want to give 1) a match, but let 2) be treated specially by hfst-tokenise -a
TODO: Could use something like this, but built-in’s don’t include šžđčŋ:
Simply give an empty reading when something is unknown: hfst-tokenise –giella-cg will treat such empty analyses as unknowns, and remove empty analyses from other readings. Empty readings are also legal in CG, they get a default baseform equal to the wordform, but no tag to check, so it’s safer to let hfst-tokenise handle them.
Needs hfst-tokenise to output things differently depending on the tag they get
This (part of) documentation was generated from tools/tokenisers/tokeniser-tts-cggt-desc.pmscript