GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started and our Privacy document.
Gå til et av Korp-grensesnitta, f.eks. det samiske. Trykk på fliken Utvidet rett under KORP-kogoen.
Boksen har 9 ulike sækemodi, ord, ordklasse, grunnform, dependensrelasjon, domain, tittel, translated from, tidsintervall. Vi går gjennom dem en etter enn:
Her skriver du inn ordform. Merk alternativa til høyre, f.eks. er, er ikke, … Alternativet er ikke gir bare mening med bruk av flere søkebokser.
Her skriver du inn grammatisk tagg. Menyen til venstre står på inneholder, fordi taggen bare er en del av ordform + analyse. Viss målet t.d. er lokativ entall, skriv Sg.Loc i søkefeltet.
Her er det ferdigdefinerte alternativ, et for hver ordklasse.
Her kan du søke på leksemet. Å velge sátni her gir sátni, sáni, sániid, …
Her kan du søke på tagger for syntaktisk funksjon, f.eks. deprel_←OBJ (i ukorp står det bare **deprel←OBJ**). Nedfallsmenyen gir ei liste over tilgjengelig funksjonstagger. Her er ei forklaring av taggene for syntaktisk funksjon.
Dette er korpusdomena administration, bible, facts, ficti, news, … Det ser ikke ut til at dette er implementert til å fungere i søk. Derimot er det mulig å sortere treff etter domene under søk på Statistikk.
Dette er tittelen til dokumentet. Det ser ikke ut til at dette er implementert til å fungere i søk. Derimot er det mulig å sortere treff etter domene under søk på Statistikk.
Her er metadata svært dårlig, og det ser heller ikke ut til at dette er implementert i søk.
Det er mulig å kopiere søk med operatorene OG og ELLER. Trykk på eller nederst i boksen for å få søke etter unionen av to eller flere krav (f.eks. søk etter substantiv eller pronomen). Trykk på og for å få en ny del av samme søkeboks, for å søke etter et snitt av to krav (f.eks. søk etter et ord som er plural og objekt).
Med å trykke på ⨁ til høyre for søkeboksen får du en søkeboks til, slik at du kan du søke på ordkombinasjoner. Her kan det også væerre en god idé å søke på ordklasse er ikke.
Søk ett er to ord (merk den tomme boksen mellom verb ob objekt), og velg Statistikk. Resultatet blir en frekvenssortert statistikk over verb + objekt.