GiellaLT

GiellaLT provides an infrastructure for rule-based language technology aimed at minority and indigenous languages, and streamlines building anything from keyboards to speech technology. Read more about Why. See also How to get started, and our Privacy document.

View GiellaLT on GitHub

Verktøy for forfattere

Dette er et forslag til hva en web-side kunne inneholde, som hjelp for forfattere av tekster på samisk. Også til hjelp for korrekturlesere. Alle verktøyene har vi, men vi må tilrettelegge dem for sluttbrukere på en egen web-side.

Forslaget mitt er at brukeren laster opp sin egen word- eller openOffice fil og får tre filer, som hun kan laste ned i sin maskin. Alternativt kan brukeren kopiere hele sin tekst over i et vindu, og få tre filer.

1. fil: Missinglist

Vi tilbyr brukerne den til enhver tid nyeste normative analysatoren.

```cat userfile preprocess usmeNorm grep “?” cut -f1 sort -u > fil1.txt

## 2. fil: Hver setning på ny linje

Brukeren kan lett se om språket er variert, eller om det er tendens til at setningene blir for like.

- Teksten preprosesseres og settes sammen med en setning på hver linje.

```cat userfile | preprocess --abbr=abbr.txt | erstatt alle .!? på begynnelsen av linja med ¢ | tr "\n" " " | tr "¢" "\n" > fil2.txt

3. fil: Frekvensliste

Brukeren kan vurdere om hun bør variere ordvalget mer.

```cat userfile preprocess –abbr=abbr.txt erstatt alle store bokstaver med små bokstaver sort uniq -c sort -nr > fil3.txt

```

Sitemap