Finite state and Constraint Grammar based analysers, proofing tools and other resources
View the project on GitHub giellalt/lang-fkv
Paikalla: Aili, Thomas, Trond
Katseltiin referaattia.
Chiara tekee sen ensi viikolla.
Onko kaikki nyt kunnossa ennen korpusajoa?
Aili on tehnyt paljon viime aikoina. Trond uusi sanakirjan kokouksen aikana. Pitikö Chiara näyttäät meile scriptin jonka avula oon noppeemin laittaat sanat sanakirjhaan?
Dublettien löytäminen:
fkvnob-sanakirjan t-elementtejä ilman käännöstä nobfkv:ssa
cat fkvnob/src/*.xml | grep '<t '| cut -d"<" -f2|cut -d">" -f2 | preprocess | nobfkv | grep '?'|cut -f1 | sort | uniq -c | sort -nr | cut -c6- | hunob | cut -f2 | cut -d"+" -f1 | uniq | grep "[a-z]" | nobfkv | grep "?" | cut -f1 | lookup Thomaksenomanobfkv.fst | grep -v ? | uniq | wc -l
cat fkvnob/src/N_fkvnob.xml | grep '<t '| cut -d"<" -f2|cut -d">" -f2 | sort | uniq | tr "\n" " " | mate
Hyvä idea: Tehdä se molempiin suuntiin, sanaluokka kerrallaan.
Ei ole.
24.3.2021