Finite state and Constraint Grammar based analysers, proofing tools and other resources
View the project on GitHub giellalt/lang-sjd
Это схема дает обзор того, как файлы исходного кода связаны между собой.
Основной файл лексики Отдельные лексические файлов
для разных частей речи
+----------------------+ +------------------+
| sjd-lex.txt | | noun-sjd-lex.txt |
| | | viessu GOAHTI ; | Из лексикона Root, там
| Root -------------> | ... | являются указателями на каждой
| | | | | части речи. Файлы для существительных,
| <---------------+ | глаголов и прилагательные точки
| | | | обратно sjd-lex.txt файл, и
| | +------------------+ направлены на их соответствующих
| | лексика.
| | +-------------------+
| ---> | verb-sjd-lex.txt | (вспомогательные глаголы встречаются
| <--------- ... | также в глаголе файл)
| | +-------------------+
| |
| | +-------------------+
| ---> | adj-sjd-lex.txt |
| <--------- ... |case
| | +-------------------+
| |
| |
| ---> +-------------------+ Другие файлы содержат лексику
| <- - - - - closed-sjd-lex.txt| закрытых классов. Они
+----------------------+ | LEXICON Pronoun | меньше, и большинство их лексика
| Personal ; | находятся в том же файле, а не в
| | sjd-lex файл (ну, некоторые
| LEXICON Personal | указать на некоторые sjd-lex
| ... | лексика). Все во всех
+-------------------+ есть ок. 10 лексикальных файлов.
Это составлен вместе с ||
twol правил. Эти правила содержат ||
(морфо) фонологических процессов, ||
чередование согласных и т.д. ||
\/
+------------+ +------------+ +------------+ sjd.save файл
|twol-sjd.txt| => |twol-sjd.bin| => | sjd.save | составлен в Lexc, и
+------------+ +------------+ +------------+ является слияние lex
файлы и правила файл
Вот сами После компиляции в twol-sjd.bin
правила twolc они в этом ||
двоичный файл ||
||
Затем идет файлы для: \/
предварительной обработки:
+----------+ +------------+ ||=========|| Это последний морфологических
|case.regex| => |caseconv.fst| ====> || sjd.fst || анализатор для языка Кильдин
+----------+ +------------+ ||=========||