Планы для проекта коми
Джек, Марина, Миха, Трун
Агенда
- Статус
- Планы
- Конкретные планы
- IWCLUL 2018
Статус анализатора
основы в базе: вместе: 181.125 слов
- Coverage (Zhugil_komi.txt): 99,4% (очень хороший)
- (Belykh): 96,8% (301.539 слов)
- Глаголы: переходные непереходные, рефлексив (Лена)
части речи
- список частиц, какие классы разных частиц
- дескриптивно-лингвистический анализ
- включить в FST и CG
Проект Фрайбург: Миха, Нико, Kone: -> 31.12.2020 (примерно)
Планы
Фокус (Сыктывкар+Тромсе):
- Практические программы
- педагогический портал
- э-учебники, э-словари, …
- напр. [https://sanat.csc.fi/wiki/Sms:võrr] где и этимология, морфология, универсальный словарь
- Переводчик
- OmegaT
- MT (дальняя перспектива)
- Лингвистика: Морфология и синтакис
- Коми в программе Korp
- новые тексты – сколько слов?
- анализ – через 3 месяца
- Программа по правописанию (грамматика)
Другие:
- Kone project (Freiburg)
- Rogier++ Синтаксис коми языка (типология)
- Micha, Niko++ Синтаксис коми языка (CG, для стандартного языка и диалектных текстов)
Конкретные планы
- Проект Баренц-региона: Корпус + анализ в Тромсе “Корп по-коми”
- Трун звонит в Киркенес
- Марина и Джек: основа для заявки (“сколько Х – раппорт о ситуацие файлов)
- Морфология, синтаксис 3 мес для анализа Корпа + 40 мил текст
- Apertium Google Summer of code (писать заявку - Трун говорит с Франом)
- писать заявку (Трун вместо с Мариной)
- OmegaT: Нет сегодня (паралельный корпус по уровние предложениям)
IWCLUL
- Митинг в Ивклуле (перед или после воркшопа?)
- Папер для IWCLUL: Миха и Нико
Следушее митинг
- В Скайпе
- IWCLUL 2018