FAD-møte 25.6.
Til stades: BM, Cip, Trond
Saksliste:
- Status quo
- Unifisering
- Enare
Status quo
Cip har prøvekøyrt unifisering, og delt kjeldene i tre (separat gt, separat fad, felles), men ikkje unifisert fellesdelen, den er framleis i to ulike filer).
BM har sett på filene.
Unifisering
src-attributter:
- nj= Nils Jernsletten
- fad= fad-prosjektet
- gt= giellatekno
3 kataloger:
dette er data som kun finnes i fad, og skal unifiseres separat:
main/words/dicts/nobsme/terms/admin/src_fad-only
** disse to inneholder felles lemma og skal slås sammen og unifiseres, først automatisk og siden manuelt:main/words/dicts/nobsme/terms/admin/src_fad-gt_commons
** –> denne er ikke unifisert separatmain/words/dicts/nobsme/src_gt-fad_commons
** –> denne er unifisert separat
gt ∩ fad = dei som har same nob.
- freq_a = frekvens i hele korpuset (nob=nowac, sme=hele gt-korpuset)
- freq_f = frekvens i fad-korpuset, både sme og nob
Ordboksartikkelen skal sorteres etter freq_a, dette gjelder både nobsme og smenob
Stor sannsynlighet for term : høy freq_f, src=fad og kanskje bare kun src=fad?
Enare
Vi må før sommarferien formulere hypoteser til Enare
Neste møte
Vi tar ei oppsummering før ferien.