Apie projektą

Pastovieji žodžių junginiai yra dviejų ar daugiau dažnai kartu vartojamų žodžių seka (pvz.: vaikų darželis, laikas bėga, daryti spaudimą). Tokie junginiai dažnai vartojami netiesiogine reikšme (pvz.: pakišti koją, pralaužti ledus, liko be nieko).

Pastoviųjų žodžių junginių tyrimai yra aktuali kryptis bendrosios, gretinamosios ir taikomosios kalbotyros, natūraliosios kalbos analizės, kalbos technologijų ir kt. srityse. Beveik kiekvienoje kalboje pastoviųjų junginių dalis dalis yra didesnė nei 40 %, todėl pastoviųjų junginių tyrimai yra aktuali bet kurios natūraliosios kalbos analizės problema. Nors pastoviųjų junginių tyrimų pastaraisiais metais daugėja, tačiau pripažįstama, kad įvairių kalbų pastoviųjų junginių aprašai leksikografiniuose ištekliuose neišsamūs; daug diskusijų kelia šių junginių automatinio atpažinimo metodika.

Šio projekto tikslas – sukurti lietuvių kalbos pastoviųjų junginių tyrimo metodiką ir atlikti išsamią lietuvių kalbos pastoviųjų junginių analizę, tam sukuriant arba pritaikant reikalingus įrankius bei išteklius. Tyrimai atliekami taikant tekstynų lingvistikos, kompiuterinės lingvistikos ir mašininio mokymo metodus.

Svarbiausi planuojami įgyvendinti projekto rezultatai: sukurti metodiką lietuvių kalbos pastoviesiems junginiams atpažinti, sudaryti lietuvių kalbos pastoviųjų junginių leksinę duomenų bazę su daugiafunkce paieška, pritaikyti įrankius lietuvių kalbos pastoviesiems junginiams atpažinti, publikuoti lietuvių kalbos kolokacijų žodyną, parengti mokslinių ir mokslo populiarinamųjų publikacijų, tyrimus pristatyti nacionaliniuose ir tarptautiniuose moksliniuose renginiuose. Projektas vykdomas 2016–2018 m.