БулПосКор: Разлика между версии

Изтрито е съдържание Добавено е съдържание
Abvgm (беседа | приноси)
Редакция без резюме
Ред 1:
Българският POS анотиран корпус (БулПосКор) е морфологично анотиран, общ едноезиков корпус от писмена реч за български, създаден от Секцията по компютърна лингвистика при Института за български език, БАНqБАН, с големина 174 697 лексикални единици.
 
Морфологично анотираните корпуси са резултат от морфологично анализиране на всяка дума от даден текст. Към думите се прикрепват тагове (етикети, анотация), съдържащи информация за граматичния клас на дадена лексикална единица и за характеризиращите я стойности на граматичните категории.