Компютърна лингвистика: Разлика между версии

Изтрито е съдържание Добавено е съдържание
Bggoldie (беседа | приноси)
м Морфология (езикознание)
Ред 14:
=== Автоматичен анализ на текстове ===
 
ПриложениетоАвтоматичното анализиране на автоматичниятекстове анализсе еизползва в области като [[машинен превод]], интелигентно търсене на [[информация]] и, автоматично отговаряне на въпроси и др.
Генерирането на текстове има приложение при интелигентните интерфейси.
ОбработкатаКомпютърната обработка на реч се използва прив комуникация сразлични компютърни системи за автоматично преобразуване на текст в реч или на реч в текст, в устройства, управлявани с гласови команди, (например управление на [[автомобил]] с глас) и др.
 
Автоматичният анализ наможе текстоведа се провежда наобхваща различни нива от заложената в текста информация. Това определя множество подзадачи и модули като: токънизиране (разделяне текста на определени единици - фонеми, морфеми, графични думи, [[лексема|лексеми]], изречения и др.); тагиране (приписване на характеристики на всяка отделна единица - приписване на дадени морфологични, синтактични, морфосинтактични, семантични и др. характеристики; парсиране - [[Морфология (езикознание)| морфология|морфологичен]] анализ, [[синтаксис|синтактичен]] анализ, анализразрешаване на дискурснитеразлични феномениезиково специфични явления като [[местоимение|местоименни]] и неместоименни [[анафора|анафори]], [[елипса|елипси]] и др. и на различните типове езикова многозначност.
 
Различните нива на анализ използват различни програми: морфологични анализатори, синтактични анализатори /parsers/, разрешители на анафори, анализатори на реторичната структура.
Ред 26:
При автоматичния анализ на текстове се използват ресурси, в които е зададено знанието за езика. Такива ресурси са морфологичните [[речник|речници]], [[граматика|граматиките]], [[онтология|онтологиите]], честотни таблици, информация за синтактичните рамки на [[глагол]]ите и др.
 
Друг източник на знания са колекциите от текстове в електронен формат /корпуси/, от които знанията се извличатизползват за различни типове езикови анализи и заключения, както и за извличане на езикова информация чрез компютърни програми и статистически техники. Този дял от компютърната лингвистика е познат като [[корпусна лингвистика]].
 
=== Генериране на текстове ===