Компютърна лингвистика: Разлика между версии

Изтрито е съдържание Добавено е съдържание
компютърна лингвистика
 
Редакция без резюме
Ред 1:
'''Компютърната лингвистика''' е теоретико-приложна наука, дял от [[изкуствен интелект|изкуствения интелект]], която се занимава с използването на компютърните[[компютър]]ните [[технология|технологии]] при обработката на [[език|естествен език]].
 
==Дялове==
 
Основни дялове на компютърната лингвистика са:
 
-* автоматичен анализ на текстове
-* генериране на текстове
* анализ и синтез на реч
 
==Приложение==
- генериране на текстове
 
-===Автоматичен анализ и синтез на речтекстове===
 
Приложението на автоматичния анализ е в области като [[машинен превод]], интелигентно търсене на [[информация]] и автоматично отговаряне на въпроси.
Генерирането на текстове има приложение при интелигентните интерфейси.
Обработката на реч се използва при комуникация с компютърни устройства с гласови команди, например управление на [[автомобил]] с глас.
 
Автоматичният анализ на текстове се провежда на различни нива: разделяне текста на [[лексема|лексеми]], [[морфология|морфологичен]] анализ, [[синтаксис|синтактичен]] анализ, анализ на дискурсните феномени като [[местоимение|местоименни]] и неместоименни [[анафора|анафори]], [[елипса|елипси]] и др.
 
Различните нива на анализ използват различни програми: морфологични анализатори, синтактични анализатори /parsers/, разрешители на анафори, анализатори на реторичната структура.
Текущото състояние на автоматичния текстов анализ позволява сравнително надежден морфологичен анализ /до 99% точност/ , не дотам точен синтактичен анализ /80-85%/ и твърде неточно разрешаване на анафори /70-80%/. Съществуват и разработки за привеждане на текста в логическа форма.
При автоматичния анализ на текстове се използват ресурси, в които е зададено знанието за езика. Такива ресурси са морфологичните речници, граматиките, онтологиите, честотни таблици, информация за синтактичните рамки на глаголите и др.
Текущото състояние на автоматичния текстов анализ позволява сравнително надежден морфологичен анализ /до 99% точност/ , не дотам точен синтактичен анализ /80-85%/ и твърде неточно разрешаване на анафори /70-80%/. Съществуват и разработки за привеждане на текста в [[логика|логическа]] форма.
Друг източник на знания са колекциите от текстове в електронен формат /корпуси/, от които знанията се извличат чрез статистически техники. Този дял от компютърната лингвистика е познат като '''корпусна лингвистика'''
 
При автоматичния анализ на текстове се използват ресурси, в които е зададено знанието за езика. Такива ресурси са морфологичните [[речник|речници]], [[граматика|граматиките]], [[онтология|онтологиите]], честотни таблици, информация за синтактичните рамки на глаголите[[глагол]]ите и др.
 
Друг източник на знания са колекциите от текстове в електронен формат /корпуси/, от които знанията се извличат чрез статистически техники. Този дял от компютърната лингвистика е познат като '''[[корпусна лингвистика''' ]].
 
===Генериране на текстове===
 
Генерирането на текст е противоположно на анализа. Програмите за генерация започват от някакъв модел на смисъла и конструират лингвистичното му представяне.
 
===Анализ и синтез на реч===
 
Обработката на реч използва статистически техники за да се превърнат гласовите команди в текст.
 
==Вижте още==
 
* [[Езикознание]]
 
[[de:Computerlinguistik]]
[[en:Computational linguistics]]
[[es:Lingüística computacional]]
[[fi:Kieliteknologia]]
[[fr:Linguistique informatique]]
[[gl:Linguaxe De Computadora]]
[[nl:Computationele taalkunde]]
[[ja:コンピュータ的言語学]]
[[ru:Математическая лингвистика]]