Компютърна лингвистика: Разлика между версии
Изтрито е съдържание Добавено е съдържание
компютърна лингвистика |
Александър (беседа | приноси) Редакция без резюме |
||
Ред 1:
'''Компютърната лингвистика''' е теоретико-приложна наука, дял от [[изкуствен интелект|изкуствения интелект]], която се занимава с използването на
==Дялове==
Основни дялове на компютърната лингвистика са:
* анализ и синтез на реч
==Приложение==
▲- генериране на текстове
Приложението на автоматичния анализ е в области като [[машинен превод]], интелигентно търсене на [[информация]] и автоматично отговаряне на въпроси.
Генерирането на текстове има приложение при интелигентните интерфейси.
Обработката на реч се използва при комуникация с компютърни устройства с гласови команди, например управление на [[автомобил]] с глас.
Автоматичният анализ на текстове се провежда на различни нива: разделяне текста на [[лексема|лексеми]], [[морфология|морфологичен]] анализ, [[синтаксис|синтактичен]] анализ, анализ на дискурсните феномени като [[местоимение|местоименни]] и неместоименни [[анафора|анафори]], [[елипса|елипси]] и др.
Различните нива на анализ използват различни програми: морфологични анализатори, синтактични анализатори /parsers/, разрешители на анафори, анализатори на реторичната структура.
Текущото състояние на автоматичния текстов анализ позволява сравнително надежден морфологичен анализ /до 99% точност/ , не дотам точен синтактичен анализ /80-85%/ и твърде неточно разрешаване на анафори /70-80%/. Съществуват и разработки за привеждане на текста в логическа форма.▼
При автоматичния анализ на текстове се използват ресурси, в които е зададено знанието за езика. Такива ресурси са морфологичните речници, граматиките, онтологиите, честотни таблици, информация за синтактичните рамки на глаголите и др.▼
▲Текущото състояние на автоматичния текстов анализ позволява сравнително надежден морфологичен анализ /до 99% точност/ , не дотам точен
Друг източник на знания са колекциите от текстове в електронен формат /корпуси/, от които знанията се извличат чрез статистически техники. Този дял от компютърната лингвистика е познат като '''корпусна лингвистика''' ▼
▲При автоматичния анализ на текстове се използват ресурси, в които е зададено знанието за езика. Такива ресурси са морфологичните [[речник|речници]], [[граматика|граматиките]], [[онтология|онтологиите]], честотни таблици, информация за синтактичните рамки на
▲Друг източник на знания са колекциите от текстове в електронен формат /корпуси/, от които знанията се извличат чрез статистически техники. Този дял от компютърната лингвистика е познат като
===Генериране на текстове===
Генерирането на текст е противоположно на анализа. Програмите за генерация започват от някакъв модел на смисъла и конструират лингвистичното му представяне.
===Анализ и синтез на реч===
Обработката на реч използва статистически техники за да се превърнат гласовите команди в текст.
==Вижте още==
* [[Езикознание]]
[[de:Computerlinguistik]]
[[en:Computational linguistics]]
[[es:Lingüística computacional]]
[[fi:Kieliteknologia]]
[[fr:Linguistique informatique]]
[[gl:Linguaxe De Computadora]]
[[nl:Computationele taalkunde]]
[[ja:コンピュータ的言語学]]
[[ru:Математическая лингвистика]]
|