Машинен превод: Разлика между версии

Изтрито е съдържание Добавено е съдържание
м век
+изт; форматиране: кавички, нов ред (ползвайки Advisor)
Ред 3:
Съвременният софтуер за машинен превод често позволява избор на предметна област (например [[право]] или [[метеорология]]). Целта е да се подобри качеството на резултата чрез ограничаване на допустимите значения на думите. Тази техника е особено ефективна в области, в които се ползват стандартизирани, шаблонни езикови средства. Затова машинният превод на правителствени или правни документи често е по-сполучлив от превода на свободен разговор или друг слабо стандартизиран текст.
 
Качеството на резултата може да се подобри и чрез човешка намеса. Например, някои системи са в състояние да превеждат по-точно, ако потребителят е определил еднозначно кои думи в текста представляват имена. С помощта на подобни техники машинният превод се оказва полезно помощно средство за хората – преводачипреводачите и в някои случаи дори може да даде резултат, използваемкойто безне се нуждае от допълнително редактиране. Съвременните системи обаче не са в състояние да конкурират хората – преводачи по качество на превода, особено при текстове в художествен или разговорен стил.<ref name="tech">{{Цитат уеб | заглавие = Изкуственият интелект и краят на професията на преводача| автор =
| труд = TechNews.bg| дата = 30 декември 2019| достъп_дата = 1 януари 2020| уеб_адрес = https://technews.bg/article-121764.html
| цитат = }}</ref>.
 
Машинният превод не трябва да се бърка с [[Превод с помощта на компютър|подпомагания от компютър превод]]. При последния водещата роля в превода се изпълнява от човек – преводач, а софтуерът само улеснява някои аспекти от работата му.
 
== УводПроцедура ==
Процесът на превеждане може да бъде описан като съвкупност от
# декодиране значението на изходния текст и
Line 18 ⟶ 20:
Към решаването на тази задача може да се подходи по различни начини.
 
== Видове машинен превод ==
=== Машинен превод, базиран на речник ===
Най-простият вид машинен превод замества думи от единия език със съответните им думи от другия, без да коригира словореда или да се съобразява с различните значения, които придобиват думите в различни съчетания помежду си. Този вид „превод“ е със силно ограничено приложение.
Line 38 ⟶ 40:
[[полисемия|Думите с повече от едно значение]] са трудни за автоматично превеждане. Днес съществуват различни подходи за преодоляване на този проблем, които могат да бъдат групирани в две категории: „плитки“ и „дълбоки“.
 
При „плитките“ подходи, които засега са по-сполучиливисполучливи в практиката, не се изисква разбиране на текста – вместо това се използват статистически методи, за да анализира контекстът на нееднозначната дума. При „дълбоките“ подходи се предполага, че системата притежава подробни знания за думите.
 
=== Имена ===
В много ситуации за системата за машинен превод е трудно или невъзможно да различи кои думи са имена или съкращения, които трябва да бъдат [[Транслитерация|транслитерирани]], [[транскрибиране|транскрибирани]] или прехвърлени без промяна, вместо да се превеждат.
 
=== Неграматичен изходен текст ===
Line 49 ⟶ 51:
 
== История ==
Същинската история на машинния превод започва през 50-те години на 20 век след [[Втора световна война|Втората световна война]]. Проведеният през [[1954]] г. експеримент „Джорджтаун – Ай Би Ем“ с участието на университета „Джорджтаун“ и фирмата „Ай Би Ем“ представлява демонстрация, включваща превеждането на няколко десетки изречения от руски на английски. Експериментът има успех и поставя началото на период на сериозно финансиране за изследвания в областта на машинния превод. Авторите му заявяват, че в срок от три до пет години задачата за машинния превод ще бъде решена.
 
Действителният напредък обаче се оказва много по-бавен. През [[1966]] г. създаденият две години по-рано Специален комитет по приложна лингвистика ([[ALPAC]]) към Националната академия на науките на САЩ издава доклад, станал известен като „Черната книга на машинния превод“. Докладът съдържа много скептична оценка за изследванията в областта на машинния превод и възможността за постигане на сериозен напредък в близко бъдеще. След излизането му финансирането на изследванията в тази област в САЩ (и донякъде в СССР и Великобритания) намалява драстично. В Канада, Франция и Германия обаче разработките продължават.
 
През [[1970]] г. ВВС на САЩ внедряват системата [[Systran]], последвани през [[1976]] г. от [[Европейска комисия|Европейската комисия]]. През [[1977]] г. в Канада се внедрява системата [[METEO]], разработена от университета в [[Монреал]], която превежда климатични прогнози от английски на френски и работи и до днес, превеждайки по около 80&nbsp; 000 думи на ден или 30 милиона думи на година. В [[Европа]] от [[1970]] до [[1994]] г. се работи по основания и финансиран от Европейската комисия проект [[Eurotra]] за превод между езиците на [[Европейска общност|Европейската общност]]. Проектът не успява да достигне до практически използваем продукт, но работата по него повлиява положително на изследванията и разработките в областта на МП в отделните страни – участнички.
 
В края на 80-те години увеличаването на изчислителната мощност и поевтиняването на компютрите предизвиква интерес към статистическите модели за машинен превод и превода чрез примери. След средата на 90-те години вследствие на поевтиняването и усъвършенстването на компютрите се наблюдава бурно развитие и поява на множество висококачествени комерсиални продуктисофтуернипродукти в областта на машинния превод. С напредъка на технологиите за разпознаване и синтез на говор започват изследвания за превод на реч в реално време. В [[Интернет]] се появяват сайтове за автоматичен превод, например услугите [[Google#Google Преводач|Google Преводач]] (''Translate'') на [[Google]] и ''Babelfish'' на [[AltaVista]], които ползват ''Systran''.
 
Сред българските програми за машинен превод са ''Translat'' (за превод от английски и немски на български и обратно), ''Bultra'' (за превод от английски на български) и ''WebTrance'' (за превод между английски, френски, испански и български).
 
== Качество на машинния превод ==
Разработени са различни методики за оценяване работата на системите за машинен превод. Най-старият подход включва хора – преводачи, които определят качеството на превода. Сред по-новите автоматизирани методи, вече автоматизирани, са [[BLEU]], [[NIST]] и [[METEOR]].
 
Съвременните системи за машинен превод не са в състояние да конкурират хората – преводачи по качество на превода, особено при текстове в художествен или разговорен стил<ref name="tech"/>. В повечето случаи преведените от тях текстове могат да се използват само за бегло запознаване с темата на текста, но не и за пълно разбиране на смисъла.
 
При някои специализирани приложения обаче машинният превод вече е в състояние да замени човешкия до голяма степен (например при превода на климатични прогнози или технически упътвания, където използваният набор от думи и изразни средства е силно ограничен).
 
== Вижте същоИзточници ==
<references />
 
== Вижте също ==
* [[Изкуствен интелект]]
* [[Компютърна лингвистика]]
Line 74 ⟶ 78:
 
== Външни препратки ==
* {{икона|de}} [http://liternet.bg/publish3/vkonstantinov/computer.htm Die ''Maschine als Deuter? Die Übersetzungskunst im Spannungsverhältnis zur Computer-Vermittlung''], [[Венцеслав Константинов|Wenzeslav Konstantinov]], "Literarisches„Literarisches Colloquium Berlin"Berlin“, 1992
 
[[Категория:Машинен превод| ]]