Статистическа семантика

Статистическата семантика изучава „как статистическите модели на употребата на думи в човешките езици може да бъде използвано да се разбере, какво хората имат предвид, поне до степен, достатъчна за достъп до информация“ (Фърнас:2006). Как разбираме какво думите значат просто гледайки в моделите на думи в големи колекции текст? Какви са границите на този подход за разбиране на думите?

ИсторияРедактиране

Терминът статистическа семантика е първо използван от Уивър (1955) в неговия известен доклад за машинния превод. Там той твърди, че поясняването и разграничаването на значението на думата в машинния превод, трябва да се базира на съответствие на честотата на употреба на контекстуалните думи близки до дадената целева дума. Предположението, което имаме тук е, че „думата се характеризира от компанията, която поддържа“, нещо, което е защитавано като теза от Дж. Р. Фърт (1957). Това приемане е познато в лингвистиката като Дистрибуционна хипотеза. Делавени (1960) дефинира статистическата семантика като „статистическо изучаване а значенията на думите и тяхната честота и ред на повтаряемост“.

ИзточнициРедактиране

  • Делавени: Delavenay, E. (1960). An Introduction to Machine Translation, New York, NY: Thames and Hudson.
  • Уивър: Weaver, W. (1955). Translation. In W.N. Locke and D.A. Booth (eds.), Machine Translation of Languages, Cambridge, MA: MIT Press. ISBN 0-8371-8434-7
  • Фърнас: Furnas, G.W. (2006). Faculty Profile: George Furnas, University of Michigan, School of Information, 2 октомври 2006.
  • Фърт: Firth, J.R. (1957). A synopsis of linguistic theory 1930 – 1955. In Studies in Linguistic Analysis, pp. 1 – 32. Oxford: Philological Society. Reprinted in F.R. Palmer (ed.), Selected Papers of J.R. Firth 1952 – 1959, London: Longman (1968).
    Тази страница частично или изцяло представлява превод на страницата „Statistical semantics“ в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс - Признание - Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година — от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница. Вижте източниците на оригиналната статия, състоянието ѝ при превода и списъка на съавторите.