Математическая лингвистика

Математическая лингвистика (также вычислительная лингвистика или компьютерная лингвистика) - направление искусственного интеллекта, который ставит целью использования математических моделей для описания естественных языков.

Компьютерная лингвистика частично пересекается с обработкой естественных языков. Однако в последнее время акцент делается не на абстрактные модели, а на прикладные методы описания и обработки речи для компьютерных систем.


1. Разделы математической лингвистики

Они зависят от среды, в которой используется язык, бывают устными и письменными. А также от действий над языком (анализ, создание, перевод)



Математическая лингвистика - ряд отраслей теоретического и прикладного языкознания, в которых используются понятия и методы математики (теории вероятностей, математической статистики, информации теории, логики математической, теории алгоритмов и т.п.). Еще в начале 20 в. рус. математик А.А. Марков (старший) применил теорию вероятностей к изучению распределения гласных и согласных букв в печатных русских текстах ("Евгений Онегин" А.С.Пушкина, "Детские годы Багрова-внука" С.Т. Аксакова). Такие исследования с 1930-х годов приобрели важное применение в телеграфии и телефонии. Основная задача здесь состояла в передаче по каналам связи максимального количества сообщений самым экономным способом. Чтобы решить эту задачу, нужно знать количественные закономерности в Каталог распределение букв (для телеграфии) и распределение фонем (для телефонии). Применяя понятие теории информации, разрабатывают с помощью современных вычислительных устройств статистики языков (статистика лингвистическая). Полученные результаты важны не только для телефонии и телеграфии, но и для теоретического языкознания. С изобретением электронных вычислительных машин и развитием кибернетики перед языкознанием появился ряд новых задач: перевод машинный с одного языка на другой, представление в автоматические устройства программы действия и данных, сформулированных непосредственно в виде печатных текстов или устной речи (т. н. Языковой управления механизмами) . Все это требует изучения грамматических и лексических свойств как математическими метод


2. Основные понятия, используемые в математической лингвистике

  • множественность исходных символов ( алфавит);
  • отношения между элементами алфавита, воспринимаемые как аксиомы (постулируются)
  • правила вывода, то есть вычисление всех возможных множеств символьных цепочек;
  • изоморфизм, то есть одно-однозначные отношения между элементами последовательности, при которых каждому элементу одной последовательности ставится в соответствие элемент другого;
  • гомоморфизм, одно-многозначные отношения, последовательности, когда одному элементу первой последовательности соответствует несколько элементов второй и наоборот;
  • отмечен цепочку, т.е. отвечающий правилам вывода;
  • вхождения символа в последовательность, т.е. появление его на заданном месте в цепочке;
  • разделение исходного множества класса цепочек по определенным правилам на подклассы.

Использование операций, основанные на этих понятиях, дает возможность получить аналоги грамматических классов и подклассов, категорий, парадигм, синтаксических единиц и отношений. Свойства отношения единиц изучаемой знаковой системы выявляют и изучают путем построения синтезувальних и аналитических математических моделей.


Источники

  • Украинская советская энциклопедия. В 12-ти томах / Под ред. Бажана. - 2-е изд. - К. : Гл. редакция УСЭ, 1974-1985.
  • Карпиловская Е. А. Введение в компьютерной лингвистики. - Донецк: Юго-Восток, 2003. - 184 с.
  • Дарчук Н.П. Компьютерная лингвистика (автоматическое обработки текста): учебник. - М.: Издательско-полиграфический центр "Киевский университет", 2008. - 351 с.
  • Бук С. Основы статистической лингвистики: Учебное пособие / Отв. ред. проф. Ф. С. Бацевич. - Издательский центр ЛНУ имени Ивана Франко, 2008. - 124 с.

См.. также


Языкознание Это незавершенная статья языкознания.
Вы можете помочь проекту, исправив и дополнив ее.