Лекция «Идентификация и классификация литературных текстов, написанных на европейских языках на основе статистических закономерностей буквенных распределений»

17 ноября 2011

Лекция «Идентификация и классификация литературных текстов, написанных на европейских языках на основе статистических закономерностей буквенных распределений»

Заведующий сектором кинетических уравнений ИПМ им. М.В. Келдыша РАН профессор кафедры высшей математики МФТИ Орлов Юрий Николаевич прочтет лекцию «Идентификация и классификация литературных текстов, написанных на европейских языках на основе статистических закономерностей буквенных распределений».

Рассматривается статистический подход к решению таких задач, как установление наиболее вероятного автора неизвестного произведения, переводное это произведение или написанное на языке автора, сколько авторов участвовало в его написании. Тестирование метода идентификации автора на достаточно большой выборке (100 авторов, 1000 текстов) показало очень высокую точность: при анализе диаграмм только 16 текстов были ошибочно отнесены не к своим авторам, а при анализе триграмм ошибка была нулевой.

Лекция состоится 17 ноября в 16:00 (аудит. 4003).

Приглашаются все интересующиеся.

Организатор: кафедра ММИТ.


Распечатать страницу