Тайны «Семантического архива»

23.11.16
РАМИ

Тайны «Семантического архива»

Источник: Независимая газета

Как, исследуя украинский Facebook, узнать, что национальные элиты хотят сделать с Донбассом?

Какое место занимает «сепаратистский регион» в публичном дискурсе украинских элит? Какая стратегия решения конфликта в Донбассе является самой популярной среди лидеров общественного мнения? При помощи «больших данных» исследователи МГИМО и ХНУ им. Каразина проанализировали массив информации пользователей украинского Facebook.

Исследование проходило в августе–ноябре 2016 года на базе Центра глобальных проблем Института международных исследований МГИМО. Под руководством старшего научного сотрудника Алексея Токарева была разработана методология, позволившая использовать информационно-аналитическую систему «Семантический архив». «Семантический архив» — это инструмент для создания интегрированного хранилища информации с возможностью хранения досье на объекты мониторинга, происходящие события, а также текстовые документы.

Система позволяет хранить информацию, импортированную из различных реляционных баз данных, вводить информацию из любых других источников: Интернет, СМИ, базы данных, онлайн-библиотеки и системы («Спарк», «Интегрум» и др.). Это дает возможность объединять информацию, содержащуюся в различных документах и различных базах данных, формируя такие массивы информации, которые называются «большими данными».

Исходная посылка авторов состояла в убеждении: украинская элита живет в Facebook, поскольку украинская политическая культура предполагает, что лидер общественного мнения просто обязан вести аккаунт именно в этой соцсети (зачастую зависимость обратная: успешное ведение аккаунта становится залогом публичности и увеличения числа подписчиков).

На сегодняшний день каждый украинский политик, гражданский активист и лидер общественного мнения имеет свой аккаунт в этой социальной сети и использует его для ретранслирования своей позиции по какому-либо вопросу. Именно поэтому изучение национального сегмента Facebook позволяет экстраполировать выводы на всю элиту страны.

В ходе исследования научная группа проанализировала аккаунты украинских лидеров общественного мнения, у которых было более 10 тыс. подписчиков.

На первом этапе были отобраны украинские блогеры «по памяти» — те, кто, по мнению авторов, оказывает влияние на украинскую общественную жизнь: политики, гражданские активисты, участники войны на востоке Украины, чиновники, журналисты и т.д. Таковых оказалось 116. Затем была проведена верификация через экспертные оценки (авторы разослали список блогеров коллегам, понимающим в украинском Facebook много больше, чем они сами), что увеличило количество аккаунтов лидеров общественного мнения до 135 человек.

После этого были изучены различные исследования и рейтинги «топ-50», «топ-100» украинского сегмента соцсети. Итоговый список включал 175 аккаунтов. Все 175 страниц соответствовали двум главным критериям: имели более 10 тыс. подписчиков и формулировали смыслы в политике. Проще говоря, из базы данных авторы исключили представителей шоу-бизнеса, не интересующихся политикой (певица Руслана, например, осталась).

На втором этапе с помощью «Семантического архива» проводилась выгрузка постов лидеров общественного мнения за период с 1 января 2016 года по 1 ноября 2016 года. Система сформировала БД из 88 563 постов. Среди них были отобраны те, которые содержали в себе объект «Донбасс» и синонимы (всего 16 позиций, включая «Минские соглашения», «ДНР», «ЛНР», «ОРДЛО», расшифровки этих аббревиатур на русском и украинском языках и пр.). В итоге таких постов оказалось 5200.

Исследовательской задачей был анализ содержания каждого поста на предмет следования одной из четырех стратегий разрешения конфликта в Донбассе: завоевание со стороны Украины, заморозка конфликта, вовлечение региона обратно в состав Украины при помощи мер экономического стимулирования и отгораживание Донбасса от остальной Украины. Если пост не содержал в себе ничего связанного с этими стратегиями, он не подлежал сортировке.

Сначала отобранные 5200 постов были обработаны системой автоматически. В поисковый запрос включались слова-маркеры, которые, по мнению исследователей, позволяли отнести пост к конкретной стратегии. Например, в отношении «завоевания»: «российско-террористические войска», «боевики», «террористы», «вата», «ватники», «захватить», «колорады», «Россия-агрессор», «сепаратисты», «сепары» и т. д.

По результатам автоматической обработки больше всего постов программа отнесла в «завоевание» 606. Затем шли «вовлечение» — 380, «отгораживание» — 41 и «заморозка» — 34.

Критически подойдя к собственной методологии, авторы поняли, что один и тот же пост может быть отнесен системой к разным стратегиям, и, наоборот, два принципиально разных по сути высказывания могут быть объединены в одну стратегию. Такое возможно, например, когда автор — сторонник завоевания пишет что-то вроде «отправим танки в Донбасс выгонять войска агрессора», а автор-миротворец цитирует его, оппонируя: «Категорически не согласен с подходом отправить танки в Донбасс выгонять войска агрессора. Нам необходим диалог с жителями Донбасса». По причине недостатка у машины интеллекта для понимания таких тонкостей исследователи предприняли ручную обработку 5200 постов.

Основным инструментом отнесения поста к определенной стратегии или же принятия решения о том, что пост не подходит ни к одной из них, был анализ каждого отдельного поста вне зависимости от общеизвестной позиции автора по данному вопросу. Если в посте говорилось, что «не надо пришивать „раковую опухоль“ Донбасса к здоровому телу Украины», подобный текст относился к стратегии отгораживания. В случаях, когда авторы подчеркивали необходимость отвода вооружения и соблюдения Минских договоренностей, пост отправлялся в стратегию заморозки.

После ручной обработки всех 5200 постов по четырем стратегиям были рассортированы лишь 327. В массиве из 5 тыс. записей рассматривались самые разные вопросы, которые имели отношение к Донбассу, но в подавляющем большинстве из которых ничего не говорилось о стратегии решения конфликта и не выражалась позиция авторов поста по этой проблеме. Среди таких тем были:

— обсуждение падения «Боинга» MH17 в зоне боевых действий, последствий этого события и обвинения в адрес России по этому поводу;

— аккредитация украинских журналистов на территории ОРДЛО и осуждение этого шага авторами поста;

— истории из жизни участников боевых действий со стороны Украины («участников АТО»);

— посты, связанные с проектом «Вернись живым» (которые по содержанию похожи на посты, указанные в предыдущем пункте);

— «диванная аналитика» политических процессов в мире, лишь косвенно затрагивающих тему Донбасса;

— информирование об обстановке в зоне боевых действий.

После рассортировки 327 постов выяснилось, что больше всего постов поддерживали стратегию заморозки — 117. Чаще всего в эту стратегию отправлялись посты, в которых говорилось о выполнении Минских соглашений, о необходимости прекращения огня, об отводе вооружений и т.д. Довольно часто о выполнении этих документов писали представители высших украинских элит. На втором месте по популярности находится стратегия завоевания, о которой речь шла в 107 постах. О возвращении Донбасса силовым путем писали участники боевых действий, комбаты, военные. Третье место заняла стратегия вовлечения Донбасса в состав Украины (69 постов). В них речь шла об экономической, политической, социальной, транспортной и о других видах реинтеграции Донбасса.

Больше всего постов, посвященных этой стратегии, написал глава Луганской областной военной государственной администрации Георгий Тука. На последнем месте была стратегия отгораживания, о которой речь шла лишь в 34 постах.

Столь малое количество отобранных из общего числа постов заставило участников исследования задаться еще одним вопросом. Число рассортированных постов (327) составляет лишь 6,3% от 5200 (тех, которые относятся к теме Донбасса в принципе), то есть 0,37% от общего числа постов (88 563). Можно ли делать какие-либо выводы на основании 0,37% от общего количества постов?

Если считать массивом 100% данных не общее количество постов, а только те, которые относятся к Донбассу, то есть цифра с 88,5 тыс. падает на уровень 5 тыс. постов, можно сделать вывод: украинские элиты не знают, как решить проблему Донбасса.

Несмотря на их публичные высказывания, записи в социальных сетях и т.д., они не представляют себе, как завершить конфликт и разобраться с этим вопросом. Из этого следует, что на сегодняшний день в высших эшелонах украинской власти отсутствует какая-либо стратегия, по которой украинская власть собирается решать жизненно важный для страны вопрос прекращения войны и возвращения Донбасса в состав Украины.

Адлан МАРГОЕВ, магистрант МГИМО, Максим БОРОДЕНКО


Распечатать страницу