Big Data — процесс пошел, вопросы остаются

10.04.17
Эксклюзив

Big Data — процесс пошел, вопросы остаются

Эксперты МГИМО: Меньшиков Петр Витальевич, к.ист.н.

Доцент кафедры связей с общественностью П.В.Меньшиков продолжает анализировать роль Big Data.

Любая самая современная инновационная высокая технология нейтральна по своей сути в отношении к ценностям, интересам и приоритетам государства, общества и индивидуума до тех пор, пока человек не придаст ее практическому применению соответствующее целевое назначение. Тогда технология принимает характер, соответствующий ценностям и устремлениям ее обладателей. Технологии комплексного сбора и аналитической обработки колоссальных объемов данных, получившие наименование Big data, несомненно, революционный шаг в контексте четвертой промышленной революции, призванной весьма кардинальным образом изменить во вполне обозримом будущем не только мировую экономику, но и основополагающие принципы построения глобальных мирохозяйственных связей и взаимозависимостей. Но возникают и настораживающие вопросы.

С глобальным трансграничным возрастанием объемов данных, обрабатываемых посредством технологий Big data, пропорционально растет и число взаимосвязанных алгоритмов, на основе которых эти технологии анализируют собранную информацию. В настоящее время большинство технологий Big data не в состоянии дать точный ответ, какие из таких взаимосвязей правильные, а какие — нет, тем более что большинство выводов, которые делаются при использовании технологий компьютерной обработки «больших данных», практически невозможно перепроверить в реальной практической жизни.

Технологии Big data оказались не в состоянии предсказать эпидемию Эболы в 2014 г. из-за того, что данные из Западной Африки поступали на местных языках, не введенных в алгоритмы анализа информации соответствующих программ наблюдения. Эксперты Гарвардского университета, осуществлявшего данный Big data — проект, получили первое предупреждение об эпидемии от этой программы наблюдения лишь после того, как сообщение об Эболе было распространено французским информационным агентством на французском языке. К тому времени правительство Гвинеи уже известило ВОЗ о разрастании эпидемии.

Преобразование технологиями Big data массивов неструктурированных данных в структурированные нередко ведет к перенятию накопившихся десятилетиями и даже веками оценочных фальшивых ценностей и предрассудков в качестве алгоритмов анализа. В итоге субъективная оценка принимает характер объективной. Ставший классическим пример, когда отбор кандидатов на вакантную должность при помощи технологий Big data не дает объективного результата именно в силу того, что компьютер отклоняет кандидатуру на основании, например, сведений о проживании соискателя в «неблагоприятном криминогенном» городском районе или принадлежности к «исторически дискриминируемым расам или этническим меньшинствам». Кадровая служба, использующая, в частности, алгоритмы Big data применительно к методике Social Graph рискует вообще «отсеять» значительную часть вполне достойных по своим профессиональным и личным качествам соискателей. Майкл Слаби, специалист по IT-коммуникациям в предвыборных штабах Б.Обамы, недвусмысленно сформулировал принцип подхода к аналитическим результатам подобной обработки «больших данных» — всегда будет иметь место смешивание качественного и количественного опыта; иногда они будут находиться в противоречии и конфликте друг с другом; в ряде случаев один опыт будет полностью перекрывать и сводить на нет другой.

Технологии Big data вторгаются в личную сферу человека, делая публичными и коммерциализируя самые различные стороны жизни, включая частную и даже интимную сферы, усиливают укрепившиеся стереотипы и клише, исторические, культурные, национальные и этнические предрассудки, формируют ценности, образ жизни и алгоритмы мышления. В США уже сейчас одна треть создаваемых семей — это люди, познакомившиеся исключительно через интернет. In-Bloom, банк данных стоимостью в 100 млн долл. продавал частным фирмам личные данные о школьниках сугубо доверительного характера. Фирма Medbase 200 из штата Иллинойс продавала под видом маркетинговой информации фармацевтическим компаниям закрытые данные о частных гражданах — к примеру, за 79 долл. поименный список одной тысячи жертв сексуального или домашнего насилия, зараженных СПИДом, или участников т.н. групп принуждений. Однажды появившись в IT-пространстве, данные в том или ином виде остаются в нем навсегда. Вопрос о том, кто владеет этими данными, столь же важен, как вопрос — кому принадлежит участок земли в период аграрной революции или кому принадлежит фабрика в эпоху индустриализации. Электронные данные трансформируются в основное сырье не только инновационного периода экономики, но и в важнейший компонент всех сфер нашей жизни.

Закономерно, что в российских профессиональных кругах нарастает дискуссия о намерении Администрации президента России и Роскомнадзора законодательно ограничить обработку «больших данных» и создать национального оператора, который будет отслеживать их трансграничную передачу. Речь идет о возможности принятия специального федерального закона, регулирующего применение технологий Big data в Российской Федерации, разработку которого, начиная с ноября 2016 г., ведет рабочая группа по вопросам развития интернета при Администрации президента.

Подразумевается, что регулирование процессов обработки больших пользовательских данных распространится не только на сведения о российских гражданах, но и информацию, генерируемую техническими средствами, например, показатели счетчиков, данные видеонаблюдения и геопозиционирования, нагрузки на сегменты сетей электроэнергии и базовых станций сотовых сетей. Российского национального оператора Big data планируется наделить функциями определения границ распространения российских «больших данных», в том числе за границу, и уровень их защиты. Такая вполне реальная перспектива увязывается экспертами с определенными рисками потери российской экономикой нескольких миллиардов долларов в год ввиду возможности установления ряда запретительных мер со стороны государства, ведущих к ограничению притока инвестиций в IT-сектор отечественной экономики.

Крупнейшие российские операторы связи и интернет-компании — «Ростелеком», «МегаФон», МТС, «Вымпелком», Mail. Ru Group и «Яндекс» — решили сыграть на опережение, начав в апреле переговоры о создании саморегулируемой организации (СРО) в сфере Big data под рабочим названием «Ассоциация больших данных» (АБД), явно стремясь опередить государственные инстанции в вопросе регулирования в России IT-отрасли, связанной с распространением технологий «больших данных». АБД будет открытой для участников других IT-ориентированных отраслей национальной экономики, в первую очередь — для финансового сектора, банков и страховых компаний. Целью создания СРО названа выработка оптимального баланса между ответственным регулированием и ограничительными законодательными инициативами со стороны государства по примеру действующего в ЕС консорциума Big Data Value Association (BDVA), созданного Orange, SAP, Siemens, Nokia, IBM, Telecom Italia и рядом других компаний IT-сектора, и китайской модели невмешательства основных регуляторов в деятельность организаций, обрабатывающих Big data на базе государственной площадки для отраслевых обсуждений, определяющей технические стандарты Data Centric Alliance и НКО Big Data Union.

Точка зрения авторов, комментарии которых публикуются в рубрике
«Говорят эксперты МГИМО», может не совпадать с мнением редакции портала.

Источник: Портал МГИМО
Коммерческое использование данной информации запрещено.
При перепечатке ссылка на Портал МГИМО обязательна.
Распечатать страницу