Михал Косински: мы не заметим как мир захватит искусственный интеллект. Утка года: как расследование Das Magazin ввело всех в заблуждение Ничего себе. И каким видишь ты решение этой проблемы

России планирует в 2018 г. ввести систему оценки кредитоспособности заемщиков по психометрическим моделям, сообщил старший вице-президент Сбербанка Александр Ведяхин.

«В 2018 г., я думаю, это уже будет. Идеальный вариант - что лицо, телефон, чтобы мы поняли, кто, все следы, все источники, чтобы стало понятно, что это за человек, и если он лайкает тюремные четки и "Владимирский централ", то навряд ли ему надо сразу одобрять кредит, скорее всего, еще раз надо что-нибудь посмотреть», - заявил Ведяхин (цитата по «Интерфаксу»).

В Сбербанке прогнозируют появление роботов-гуманоидов через 10–15 лет

Через 10-15 лет появятся роботы-андроиды, обладающие универсальным искусственным интеллектом, сообщил Ведяхин. По его словам, существующие системы искусственного интеллекта ограничены специфическими, поставленными разработчиками конкретными задачами, а гуманоидные роботы будут оснащены универсальным интеллектом. Такие человекоподобные роботы смогут применяться практически в любой сфере, сказал Ведяхин. При этом их можно будет обучать имитировать человеческие эмоции.

По словам топ-менеджера, уже работает пилотный проект по психологическому скорингу, в котором принимает участие «ограниченная выборка» согласившихся клиентов. «Мы полностью действуем в соответствии с законодательством относительно защиты персональных данных, поэтому здесь то направление, где мы работаем. Это прототип, который мы изучаем внутри, но здесь мы берем полное согласие клиентов», - отметил старший вице-президент Сбербанка.

Ведяхин уточнил, что психометрический скоринг будет проводиться на основе метода, разработанного польским исследователем Михаилом Косински. Косински является ведущим специалистом в психометрии – разделе психологии, основанном на анализе данных. Он разработал систему, которая, анализируя действия пользователя в социальной сети, составляет психологический портрет человека.

Об исследовании ученых Кембриджского и Стэнфордского университетов писала Financial Times. Ученые пришли к выводу, что профиль пользователя, составленный на основе его лайков в социальной сети Facebook , лучше описывает его личность, чем это делают даже самые близкие люди. В Кембриджском и Стэнфордском университетах пришли к выводу, что компьютер описывает личность человека лучше, чем его коллега, после анализа лишь 10 лайков, чем друг - после 70 лайков, чем родственник - после 150 лайков и чем супруг - после 300 лайков. Среднее по Facebook количество отметок «нравится», приходящееся на пользователя, - 227, замечает FT.


Известно, что все наши действия в Сети оставляют след, да и не только в Сети. Фиксируется, что купили (карточки), где бывали (смартфоны), видеокамеры по всему городу, видеорегистраторы на машинах и пр. Теоретически, если проанализировать все эти данные, то можно узнать о человеке все.
Вот только вопрос: а зачем это нужно? Ну, узнали вы все обо всех – дальше что? Ведь и без хранения огромного количества информации о людях известно все, что нужно – не так уж они отличаются друг от друга.
Говорят, что анализ подобных данных поможет улучшить продажи и голосовать за нужного кандидата. Да, но данные-то будут у всех кандидатов и у всех продавцов – в чем профит?
По-моему, это все ерунда: данные про всех просто не нужны, а про отдельного человека можно собрать, но это другой вопрос, да и кроме электронных данных есть способы, и более надежные.
Но очень уж хочется верить в могущество и новые возмоэности.
Сегодня в СМИ много пишут про некоего Михаила Козинского.
Он поляк, из Вашавы. Ему 34 года. В 2008 году он поступил в Кембридж, в Центр психометрии, лабораторию Кэвендиш - лабораторию по психометрии для работы над докторской диссертацией (напоминаю, что кандидатской у них нет, так что он был кем-то вроде нашего аспиратнта).
Козинский и его однокурсники запустили компьютерное психологическое тестирование. Благодаря созданному ими приложению для Facebook под названием MyPersonality они получили психологические данные миллионов людей.
Далее они изучали статистические связи между психологическими свойствами, возрастом, полом, расой, сексуальной ориентацией и теми лайками, которые ставили люди, страничками, которые они посещали и др.
В итоге получили большое количество каких-то связей, по которым Косинский теперь берется по лайкам и страничкам устанавливать пол, возраст, расу, сексуальную ориентацию, какие-то особенности личности.
В принципе, ничего особенного. Сам же Козинский подает свои результаты очень бойко: . например, если мужчина подписан на страничку бренда косметики MAC, он с высокой вероятностью является геем. Наоборот, сильный показатель гетеросексуальности - если человек поставил лайк хип-хоп группе Wu-Tang Clan из Нью-Йорка. Поклонник Леди Гаги с высокой долей вероятности экстраверт, а человек, ставящий «нравится» философским постам - интроверт.

В 2012 году Козинский доказал, что анализа 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с 95% вероятностью), его гомосексуальность (88% вероятности) и приверженность Демократической или Республиканской партии США (85% вероятности). Но процесс идет дальше: интеллектуальное развитие, религиозные предпочтения, пристрастие к алкоголю, курению или наркотикам. Данные даже позволяли узнать, развелись ли родители испытуемого до его совершеннолетия или нет. Модель оказалась настолько хороша, что стало возможным предугадывать ответы испытуемого на определенные вопросы. Скоро модель смогла лучше узнавать личность после десяти изученных лайков, нежели его коллеги по работе. После 70 лайков - лучше, чем друг. После 150 лайков - лучше, чем родители. После 300 лайков - лучше, чем партнер. С еще большим количеством изученных действий можно было бы узнать о человеке лучше, чем он сам.
Козинский и команда могут оценивать людей по Большой пятерке критериев исходя из их юзерпика, фотографии в соцсетях. Или даже по числе друзей: хороший показатель экстраверсии! Но мы также сдаем личные данные, когда находимся не в сети. Датчик движения в смартфоне показывает, размахиваем ли мы рукой с ним, как далеко ездим (коррелирует с эмоциональной нестабильностью). Как замечает Козинский, смартфон - это огромный психологический опросник, который мы вольно или невольно заполняем. Что особенно важно, это работает и в обратную сторону: можно не только создавать из данных психологический портрет, вы можете искать среди этих портретов нужные. Например, обеспокоенные папаши, озлобленные интроверты, не определившиеся с выбором сторонники демократов.
По-моему, это большей частью пиар Козинского, чем реальные результаты, но люди ему верят.
Козинский работает в Фейсбуке и выполняет коммерческие заказы. Так в 2014 году он отвечал на вопро ы в отношении 10 млн. американских граждан.
Теперь Козинский рассказывает что это были зловещие люди из тех, кто управляет миром.
Благодаря его работе, они получили ключ к душам миллионов.
Эти данные, по его мнению использовали те, кто провернули Брексит, а также Трамп. Суть была в том, что для отдельных групп людей использовалась разная реклама, приходящая на ФБ.
Занималась всем этим компания Cambridge Analytica. Вот как они сами объясняют принцип своей работы.
Например, закон о свободном распространении оружия: «Для боязливых людей с высоким уровнем нейротизма мы представляем оружие как источник безопасности. Вот, на левой картинке изображена рука взломщика, который разбивает окно. А на правой картинке мы видим мужчину с сыном, которые идут по полю с винтовками навстречу закату. Очевидно, утиная охота. Эта картинка для богатых консерваторов-экстравертов».
Фирма выделяет у американских граждан 32 психотипа, сконцентрировавшись лишь на 17 штатах. И как Козинский выяснил, что мужчины-поконники косметики MAC скорее всего являются гомосексуалами, в Cambridge Analytica доказали, что приверженцы американского автопрома однозначно являются потенциальными сторонниками Трампа. Помимо прочего, подобные открытия помогли самому Трампу понять, какие послания где лучше всего применять. Решение предвыборного штаба сконцентрироваться в последние недели на Мичигане и Висконсине было принято на основе анализа данных. Кандидат стал моделью применения системы.
Козинский утверждает, что психологическое таргетирование, подобно тому, что использовали в Cambridge Analytica, повышают число кликов на рекламе в Facebook на 60%. Вероятность же того, что после просмотра персонализированной рекламы люди перейдут к действиям (купят ту или иную вещь или проголосуют за нужного кандидата) возрастает на 1400%.
Действительно ли новые технологии делают людей столь управляемыми? И действительно ли в США голосовать ходят исключительно пользователи ФБ? У нас, например, на выборы ходят пенсионеры, и им вполне хватает доброго, старого телевизора.

Издания Das Magazin, в котором речь шла о том, как Big Data и таргетированная реклама в соцсетях помогли Дональду Трампу одержать победу на президентских выборах в США. Многие поспешили назвать этот материал текстом года. Объясняем, почему массовая истерия вокруг расследования и изложенные в нем выводы оказались неоправданно преувеличенными и почему мы, скорее всего, имеем дело не с текстом года, а с крупнейшей журналистской уткой уходящего 2016-го.

Что случилось?

В начале декабря швейцарский журнал Das Magazin опубликовал материал о том, как британская компания Cambridge Analytica, объединив в один мощный сплав технологию Big Data, персональные данные пользователей Facebook и таргетированную рекламу в соцсетях, помогла Дональду Трампу стать президентом США вопреки всем ожиданиям. Также выяснилось, что услугами Cambridge Analytica пользовались радикальные организации, настроенные на выход Британии из Евросоюза. Этот материал был переведен на русский язык изданием The Insider, и его принялись массово распространять в качестве ответа, некоего универсального объяснения Трампу в президентском кресле и победы сторонников Brexit.

В начале статьи - история Михала Косински (Michal Kosinski), ученого, который первым, как кажется во время прочтения, придумал «подружить» психометрию с большими данными. Дальше история переключается на компанию Cambridge Analytica, которых представляют такими себе злыми гениями, воспользовавшимися наработками Косински для победы Трампа. Суть метода Cambridge Analytica в следующем: они скупают все доступные (и труднодоступные) массивы данных об интернет-пользователях, а затем на основании полученной информации тщательно создают такую рекламу для соцсетей, которая бы, во-первых, точно привлекла внимание конкретного психотипа, а во-вторых, заставила принять нужное решение (отдать голос за Трампа).

Михал Косински

В ход идет все: лайки, поисковые запросы, геометки - абсолютно все «следы», оставляемые пользователями в интернете. В тексте утверждается, что технология Косински, взятая на вооружение Cambridge Analytica, - это социология совершенно нового типа и по совместительству мощное оружие массового воздействия. Соцопросы и деление по гендерному или географическому признаку уже не работают - это слишком просто. Новый сложный мир, в котором мы живем, требует гораздо более сложных решений.

Уверенный стиль изложения статьи, компоновка достоверных фактов с обилием художественных деталей («задумчивый Косински, прилизанный Никс и широко улыбающийся Трамп») и упрощенная, «разжеванная» логика сложных явлений помогли этому материалу стать, что называется, «вирусным» и получить широчайшее распространение в Сети. Людям, до сих пор возмущенным и обескураженным последними событиями (в том числе победой Трампа), пришлось по душе складное и простое объяснение: оказывается, в их адрес применили новое страшное оружие управления массами. А словосочетание Big Data вместо размытых и абстрактных представлений приобрело отчетливые зловещие оттенки.

В общем, народу преподнесли историю в духе сериала «Черное зеркало»: есть такой благородный ученый Косински, который хотел предупредить мир об опасности, затем нашлись его циничные последователи (Cambridge Analytica), применившие теоретические знания на практике, и есть абсолютный победитель, нажившийся на этом (Трамп). Герои и злодеи. Добро, зло и пострадавшие (мы с вами). И мало кто заметил, что слишком уж подозрительно стройной вышла эта теория о заговоре вокруг больших данных.

Модель OCEAN

Директор Cambridge Analytica Александр Никс

В основе метода Михала Косински, который позаимствовали предприимчивые люди из Cambridge Analytica, используется так называемый метод OCEAN - попытка описать тип личности с помощью таких пяти популярных параметров, как открытость, добросовестность, экстраверсия, доброжелательность, нейротизм (в английском переводе эти слова образуют аббревиатуру OCEAN, которая и дала название методу). Еще с XIX века (все началось с исследований основателя психометрики Фрэнсиса Гальтона в 1884 году) психологи пытались дифференцировать этот метод изучения личности, но за прошедшие годы исследований количество параметров было сокращено с более чем сотни до пяти. Сделано это было, очевидно, для удобства применения модели OCEAN, но с ее соответствующим огрублением. В своем нынешнем виде пятифакторная модель личности используется с 1980-х.

В «расследовании Das Magazin» упоминают об этом факте, но после предложения «в 1980-е годы два психолога доказали, что каждая черта характера может быть измерена при помощи пяти измерений» сразу же перескакивают на историю Михала Косински. Это и создает манипулятивный эффект: у тех, кто не слишком-то знаком с развитием психологии как науки, возникает ощущение, что именно Косински всерьез взялся изучать и применять этот метод на практике, а до него этим как будто бы никто не занимался. Но это, конечно, не так.

С 1990-х кадровики уже пытались внедрить модель OCEAN, чтобы иметь возможность оценивать соискателей работы при найме персонала. В 2003 году в SA Journal of Industrial Psychology вышло исследование , целью которого было выявить взаимосвязь между характеристиками личности и качеством выполнения работы. В исследовании приняли участие 159 сотрудников фармацевтической компании, которых попросили пройти NEO PI-R - методику психологической диагностики личности, являющую собой опросник из 240 вопросов. Результаты исследования показали, что эмоциональная устойчивость, экстраверсия, открытость к новому опыту и добросовестность связаны с выполнением рабочих задач и креативностью. А три параметра измерения личности (эмоциональная устойчивость, открытость опыту и уступчивость) объяснили всего лишь 28 % процентов результатов, оказавшихся отклонением от усредненного значения.

То есть модель OCEAN смогла обработать и объяснить меньше трети полученных результатов, да и то с оговорками.

В дальнейшем количество исследований в этой области - личностные качества сотрудников и то, как эти качества влияют на выполнение рабочих задач - только росло. Было проведено больше сотни исследований, из которых стало понятно, что пятифакторная модель - это, конечно, просто и удобно, но собирать данные для построения модели OCEAN сложно: слишком длинный опросник и слишком высокая вероятность того, что опрашиваемый человек наврет в своих ответах.

С появлением и активным внедрением социальных сетей в нашу жизнь исследователи пятифакторной модели переключились на интернет-пользователей. В период между 2011–2012-м годами Михаил Косински как раз и приобрел известность благодаря своим предупредительным научным работам , в которых изучал потенциал применения этого метода. Чуть позже это подхватили мировые СМИ, и уже в 2013 году, например, на сайте таблоида The Independent появилась (одна из множества подобных) о том, как нас легко можно предсказать по нашим лайкам в соцсетях.

В действительности точность предсказаний по пятифакторной модели оказалась довольно спорной. можно посмотреть на список лайков страниц на фейсбуке и «личностные характеристики», которые они собой означают согласно Five Factor Model.

Умные - это те, кто лайкает кинофильм «Крестный отец» и «Властелин колец», шоу The Colbert Report, песенку Thunderstorms, слово «наука» и т. д. Сторонники Демократической партии - это те, кто залайкали следующие страницы: Joe Biden; Health Care Reform; The White House; Democrats; Being Liberal; Barack Obama 2012.

Не слишком репрезентативная выборка, не правда ли?

В 2013 году стало понятно , что помимо сочетания FFM и Big Datа есть еще Big Big Data и множество более перспективных игровых моделей, на которые и переключились профессиональные исследователи и до сих пор испытывают. Михал Косински тоже не стал зацикливаться на тупиковой (по крайней мере, на сегодняшний день) сфере пятифакторной модели: в декабре 2015 года, например, у него вышла работа , посвященная выяснению причин несовпадения вкусов и пристрастий у супругов и друзей.

Однако в медиа и в сознании людей остался этот конспирологический шлейф вокруг использования больших данных сильными мира сего ради собственной выгоды.

Скажи мне, кто твой лайк

Об этом нигде нет упоминания в «расследовании», но то самое «страшное оружие» Косински, основанное на анализе Big Data, можно протестировать самостоятельно. Опробовать на себе демоверсию революционной технологий, с помощью которой компания Cambridge Analytica, как утверждается, привела Дональда Трампа к победе на президентских выборах. И уже после этого сделать выводы: действительно ли эта штука способна навязывать людям те или иные поступки?

Тестирование доступно в двух вариантах: анализ вашего фейсбук-аккаунта и анализ написанного вами текста из 1 000 слов.

В первом случае инструмент анализирует ваши лайки по страницам на фейсбуке (любимые фильмы, книги, музыку, общественные организации) и составляет ваш психометрический портрет, определяя те или иные характерные черты. К примеру, в увлечении группой The Cure и сатирическим мультсериалом «Робоцып» программа усматривает «женственность», тогда как шоу Top Gear и канал Comedy Central гарантированно свидетельствуют о вашей маскулинности. Любовь к «Симпсонам» и передаче Saturday Night Live почему-то приравнивается к консерватизму, а вот группа Depeche Mode сразу выдает в вас либералов, трудоголиков и созерцателей (да, коллектив подпадает сразу под три характеристики). И в то же самое время вышеупомянутые лайки группам The Cure и Depeche Mode машина определила как склонность к «менее интеллигентному» поведению.

Этот инструмент не смог с точностью определить религиозную принадлежность автора статьи, засунув его в категорию «другое», куда входят атеизм, агностицизм, буддизм и пастафарианство. Теперь вспоминаем громкие слова из оригинального расследования: «После анализа 70 лайков модель сможет лучше узнать человека, чем его друг. После 150 лайков - лучше, чем родители. После 300 лайков - лучше, чем партнер. С еще большим количеством изученных действий можно было бы узнать о человеке лучше, чем он сам».

Да, кстати, еще с помощью «оружия» удалось выяснить, что лайк официальной странице группы U2 на фейсбуке свидетельствует о «слабо выраженной заинтересованности в психологии».

Big Data и возможность их объединения с психологией - это, безусловно, крайне перспективная сфера, в которой еще предстоит прояснить этический вопрос границ использования личных данных. Но вряд ли эту комбинацию можно назвать стопроцентным оружием, гарантирующим крупную политическую победу или успех в бизнесе. Все-таки человек и его поведенческие паттерны - это слишком труднопрогнозируемая история. Как бы ни хотелось обратного журналистам, сочиняющим манипулятивные статьи, читателям - любителям «простых истин» и политикам, которые по старинке рассчитывают купить голоса.

⇔⇔⇔

При подготовке статьи были использованы материалы из Telegram-канала Сергея Карелова.

Читайте нас у
Telegram

Дэвид Стиллвэлл и Михал Косински из Кембриджского университета (Великобритания) разработали компьютерную программу, способную "просчитать" черты личности и характера пользователя, ориентируясь на "лайки", оставленные им в социальных сетях. Причем, как утверждают разработчики, новый алгоритм делает это гораздо точнее, чем живые люди.

"Способность судить об особенностях личности того или иного человека является краеугольным камнем нашей общественной жизни, начиная с тех социальных действий, которые мы совершаем каждый день, и заканчивая долгосрочными решениями, такими как на ком жениться, кому доверять, кого нанимать на работу или выбирать президентом, - комментирует Дэвид Стиллвэлл. - Результаты работы подобных алгоритмов могут заметно помочь нам делать правильный выбор".

Это не первая подобная разработка Косински и Стилвэлла. В 2013 году ими была представлена программа, практически безошибочно определявшая по "лайкам" такие характеристики, как возраст, расовая принадлежность, сексуальная ориентация и коэффициент интеллекта юзеров Facebook.

Что же касается новой программной версии, то она способна на основании "лайков", поставленных под постами, идентифицировать пользователей по пяти критериям, используемым западными психологами для исследований модели личности человека: это доброжелательность, открытость, добросовестность, эмоциональная стабильность и экстраверсия.

Для того, чтобы проверить точность работы алгоритма, исследователи создали специальное игровое приложение к Facebook - myPersonality. В ходе работы с ним пользователям предлагалось ответить на ряд вопросов, касавшихся их мировоззрения, а также оценить черты характера одного или нескольких своих "френдов" в соцсети.

В общей сложности приложение скачали 87 тысяч, при этом 17 тысяч были "друзьями" на Facebook или же были знакомы между собой в реальной жизни.

Выяснилась поразительная вещь: виртуальная программа справлялась с задачей идентификации личности куда лучше, чем это делали виртуальные и реальные друзья и знакомые человека! Программе было достаточно всего 10 "лайков", чтобы дать более точную оценку личности человека, чем это делали его коллеги по работе, 70 "лайков" - чтобы превысить показатели друзей и 150 - родственников.

Подобный результат оставляет неоднозначные впечатления. С одной стороны, говорят эксперты, анализ "лайков" может помочь нам составить более точный портрет человека, с которым мы собираемся иметь дело - в личной жизни, по работе, по бизнесу и так далее.

С другой стороны, он ставит под сомнение безопасность личных данных в интернете, ведь если кто-то вздумает воспользоваться программой, он может узнать о нас больше, чем мы хотим… Со временем это даже может заставить людей ограничить пользование социальными сетями.

В последнее время появилось множество исследований, пытающихся изучать людей по тому, как они ведут себя в интернете. Так, совсем недавно ученые из Университета Огайо пришли к выводу, что мужчины, которые любят выкладывать селфи в соцсетях, склонны к антисоциальному поведению.

К участию в исследовании привлекли около 800 мужчин в возрасте от 18 до 40 лет. Всех участников попросили ответить, как часто они выкладывают свои фото в социальных сетях. Также они заполнили анкеты, на основании которых ученые делали выводы об их социальном поведении и самообъективации (внимании к собственной внешности).