Меню

Михаил косинский психолог. Социальные сети: диагноз по "лайкам"

Мать и дитя


Известно, что все наши действия в Сети оставляют след, да и не только в Сети. Фиксируется, что купили (карточки), где бывали (смартфоны), видеокамеры по всему городу, видеорегистраторы на машинах и пр. Теоретически, если проанализировать все эти данные, то можно узнать о человеке все.
Вот только вопрос: а зачем это нужно? Ну, узнали вы все обо всех – дальше что? Ведь и без хранения огромного количества информации о людях известно все, что нужно – не так уж они отличаются друг от друга.
Говорят, что анализ подобных данных поможет улучшить продажи и голосовать за нужного кандидата. Да, но данные-то будут у всех кандидатов и у всех продавцов – в чем профит?
По-моему, это все ерунда: данные про всех просто не нужны, а про отдельного человека можно собрать, но это другой вопрос, да и кроме электронных данных есть способы, и более надежные.
Но очень уж хочется верить в могущество и новые возмоэности.
Сегодня в СМИ много пишут про некоего Михаила Козинского.
Он поляк, из Вашавы. Ему 34 года. В 2008 году он поступил в Кембридж, в Центр психометрии, лабораторию Кэвендиш - лабораторию по психометрии для работы над докторской диссертацией (напоминаю, что кандидатской у них нет, так что он был кем-то вроде нашего аспиратнта).
Козинский и его однокурсники запустили компьютерное психологическое тестирование. Благодаря созданному ими приложению для Facebook под названием MyPersonality они получили психологические данные миллионов людей.
Далее они изучали статистические связи между психологическими свойствами, возрастом, полом, расой, сексуальной ориентацией и теми лайками, которые ставили люди, страничками, которые они посещали и др.
В итоге получили большое количество каких-то связей, по которым Косинский теперь берется по лайкам и страничкам устанавливать пол, возраст, расу, сексуальную ориентацию, какие-то особенности личности.
В принципе, ничего особенного. Сам же Козинский подает свои результаты очень бойко: . например, если мужчина подписан на страничку бренда косметики MAC, он с высокой вероятностью является геем. Наоборот, сильный показатель гетеросексуальности - если человек поставил лайк хип-хоп группе Wu-Tang Clan из Нью-Йорка. Поклонник Леди Гаги с высокой долей вероятности экстраверт, а человек, ставящий «нравится» философским постам - интроверт.

В 2012 году Козинский доказал, что анализа 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с 95% вероятностью), его гомосексуальность (88% вероятности) и приверженность Демократической или Республиканской партии США (85% вероятности). Но процесс идет дальше: интеллектуальное развитие, религиозные предпочтения, пристрастие к алкоголю, курению или наркотикам. Данные даже позволяли узнать, развелись ли родители испытуемого до его совершеннолетия или нет. Модель оказалась настолько хороша, что стало возможным предугадывать ответы испытуемого на определенные вопросы. Скоро модель смогла лучше узнавать личность после десяти изученных лайков, нежели его коллеги по работе. После 70 лайков - лучше, чем друг. После 150 лайков - лучше, чем родители. После 300 лайков - лучше, чем партнер. С еще большим количеством изученных действий можно было бы узнать о человеке лучше, чем он сам.
Козинский и команда могут оценивать людей по Большой пятерке критериев исходя из их юзерпика, фотографии в соцсетях. Или даже по числе друзей: хороший показатель экстраверсии! Но мы также сдаем личные данные, когда находимся не в сети. Датчик движения в смартфоне показывает, размахиваем ли мы рукой с ним, как далеко ездим (коррелирует с эмоциональной нестабильностью). Как замечает Козинский, смартфон - это огромный психологический опросник, который мы вольно или невольно заполняем. Что особенно важно, это работает и в обратную сторону: можно не только создавать из данных психологический портрет, вы можете искать среди этих портретов нужные. Например, обеспокоенные папаши, озлобленные интроверты, не определившиеся с выбором сторонники демократов.
По-моему, это большей частью пиар Козинского, чем реальные результаты, но люди ему верят.
Козинский работает в Фейсбуке и выполняет коммерческие заказы. Так в 2014 году он отвечал на вопро ы в отношении 10 млн. американских граждан.
Теперь Козинский рассказывает что это были зловещие люди из тех, кто управляет миром.
Благодаря его работе, они получили ключ к душам миллионов.
Эти данные, по его мнению использовали те, кто провернули Брексит, а также Трамп. Суть была в том, что для отдельных групп людей использовалась разная реклама, приходящая на ФБ.
Занималась всем этим компания Cambridge Analytica. Вот как они сами объясняют принцип своей работы.
Например, закон о свободном распространении оружия: «Для боязливых людей с высоким уровнем нейротизма мы представляем оружие как источник безопасности. Вот, на левой картинке изображена рука взломщика, который разбивает окно. А на правой картинке мы видим мужчину с сыном, которые идут по полю с винтовками навстречу закату. Очевидно, утиная охота. Эта картинка для богатых консерваторов-экстравертов».
Фирма выделяет у американских граждан 32 психотипа, сконцентрировавшись лишь на 17 штатах. И как Козинский выяснил, что мужчины-поконники косметики MAC скорее всего являются гомосексуалами, в Cambridge Analytica доказали, что приверженцы американского автопрома однозначно являются потенциальными сторонниками Трампа. Помимо прочего, подобные открытия помогли самому Трампу понять, какие послания где лучше всего применять. Решение предвыборного штаба сконцентрироваться в последние недели на Мичигане и Висконсине было принято на основе анализа данных. Кандидат стал моделью применения системы.
Козинский утверждает, что психологическое таргетирование, подобно тому, что использовали в Cambridge Analytica, повышают число кликов на рекламе в Facebook на 60%. Вероятность же того, что после просмотра персонализированной рекламы люди перейдут к действиям (купят ту или иную вещь или проголосуют за нужного кандидата) возрастает на 1400%.
Действительно ли новые технологии делают людей столь управляемыми? И действительно ли в США голосовать ходят исключительно пользователи ФБ? У нас, например, на выборы ходят пенсионеры, и им вполне хватает доброго, старого телевизора.

Михаил Косински - гуру цифровой психометрии, анализирующей людей по их дигитальным следам. Что будет с нашей приватностью, с тревогой выясняла у него Ника Дубровская.

Михал Косински - психолог, специалист по big data, бывший заместитель директора Центра психометрии Кембриджского университета, сейчас доцент Стэнфордского университета, один из ведущих спецов в мире по психометрии нового образца, которую бизнес, политика, спецслужбы, здравоохранение или просто другие люди могут использовать в своих целях.

- Расскажи о том, что такое психометрия, как давно она существует и как развивалась.

Психометрия - это наука, изучающая теорию и методику психологических измерений. Ей занимаются психологи, которые анализируют личностные черты человека с помощью различных анкет и тестов. Существует она очень давно: более тысячи лет назад китайских чиновников нанимали на работу на основе стандартизированных тестов, подобных современным GMAT и SAT, которые мы используем в Америке сегодня.

Самое большое изменение в психометрии заключается в том, что вместо опроса людей с помощью анкет теперь мы можем наблюдать за их поведением. Психологи давно знают, что лучший способ оценить человека - пронаблюдать за ним. Вместо того чтобы спрашивать, как часто вы ходите на вечеринки, лучше это самим увидеть. В реальной жизни это очень трудно, потребовалось бы невероятное количество времени и ресурсов, чтобы следить за людьми и записывать, чем они занимаются, не говоря уже о том, что это довольно жутко.

Но в мире новых технологий мы сами, не задумываясь, оставляем множество цифровых отпечатков - каждый раз, когда пользуемся Facebook, браузером, Google, смартфоном. Сегодня нетрудно использовать эти данные, чтобы составить портрет человека. И у этого метода много преимуществ. Например, людям сложнее исказить информацию о себе. В прошлом если ты солгал в психологическом тесте, то легко мог получить преимущество перед тем, кто был честен. Сегодня тебе пришлось бы полностью изменить свое поведение и придерживаться его много лет подряд, чтобы обмануть систему. Так что если ты действительно в состоянии в течение пяти лет вести себя как хорошо организованный человек, то, вероятно, ты им и являешься.

Мне бы тоже хотелось узнать свой психологический профиль. Но ведь это интересует не только меня, но и тех, кто не прочь продать мне что-нибудь или как-то на меня повлиять.

Безусловно, есть люди, которые этого хотят, и в некотором смысле это даже хорошо. Министр здравоохранения хочет, чтобы ты не курила, питалась здоровой пищей и жила дольше. И у него больше шансов помочь тебе, если он будет знать, как тебе это правильно подать. Твой школьный учитель помогает тебе стать хорошим, честным человеком. Есть множество примеров, когда на наше поведение влияют нам же во благо.

Я не сторонник того, чтобы вся персональная информация была в открытом доступе и чтобы любой желающий мог получить ее без нашего ведома. Но если человек согласен, мы могли бы, например, помочь ему найти работу, на которой он может реализовать себя, ради которой ему хотелось бы вставать по утрам. Или проследить симптомы психических заболеваний и даже предвидеть высокий риск самоубийства, анализируя фотографии лиц или цифровые следы. Болезнь влияет на твое поведение, но это влияние может быть настолько малым, что обычный человек, в отличие от компьютеров, его не заметит. В прошлом только люди c деньгами могли позволить себе визиты к психологу. Сегодня благодаря алгоритмам мы можем дать все это простым людям, не предлагая им тратить сотни долларов в кабинетах врачей.

Или подумай, например, об образовании. Предположим, учитель что-то рассказывает аудитории - но к кому он в действительности обращается? Он говорит со средним студентом, которого на самом деле не существует. В результате много студентов скучает: для кого-то он говорит слишком быстро, для кого-то - слишком медленно. И мы разрабатываем алгоритмы, которые могут определять, насколько быстро студент справляется с заданиями, и подстраивать под него программу. Быстрый студент будет в состоянии прогрессировать быстро, медлительный не будет брошен в отстающих, потому что компьютер терпеливо подождет и объяснит ему все более четко.

И как же именно, основываясь на наблюдении за поведением пользователей онлайн, можно узнать о них что-то личное?

Пока ты пользуешься Facebook, он изучает твое поведение и на основе этой информации создает твой психологический профиль. Впоследствии он используется другими алгоритмами, чтобы в ленте отображались только интересующие тебя новости и истории. И это классно, потому что иначе тебе бы очень быстро надоело сталкиваться с ненужной информацией. Те же механизмы Facebook использует, чтобы показывать тебе рекламу. Это тоже отлично - зачем тебе видеть объявления, которые тебя вообще не интересуют? Facebook должен показывать рекламу, чтобы зарабатывать, - для нас это своего рода плата за пользование. Но лучше, чтобы эти объявления, по крайней мере, были полезными. Так что в целевом маркетинге часто нет ничего плохого, если никто не вторгается в твою жизнь без твоего ведома и согласия. Конечно, у всех должна быть возможность отказаться, запретить алгоритму создавать профиль. Но всем остальным это заметно облегчает жизнь.

Очень странно, что ты так оптимистично настроен. В других интервью, после победы Трампа, ты был куда менее жизнерадостен.

Это журналисты выбирают только негативное. Плохие новости продаются, никто не хочет слушать ничего оптимистического.

И тем не менее. Например, я - американский гражданин, и на последних выборах я не голосовала, потому что не хотела отдавать голос за Хиллари, но была абсолютно уверена, что она в любом случае победит. Но теперь я думаю, что это решение навязал мне Facebook, фильтруя информацию в ленте. Мой профиль говорит о том, что я не буду голосовать за Трампа, но могу, если что, не проголосовать и за Хиллари тоже. Вот за это «если что» система и могла ухватиться.

Да, люди говорят об информационном пузыре, даже Обама упоминал его в прощальной речи. Это модный тренд, основанный на ложном представлении. Есть даже институты, которые по сути являются научно-исследовательскими центрами по изучению феномена информационного пузыря. Очевидно, что если ты - научно-исследовательский центр по изучению какой-то проблемы, ты ее найдешь, поскольку получаешь на это гранты. Но на самом деле нет никакого научного обоснования информационных пузырей. Как раз наоборот.

В прошлом такой феномен действительно был, и он был связан с тем, что из информационного пузыря невозможно было выбраться. Если ты жил в России, то слышал только российскую пропаганду. Если родился в богатой английской семье, то получал информацию только от зажиточных друзей. Если в деревне, то только от своих священника и библиотекаря.

Теперь у нас есть интернет. Но у людей сохранилась тенденция воспринимать только информацию, подтверждающую их взгляды. Эта склонность к подтверждению своей точки зрения - одно из наиболее исследованных когнитивных искажений в психологии. Оно подразумевает, что если ты либерал, то ты предпочитаешь либеральную информацию, если консерватор - консервативную. Раньше ты ничего не мог с этим поделать, даже не понимал этого. Но сегодня на Facebook ты время от времени сталкиваешься с совершенно сумасшедшей информацией от людей, которые находятся за пределами твоего пузыря. Это дает тебе возможность узнать что-то, абсолютно противоположное тому, что ты знал до этого.

Сегодня люди потребляют беспрецедентное разнообразие информации, причем не только в политической сфере. Недавно я разговаривал с главным инженером Spotify, и он сказал мне, что только за 2016 год вариативность музыкальных коллективов, которые слушают люди, увеличилась в среднем на 20%. Так что, даже несмотря на нашу предрасположенность, мы все равно получаем более широкую информацию. Очевидно, что часть ее будет низкого качества, а часть - просто фальшивкой. Это новые медиа, и мы должны научиться пользоваться ими, фильтровать - этот навык сегодня становится важнее, чем когда-либо.

И целевой политический маркетинг - тоже вещь хорошая. Если ты живешь в большом городе, проблемы, связанные с сельским хозяйством, тебя не интересуют. И если ты увидишь на ТВ политика, который говорит об этом, ты, вероятно, переключишь канал, а это неправильно, потому что ты исключаешь себя из политического процесса. Но новый алгоритм дает политикам возможность общаться с избирателями один на один о проблемах, которые их интересуют. Программы партий - это длинные документы, сотни, если не тысячи, страниц. Простой человек не сможет в них разобраться. Алгоритмы позволяют выбрать часть программы, которая относится к тебе, и показать ее так, что ты можешь с ней ознакомиться.

Это раньше политики просто посылали одно сообщение всем сразу о проблеме, до которой многим не было дела. Теперь они могут говорить о том, что актуально для тебя. И очевидно, что некоторые начнут делать это раньше, некоторые позже. Те, кто раньше, получат преимущество просто потому, что они уже сейчас слышат тебя лучше. Другие политики вскоре подключатся, и равновесие сил будет восстановлено, мы все извлечем из этого выгоду.

- Но пока в авангарде Трамп…

Да, Трамп - это история успеха парня без поддержки крупных лоббистов. Это ведь было просто смешно: у него не было внятной идеи, он говорил глупости. У Клинтон был в разы больший бюджет. Но Трамп обратился к людям напрямую. Берни Сандерс тоже сегодня может зайти на выборах далеко просто потому, что ему есть что сказать в Твиттере, - это настоящая революция в политике. Еще 10 или 20 лет назад никто бы о нем не услышал.

Вопрос в том, есть ли у меня или у любого пользователя реальная возможность остановить постоянную слежку и выбраться из паутины, собирающей персональную информацию.

Остановить это невозможно. Хотя можно просто прекратить пользоваться Facebook и Твиттером. Кстати, эти две компании собирают данные наименее агрессивно. Подумай о кредитной карте или веб-браузере - это очень личные данные, цифровые следы, которые действительно могут сказать о тебе многое. Так что пришлось бы выключить свет, переехать в пещеру посреди леса и избавиться от всех цифровых устройств. И даже в этом случае тебя нашел бы какой-нибудь турист и сделал бы твой снимок, потому что ты чудак. И вот снова ты оставляешь цифровые следы. Готовых решений тут нет, нужно быть осторожным, анализировать, создавать новую политику конфиденциальности, разрабатывать необходимые технологии для ее реализации. Можно голосовать за политиков, которые относятся серьезно к вопросам приватности.

- Менять законы?

Я думаю, это просто замедляет процесс. Если ты примешь закон, запрещающий любое профилирование пользователей, это приведет к коллапсу, вся рекомендательная система прекратит работать. Твой Spotify, Last.fm, Netflix, Facebook - всё. Результаты поисковой выдачи, которые ты видишь, - тоже часть рекомендательного механизма, и Google прекратил бы работать тоже. В целом я считаю, что, поскольку мы все сильнее погружаемся в цифровую среду и оставляем все больше дигитальных отпечатков, а алгоритмы становятся все умнее, сохранить приватность в будущем у нас не получится.

- И что будет означать эта потеря приватности?

Возможно, в будущем ты не сможешь скрыть даже свои самые личные черты. Сегодня ты можешь сказать мне, какие у тебя политические взгляды, сексуальная ориентация, религиозная принадлежность, а можешь и не говорить. Но в будущем у тебя может не быть такого выбора. Алгоритмы видят тебя насквозь. Уже сегодня мы в состоянии взять фотографию любого человека и с точностью более 90% определить, какая у него сексуальная ориентация, не прибегая к анализу дополнительных данных. Не говоря уже о том, сколько о тебе можно узнать, когда есть лайки и твиты. Это будут в состоянии сделать правительства, компании и даже обычные люди. То, что Штази делала в Восточной Германии, используя сотни тысяч людей на зарплате, сегодня может сделать за своим ноутбуком ученик средней школы.

При этом та же самая технология представляет гораздо большую опасность для людей, живущих в таких странах, как Саудовская Аравия или, возможно, Россия. Если ты живешь в Саудовской Аравии и алгоритм может сообщить правительству, какие у тебя политические взгляды и сексуальная ориентация, - тебя могут просто убить.

- При этом тот же Фейсбук - это еще и частная компания, бизнес.

Кто контролирует медиа - это важно. Очевидно, что Марк Цукерберг сегодня единолично управляет средой, которую множество людей использует для потребления информации. Ларри Пейдж и Сергей Брин управляют еще одной средой, которая потенциально имеет огромное влияние на результаты выборов. И это действительно опасно на многих уровнях. Возможно, все они - хорошие парни, но кто знает наверняка? Предположим, Цукерберг в порядке, но что, если следующий Цукерберг - монстр? Для демократии всегда плохо, когда один человек имеет слишком много власти, но это - то, с чем мы уже имеем дело сейчас.

Прежде всего, Цукерберг может изменить свой алгоритм. Но Марк, по крайней мере, - ответственное лицо, и люди знают: если что, его можно обвинять. А у простого разработчика, анонимного парня, который сидит в серверной, такой ответственности нет. Завтра он может изменить пару строк кода в алгоритме работы Facebook и повлиять на работу этой огромной машины, и этого никто не заметит, более того, людям будет сложно вычислить, что это сделал именно он.

Вторая проблема состоит в том, что алгоритм может начать делать вещи, которых никто не ожидает, даже сам Цукерберг и его разработчики. В прошлом, если у тебя была газета и ты хотел завести политическую колонку, ты организовывал встречу с редакторами и говорил им, как это должно выглядеть. Это было легко контролировать, и как владелец ты сразу видел, если твоя газета печатала что-то не то.

Алгоритмы Facebook контролировать гораздо сложнее, они показывают всем разные вещи. Ни Цукерберг, ни его инженеры не в силах понять, что этот алгоритм фактически делает, что происходит у него внутри. То есть мы, конечно, можем понять, как это работает, ведь даже нейронные сети довольно просты - но они огромны. Там такое количество слоев этих простых вещей, что система становится совершенно непонятной. Это делает возможной парадоксальную ситуацию, когда алгоритм Цукерберга начнет делать вещи, о которых мы не догадываемся и которые, соответственно, не можем проконтролировать.

- Ничего себе. И каким видишь ты решение этой проблемы?

Традиционные СМИ находятся под контролем общественных организаций и правительственных медиаагентств, следящих за тем, чтобы журналисты не публиковали ложную информацию. Я думаю, что те же самые стандарты должны применяться и к таким компаниям, как Facebook или Google. Очевидно, что это намного сложнее осуществить, поскольку у каждого пользователя Facebook свой персонализированный опыт. Это не похоже на отношения с традиционными СМИ, когда ты можешь подсчитать, кто сколько раз солгал, и оштрафовать их. Но я думаю, что мы можем анализировать опыт случайных десяти или ста тысяч пользователей и на основе этого делать выводы о поведении алгоритма в целом.

- Ты предлагаешь контролировать алгоритм, а не пользователя, верно?

Я предлагаю использовать один алгоритм, чтобы контролировать другие алгоритмы. Если бы за работой алгоритмов Марка Цукерберга следили другие алгоритмы, не только он полнее осознавал бы свою ответственность, но и люди больше доверяли бы ему. Общество, политики, Цукерберг - мы все должны принять эту новую политику, способную застраховать нас от вмешательства программиста в серверной. Все только выиграют от этого дополнительного контроля, публичного и открытого. За этим могут следить университет, несколько университетов, общественные организации или каждый пользователь.

Сейчас, когда в Facebook замечают за своим алгоритмом странности, они пытаются разобраться с этим. Возьмем, к примеру, fake news. Это проблема, с которой они давно столкнулись и над решением которой упорно работают. И можно сказать, что им удалось настроить алгоритм таким образом, чтобы он прекратил показывать fake news. Но все это говорит о том, что никто не понимает, как работает алгоритм, - мы можем только смотреть на результат и исправлять ошибки. Это касается и других областей - очень скоро ты придешь к доктору, а он скажет тебе: «Выпей это лекарство, оно поможет тебе. Но я не знаю почему - так сказал компьютер. Должно быть, это правда, потому что он практически не ошибается и знает все лучше меня».

- Я бы, наверное, не стала пить эти таблетки.

Думаю, стоило бы - компьютеры тут точнее.

- И все-таки, как ты думаешь, будем ли мы в состоянии защитить себя в будущем?

Мы можем изменить законы и создать компании, которые в состоянии лучше защитить наши технологии; мы можем обсуждать децентрализованные технологии шифрования. Но вместо того, чтобы продолжать участвовать в битве за приватность, которую мы уже проиграли, мы должны подумать, как вести себя дальше. Давайте попытаемся сделать общество более открытым и терпимым. Образованными избирателями манипулировать сложнее, толерантное общество не будет угрожать людям с иными взглядами, сексуальной ориентацией или вероисповеданием. И мы не сможем защитить себя, если не объединимся. Эта проблема слишком серьезна - нельзя в одиночку защитить себя от ядерной бомбы. Хотя этот пример как раз обнадеживает. У нас есть много других потенциально опасных технологий, которые разработало человечество, и нам удалось с ними разобраться. Подумай о ядерной энергии, динамите или кухонных ножах. Очевидно, есть примеры использования этих технологий против нашего благополучия, но в целом нам удается их контролировать. Мы справляемся с ядерной энергией - справимся и с алгоритмами.

В работе над текстом принимал участие Арнольд Хачатуров.

В субботу швейцарский журнал Das Magazin опубликовал расследование о том, как технологии персонализированной рекламы в сети Facebook повлияли на итоги выборов в США и референдума о выходе Великобритании из ЕС. Как отмечает немецкий Spiegel, многие журналисты уже стали называть расследование «текстом года». В нем есть все: и новейшие технологии; и универсальное оружие, которое попало из хороших рук в плохие; и ежедневная слежка за каждым из нас; и таинственные заказчики; и превращение из нищего в принца (и наоборот). The Insider публикует полный перевод текста с немецкого языка.

В половине девятого утра 9 ноября Михал Козинский проснулся в цюрихском отеле Sunnehus. 34-летний ученый приехал, чтобы выступить в Федеральной высшей технической школе (ETH) с докладом на конференции об опасности Big Data и так называемой «цифровой революции». С подобными лекциями Козинский разъезжает по всему миру, ведь он является ведущим экспертом в психометрии - разделе психологии, основанном на анализе данных. Включив тем утром телевизор он понял: бомба разорвалась. Дональд Трамп избран президентом США, несмотря на все прогнозы социологов.

Козинский долго смотрит новости о триумфе Трампа, о результатах голосования по разным штатам. Он подозревает, что произошедшее как-то связано с его научными разработками. Козинский вздыхает и выключает телевизор.

В тот же день доселе малоизвестная лондонская фирма рассылает пресс-релиз следующего содержания: «Мы поражены тем, что наш революционный подход к основанным на данных коммуникациям внес такой существенный вклад в победу Дональда Трампа». Пресс-релиз подписан неким Александром Джеймсом Эшбернером Никсом. Ему 41 год, он британец и возглавляет компанию Cambridge Analytica. Никс всегда носит костюм, модные роговые очки, а свои светлые волнистые волосы обычно зачесывает назад.

Задумчивый Козинский, прилизанный Никс и широко улыбающийся Трамп - первый сделал цифровую революцию возможной, второй осуществил ее, последний стал благодаря ей победителем.

Насколько опасна Big Data?

Сейчас каждый, кто не жил на Луне последние пять лет, знаком с термином Big Data. Этот термин значит и то, что все, что мы делаем - в интернете или «офлайн» - оставляет цифровой след. Покупка по кредитке, запрос в Google, прогулка со смартфоном в кармане, каждый лайк в соцсети: все это сохраняется. Долгое время никто не мог понять, для чего хорошего могли бы пригодиться эти данные - кроме тех случаев, когда в ленте Facebook всплывает реклама средств от гипертонии, потому что недавно мы искали в Google «как понизить давление». Непонятно было и то, чем же является Big Data для человечества - большой опасностью или большим достижением? Но с 9 ноября мы знаем на это ответ. Ведь и за предвыборной кампанией Трампа в интернете, и за кампанией в поддержку Brexit стоит одна и та же компания, исследующая Big Data: Cambridge Analytica и ее директор Александр Никс. Тот, кто хочет понять природу этих голосований (и природу того, что ожидает Европу в ближайшие месяцы), должен начать с примечательного события, произошедшего в 2014 году в британском Кембриджском университете. А именно, на кафедре психометрии Козинского.

Психометрия, которую иногда зовут психографией, представляет собой попытку измерить человеческую личность. В современной психологии стандартом является так называемый «метод океана» (по буквам OCEAN, анаграмму пяти измерений на английском языке). В 1980-е годы два психолога доказали, что каждая черта характера может быть измерена при помощи пяти измерений. Это так называемая «большая пятерка»: открытость (насколько вы готовы к новому), добросовестность (насколько вы перфекционист), экстраверсия (как вы относитесь к социуму), доброжелательность (насколько вы дружелюбны и готовы к сотрудничеству) и нейротизм (насколько легко вас вывести из себя) На основе этих измерений можно точно понимать, с каким человеком имеешь дело, в чем его желания и страхи, наконец, как он себя может вести. Проблема была в сборе данных: чтобы что-то понять о человеке, от него требовалось заполнить огромный опросник. Но потом появился интернет, затем Facebook, затем Козинский.

В 2008 году студент из Варшавы Михал Козинский начал новую жизнь: он поступил в престижный английский Кембридж, в Центр психометрии, лабораторию Кэвендиш, самую первую лабораторию по психометрии в мире. Со своими однокурсниками он придумал и запустил приложение для Facebook под названием MyPersonality. Пользователю предлагалось ответить на огромный список вопросов («легко ли вас вывести из себя в состоянии стресса? Есть ли у вас склонность критиковать окружающих?»), получив затем свой «профиль личности», а создатели приложения получали бесценные личные данные. Вместо ожидавшихся данных по дюжине однокурсников создатели получили информацию по сотням, тысячам, а затем и миллионам людей. Два докторанта собрали тем самым крупнейший «урожай» данных в истории психологических исследований.

Процесс, который Козинский сотоварищи разработал за последующие несколько лет, достаточно прост. Во-первых, тестируемый получает список вопросов, онлайн-тест. Из ответов на него ученые вычисляют личные ценности испытуемого. Далее, Козинский с командой изучают действия испытуемого: лайки и репосты в Facebook, а также его пол, возраст и место жительства. Так исследователи получают связи. Из простого анализа данных в сети могут получится необычные выводы. Например, если мужчина подписан на страничку бренда косметики MAC, он с высокой вероятностью является геем. Наоборот, сильный показатель гетеросексуальности - если человек поставил лайк хип-хоп группе Wu-Tang Clan из Нью-Йорка. Поклонник Леди Гаги с высокой долей вероятности экстраверт, а человек, ставящий «нравится» философским постам - интроверт.

Анализа 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с 95% вероятностью), его гомосексуальность (88% вероятности) и приверженность Демократической или Республиканской партии

Козинский и его коллеги беспрестанно совершенствовали свою модель. В 2012 году Козинский доказал, что анализа 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с 95% вероятностью), его гомосексуальность (88% вероятности) и приверженность Демократической или Республиканской партии США (85% вероятности). Но процесс идет дальше: интеллектуальное развитие, религиозные предпочтения, пристрастие к алкоголю, курению или наркотикам. Данные даже позволяли узнать, развелись ли родители испытуемого до его совершеннолетия или нет. Модель оказалась настолько хороша, что стало возможным предугадывать ответы испытуемого на определенные вопросы. Опьяненный успехом, Козинский продолжал: скоро модель смогла лучше узнавать личность после десяти изученных лайков, нежели его коллеги по работе. После 70 лайков - лучше, чем друг. После 150 лайков - лучше, чем родители. После 300 лайков - лучше, чем партнер. С еще большим количеством изученных действий можно было бы узнать о человеке лучше, чем он сам. В день, когда Козинский опубликовал статью о своей модели, он получил два звонка: жалобу и предложение работы. Оба звонка были из компании Facebook.

Только для друзей

Теперь на Facebook можно отмечать свои посты как открытые и приватные, «подзамочные»: во втором случае просматривать их могут лишь определенный круг друзей. Но для сборщиков данных и это не проблема. Если Козинский всегда запрашивал соглашения пользователей Facebook, современные тесты требуют доступа к персональным данным как обязательного условия для их прохождения.

Но речь не только об отметках «нравится» в Facebook: Козинский и команда могут оценивать людей по Большой пятерке критериев исходя из их юзерпика, фотографии в соцсетях. Или даже по числе друзей: хороший показатель экстраверсии! Но мы также сдаем личные данные, когда находимся не в сети. Датчик движения в смартфоне показывает, размахиваем ли мы рукой с ним, как далеко ездим (коррелирует с эмоциональной нестабильностью). Как замечает Козинский, смартфон - это огромный психологический опросник, который мы вольно или невольно заполняем. Что особенно важно, это работает и в обратную сторону: можно не только создавать из данных психологический портрет, вы можете искать среди этих портретов нужные. Например, обеспокоенные папаши, озлобленные интроверты, не определившиеся с выбором сторонники демократов. По сути, Козинский изобрел поисковую систему по людям.

Все явственнее Козинский понимал и потенциал, и опасность своей работы.

Примерно в это время, в начале 2014 года, к Козинскому обратился молодой ассистент профессора по имени Александр Коган. У него был запрос от некой фирмы, заинтересованной в методе Козинского. Предложение состояло в том, чтобы проанализировать путем психометрии 10 млн американских пользователей Facebook. С какой целью, собеседник не сказал из соображений конфиденциальности. Козинский сначала согласился, ведь речь идет о больших суммах в пользу его института, но потом начал медлить с согласием. В итоге, он выжал из Когана название фирмы: SCL, Strategic Communications Laboratories («Лаборатории стратегических коммуникаций»). Козинский погуглил название компании. «Мы являемся глобальной компанией по управлению предвыборными кампаниями», - гласил сайт фирмы, предлагая маркетинг на основе психологии и логики. Фокус на влиянии на исход выборов. Козинский недоуменно щелкал по страничкам сайта, раздумывая, чем же может заниматься эта фирма в США.

Александр Коган

Чего Козинский на тот момент еще не знал: за SCL стоит сложная корпоративная система, завязанная на «налоговых гаванях»: позднее это было показано в «Панамских документах» и разоблачениях Wikileaks. Часть этой системы ответственна за кризисы в развивающихся странах, другая помогала НАТО разрабатывать методы психологической манипуляции гражданами Афганистана. Одна из дочерних компаний SCL - та самая Cambridge Analytica, зловещая маленькая компания, организовавшая интернет-кампании в поддержку Brexit и Трампа.

Козинский ничего об этом не знает, но подозревает неладное. Проводив изучение, он узнал, что Александр Коган создал тайную компанию, которая ведет дела с SCL. Из документа, который есть в распоряжении Das Magazin, следует, что SCL получила данные о методе Козинского именно из рук Когана. Внезапно Козинского осенило, что Коган мог скопировать или выстроить заново его систему, чтобы затем продать ее политтехнологам из SCL. Ученый незамедлительно разрывает связь с Коганом и информирует о ситуации своего институтского начальника. Внутри института зреет конфликт, учреждение опасается за свою репутацию. Коган переехал в Сингапур, женился и начал именовать себя доктором Спектром. Козинский переехал в Штаты, начав работать в Стэнфорде.

Больше года все идет спокойно, но в ноябре 2015 года лидер радикальных сторонников Brexit Найджел Фарадж объявил , что его сайт подключает к работе со своей интернет-кампанией некую компанию, специализирующуюся на Big Data, а именно, Cambridge Analytica. Ключевая компетенция фирмы: политический маркетинг нового типа - так называемый «микротаргетинг» - основанный на «методе океана».

Козинский начинает получать множество писем - учитывая слова «Кембридж», «океан» и «аналитика», многие думают, что он как-то с этим связан. Однако только тогда он сам узнает о существовании такой компании. С ужасом он просматривает сайт фирмы. Кошмар стал былью: его методология используется в большой политической игре.

В июле 2016 году, уже после референдума по Brexit, на его голову начинают обрушиваться проклятия. Дескать, посмотрите, что вы сделали! Каждый раз Козинскому приходится оправдываться и доказывать, что к той фирме он не имеет никакого отношения.

Вначале Brexit, затем Трамп

Прошло десять месяцев. На календаре 19 сентября 2016 года, избирательная кампания в США в самом разгаре. Зал нью-йоркского отеля Grand Hyatt, выполненный в темно-синих тонах, наполняют гитарные риффы: играет песня Bad Moon Rising группы Creedence Clearwater Revival. Проходит ежегодный саммит Concordia, мировой экономический форум в миниатюре. Приглашены сильные мира сего, даже действующий президент Швейцарии Йоханн Шнайдер-Амманн. «Прошу приветствовать Александра Никса, директора Cambridge Analytica», - раздается приятный женский голос. На сцену поднимается долговязый мужчина в темном костюме. В зале царит тишина. Многие уже знают, что перед ними новый digital-специалист Трампа. «Скоро вы будете называть меня Мистер Brexit», - таинственно написал Трамп в своем Twitter несколькими неделями ранее. Действительно, политологи уже писали тогда о сходстве программ у Трампа и у сторонников выхода Великобритании из ЕС. И лишь немногие знали о связи Трампа с малоизвестной Cambridge Analytica.

Директор Cambridge Analytica Александр Никс

До тех пор digital-кампания Трампа состояла более-менее из одного человека: Брэда Парскейла. Маркетинговый энтузиаст и основатель одного провалившегося стартапа, он создал для Трампа простенький веб-сайт за $1500. 70-летнего Трампа едва ли можно назвать человеком цифровой эпохи: на его рабочем столе даже компьютера нет. Как однажды поведала его персональная ассистентка, нет даже такого явления, как электронное письмо от Трампа. Сама ассистентка приучила его к смартфону - с которого он с тех пор льет потоки мыслей в Twitter.

Хиллари Клинтон, напротив, опиралась на наследие Барака Обамы как первого «президента соцсетей». У нее были адресные листы Демократической партии, миллионы подписчиков, поддержка Google и Dreamworks. Когда в июне 2016 года Трамп нанял Cambridge Analytica, многие в Вашингтоне скорчили мину. Иностранные чуваки в костюмах, которые ничего в этой стране не понимают? Серьезно?

«Это честь для меня, уважаемые дамы и господа, рассказывать вам сейчас о силе Big Data и психометрии в избирательной кампании», - говорил на саммите Никс. За его спиной в тот момент появился слайд с логотипом его фирмы: изображение мозга, составленное из сетей, подобно карте. «Еще пару месяцев назад Тед Круз был одним из наименее одобряемых кандидатов, - говорил блондин с английским акцентом, да таким, что присутствовавшие американцы ощущали себя подобно швейцарцам, которые слышат литературный немецкий. - Всего 40% электората знали его имя». Все присутствовавшие помнили историю стремительного взлета сенатора-консерватора Круза, едва ли не самое необъяснимое событие предвыборной гонки. Последний из серьезных оппонентов Трампа внутри Республиканской партии буквально выскочил из ниоткуда. «Ну и как же так произошло?» - вопрошал Никс. В конце 2014 года Cambridge Analytica вошла в предвыборную кампанию в США именно как советник Теда Круза, которого финансировал миллиардер Роберт Мерсер. До тех пор, утверждал Никс, предвыборные кампании велись по демографическим критериям: «Глупейшая идея, если всерьез об этом подумать: все женщины получают одинаковый месседж, потому что они одного пола, все афроамериканцы получают другой посыл, исходя из их расы». Таким дилетантским способом (и тут даже Никсу можно ничего не добавлять) вела кампанию команда Клинтон: разделить общество на формально гомогенные группы, подсказанные социологами. Теми самыми, что до самого конца отдавали ей победу.

Cambridge Analytica утверждает, что Тед Круз обязан ей своим успехом

И тут Никс щелкает на другой слайд: пять лиц, каждое соответствует определенному профилю личности, Большая пятерка измерений. «Мы в Cambridge Analytica разработали модель, которая позволит высчитать личность каждого совершеннолетнего гражданина США», - продолжает Никс. В зале полная тишина. Маркетинговый успех Cambridge Analytica основан на трех китах. Это психологический поведенческий анализ, основанный на «модели океана», изучение Big Data и таргетированная реклама. Последнее означает персонализированную рекламу, а также такую рекламу, которая максимально близко подстраивается под характер отдельного потребителя.

Никс искренне объясняет, как его компания этим занимается (лекция доступна на YouTube). Его фирма закупает персональные данные из всех возможных источников: кадастровые списки, бонусные программы, телефонные справочники, клубные карты, газетные подписки, медицинские данные. В США возможно купить почти любые персональные данные. Если вы хотите узнать, допустим, где живут женщины-еврейки, можно спокойно купить базу данных. Затем Cambridge Analytica скрещивает эти данные со списками зарегистрированных сторонников Республиканской партии и данными по лайкам-репостам в Facebook - вот и получается личный профиль по «методу океана». Из цифровых данных вдруг возникают люди со страхами, стремлениями и интересами - и с адресами проживания.

Процедура идентична разработанной Козинским модели. Cambridge Analytica также использует IQ-тесты и прочие небольшие приложения, чтобы получать осмысленные лайки от пользователей Facebook. И компания Никса делает то, от чего предостерегал Козинский: «У нас есть психограммы всех совершеннолетних американцев, это 220 млн человек. Наш контрольный центр выглядит так, прошу внимания», - говорит Никс, щелкая слайды. Появляется карта Айовы, где Тед Круз собрал неожиданно большое число голосов на праймериз. На карте видны сотни тысяч маленьких точек: красные и синие, по партийным цветам. Никс выстраивает критерии. Республиканцы - и синие точки исчезают. Еще не определились с выбором - точек становится меньше. Мужчины - еще меньше, и так далее. В итоге, появляется имя одного человека: с возрастом, адресом, интересами, политическими предпочтениями. Но как Cambridge Analytica обрабатывает отдельных людей своим месседжем?

В другой презентации Никс рассказал, как на примере закона о свободном распространении оружия: «Для боязливых людей с высоким уровнем нейротизма мы представляем оружие как источник безопасности. Вот, на левой картинке изображена рука взломщика, который разбивает окно. А на правой картинке мы видим мужчину с сыном, которые идут по полю с винтовками навстречу закату. Очевидно, утиная охота. Эта картинка для богатых консерваторов-экстравертов».

Противоречивая натура Трампа, его беспринципность и исходящая из этого целая прорва различных сообщений внезапно сыграла ему на руку: для каждого отдельного избирателя свой месседж. «Трамп действует как идеальный оппортунистский алгоритм, который опирается лишь на реакцию публики», - отмечала в августе математик Кэти О"Нил. В день третьих дебатов между Трампом и Клинтон команда Трампа отправила в соцсети (преимущественно, Facebook) свыше 175 тыс. различных вариаций посланий. Они различались лишь в мельчайших деталях, чтобы максимально точно психологически подстроиться под конкретных получателей информации: заголовки и подзаголовки, фоновые цвета, использование фото или видео в посте. Филигранность исполнения позволяет сообщениям находить отклик у мельчайших групп населения, пояснил Das Magazin сам Никс: «Таким способом мы можем дотянуться до нужных деревень, кварталов или домов, даже до конкретных людей». В квартале Маленький Гаити в Майами была запущена информация об отказе Фонда Клинтон участвовать в ликвидации последствий землетрясения в Гаити - чтобы разубедить жителей отдавать свои голоса Клинтон. Это было еще одной целью: удержать электорат Клинтон (например, сомневающихся леваков, афроамериканцев и молодых девушек) от урны для голосования, «подавлять» их выбор, по выражению одного из сотрудников Трампа. Использовались и так называемые «темные посты» Facebook: платные объявления посреди ленты новостей, которые могли попадаться только определенным группам лиц. Например, афроамериканцам показывали посты с видео, на котором Клинтон сравнивала чернокожих мужчин с хищниками.

Хиллари Клинтон оказалась одной из жертв антирекламы Cambridge Analytica

«Мои дети не смогут больше объяснить, что значит рекламный плакат с одинаковым сообщением для всех и каждого», - завершает Никс свое выступление на саммите Concordia, благодарит за внимание и спускается со сцены.

Насколько американское общество в данную конкретную минуту обрабатывается специалистами Трампа, сказать трудно, ведь они крайне редко атакуют на центральных телеканалах, а чаще всего используют социальные сети и цифровое ТВ. И пока команда Клинтон, работавшая по лекалам социологов, пребывает в летаргии, в Сан-Антонио, где располагается «цифровой штаб» Трампа, возникает, по словам корреспондента Bloomberg Саши Иссенберга, «вторая штаб-квартира». Всего дюжина сотрудников Cambridge Analytica получила от Трампа в июле $100 тыс., в августе еще $250 тыс., в сентябре еще $5 млн. По подсчетам Никса, общая сумма оплаты услуг составила $15 млн.

Но и проводимые мероприятия тоже радикальны: с июля 2016 года волонтеры кампании Трампа получили приложение, которое подсказывает политические предпочтения и личностные типы жителей того или иного дома. Соответственно, волонтеры-агитаторы модифицировали свой разговор с жителями исходя из этих данных. Обратную реакцию волонтеры записывали в это же приложение - и данные отправлялись прямиком в аналитический центр Cambridge Analytica.

Фирма выделяет у американских граждан 32 психотипа, сконцентрировавшись лишь на 17 штатах. И как Козинский выяснил, что мужчины-поклонники косметики MAC скорее всего являются гомосексуалами, в Cambridge Analytica доказали, что приверженцы американского автопрома однозначно являются потенциальными сторонниками Трампа. Помимо прочего, подобные открытия помогли самому Трампу понять, какие послания где лучше всего применять. Решение предвыборного штаба сконцентрироваться в последние недели на Мичигане и Висконсине было принято на основе анализа данных. Кандидат стал моделью применения системы.

Чем занимается Cambridge Analytica в Европе?

Но насколько велико было влияние психометрии на результат выборов? Cambridge Analytica не спешит предъявлять доказательства успешности своей кампании. Вполне возможно, что это вообще вопрос без ответа. Хотя вот, есть один факт: благодаря поддержке Cambridge Analytica Тед Круз превратился из ничего в серьезнейшего конкурента Трампа на праймериз. Вот рост голосов сельских жителей. Вот сокращение электоральной активности афроамериканцев. Даже тот факт, что Трамп потратил на проект так мало денег, может говорить об эффективности персонализированного продвижения. И даже то, что он пустил три четверти рекламного бюджета в цифровую сферу. Facebook превратился в совершенное оружие и лучшего помощника на выборах, как написал в Twitter один из сподвижников Трампа. К слову, в Германии антиэлитарная «Альтернатива для Германии» имеет в Facebook больше подписчиков, чем ведущие партии ХДС и СДПГ вместе взятые.

Кроме того, ни в коей мере нельзя утверждать, что социологи, статистики, проиграли выборы, потому что сильно ошиблись со своими прогнозами. Верно обратное: статистики выиграли, но лишь те, что использовали новейшие методы. Шутка истории: Трамп постоянно критиковал эту науку, но выиграл во многом благодаря ей.

Второй победитель - компания Cambridge Analytica. Издатель главного консервативного рупора Breitbart Стив Бэннон входит также в совет директоров этой фирмы. Недавно он был назначен старшим стратегом в команде Трампа. Марион Марешаль Ле Пен, активистка французского «Национального фронта» и племянница лидера партии, уже радостно сообщила о сотрудничестве с компанией, на внутреннем корпоративном видео которой изображено совещание по теме «Италия». По словам Никса, сейчас им заинтересованы клиенты со всего мира. Уже были запросы на сотрудничество из Швейцарии и Германии.

Мари Ле Пен хочет стать следующим клиентом Cambridge Analytica

Все это наблюдает и Козинский из своего кабинета в Стэнфорде. После выборов в США в университете все стоит вверх дном. На развитие событий Козинский отвечаем самым острым оружием из доступных исследователю: научным анализом. Вместе со своей коллегой Сандрой Матц он провел серию тестов, результаты которых скоро будут опубликованы. Некоторые из этих выводов, которыми ученый поделился с Das Magazin, шокируют. Например, психологическое таргетирование, подобно тому, что использовали в Cambridge Analytica, повышает число кликов на рекламе в Facebook на 60%. Вероятность же того, что после просмотра персонализированной рекламы люди перейдут к действиям (купят ту или иную вещь или проголосуют за нужного кандидата) возрастает на 1400%.

Теперь мир перевернулся: Brexit состоялся, в Америке скоро будет править Трамп. Все это началось с человека, который хотел предупредить нас об опасности. Сейчас он снова получает кучу жалоб на рабочую почту. «Нет, - говорит Козинский. - Тут нет моей вины. Это не я соорудил бомбу, я лишь показал, что они существуют».

Издания Das Magazin, в котором речь шла о том, как Big Data и таргетированная реклама в соцсетях помогли Дональду Трампу одержать победу на президентских выборах в США. Многие поспешили назвать этот материал текстом года. Объясняем, почему массовая истерия вокруг расследования и изложенные в нем выводы оказались неоправданно преувеличенными и почему мы, скорее всего, имеем дело не с текстом года, а с крупнейшей журналистской уткой уходящего 2016-го.

Что случилось?

В начале декабря швейцарский журнал Das Magazin опубликовал материал о том, как британская компания Cambridge Analytica, объединив в один мощный сплав технологию Big Data, персональные данные пользователей Facebook и таргетированную рекламу в соцсетях, помогла Дональду Трампу стать президентом США вопреки всем ожиданиям. Также выяснилось, что услугами Cambridge Analytica пользовались радикальные организации, настроенные на выход Британии из Евросоюза. Этот материал был переведен на русский язык изданием The Insider, и его принялись массово распространять в качестве ответа, некоего универсального объяснения Трампу в президентском кресле и победы сторонников Brexit.

В начале статьи - история Михала Косински (Michal Kosinski), ученого, который первым, как кажется во время прочтения, придумал «подружить» психометрию с большими данными. Дальше история переключается на компанию Cambridge Analytica, которых представляют такими себе злыми гениями, воспользовавшимися наработками Косински для победы Трампа. Суть метода Cambridge Analytica в следующем: они скупают все доступные (и труднодоступные) массивы данных об интернет-пользователях, а затем на основании полученной информации тщательно создают такую рекламу для соцсетей, которая бы, во-первых, точно привлекла внимание конкретного психотипа, а во-вторых, заставила принять нужное решение (отдать голос за Трампа).

Михал Косински

В ход идет все: лайки, поисковые запросы, геометки - абсолютно все «следы», оставляемые пользователями в интернете. В тексте утверждается, что технология Косински, взятая на вооружение Cambridge Analytica, - это социология совершенно нового типа и по совместительству мощное оружие массового воздействия. Соцопросы и деление по гендерному или географическому признаку уже не работают - это слишком просто. Новый сложный мир, в котором мы живем, требует гораздо более сложных решений.

Уверенный стиль изложения статьи, компоновка достоверных фактов с обилием художественных деталей («задумчивый Косински, прилизанный Никс и широко улыбающийся Трамп») и упрощенная, «разжеванная» логика сложных явлений помогли этому материалу стать, что называется, «вирусным» и получить широчайшее распространение в Сети. Людям, до сих пор возмущенным и обескураженным последними событиями (в том числе победой Трампа), пришлось по душе складное и простое объяснение: оказывается, в их адрес применили новое страшное оружие управления массами. А словосочетание Big Data вместо размытых и абстрактных представлений приобрело отчетливые зловещие оттенки.

В общем, народу преподнесли историю в духе сериала «Черное зеркало»: есть такой благородный ученый Косински, который хотел предупредить мир об опасности, затем нашлись его циничные последователи (Cambridge Analytica), применившие теоретические знания на практике, и есть абсолютный победитель, нажившийся на этом (Трамп). Герои и злодеи. Добро, зло и пострадавшие (мы с вами). И мало кто заметил, что слишком уж подозрительно стройной вышла эта теория о заговоре вокруг больших данных.

Модель OCEAN

Директор Cambridge Analytica Александр Никс

В основе метода Михала Косински, который позаимствовали предприимчивые люди из Cambridge Analytica, используется так называемый метод OCEAN - попытка описать тип личности с помощью таких пяти популярных параметров, как открытость, добросовестность, экстраверсия, доброжелательность, нейротизм (в английском переводе эти слова образуют аббревиатуру OCEAN, которая и дала название методу). Еще с XIX века (все началось с исследований основателя психометрики Фрэнсиса Гальтона в 1884 году) психологи пытались дифференцировать этот метод изучения личности, но за прошедшие годы исследований количество параметров было сокращено с более чем сотни до пяти. Сделано это было, очевидно, для удобства применения модели OCEAN, но с ее соответствующим огрублением. В своем нынешнем виде пятифакторная модель личности используется с 1980-х.

В «расследовании Das Magazin» упоминают об этом факте, но после предложения «в 1980-е годы два психолога доказали, что каждая черта характера может быть измерена при помощи пяти измерений» сразу же перескакивают на историю Михала Косински. Это и создает манипулятивный эффект: у тех, кто не слишком-то знаком с развитием психологии как науки, возникает ощущение, что именно Косински всерьез взялся изучать и применять этот метод на практике, а до него этим как будто бы никто не занимался. Но это, конечно, не так.

С 1990-х кадровики уже пытались внедрить модель OCEAN, чтобы иметь возможность оценивать соискателей работы при найме персонала. В 2003 году в SA Journal of Industrial Psychology вышло исследование , целью которого было выявить взаимосвязь между характеристиками личности и качеством выполнения работы. В исследовании приняли участие 159 сотрудников фармацевтической компании, которых попросили пройти NEO PI-R - методику психологической диагностики личности, являющую собой опросник из 240 вопросов. Результаты исследования показали, что эмоциональная устойчивость, экстраверсия, открытость к новому опыту и добросовестность связаны с выполнением рабочих задач и креативностью. А три параметра измерения личности (эмоциональная устойчивость, открытость опыту и уступчивость) объяснили всего лишь 28 % процентов результатов, оказавшихся отклонением от усредненного значения.

То есть модель OCEAN смогла обработать и объяснить меньше трети полученных результатов, да и то с оговорками.

В дальнейшем количество исследований в этой области - личностные качества сотрудников и то, как эти качества влияют на выполнение рабочих задач - только росло. Было проведено больше сотни исследований, из которых стало понятно, что пятифакторная модель - это, конечно, просто и удобно, но собирать данные для построения модели OCEAN сложно: слишком длинный опросник и слишком высокая вероятность того, что опрашиваемый человек наврет в своих ответах.

С появлением и активным внедрением социальных сетей в нашу жизнь исследователи пятифакторной модели переключились на интернет-пользователей. В период между 2011–2012-м годами Михаил Косински как раз и приобрел известность благодаря своим предупредительным научным работам , в которых изучал потенциал применения этого метода. Чуть позже это подхватили мировые СМИ, и уже в 2013 году, например, на сайте таблоида The Independent появилась (одна из множества подобных) о том, как нас легко можно предсказать по нашим лайкам в соцсетях.

В действительности точность предсказаний по пятифакторной модели оказалась довольно спорной. можно посмотреть на список лайков страниц на фейсбуке и «личностные характеристики», которые они собой означают согласно Five Factor Model.

Умные - это те, кто лайкает кинофильм «Крестный отец» и «Властелин колец», шоу The Colbert Report, песенку Thunderstorms, слово «наука» и т. д. Сторонники Демократической партии - это те, кто залайкали следующие страницы: Joe Biden; Health Care Reform; The White House; Democrats; Being Liberal; Barack Obama 2012.

Не слишком репрезентативная выборка, не правда ли?

В 2013 году стало понятно , что помимо сочетания FFM и Big Datа есть еще Big Big Data и множество более перспективных игровых моделей, на которые и переключились профессиональные исследователи и до сих пор испытывают. Михал Косински тоже не стал зацикливаться на тупиковой (по крайней мере, на сегодняшний день) сфере пятифакторной модели: в декабре 2015 года, например, у него вышла работа , посвященная выяснению причин несовпадения вкусов и пристрастий у супругов и друзей.

Однако в медиа и в сознании людей остался этот конспирологический шлейф вокруг использования больших данных сильными мира сего ради собственной выгоды.

Скажи мне, кто твой лайк

Об этом нигде нет упоминания в «расследовании», но то самое «страшное оружие» Косински, основанное на анализе Big Data, можно протестировать самостоятельно. Опробовать на себе демоверсию революционной технологий, с помощью которой компания Cambridge Analytica, как утверждается, привела Дональда Трампа к победе на президентских выборах. И уже после этого сделать выводы: действительно ли эта штука способна навязывать людям те или иные поступки?

Тестирование доступно в двух вариантах: анализ вашего фейсбук-аккаунта и анализ написанного вами текста из 1 000 слов.

В первом случае инструмент анализирует ваши лайки по страницам на фейсбуке (любимые фильмы, книги, музыку, общественные организации) и составляет ваш психометрический портрет, определяя те или иные характерные черты. К примеру, в увлечении группой The Cure и сатирическим мультсериалом «Робоцып» программа усматривает «женственность», тогда как шоу Top Gear и канал Comedy Central гарантированно свидетельствуют о вашей маскулинности. Любовь к «Симпсонам» и передаче Saturday Night Live почему-то приравнивается к консерватизму, а вот группа Depeche Mode сразу выдает в вас либералов, трудоголиков и созерцателей (да, коллектив подпадает сразу под три характеристики). И в то же самое время вышеупомянутые лайки группам The Cure и Depeche Mode машина определила как склонность к «менее интеллигентному» поведению.

Этот инструмент не смог с точностью определить религиозную принадлежность автора статьи, засунув его в категорию «другое», куда входят атеизм, агностицизм, буддизм и пастафарианство. Теперь вспоминаем громкие слова из оригинального расследования: «После анализа 70 лайков модель сможет лучше узнать человека, чем его друг. После 150 лайков - лучше, чем родители. После 300 лайков - лучше, чем партнер. С еще большим количеством изученных действий можно было бы узнать о человеке лучше, чем он сам».

Да, кстати, еще с помощью «оружия» удалось выяснить, что лайк официальной странице группы U2 на фейсбуке свидетельствует о «слабо выраженной заинтересованности в психологии».

Big Data и возможность их объединения с психологией - это, безусловно, крайне перспективная сфера, в которой еще предстоит прояснить этический вопрос границ использования личных данных. Но вряд ли эту комбинацию можно назвать стопроцентным оружием, гарантирующим крупную политическую победу или успех в бизнесе. Все-таки человек и его поведенческие паттерны - это слишком труднопрогнозируемая история. Как бы ни хотелось обратного журналистам, сочиняющим манипулятивные статьи, читателям - любителям «простых истин» и политикам, которые по старинке рассчитывают купить голоса.

⇔⇔⇔

При подготовке статьи были использованы материалы из Telegram-канала Сергея Карелова.

Читайте нас у
Telegram