BIG DATA. Вся технология в одной книге. Андреас Вайгенд
Читать онлайн книгу.предоставляет информацию о частоте откликов на входящие сообщения и описательную статистику (возрастной диапазон, этническая принадлежность, телосложение и т. п.) по людям, которыми действительно интересовался данный пользователь (а не только то, что он описывает в своем профайле в качестве интересующих его черт). Такая прозрачность позволяет пользователям лучше понимать не только имеющиеся варианты, но и свои шансы. Если интересующий вас персонаж отвечает только на 12 процентов сообщений, то, наверное, лучше потратить время на знакомство с кем-то еще, тем более что 64 процента интересующих его пользователей сообщают о своей «накачанности», а это совсем не про вас. Для получения большей достоверности о вкусах пользователей Jack’s опирается не на статистику просмотров или входящих и исходящих сообщений, а исключительно на анализ списка «Избранных», а также специальной функции, позволяющей пользователям выражать свою заинтересованность в знакомстве. Эта опция направляет информацию в базу данных только в случае взаимного интереса.
Самая богатая и более персонализированная по сравнению с этими прямыми сигналами информация, которой обладает любой сайт знакомств, содержится в истории просмотров профайлов каждым пользователем. Однако интерпретировать мотивы этих просмотров достаточно сложно. Работая с сайтом Match.com, я обнаружил пользователя, который заблокировал доступ к себе огромному количеству черных женщин. Скорее всего, это был расист, правильно? Неправильно! Посмотрев на установки его фильтра и его просмотры, мы убедились в том, что все обстоит ровно наоборот: он интересовался именно черными женщинами, причем только теми, кто описывал себя «фигуристыми». Для экономии времени и сил он блокировал пользователей-женщин, попытки познакомиться с которыми оказались неудачными. Информационным детективам приходится решать и такие забавные задачки. А способность обнаруживать интересные случаи и рассказывать о них – важная составляющая умения понимать информацию.
Чтобы правильно трактовать данные, надо встать на точку зрения пользователя. Здесь очень важна обстановка. По ходу дня наши желания меняются, или же это происходит по ходу ночи. Когда я консультировал сингапурский сайт знакомств Fridae, мы заметили, что типы профайлов, просматриваемых в два часа дня пятницы, отличаются от просматриваемых в два часа ночи субботы. В этой связи научной команде Fridae предстояло решить, как использовать эту информацию в рэнкингах, представленных на сайте.
Сайты знакомств все чаще предлагают пользователям возможность раскрыть свою «истинную сущность», стимулируя их добавлять в профайл кнопки ссылок на аккаунты в Facebook, Instagram или Twitter. Но это не значит, что случаи предосудительного поведения пользователей прекратились. Себастиан Боэр, один из специалистов по обработке данных мобильной платформы знакомств Skout, написал алгоритм фильтрации неприемлемых сообщений, под неформальным названием «гадоистребитель»[127]. Что считалось
127
Я был членом совета директоров Skout с 2007 по 2012 год. В июне 2016 года компанию приобрела MeetMe. См. Yeung, Ken, “MeetMe Acquires Mobile Flirting App Skout for $55 Million in Cash and Stock”, VentureBeat, June 27, 2016, http://venturebeat.com/2016/06/27/meetme-acquires-mobile-flirting-app-skout-for-55-million-in-cash-and-stock.