Разведка боем, или OSINT для продуктологов
(Tasha Kozhanova для PU – апрель 2019)
WTF OSINT?
Немного матчасти: OSINT (Open Source INTelligence) — поиск, сбор и анализ информации, полученной из общедоступных источников (Google). Проще и по-русски – поиск в открытых источниках (ПОИ). Именно с данных начинается аналитика любого проекта/продукта/идеи. Быстрый поиск данных – конкурентное преимущество РМа. Почему?
В XX веке основная цель бизнеса заключалась в построении производства, цепочки создания продукта, и бизнес считался успешным, когда помимо продукта выстраивались средства производства: завод, цех, сборочная линия. Основной (и первый) вопрос был в том, как сделать продукт, и того, кто выстраивал решение раньше других, ждал успех. В конце XX века экономика потребления поставила во главу угла потребителя – клиента, пользователя, и вопрос «как сделать продукт» поменялся на «для кого делать продукт», ведь без покупателей бизнес обречен. Данные стали «золотом XXI века», так как именно данные о клиенте, его потребностях и болях позволяют точно сформулировать характеристики продукта, его свойства и функции, закрывающие потребность покупателя. Успех бизнеса сейчас заключается в создании конкретного продукта для конкретных пользователей.
Что есть сейчас?
Каким образом данные стали открытыми, доступными? Ответ очевиден. Появление цифрового пространства (интернета) породило новые элементы человеческих взаимоотношений: веб-сообщества, создаваемый пользователями контент — социальные сети, видеохостинги, блоги, веб-форумы и прочее. Для вхождения в эти сообщества человеку необходимо раскрывать информацию о себе, своих привычках, интересах, положении в обществе, семье, географии, возрасте, даже свои физиологические характеристики – рост, вес, пол и тому подобное.
Можно классифицировать инструменты сбора информации о поведении пользователей в цифровом пространстве следующим образом:
Рекламные сети поисковиков-гигантов (Гугл, Яндекс, Bing, Baidu)
Собирают информацию о перемещении пользователей по цифровому пространству, и эта информация дает данные о миллиардах пользователей.
Соцсети (Facebook, Twitter, Instagram, VK, OK)
Наиболее точно собирают информацию об интересах пользователей, а также информацию о ближайшем окружении. Эта информация дает знание по сотням миллионов пользователей.
Тематические соцсети, форумы и сообщества (LinkedIn, Bookmate, Deezer, Soundcloud, Runkeeper и другие)
Объединяют людей с общими интересами: профессионалы, любители чтения книг, любители музыки, любители бега. Это уже сформированные группы пользователей, которые «упакованы» для продуктовой работы. Пользователи исчисляются десятками миллионов человек.
Можно дробить и дальше...
Сообщества по интересам в соцсетях, региональные форумы, подписчики блогов и каналов и проч. Сужается охват (аудитория может быть от миллиона до сотни человек), но сегментация по интересам и другим признакам более точная.
Все эти знания находятся в открытом доступе, и, понимая методы и способы работы со всеми перечисленными источниками, можно достаточно подробно и глубоко проанализировать потенциальных пользователей нового продукта. Но когда источников данных много и каждый из них обладает специфическим набором функций поиска, провести такое исследование качественно и быстро будет непросто или невозможно даже опытному пользователю. Конечно, ручной поиск никто не отменял, но есть ли альтернатива?

Альтернатива ручному поиску – инструменты OSINT
Примерная классификация этих инструментов выглядит так:
1
Специальные поисковые команды в стандартных поисковиках, например Google Dorks.
Это специальный (уточняющий) запрос ко всему объему данных, накопленных Google. Плюсы: большой объем данных, по которым ведется поиск. Минусы: сложность языка запросов, низкая точность результатов.
2
Агрегаторы данных: pipl.com, clearbit, amaizinghiring и др.
Это площадки с предварительно собранной информацией о людях и их присутствии в цифровом пространстве. Плюсы: точность данных. Минусы: актуальность, необходимость наличия минимального знания о персоне (идентификаторы типа ФИО, номера тел., email).
3
Провайдеры данных
Компании, специализирующиеся на сборе информации в конкретной предметной области, например: «Коммерческие организации США», «IT-профессионалы Европы», проекты open data – информация,
раскрываемая правительствами разных стран и разрешенная к публикации в открытых источниках (примеры в России – сервисы ФНС, ГИБДД, ФССП, правительство Москвы и проч.). Плюсы: качественное наполнение специализированными данными. Минусы: узкий охват.
4
Инструменты, используемые в OSINT-сообществе: Maltego, SocialLinks, KeyLines, Lampyre.
Данные продукты в том или ином виде (и в разном объеме) предлагают единую точку доступа к разным источникам информации, находящейся в открытом пространстве. Плюсы: единый интерфейс работы с большим количеством источников. Минусы: эти инструменты заточены на проведение комплексных исследований, поэтому много лишнего функционала с точки зрения продакта.
Что из этого арсенала можно взять продакту? Сейчас видно, что нет однозначной формы, в которой инструмент был бы удобен для работы. Но для понимания плюсов таких решений можно рассмотреть группу (4). Эти инструменты позволяют оценить тот объем знаний, который не используется сейчас в широком смысле, но будет полезен для более глубокой аналитики по продукту.
Где использовать?
Например, есть гипотеза MVP, которую нужно протестировать. Есть собранные на лэндинге адреса эл.почты. Какую сопутствующую информацию может извлечь продакт в такой ситуации? Вариант 1: отправить опросник и ждать, что расскажут о себе пользователи, но не все ответят и не всему нужно верить. Вариант 2: взять емэйлы и попытаться обогатить данные с помощью инструментов группы (4). По емэйлам получим соцсети >> по соцсетям получим активность пользователей в них (количество лайков и кого лайкают, подписки, интенсивность использования) >> при надлежащей ловкости получим группы по интересам, в которых состоят пользователи, и профили других участников этих групп.

Данное исследование займет 5-10 минут, на выходе – данные по каналам привлечения пользователей, какие соцсети дадут бОльшую ЦА, в какие каналы стоит вкладываться и каким образом вкладываться. Также на этих данных можно составить типовой портрет пользователя, это поможет уточнить ЦА и найти то, что не видно с первого взгляда. В ситуации полной неопределенности по продукту это знание позволит удешевить стоимость эксперимента.

Конкурент или партнер?

Исследование рынка
Теперь рассмотрим другую область знаний – исследование рынка, конкурентов, нечестных конкурентных преимуществ. Либо исследование компании-партнера и компетенций команды, с которой предстоит работать (например, исследовать будущего работодателя). Вариант 1: гуглить, читать СМИ, строить гипотезы, задавать прямые вопросы, получать непрямые ответы. Вариант 2: искать данные, анализировать, получать факты. Так как вариант 1 общеизвестный и не нуждается в пояснениях, приведу пример использования варианта 2.

Пример безобидный, так как в нем рассматривается способ построения нетворкинга и оценка целесообразности работы с командой-партнером в совместных проектах (продуктах). В качестве входных данных – обычная информация с визитки: ФИО, компания, email. Эту информацию можно найти в разделе Контакты на сайте компании либо получить вместе с визиткой на совместно посещаемых мероприятиях (конференциях). Как минимум, по email можно получить активность сотрудника компании в интернете (см. пример исследования ЦА выше), это полезно, если я собираюсь с ним контактировать и предлагать себя/продукт/совместный проект. Меня будут интересовать профессиональные навыки (компетенции), а значит история (карьера), конференции/публичные выступления/статьи, что в соцсетях, что на GitHub.

Допустим, все устраивает, местоположение офиса компании говорит о том, что все солидно, штат сотрудников достаточно большой, Гугл мне нашел контракты на 400+ миллионов за 4 года. Что дальше? Хочу посмотреть их продукт и демо, чтобы понять, на чем строится технология и их лучшесть (и есть ли она), но не могу.

Попробую сделать следующее: найти домены >> по доменам найти емэйлы >> по емэйлам нахожу телефоны >> по телефонам – профили в ВК. Среди этих профилей есть сотрудница, которая в соцсетях уже два года как публикует фотки с корпоративов (все открыто, можно оценить количественно штат сотрудников). По ВК нахожу других сотрудников и их посты о том, как они приезжают на корпоратив из другого региона (например, Уфа). Примерно 15 человек – сотрудники не из московского офиса. Вообще, это в порядке вещей, когда компания не раскрывает компетенции и местонахождение группы разработки из соображений «чтобы не переманили конкуренты» (технология = компетенция = нечестное конкурентное). Значит, компания дорожит своими разработчиками, и они находятся не в Москве. Нахожу профили сотрудников из Уфы в LinkedIn, понимаю, что это действительно разработчики, смотрю, на каких языках пишут, чем интересуются >> делаю вывод о технологиях, которые используют.

Теперь бэкграунд компании и компетенции команды становятся более-менее ясными, этап полной неопределенности считаю пройденным. Есть, что предлагать, и есть понимание, что могут предложить они.
Выводы
Ну и в конце вполне ожидаемых вопрос – зачем такие сложности, если можно спросить, если есть интернет и если есть готовая аналитика? Ответ такой: интернет дает не информацию и факты, а то, что информация излучает, некий фон. От вопроса могут уйти, а аналитику нужно перепроверять. В состоянии неопределенности лучше иметь дополнительный способ для оценки ситуации, а если этот способ еще и существенно сэкономит время, то это уже ваше личное конкурентное преимущество в цепочке команда – продукт – пользователи.
Made on
Tilda