Как «пробить» человека в Интернет: используем операторы Google и логику

15.10.2017
Как «пробить» человека в Интернет: используем операторы Google и логику

Мы постоянно встречаемся в своей жизни с новыми людьми, и стоит констатировать, что помимо хороших друзей нам попадаются мутные товарищи, а иногда и отъявленные мошенники. Любовь наших сограждан оставить свой след в интернете и старания наших ИТ-компаний по автоматизации всего и вся позволяют нам довольно оперативно собирать интересующую информацию о конкретных персонах по открытым источникам. Чтобы это делать быстро и качественно, нам нужно владеть простой методологией разведывательной работы и знать, где и какую информацию о человеке можно добыть в интернете.

Как работает разведка?

Доступной моделью работы любой разведывательной службы является так называемый разведывательный цикл. Ниже представлена иллюстрация цикла, взятая с сайта ФБР.
 


Мы можем творчески перевести и сгруппировать немного по-своему и получить следующие этапы:
 

  1. Постановка задачи/формулировка проблемы;
  2. Планирование;
  3. Сбор данных;
  4. Обработка данных;
  5. Анализ информации;
  6. Подготовка отчета и презентация результатов.

Возьмем эту модель на вооружение и адаптируем для наших благих целей проверки нечистоплотных товарищей.

Шаг 1. Постановка задачи

Обычно задача про проверке какого-либо человека ставится примерно так: “Надо собрать всю информацию об этом человеке!” По факту чаще всего нам интересно знать его биографию, психологический портрет, круг знакомств.

Шаг 2. Планирование

Не имея плана поиска и анализа данных, мы будем долго и грустно смотреть в экран и отправлять в поисковики различные запросы, содержащие крупицы известных нам данных о нашей цели. Если нам повезет, то мы сможем что-нибудь выловить, если нет – то зря потратим время в попытках перетрясти весь интернет.

Как спланировать наши действия?

1) Нам нужно собрать все, что известно на текущий момент: имя, фото, тел, сфера деятельности, друзья и т.д. и т.п. Как правило, самой ценной информацией является ник, используемый человеком в интернете (чаще всего его можно получить, зная личный адрес электронной почты).

2) Нам нужно сформулировать рабочие гипотезы для поиска данных на основе имеющейся информации. Например:
 

  • Человек работает в компании, занимающей продажей комбикормов, название которой заканчивается на «ва»: мы видели фотографию с выставки и смогли рассмотреть часть названия компании.
  • Возраст от 30 до 40: оценили по голосу или описанию.
  • Дружит с таким-то человеком.
  • и т.п.

Примечание. Талантливый разведчик должен уметь переключаться между двумя состояниями: безудержный креатив и жуткое занудство. В первом случае накидываем гипотезы для проверки, а во втором тщательно их проверяем: находим информацию и отбраковываем гипотезы в случае выявления несоответствий.

3) Имея рабочие гипотезы, продумываем какие источники данных нам могут быть полезны в этом легком деле по выводу на чистую воду.

На поверхности лежат следующие источники интересной информации:

  • Социальные сети VKontakte, Facebook, Twitter, Instagram и т.п. (масса интересной информации: фото, гео, друзья, интересы, контакты, психологический портрет и т.п.).
  • Сайты судов (если знаем фамилию и место регистрации, то сможем узнать не судится ли человек по базе на сайте конкретного суда).
  • База недействительных паспортов (http://services.fms.gov.ru/info-service.htm?sid=2000).
  • База судебных приставов: не должен ли наш товарищ чего? (http://fssprus.ru/iss/ip/).
  • База дипломов (http://frdocheck.obrnadzor.gov.ru).
  • Google с Яндексом.

Замечание. Зная ник, можно быстро посмотреть в каких социальных сетях существуют соответствующие страницы. Для этого существуют специальные сервисы для проверки доступности страниц, например, namechk.com Забытые пользователем аккаунты иногда бывают намного интересней текущих.

Мощным источником информации может стать поисковик, но чтобы извлечь максимальную пользу начинающему разведчику необходимо освоить так называемые операторы продвинутого поиска, среди которых одними из самых полезных являются: “”, -, cache, site:, filetype:, но это тема для отдельной статьи.

Шаг 3. Сбор данных

В рассматриваемом случае сбор данных будет заключаться в формировании запросов к рассмотренным источникам и сохранении результатов для текущего и последующего сопоставления и анализа. Бывает очень полезно в процессе подобного упражнения открыть текстовый редактор и последовательно сохранять в него обнаруженные данные (скриншоты, текст, фото и т.п.).

Вспомните новость: Google предложил пользователям платить деньги за просмотр сайтов без рекламы

Шаг 4. Обработка данных

Иногда чтобы получить ценную информацию нужно покопаться в сырых данных. Примерами обработки могут быть:

  • Извлечение метаданных из документов (авторство, GPS-координаты).
  • Приведение выгрузки данных из социальных сетей к виду, с которым можно работать, например, в том же Excel.
  • и т.п.

Шаг 5. Анализ информации

1. Тестируем гипотезы. Собирая по крупицам информацию, мы сразу же проводим ее анализ и тут снова могут быть полезны гипотезы и их тестирование на жизнеспособность. Сопоставляя с ними выявленные факты, косвенные признаки, логические заключения из фактов, можно определить наиболее вероятную гипотезу.

Факты/Суждения Гипотеза 1 Гипотеза 2 Гипотеза 3 Гипотеза 4
Факт 1 + + + +
Факт 2 - + + +
Суждение 1 - - + +
Факт 3 - - - +


2. Элементарные операции с данными: сортировка, сопоставление элементов и т.п. могут открыть массу интересного. Например, можно выгрузить списки друзей друзей интересующего человека и, сопоставив их, определить сообщества, структуры, к которым может иметь и интересующее нас лицо. В этом нелегком деле нам может помочь Excel с его возможностью условного форматирования в случае совпадения элементов.

3. Анализ фото- и видео-изображений. От опытного глаза начинающего интернет-разведчика не уйдут не только случайно попавшие в кадр: вид из окна, часть названия географического пункта или пикантное отражение в зеркале на заднем плане, но и различные невербальные сигналы, которые позволят судить о человеке:

  • складки на лице, открывающие превалирующую эмоцию человека;
  • любимые жесты;
  • характер взаимоотношений с другими людьми и т.п.


4. Анализ содержимого текстов интересующего человека или его собеседников. Обратите внимание на то, как человек описывает свое отношение к другим, что его друзья пишут о нем самом. Тут, конечно, стоит не только уметь внимательно читать, но и знать различного рода тонкости, например, то, что можно в FB искать упоминания о человеке.

5. Анализ лайков. Некоторые ставят лайки всему, что видят, от кого-то лайка никогда не дождешься, но, в основном, люди довольно избирательны в этом деле и вот тут очень интересно посмотреть статистику того, кто или что собирает максимум лайков от нашего человека. Хорошо, что появляются сервисы, позволяющие этот интересный процесс анализа автоматизировать, например, такие как searchlikes.ru

Тема анализа информации очень обширная и интересная, и мы к ней еще не раз вернемся в будущих статьях.

Шаг 6. Подготовка отчета и презентация результатов

Настоящие разведчики много пишут, так как работают на государство. Нам же, так как мы занимаемся подобными вещами исключительно в личных целях и в рамках закона, отчеты строчить не нужно. Тем не менее упражняться в письменном изложении процесса анализа и его результатов очень полезно, так как мы можем тем самым развивать логическое мышление и приобретать навыки анализа текстовой и числовой информации.

Для демонстрации возможностей «продвинутого» поиска Google в качестве целей были выбраны личные аккаунты автора. Сделано это, чтобы никого не обидеть излишним интересом к его частной жизни. Хочу сразу предупредить, что никогда не задавался целью скрыть свое присутствие в интернете, поэтому описанные методы подойдут для сбора данных об обычных людях, и могут быть не очень эффективны для деанонимизации фэйковых аккаунтов, созданных для разовых акций. Интересующимся читателям предлагаю повторить приведенные примеры запросов в отношении своих аккаунтов и оценить насколько легко собирать информацию по ним.

Прежде чем заниматься сбором и анализом информации о конкретном человеке необходимо представить всю картину того, какие данные о человеке существуют.

 

 

Подобную карту нужно детализировать до уровня, необходимого для решения конкретной задачи. Любой поиск информации начинается с некоторого начального набора данных. В нашем случае это будет фамилия, имя и место работы. Остальные данные где-то есть, но связать их с имеющимися мы пока не можем. Поэтому мы формируем гипотезы и проверяем с помощью поисковых запросов.

Источниками информации о человеке могут быть:

  1. он сам: аккаунты в соцсетях, блог и т.п.;
  2. государство: базы данных налоговой, судебных приставов, судов и т.п.
  3. кто-то еще (друзья, враги, СМИ, работодатель и т.п.)

В настоящей статье рассмотрим п.1. – будем вычислять аккаунты автора в социальных сетях.

Цель номер один: ники пользователя

Что такое ник и как мы его выбираем?

Ник представляет собой наше имя в интернете: мы выбираем его, создавая свой личный почтовый ящик, а потом часто используем и в различных сервисах.

Мы ничем не ограничены при выборе ников, но есть любимые алгоритмы формирования наших интернет-имен:

  1. Игры со своим именем: фамилия, имя+фамилия, имя+год рождения, имя+дата, инициалы;
  2. Игры с именами любимых персонажей (tovbender, napoleon);
  3. Немного о себе: профессия, психология (coolhacker, murmur);
  4. Демонстрация увлечений: footballer, boxer;
  5. “Чтобы никто не догадался”: слово наоборот, русское слово в английской раскладке, слово на латыни и т.п.

Если мы не знаем ник, но знаем кое-что о человеке, мы уже можем строить предположения и проверять их.

Хорошим способом вычислить ник пользователя является поиск и анализ его страниц в соцсетях и поиск адреса личной электронной почты.

Начать поиск информации о конкретном пользователе можно с простого запроса, подобного следующему:

джон смит ромашка

где «ромашка» — название компании.

На текущий момент мы должны вспомнить, что некоторые особенности работы поисковика Google:

  • Google читает запрос слева направо.
  • Google не различает регистр: «Земля» и «земля» для него одно и то же;
  • длина запроса не должна превышать 32 слов;
  • * представляет одно слово в запросе;
  • можно искать точную фразу, взяв ее в кавычки;
  • между словами в запросе стоит невидимое логическое «И»;
  • Google сам умеет склонять слова;
  • Оператор «-» исключает из выдачи результаты, которые содержат выражение, помещенное сразу за данным оператором (обязательно без пробела).
  • в верху выдачи находятся страницы, которые, по мнению Google, являются самыми релевантными. Тем не менее это его догадка, так как наших мыслей он читать пока не умеет;
  • для уточнения параметров поиска необходимо владеть операторами продвинутого поиска (advanced search operators).

Теперь можно ввести аналогичный запрос по автору статьи и получить массу страниц, среди которых должна быть и искомые страницы в социальных сетях:

 

Информации в выдаче поисковика достаточно много, и чтобы найти страницы в социальных сетях нам придется пересмотреть большое количество страниц.

Примечание:

Кстати, а что делать, если мы хотим найти человека из определенной компании, но забыли его фамилию? Тут может помочь оператор звездочка:

джон * ромашка

А если мы ищем человека из ООО «Ромашка», а таких «Ромашек» — миллион: и АО «Ромашка», и АНО «Ромашка», и ФГУП «Ромашка» и т.д.

Вариант 1. Искать полную фразу «ООО Ромашка».

Вариант 2. «Минусовать» ненужные слова: -АНО – АО –ФГУП (но так можно «заминусовать» и нужные результаты, например если на странице говорится, что наша «Ромашка» подружилась с ФГУП «Апельсин».

Теперь нам необходимо сузить выдачу и найти страницу автора статьи в социальной сети «ВКонтакте». Это позволит нам определить один из ников пользователя, а затем и вычислить адрес электронной почты. Для этого будет полезно использовать такой оператор, как site. Он ограничивает поиск определенным доменом любого уровня.

 

Вторая ссылка уже ведет на страницу автора статьи в сети «ВКонтакте». Обратите внимание, что автор сознательно выбрал короткий ник: alexdorofeev. Не все интернет-ресурсы дают возможность самим задать ссылку на свою страницу, иногда она формируется автоматически, но может содержать в себе ник, взятый из адреса электронной почты.

Используя добытую информацию и знания, постараемся найти аналогичную страницу в сети Facebook.

Сначала на удачу в браузере введем следующий URL: https://www.facebook.com/alexdorofeev, но, к сожалению, увидим, что страница принадлежит кому-то другому. Тогда воспользуемся проверенным приемом и добавим в запрос site:facebook.com.

В результатах выдачи отсутствует прямая ссылка на профиль, который мы ищем, так как пользователь проявил в свое время бдительность и запретил «сдачу» его странички поисковикам

Здесь необходимо снова сделать небольшое отступление и вспомнить как работают поисковики и в том числе Google.

Что поисковики сделать могут, а что не могут?

Поисковики в общих чертах работают по следующему алгоритму:

  1. боты поисковых машин обходят сайты;
  2. содержимое страниц индексируется;
  3. по запросу пользователей извлекаются ссылки на релевантные страницы.

Поисковики не могут:

  • проиндексировать информацию, доступ к которой возможен только авторизованным пользователям;
  • данные, которые доступны после заполнения форм, например, результаты выгрузки из различных баз данных;
  • качественно извлечь информацию из видео, фото, аудио-материалов.

Еще некоторые нюансы:

  • контекст: результат выдачи зависит от запроса пользователя, от истории его предыдущих запросов и от истории просмотров страницы другими пользователями;
  • поиск осуществляется только на том языке, на котором пользователь ввел свой запрос;
  • имеется некоторый конфликт интересов: поисковики зарабатывают на рекламе, на которую кликают пользователи, потому что нужные им страницы оказались не в самом верху выдачи;
  • действует цензура из-за нарушения чьих-либо прав (авторские, право на забвение и т.п.).

Facebook относится к той категории интернет-ресурсов, которые не очень жалуют индексацию своего сайта и о чем непосредственно сообщают в robots.txt: