Пост про идеальные условия сбора данных в...

Телеграм апр. 25, 2020

Пост про идеальные условия сбора данных в Московском метро, и грядущем «цифровом концлагере» вызвал много вопросов в бота, поясню техническую и организационную сторону вопроса.

Основные вопросы и замечания: выкину я тройку после отмены пропусков и прощай система контроля. Местоположение человека со смартфоном определяется легко, «тройки» пополняются банковскими картами, указывающими на личность, камеры уже стоят. Что мешало накрыть город тотальным контролем раньше, до пандемии?

Рассмотрим построение системы тотального контроля в доковидные времена. Нужно взять геолокацию и селфи с помощью госуслугоподобного приложения на мобильном телефоне, нагнуть операторов связи, чтобы получить триангуляцию по каждому устройству, нагнуть банки для выдачи личности по каждой из транзакций на тройку, взять данные с камер, долго и мучительно сегментировать видеопоток толпы людей, после чего пытаться из этой кучи информации добывать что-то полезное.

Даже если это реализуемо в теории, масштабировать на весь город довольно сложно: как минимум, процесс получения информации от банков и сотовых операторов строго регламентирован, только по запросу на конкретную личность, с привлечением прокуратуры или суда. Запрос вида «выгрузите нам всю свою базу» мне представляется неисполнимым.

Те же фотографии с камеры смартфона, которые можно утянуть с помощью приложения, тоже так с ходу не присобачишь: нужно как минимум определить, владелец ли на кадре (мб сын помогает с глючной приложухой разобраться), да еще изображения с камер интереснее анализировать с учетом походки, пропорций тела и т.д., а селфи этого не дает.

А теперь вариант в нынешних реалиях, про который я писал. Есть база mos.ru с профилями людей. Туда добавлен номер тройки. Простеньким запросом вытягиваем все профили, у которых добавлен номер тройки. Есть база проходов через турникеты. Оттуда грузим все проходы за время работы пропускной системы, находим пересечение двух выборок и из него определяем время, когда человек светился перед камерами, после чего берем видеофрагмент с нужной камеры. Задача для одного новичка на день, ну два, и можно спокойно собирать качественный датасет. И все данные уже в распоряжении ДИТ, не нужно выдавливать информацию из сторонних источников.

Понятно, что смена карты "Тройка" в такой ситуации не поможет: соответствие видеофрагмента и личности уже установлено, данные собраны. Разумеется, есть куча нюансов при работе с высоконагруженными системами, которые, помноженные на компетенцию начальства и высшего руководства могут запросто похерить весь задел, но условия для подготовки системы тотального контроля прекрасные.

Eshu Marabo

Теги