Минулого тижня ми запросили на зустріч представників Харківської поліції, щоб відверто поговорити про головне, тобто про мапи та геоінформаційні системи.
Це може дещо бентежити, адже в нас так само до недавнього часу місцеві силові структури не викликали подібних асоціацій, і навіть безпосередньо перед зустріччю ми мали деякі сумніви щодо цієї вигадки. Єдине, що дивувало під час попереднього листування, це незвична відкритість та готовність співпрацювати з громадкістю, що відчувалися по той бік монітору.
Власне, вперше ми дуже здивувалися ще минулої осені, у жовтні, коли побачили повідомлення у провідних українських ЗМІ, що саме у Харкові запрацював геоінформаційний сервіс police.kh.ua, за допомогою якого у режимі онлайн можна повідомити про правопорушення та дослідити ступінь злочинності у будь-якому районі міста. Подив викликала і ГІС-складова сервісу, адже під час розробки явно використовувались найпрогресивніші технології, що дозволяли одночасно працювати з великими обсягами інформації.
То ж редакції було дуже цікаво побачити, хто саме стоїть за цим геоінформаційним сервісом, як виникла ідея його створення, і яким чином police.kh.ua використовується зараз.
Остаточний розрив шаблонів стався тоді, коли на зустріч замість типових міліціонерів з минулого прийшли харизматичні та талановиті молоді люди з потужним технічним бекграундом, аналітичними скілами та почуттям гумору. Та що найбільше вразило та надихнуло нас – це їх віра у те, що вони роблять корисну для суспільства справу, і що великі цілі досягаються маленькими кроками.
Через декілька днів ми знову випадково зустріли цих хлопців на 1991 Open Data Hackathon | Харків, де презентація проекту RICAS (Realtime intelligence crime analytics system), у рамках якого і був створений сервіс police.kh.ua, була визнана найкращою. Це нас вже ані трохи не здивувало, адже ми мали попереднє уявлення про надзвичайно високий рівень цього проекту. І ми залюбки поділимося зараз усіма подробицями з нашими читачами.
Щодо інтерв’ю: після деякої дискусії ми вирішили залишити мову оригіналу, адже такі вже в нас реалії, і не має великої різниці, якою мовою спілкуються люди, що дбають про розбудову громадянського суспільства в Україні. Отже, приємного читання!
Елена Ачкасова: Представьтесь, пожалуйста, расскажите, чем Вы занимаетесь, какое отношение имеете к системе Ricas и сайту police.kh.ua.
Станислав Доскаленко: Меня зовут Станислав Доскаленко, я старший инженер-программист Управления информационного обеспечения Главного Управления Национальной Полиции в Харьковской области. Длинное название)
Артём Петрусенко: я Артём Петрусенко, тоже разработчик в Управлении полиции. Собственно, непосредственно мы и занимались разработкой системы совместно с компаниями-партнёрами в Харькове.
ЕА: Расскажите, пожалуйста, как возникла идея создания подобной системы, и почему именно Вы причастны к этому проекту? У Вас есть опыт работы с геоданными или геотехнологиями?
СД: Изначально идея создания информационно-аналитической системы, связанной с раскрытием преступлений, с криминальным анализом, зародилась у нашего начальника, Узлова Дмитрия. Это было уже достаточно давно, может быть, лет 5 назад. И так сложилось, что три года назад мы попали в это управление, под его руководство. Мы окончили Харьковский национальный университет внутренних дел по специальности компьютерные науки, то есть мы “айтишники в погонах”. То есть мы и стреляли, и все другие дела делали, но при этом программировали.
ЕА: Это интересная и необычная специальность.
СД: Да, это уникальная в мире профессия, такого в принципе нигде нет. Но специальность – её закрыли.
АП: Университет больше не готовит специалистов в IT-сфере.
СД: Так вот, получилось так, что после десятков мозговых штурмов мы пришли к выводу, что лучшим, скажем, базовым интерфейсом для аналитической системы, будет географическая подложка. Так начала формироваться постановка задач, включаться математика и логика.
ЕА: А, собственно, какие цели закладывались изначально в эту систему? Для чего она создавалась?
СД: Дело в том, что Дмитрий Узлов, занимающий пост начальника Управления информационного обеспечения, больше 20-ти лет был оперативным сотрудником. И при этом он ещё давно получал образование в ХИРЭ (ред: зараз – Харківський національний університет радіоелектроніки), то есть такой симбиоз получился. Человек понимает ценность данных: в расследованиях, в предиктивных делах (т.е. предупреждении преступности). И он пришел к выводу, что этот инструментарий просто необходим. Где-то за рубежом есть аналоги, например, IBM i2 и прочие, но у всех есть свои недостатки. Если Вам интересно, мы сможем подробнее дальше уже это описать.
ЕА: Да, это было бы интересно. Насколько мы понимаем, это уникальный в своём роде продукт. Выходит, что в Украине подобных сервисов больше не существует. Вы планировали поделиться своим опытом и распространить его на другие города тоже?
СД: Дело в том, что это очень сложный процесс. Кроме основы геоинформационной системы, геоподложки, в клиентской части, происходит работа с big data, большими данными. Там просто террабайты данных, и всё это закрытая информация. И для того, чтобы это всё масштабировать в пределах страны, нужен очень большой вычислительный ресурс. Плюс желание других областей. Реально нужно финансирование для всего этого.
ЕА: А к Вам не поступало предложений от управлений из других городов о том, что они хотели бы сотрудничать?
СД: Просто мы еще не пиарились.
ЕА: Надеемся, это изменится.
Анна Новгородова: Но у нас в государстве такая бюрократическая система, которая очень редко приемлет какие-то новшества. Как вообще получилось, что согласились это создать, внедрить, время выделить?
АП: Мы просто начали это делать. А потом система начала давать результаты.
СД: По личной инициативе.
ЕА: Если подробнее о самой системе, что она собой представляет? То, что мы видим на сайте police.kh.ua, это только малая часть, правильно? Есть еще какая-то внутренняя система, у патрульных…
АП: Нет, это касается больше не патрульных, это касается внутренней системы для аналитики, которая должна расследовать преступления. Например, как мы все видели в фильмах (кто смотрел CSI, тот поймет) есть штат аналитиков, которые просто сидят у себя в кресле и со своего рабочего места делают какие-то аналитические сводки, а потом дают это людям, которые на земле, и они уже идут проверяют те или иные данные. Мы стремимся к такому варианту, и у нас есть рабочее место аналитика.
СД: Аналитики, например, раскрывают “висяки”, т.е. бывают такие ситуации, когда два райотдела граничат между собой, и два преступления совершаются на территории разных районов. Сотрудники райотделов просто не знают, что у этих преступлений есть связь из-за ограниченности в знаниях, так сказать. Система позволяет увидеть картину в целом.
ЕА: Собственно, преимущество ГИС-анализа как раз в этом и состоит….
СД: Да, сетка данных ложится на сетку геоподложки.
ЕА: Нам бы хотелось подробнее узнать, как это происходит в реальности.
Кстати, сколько месяцев прошло с момента релиза?
СД: Внутренняя часть системы постоянно в разработке, постоянно партнерами и нами проводятся улучшения всевозможные. А police.kh.ua мы начали планировать в мае 2015-го. Вообще-то планировали раньше намного, но первая реализация в мае, по-моему…
АП: Да, появилась в мае 2015 года после нашего обсуждения на встрече с курсантами и студентами ХНУВД, где затрагивались эти проблемы. И мы пришли к выводу, что такой внешний модуль необходим, для того, чтобы информировать и получать фидбек от населения.
ЕА: А как население реагирует, есть ли поддержка?
АП: Конечно, поддержка и в соцсетях у нас есть, и активность на сайте. Если зайти посмотреть статистику за неделю, там довольно много окажется посещений.
ЕА: То есть действительно на сайт заходили не только в первое время, но постоянно им пользуются?
АП: Сейчас запустим и посмотрим, что у нас здесь. (ред.: Артем дивиться статистику на смартфоні)
СД: У нас есть стабильные посетители. В первый день зашло 20 тысяч человек. Сейчас у нас спад пошел, 15, 10, 8, ну и устаканилось.
АН: Некоторые же зашли посмотреть просто, а, например, заявки?
СД: Мы не планировали запускать сервис тогда, когда это произошло. Он был сырой, и мы планировали через месяц или через два это сделать.
Но какой-то журналист из IT-сектора, наверное, случайно вбивает в поиск police.kh.ua, видит – там что-то есть, какая-то карта напряженности преступности, и давай. Это всё распространилось.
Мы смотрим: нагрузка пошла, колоссальная, в социальных сетях – везде.
ЕА: В перспективе вы видите, что люди будут пользоваться сервисом, и он поспособствует прозрачности работы новой полиции?
СД: Да, здесь действительно отображаются реальные данные о происшествиях.
ЕА: По поводу анализа полученных данных – понятное дело, их масса, есть какие-то закономерности, на которые вы обратили внимание в Харькове? Как преступность распределяется во времени-пространстве?
АП: Мы обратили внимание на самый активный район.
СД: С точки зрения гражданской позиции самый активный район – Московский. Это относительные показатели – количество заявок на количество жителей. Естественно, жителей в Московском и Киевском районах больше, поэтому больше всего заявок. Наверное, это связано с тем, что это спальные районы, и людей больше волнуют проблемы бытовые: соседи шумят, паркуются на газоне и прочее.
ЕА: А что касается преступности есть такие четкие корреляции по районам?
СД: Вот в основной системе, которая наша внутренняя, Ricas, у нас есть аналитическая часть. А на police.kh.ua – это карта напряженности преступности. То есть, в принципе видно точки вырождения, где так или иначе повторяется преступность.
ЕА: И как эта информация может дальше обрабатываться? Есть аналитики, которые занимаются ей в дальнейшем?
СД: Информация передаётся, и в дальнейшем оперативные службы с этим работают.
АН: А как именно?
СД: Например, больше патрулей на эти места выделяется. В теории, если будет финансирование, камеры будут ставить. И, естественно, в нашей системе предусмотрена работа с камерами.
ЕА: А были такие случаи, что благодаря этой системе предупредили какие-то преступления?
СД: Безусловно! Мы просто можем даже и не знать, предупредила или нет, по одной простой причине: увеличивается количество патрулей в местах с концентрированной преступностью, и соответственно, любитель, когда идёт на дело и видит мигалки (ред.: патрульних автівок), он не станет совершать задуманное.
ЕА: А у вас есть идеи улучшений, функции для дальнейшей разработки, чтобы раскрыть весь потенциал системы?
СД: Их огромное количество!
АП: Например, есть идея, чтобы прогнозировать во времени максимальные всплески преступной активности.
АН: Вы говорили о внутренней системе и той, которая доступна нам, обычным пользователям. Что во внутренней системе, чем она отличается от внешней публичной системы?
СД: Основа дизайна похожа, её создавали изначально кастомизированной, такой, как Photoshop, к примеру. Чтобы аналитик – человек, который работает с этой системой, – мог её настроить под себя. Там огромное количество фильтров, огромное количество подключаемых данных, автоматический анализ связей между ними, в принципе – это проще один раз увидеть, чем объяснить.
АП: Также у нас есть загрузка дополнительных данных. Если у оперативного рабочего есть данные, собранные в какой-нибудь excel файл, он может прийти на своё рабочее место и выгрузить эти файлы в систему.
СД: Или подключить внешнюю базу данных.
АП: Там распределение по … У нас это называется “слои”, но это как различные уровни, работа с различными делами: сегодня мы работаем над кражей велосипедов, завтра работаем над кражей колёс, к примеру, и если нам завтра нужно будет посмотреть данные по каждому из этих дел, эта информация загружается в виде кейсов.
ЕА: То есть, это работа с базами данных, правильно я понимаю?
СД: Да, там глубокая интеграция идёт с базами данных.
АП: Есть различные фильтры, поисковые запросы.
ЕА: А ваши аналитики, они имеют какое-то отношение к геоинформационным технологиям? Это ГИС-специалисты или это аналитики из других сфер?
СД: В принципе, специализироваться на ГИС не обязательно, потому что всё визуализируется автоматически. То есть, система автоматически распознаёт адрес события, и через довольно-таки сложные семантические алгоритмы адрес приводится к правильному виду, конвертируется в координаты.
АН: А еще какие специальные ГИС-инструменты есть?
СД: У нас есть соответствующий инструментарий, например, поиск в радиусе, он работает автоматически, на том же police.kh.ua есть карта напряжённости преступности, Вы смотрели, запускали её?
АН: Да, конечно. Это heatmap на Leaflet, да?
СД: Да, это heatmap по преступности, т.е. здесь используются определённые коэффициенты. Это всё реальные данные, работа с big data.
АН: На карте очень много событий в категории Інші події. Что это?
АП: Давайте я вам расскажу: это всё события, которые невозможно квалифицировать под категорию из доступных в списке событий, к примеру, “шумлять сусіди”, нет такого.
СД: Например, хулиганство, когда стороны между собой договорились не подавать заявление, а событие в любом случае произошло, и в этой категории хранится.
АП: В інше попадает ДТП без потерпілих, все такие малозначимые вещи, которые не относятся к основным событиям, на которые направлена эта раскрываемость – кражи, разбои, грабежи.
АН: Вы используете библиотеку Leaflet. Почему выбрали именно её?
СД: Потому что …
АП: … поддержали отечественного разработчика!
(Ред.: посміхаються)
АП: Нам, на самом деле, эта библиотека нравится из-за очень детализированной апишки. Мы используем последнюю версию с небольшой нашей кастомизацией.
СД: Небольшой? Большой! Очень большая кастомизация!
Во-первых, да, очень хороший API, у него очень высокое быстродействие, и оно реально колоссально. Mapbox базируется на Leaflet, они же не зря пригласили работать нашего соотечественника (ред.: мова про Володимира Агафонкіна).
ЕА: Ещё был вопрос по поводу того, пользуются ли этим сайтом сами патрульные во время патрулирования, но я так поняла, что у них другая система?
СД: Да, там централизованно из Киева спустили систему Цунами (ред.: Системи централізованого управління нарядами міліції), это немножко другое, и суть там сведена к минимуму геоинформационной системы. Там в принципе сейчас даже выключен режим построения маршрута, т.е. они просто сворачивают её и через навигатор строят заново маршрут. Там минимальное присутствие геоинформационной системы. Почему у них нет нашей системы? Потому что чем больше гаджетов, тем больше падает эффективность у патрульного. В дальнейшем, конечно, хотелось бы, чтобы это всё объединилось в одно целое.
АП: Наши системы решают немного различные задачи. У них это управление патрулями, в первую очередь. Наша же система направлена, во-первых, на расследование преступлений, во-вторых, на связь с общественностью и информирование общественности.
АН: А в вашей системе заявки, которые поступают на 102, добавляются в базу?
СД: Да, это же они и есть по сути.
АН: А те, которые пользователи через сайт подают?
АП: Те, которые добавляют через сайт, они точно так же поступают в систему 102.
То есть в колл-центре 102 работает человек, который из вот этой формы police.kh.ua отправляет патрули на события с карты.
АН: И много таких заявок, именно добавленных через Интернет?
АП: Поток не очень большой, просто сейчас часть харьковчан, которая знает об этом сервисе минимальна, меньше процента, мне кажется.
СД: Даже мы когда с друзьями общаемся, мы спрашиваем:
“Знаешь про police.kh.ua?”
“Не, а чё это такое?”
То есть, даже среди молодёжи не все осведомлены, не говоря уже о старших слоях населения.
АН: А расскажите подробнее, поступает заявка на 102, и что дальше происходит с этой информацией? Необходим довольно мощный бек-энд для обработки данных. Какие технологии Вы используете?
СД: Оператор квалифицирует, что это такое, добавляет в базу, передаёт информацию патрульным.
Сейчас система функционирует на PHP7, для максимального быстродействия. Геоданные хранятся в PostgreSQL, PostGIS, потому что мы пришли к выводу, что Oracle не очень быстрый для наших задач, а мускул (ред.: MySQL) быстрый и прикольный, но бывают сбои. Постгрес надёжный, быстрый, с геоданными очень шустро работает. Такие вот технические подробности.
СД: В принципе почти все плагины, которые используются, там много своих разработок, всё переписано для того, чтобы нормально работать с big data. Представьте себе, допустим, выводится 20 тысяч маркеров одновременно, и между ними автоматически строятся связи, это 20 тысяч умножить на 10 и полилайны между ними, и это все работает очень-очень быстро.
ЕА: Как вам это удалось?
АП: Оптимизация.
СД: Да, оптимизация, часть расчётов производится на сервере, часть на клиенте.
АП: И предпроцессинг данных.
АН: Вы не расшаривали на github-е ваши плагины?
СД: Нет, у нас была мысль… В принципе у нас есть аккаунт на гитхабе, была мысль коммитить, контрибьютить, просто они все между собой очень сильно взаимосвязаны, и это нужно связкой выкладывать, а там уже идёт довольно-таки серьёзная работа.
СД: При поддержке определённых партнеров по работе с данными, там очень мощная работа с семантикой, я понимаю что вас больше интересует ГИС составляющая…
Что из себя представляет полицейская база данных – это огромный поток данных с миллионами записей, у которых основное поле – это описание текстовое. И для того, чтобы работать с ними, нужен мощный семантический анализ этих данных. Собственно говоря, потом последующая их визуализация, поиск скрытых закономерностей с помощью Text Mining.
АН: А что это за IT-компания, которая помогает вам?
СД: Пока по договору нельзя разглашать это всё. По сути, как бы в большей степени по официозу, они являются владельцами процесса, мы являемся постановщиками задач.
Они же работают на перспективу, потрачено очень много человеко-часов.
АП: У нас, чтоб вы понимали, не два человека в команде, нас больше. Просто у нас есть еще администраторы…
АН: Расскажите про вашу команду, раз вы уже заговорили.
АП: Молодые, красивые , жаждущие что-то поменять в стране!
СД: Скромные.
АП: Не без этого.
АН: Ну вот вы начали уже про администраторов, про девелоперов. В принципе про коллектив расскажите, если это не тайна.
АП: Мужской коллектив) Если серьёзно, у нас есть админы, три человека, три человека программиста, и еще три человека, которые занимаются проджект-менеджментом.
СД: Наш начальник, у него очень большой опыт в оперативной работе, т.е. он знает, как ловить преступников на земле, и он этот процесс может спроецировать в IT, по сути бизнес-аналитик. Постановкой задач занимается вся наша команда, мейн девелоперами являемся мы с Артёмом. Всё дело проецируется в IT и отдаётся часть задач на аутсорс, часть сами выполняем.
АН: А вы, кстати, обещали рассказать про мировой опыт.
СД: Есть такая система замечательная, IBM i2, она стоит очень дорого. Cуть её заключается в дата майнинге, они работают сугубо с текстовыми массивами данных и анализируют скрытые закономерности. То же самое по сути что и у нас, но у них не используется геоподложка. В последних версиях они прикрутили ESRI, в принципе используя только базовый функционал, просто часть визуализации, т.е аналитики прямо на геоподложке нет, как у нас.
Плюс ко всему IBM i2 – это комплекс продуктов, т.е. для аналитики в радиусе – один продукт, для аналитики между людьми – второй, в целом – тысячи продуктов, и за это всё нужно заплатить. Такого, чтобы это всё было в одном рабочем пространстве, как у нас, нет. Такого, чтобы это работало на планшете, компьютере и смартфоне, нет. То есть у них это под каждую операционную систему отдельно скомпиллированное представление. Мы подошли к этому вопросу, когда начинали разрабатывать, с той точки зрения, что система должна работать везде и динамически. Всё работает на ajax-е, т.е. клиентская часть довольно-таки мощная, кроме гео-библиотек, у нас там очень-очень много клиентского кода, который оптимизирует это всё дело и минимизирует затраты клиентом.
Суть в том, что мы объединяем visual mining, т.е визуальное представление, и data mining автоматический. Полностью автоматизированный, как в i2, невозможно сделать, потому что не будет видно процессов в целом. Они это понимают. Но IBM – это суперкорпорация миллиардная, как говорит наш начальник, это локомотив, который несётся на скорости света, его остановить и поменять курс движения невозможно. Для того, чтобы дописать какой-то модуль или пересобрать эту систему под конкретного заказчика, им нужно тратить кучу ресурсов, у них штат из тысячи программистов работает над этим…
АП: Недавно, вот на днях, мы встречались с представителями IBM.
СД: Джон Нэш – это эксперт по планетарной безопасности. (ред.: Керівник європейського напрямку Безпечніша Планета у IMB)
АП: Он европейский регион представляет, вот он приехал позиционировать i2, и мы с ним встретились, рассказали о нашей системе. Он говорит: “Ребят, вы в принципе наши конкуренты.”
СД: Эксперт по планетарной безопасности, масштаб какой!
АП: Это радует, если нам говорят “Ребят, вы наши конкуренты”, это о чём-то говорит.
СД: Ericsson тоже с нами на связь выходил. Они сейчас заинтересованы в создании единого по стране колл-центра 112, чтобы 101, 102, 103, 104 – всё объединить в один. Суть в том, что у них нет как раз вот этой части аналитической, т.е. может быть и есть, но когда они увидели то, что есть у нас, они сказали: ”Ребята!” Ericsson, IBM, Cisco говорят, что классно.
АН: Есть такие крупные конкуренты у вас, а про вас мало кто знает, хотя, возможно, ваша система лучшая. Нужно как-то доносить о том, что вы лучше всех. Есть ли у вас такая стратегия, задача?
СД: Наша система больше сейчас на альтруизме построена.
АП: Мы понимаем, как это работает здесь, на наших данных, т.е. в каждом районе Украины крутятся одинаковые данные. У IBM есть конструктор. Это не конкретная система, которую вы соберёте, и она вам будет раскрывать, штамповать, нет, такого не будет.
СД: Для того, чтобы настроить эту систему годы уйдут, и очень большие затраты.
АП: Наша же система уже сейчас, в данный момент, позволяет раскрывать преступления. В последнее время мы проводили анализ, что наши аналитики за три месяца раскрыли порядка 150-ти краж, других правонарушений.
АН: А как это происходит вообще?
АП: Как происходит – работают аналитики.
СД: По поверхности пройдемся, потому что…
АП: Работают аналитики, после чего они составляют аналитическую сводку, которая представляет собой набор преступлений, объединённых по признакам, и набор потенциальных преступников, которые, возможно, совершили это преступление, после чего эта информация отдаётся на отработку в соответствующие службы. Они дальше проводят мероприятия по проверке данных и, если это подтверждается, то у нас в системе отмечается, что раскрыто с помощью системы RICAS, и нам засчитывается…
АН: бонус-балл
СД: “Дзынь”, там даже звук проигрывается такой.
А по поводу аналогов police.kh.ua – есть пару аналогов в Чикаго.
АП: За рубежом, конечно, есть такие аналоги.
СД: Конечно, они работают на своих решениях, довольно-таки устаревших, это даже не Google maps, это какие-то Yahoo, или что-то в этом роде. В общем медленно.
АП: Просто это, наверное, довольно давно было сделано, и на апгрейд сейчас не затрачиваются средства.
ЕА: А расскажите ещё, пожалуйста, о планах на будущее.
СД: Из-за того, что развивается активно внутренняя система, немножко приостановилось развитие police.kh.ua, но мы планируем в идеале разворачивать это на всю Украину. Но опять же как договорится руководство тех областей с нашим руководством, и с партнерской IT-компанией, которая нам помогает разворачивать это, а также железом, работой и прочим.. Police.dp.ua, police.lviv.ua – это уже, по сути, почти готовые проекты, остались бюрократические вопросы. Будем развивать, будем добавлять новые функции.
АН: Какие, например?
СД: С геоподложкой вряд ли какие-то.
АП: А какие есть идеи, что нам нужно добавить, может чего-то не хватает?
АН: Котиков, ггг.
АП: Будет особая версия сайта.
СД: Секретная кнопочка.
АН: И чтоб можно было селфи запостить.
СД: Там можно селфи сделать.
АН: Можно, да?
АП: Хотите селфи – делайте. Это увидит оператор.
СД: В мобильной версии предусмотрена загрузка прямо из мобильного браузера, Android и iOS тоже поддерживают, скоро будет API открытым. Он сейчас на стадии тестирования, и можно будет создавать приложения для подачи заявлений.
АП: А пока через сайт, но он адаптирован.
СД: Мало трафика, поэтому все функции работают хорошо. Кое-что отключено.
ЕА: Можете пару слов сказать в завершение, каким Вам видится будущее?
СД: Расширение подобных систем позволит открыть диалог между населением и правительством, улучшить качество жизни, осведомить людей…
АП: А я хочу пожелать всем, чтобы люди, прежде чем менять Украину, начинали менять себя. Нужно подумать, что можно полезное принести стране прежде, чем требовать что-то от неё!
СД: И чтобы негативные мысли не брали верх!