"А я милого узнаю по силуэту": учёные ИИ МГУ совершили прорыв в области нейросетей

Алгоритмы, созданные отечественной компанией Tevian под руководством научного сотрудника Центра ИИ МГУ, побили рекорды на тестировочных площадках, выдав лучшие результаты по распознаванию человека с камер наблюдения по силуэту. Metro выясняет, насколько близко будущее
"А я милого узнаю по силуэту": учёные ИИ МГУ совершили прорыв в области нейросетей
предоставлено героем материала
Вот вам пример – камера "засекла" объект и теперь нейросеть ищет его в других местах.

В мегаполисе камеры видеонаблюдения – вещь привычная. С помощью нейросетей камеры научились распознавать людей по лицу, однако его можно скрыть или надеть маску. Специалисты на протяжении нескольких лет бились над задачей родом из фантастических сюжетов – научить нейросети чуду под названием "реидентификация". Простыми же словами, нужно было натренировать искусственный интеллект распознавать людей по их силуэтам, изменить которые уже гораздо сложнее.

Тимур Мамедов, научный сотрудник Центра ИИ МГУ и руководитель направления распознавания силуэтов компании Tevian, начал заниматься этой темой шесть лет назад, когда попал в лабораторию компьютерной графики и мультимедиа МГУ.

Цифра
>270 000
видеокамер интегрировано в систему наблюдения города Москвы согласно данным ГУ МВД по состоянию на апрель 2025 года.

– Как оказалось, самая большая сложность в освоении алгоритмов по распознаванию человеческих силуэтов и их настройки заключалась в недостаточности нужных данных. Чтобы нейросеть научилась "узнавать" те или иные очертания, ей необходимо увидеть силуэт одного и того же человека с разных ракурсов, а найти такие снимки и видео в реальном времени крайне сложно, – поделился Тимур в разговоре с Metro. – За рубежом подобные алгоритмы, конечно, уже существовали, однако довести до абсолюта технологию мешали многие факторы. Один из главных – большая разница в системах видеонаблюдения. Качество изображения на каждой из камер зависит от ракурса, освещения, самого типа устройства и его настроек, поэтому собрать общий алгоритм, который сможет распознавать человека по силуэту в любой из существующих систем, было практически невозможно. Да и системы, в которых бы много камер снимали в одних и тех же ракурсах, встречаются крайне редко.

Ещё сложнее, по словам эксперта, было захватить изображения одного и того же человека с разных камер в разных ракурсах – такое встретишь редко, да и нейросети приходится вручную объяснять, что она перед собой видит не разных людей, а одного и того же.

Технологией интересуются неспроста – она может стать настоящим прорывом в видеоаналитике преступлений, ведь не всегда камера может "увидеть" лицо нарушителя, а вот подделать силуэт уже невозможно. Интересна она и сфере торговли – благодаря данным с камер маркетологи позже смогут понять, у каких прилавков и товаров задерживаются покупатели, что поможет более грамотно выстраивать стратегии продвижения.

Настоящим шагом вперёд в обучении нейросети стал новый подход команды Тимура – они начали смешивать большой объём однокамерных данных с небольшим количеством многокамерных.

– Благодаря этому улучшили способность алгоритма работать с разными ракурсами и камерами, смогли эффективно обучить систему на миллионах изображений, которые собрали на просторах YouTube и Интернета в общем, – рассказывает эксперт. – Благодаря этому нам удалось проверить алгоритм на известных бенчмарках (так называют наборы данных, на которых тестируются различные программы и алгоритмы), где мы смогли получить впечатляющие результаты, в некоторых случаях даже превышали вдвое уровень, достигнутый другими тестировщиками.

И вот нейросеть нашла объект – в другом месте и снятый с другой камеры!
предоставлено героем материала
И вот нейросеть нашла объект – в другом месте и снятый с другой камеры!

Улучшение алгоритма, тем временем продолжается – теперь в него можно загрузить не только изображения, но и текстовое описание искомого объекта, которое значительно улучшает процесс поиска. В скором времени эти результаты также будут опубликованы.

В будущем Тимур надеется, что его технология поможет улучшить безопасность в городах и стать незаменимой частью концепции "умного города". Однако, глядя на растущий потенциал нейросетей, начинаешь невольно переживать, а вдруг нас всё-таки поработит ИИ? Ведь кажется, что нейросети уже знают гораздо больше, чем нужно.

– Нейросети уже знают больше среднестатистического человека, это факт, однако у них нет софт‑скиллов – умения общаться, проводить интервью, проявлять талант, – отметил Мамедов. – Они могут заменить рутинные задачи, но не творческих профессионалов.