Автор: Ирина ОСТРОУХОВА, директор по работе с партнерами в России и СНГ RecFaces

Технологии будущего в настоящем: машинное и компьютерное зрение и лицевая биометрия



Быстрее, точнее, эффективнее – эти требования сегодня предъявляются к большинству процессов в окружающей нас действительности. Добиться их выполнения человеку помогают технологии компьютерного и машинного зрения. Что это такое? Где применяются эти технологии и как они связаны с лицевой биометрией?


Разбираемся в понятиях

На первый взгляд, кажется, что оба термина обозначают одно и то же. На самом деле, ставить между ними знак равенства неправильно. Компьютерное зрение – это область компьютерной науки, тесно связанная с искусственным интеллектом и робототехникой. Во главе научной области стоит развитие технологии, позволяющей компьютерам извлекать информацию из изображений и видео объектов реального мира, а затем анализировать ее. На основе обработанных данных компьютер способен находить и распознавать определенные объекты, классифицировать по заданным признакам, а также отслеживать перемещения. Кроме того, компьютерное зрение умеет анализировать графики, таблицы и текст.

Машинное зрение – подраздел компьютерного зрения, чаще всего используемый в промышленности и на производстве. Как правило, такие системы заточены на выполнение конкретных прикладных задач: выявить дефект детали, пересчитать количество сошедших с конвейера единиц продукции и так далее. Принцип их работы тот же: анализ информации на основе захвата и обработки изображения.

Как «видят » компьютеры?

Работа программы компьютерного зрения состоит из трех этапов. Первый – получение изображения от сенсорного устройства в режиме реального времени. В качестве сенсора обычно выступает фото- или видеокамера. Но это могут быть и «узкоспециальные» устройства, например, аппараты медицинской визуализации. В качестве изображения используются фотографии, видео или 3D-модели. Второй этап – обработка картинки. Первые технологии использовали статистические методы. Но сегодня золотым стандартом является глубокое обучение и алгоритм нейронной сети. С их помощью программа начинает сохранять данные о каждом обработанном изображении, постепенно начиная обучать сама себя. Анализ при этом становится еще более точным. Третий этап – расшифровка полученного изображения, когда компьютер идентифицирует и классифицирует нужные объекты. В зависимости от целей обработки используются следующие функции.

Распознавание символов – одна из первых технологий, которая используется для преобразования букв и цифр на картинке в текст.

Классификация – компьютер разбивает объекты на картинке на группы по определенному признаку. Например, отличает людей от животных или подсчитывает количество нужных предметов.

Идентификация – система распознает нужный объект с картинки и анализирует его внешний вид. Самый яркий пример идентификации — установка личности человека на фото или видео.

Отслеживание – анализ того, в какой момент и где находился нужный объект или человек на видео.

Объектовая аналитика – распознавание и классификация физических объектов для решения различных технологических задач.

Для чего нужно компьютерное зрение?

Будучи одной из областей искусственного интеллекта компьютерное зрение ориентировано на автоматизацию тех задач, которые в предыдущие века или десятилетия выполнялись людьми. А конкретно тех, которые требуют имитации зрения человека и его восприятия окружающих объектов. Компьютер перенимает у нас способность видеть, но способен ли он полностью заменить человека? Это сложный вопрос. Хотя искусственный интеллект по своему уровню все ближе подбирается к человеческому разуму, компьютеры по-прежнему не умеют использовать абстрактное мышление или фантазию. И все-таки у компьютерного зрения есть два больших преимущества перед человеком: способность к восприятию бесконечного количества объектов и более высокая работоспособность. В отличие от человека компьютер не устает и не теряет концентрацию. Представим себе оператора системы видеонаблюдения. Он должен часами сидеть на одном месте, всматриваться в экран и следить, не возникнет ли на территории внештатная ситуация. Сколько бы ни было камер, какими бы удобными ни были мониторы наблюдения, через пару часов человек банально устанет, перестанет адекватно воспринимать происходящее на мониторе и с большой долей вероятности пропустит что-то важное. С компьютером такого произойти не может. Поэтому во всем, что касается взаимодействия с визуальной информацией, компьютерное зрение действительно справляется с работой на несколько порядков точнее и быстрее.

Где используют компьютерное зрение?

Промышленность – та сфера, где компьютерное зрение сегодня внедряют активнее всего. Технологию используют для контроля качества продукции и упаковки, выявления дефектов, подсчета количества выпущенных единиц товара, мониторинга состояния конвейерной линии.
Все это позволяет сокращатьть издержки и увеличивать рентабельность производства.

Банки – высокий спрос на внедрение технологии обусловлен тенденцией на автоматизацию и цифровизацию ежедневных бизнес-процессов, а также на повышение лояльности клиентов. Мгновенная идентификация клиента в отделениях банка сокращает время обслуживания и дает возможность предложить ему индивидуальный пакет услуг. А удаленная верификация по лицу в мобильных приложениях позволит дистанционно получить банковские услуги.

Сельское хозяйство – технологию применяют для анализа изображений полей, сделанных с воздуха. Полученные данные позволяют поддерживать нужный уровень полива посевов, отслеживать созревание и вести учет сбора урожая. А еще бороться с сорняками и заболеваниями растений.

Безопасный город – благодаря комплексу инструментов, основанных на искусственном интеллекте, компьютерном зрении и распознавании лиц, становится возможным выявлять уставших водителей за рулем, идентифицировать номерные знаки машин и траекторию их передвижения, а также обеспечивать безопасность в местах массового скопления людей. Комбинация инструментов позволит уполномоченным органам быстро реагировать на инциденты и повышать уровень физической безопасности людей.

Транспорт – еще одна перспективная сфера для внедрения компьютерного зрения. Яркий пример – автопилоты. Их существование целиком строится на развитии технологии, ведь именно компьютер в режиме реального времени отслеживает состояние дороги, наличие рядом других машин или дорожных знаков. Разумеется, в этом случае в системе управления используется существенно большее количество данных, дополняющих сведения с камер, что существенно превышает человеческие возможности.


Здравоохранение – компьютерное зрение помогает в диагностике различных заболеваний, в разы повышая качество основных медицинских обследований: рентгена, МРТ или УЗИ. Причем часто технологии удается выявить проблему уже на ранней стадии, когда разглядеть ее «глазами» врача просто невозможно. А в будущем компьютеры и вовсе смогут заменить классические аппараты для диагностики. Такие обследования будут не только точнее, но и безопаснее для пациентов из-за меньших доз облучения. И, разумеется, компьютерное зрение станет локомотивом развития роботохирургии.

Ритейл – технология активно адаптируется и к нуждам торговли. Причем не только для защиты от магазинных краж, но и для ведения товарооборота, учета товаров, контроля над выкладкой продукции, мониторинга сроков годности, бесконтактной оплаты «по лицу».

Компьютерное зрение и биометрия

Биометрия является одним из подразделов или направлений компьютерного зрения. Это тот сегмент технологии, с которым среднестатистический человек знаком лучше всего. Основной принцип работы здесь тот же: камеры передают программе по распознаванию лиц картинку. Программа обрабатывает изображение, «вычленяет» из него лицо человека и определяет уникальный набор его неизменяемых параметров. На их основе формируется биометрический шаблон, после чего он сравнивается с теми шаблонами, которые хранятся в базе данных программы. При наличии или отсутствии совпадения запускается установленный сценарий действий. Например, это может быть оповещение сотрудников службы безопасности о наличии подозрительного лица в здании. Или открытие «биометрического» турникета.

Функция распознавания лиц расширяет возможности по использованию компьютерного зрения практически во всех областях, идентификация часто оказывается наиболее востребованной функцией компьютерного зрения.

Кроме того, биометрия работает с людьми. А значит помогает нивелировать в различных процессах негативный эффект от человеческого фактора. Рассмотрим основные задачи лицевой биометрии и посмотрим, какую пользу она приносит в упомянутых сферах.

Физическая безопасность – ключевая функция распознавания лиц.

Внедрение лицевой биометрии в системы видеонаблюдения в разы повышает безопасность как в пределах одного объекта (например, завода или станции ТЭК), так и в масштабах всего города. Городские системы «умного» видеонаблюдения позволяют отслеживать обстановку на улицах и на объектах транспортной инфраструктуры: в метро, на остановках и так далее.

Биометрия помогает предотвращать различные противоправные инциденты, в том числе, и теракты, а также повышает эффективность их расследований. Современные алгоритмы распознавания лиц применяются и для обеспечения безопасности сотрудников на производстве. Так, с помощью системы можно удостовериться, что все рабочие используют средства защиты и соблюдают технику безопасности.

Информационная безопасность – защита данных сегодня зачастую оказывается не менее важной, чем физическая защита периметра объекта или сотрудников. Это актуально для всех: от промышленных предприятий до медицинских клиник и от государственных учреждений до банков.
Интеграция продуктов на основе лицевой биометрии в системы служебных компьютеров позволяет контролировать доступ к информационным ресурсам компании и предотвращать возможные кражи или утечки данных.

Финансовые операции – биометрические данные в силу своей уникальности и неотчуждаемости становятся более надежной альтернативой паролям или пин-кодам. Поэтому сегодня биометрия активно используется для идентификации клиентов в банковской сфере, в том числе, и при удаленном обслуживании. Да и «оплата по лицу» за последние годы успела стать вполне себе технологией настоящего. В разных странах ее успешно применяют и для оплаты проезда в общественном транспорте, и для оплаты покупок в кафе или магазинах.

Персонализация услуг – использование лицевой биометрии в ритейле делает обслуживание клиентов более персонифицированным. Узнавая покупателя «в лицо», система сама формирует для него специальные предложения или предлагает скидки на интересные именно ему категории товаров.

Аналитика данных – биометрия является удобным инструментом сбора достоверных данных. А достоверные данные – это всегда большая ценность, ведь их анализ можно применять практически для любых целей. Например, обладая статистикой по пассажиропотокам в часы пик, мы можем корректировать маршруты и интенсивность движения на наиболее популярных линиях метро или наземного транспорта. А зная, сколько именно людей зашло в наш магазин в разные периоды, можно оценить эффективность той или иной маркетинговой кампании.

К повсеместной цифровизации и автоматизации относиться можно по-разному. Однако с трендом на автоматизацию неразрывно связаны и наше настоящее, и наше будущее. В 2020 году глобальный рынок машинного зрения оценивался в ,45 млрд, а к 2030 году эта цифра может достигнуть ,11 млрд. Все активнее технология внедряется и в России, так в 2021 году компьютерное зрение вошло в ТОП-15 наиболее важных цифровых технологий для российской промышленности по версии Института статистических исследований и экономики знаний НИУ ВШЭ. Распознавание лиц не только является одной из ключевых функций компьютерного зрения, но и позволяет значительно расширить сферы применения этой технологии.

По мере распространения и популяризации технологии в сферах, где присутствует взаимодействие с человеком, готовые биометрические решения с функцией распознавания лиц будут играть связующую роль в персонализированном взаимодействии между различными системами.


Внимание! Копирование материалов, размещенных на данном сайте допускается только со ссылкой на ресурс http://www.tzmagazine.ru