Журнал ТЗ № 5 2011 | Вы меня слышите?
  бюро находок  
  Где искать        
наши издания
наши анонсы






2011
№ 5
статьи



Журнал ТЗ № 5 2011



Раздел: СТОП-КАДР
Тема:
Автор:

Вы меня слышите?

В статье, предоставленной Гэри Тангом (Gary Tang) , рассматривается проблема разработки и внедрения систем восприятия и анализа звука.
Быстроразвивающиеся технологии видеонаблюдения вновь становятся объектом пристального интереса с точки зрения инноваций и безопасности. Американская ассоциация рекламных агентств провела исследование дополнительных возможностей современных систем наблюдения – восприятия и анализа звука.
Вспомните свою реакцию на необычный шум в привычной для вас обстановке. По словам Дерека ван дер Форста, главного исполнительного директора Sound Intelligence, большинство камер – «глухие». Человек сначала реагирует на звук и только потом поворачивает голову, чтобы рассмотреть происходящее. А что если бы системы безопасности вели себя точно так же? Автомобильная сигнализация, выстрелы, шаги, агрессивное поведение и звук бьющегося стекла – это всего лишь часть из многообразия звуков, на которые стоит обратить внимание.
Обработка и распознавание звука – достаточно сложный процесс, однако его результаты могут оказаться крайне полезными. Представьте систему, которая не только видит и слышит все, что происходит вокруг, но еще и обрабатывает поступающие сигналы. Характерная особенность видеокамер и адаптеров оцифровки изображения заключается в том, что они смотрят только в заданном оператором направлении и никуда больше. Благодаря внедрению функции анализа звука система сможет не просто видеть происходящее, но и слышать то, что не попало в поле зрения камеры. По мнению Криса Митчела, основателя и главного исполнительного директора Audio Analytic, именно эта аудиоаналитическая функция чаще всего остается недооцененной: «Камера, как правило, всего лишь фиксирует событие, попавшее в зону покрытия, и только при соответствующем освещении; аудиосистема же может видеть в темноте и слышать происходящее на самых отдаленных участках».
По мнению Митчела, очень долго аудиоаналитика испытывала недостаток внимания по сравнению с другими ключевыми элементами системы безопасности. Первое, что приходит в голову, когда мы касаемся темы распознавания звуков, – это акустический датчик разбивания стекла или аудиодетектор. Независимые акустические датчики разбивания стекла используются уже давно и на данном этапе широко представлены на рынке. Часто эти устройства, способные улавливать звук бьющегося стекла, подключаются непосредственно к сигнализационному щиту или даже к более сложной системе безопасности.
По мнению Митчела, потенциал сложных алгоритмов, используемых для того, чтобы завоевать преимущественное положение на массовом рынке устройств безопасности, был признан относительно недавно. Предыдущие попытки использовать продвинутые технологии предопределили создание сложных и заоблачно дорогих решений, которые требовали использования выделенных серверов и высокопроизводительных микрофонов. Стоимость и степень функциональной сложности стали причиной формирования барьеров на пути перехода к массовому производству.
Наблюдаемый переход к IP-системам безопасности позволяет снова обратиться к развитию аудиоанализа, а недавние разработки в области проектирования и создания аппаратного и программного обеспечения помогли решить задачу оптимизации затрат и снижения общей стоимости процесса движения продукта от производителя к конечному пользователю.

Последние достижения
Использование современных сетевых камер со встроенными микрофонами помогает быстро и эффективно интегрировать аудиоанализ в системы безопасности. По словам Митчела, такая комбинация способствует созданию систем, представляющих большие преимущества для конечных пользователей, и определяет перспективы для развития отрасли.
Последние разработки в области аудиоанализа представлены решениями, которые могут использоваться сразу с несколькими микрофонами, встроенными в камеры или телефонные системы связи, или с недорогими автономными микрофонами. Более ранние решения требовали установки и программирования отдельных профессиональных микрофонов или предусилителей. Более того, периферийные устройства становятся все более и более восприимчивыми, так как их техническое развитие обусловлено возникновением спроса на потребительском рынке. Ван дер Форст говорит о том, что производители используют технологии аудиоаналитики в периферийных устройствах, контролирующих системы обработки цифровых сигналов в камерах, системах внутренней телефонной связи, системах воспроизведения видеозаписи и в других устройствах: «На данном этапе спросом пользуется в основном серверная аналитика, однако примерно через год мы ожидаем повышения спроса на встроенные системы».
Прогресс заметен и в области разработки программного обеспечения. Относительно недавно стало возможным использовать сложные решения на периферийных устройствах, равно как и формировать несколько каналов в используемых системах виртуальной памяти. Митчел отмечает, что сложные алгоритмы обработки сигналов в сочетании с инновационными разработками позволяют использовать аудиоаналитические решения, встроенные в малые элементы программного обеспечения, которые можно с легкостью интегрировать в периферийные или центральные устройства, например в системы виртуальной памяти.
По словам ван дер Форста, самые существенные достижения, связанные с повышением производительности, касаются способности определять звуки в различных обстановках. Кроме того, улучшился и способ устранения ложных сигналов, который направлен на распознавание процесса развития события и определение сопутствующих факторов, например, повышения тона голоса, распыления баллонов с краской для граффити, выстрелов, присутствия и классификации транспортных средств, эпилептических припадков и многого другого. Возможности кажутся бесконечными.
Решения, внедряемые в новые устройства, созданные на базе мощных процессоров, занимают небольшой объем памяти и используют меньше электроэнергии для обработки сигналов, что позволяет использовать их в уже существующих системах. Они могут распознавать малейшие звуковые колебания в шумных помещениях, сохраняя при этом приемлемый уровень точности.

Упрощаем
Небольшие размеры программных компонентов дают возможность внедрять функции в продукты с простыми системами интеграции и несложными конфигурациями, что не требует использования дополнительного аппаратного обеспечения кроме видеокамер с встроенными аудиосистемами и других устройств. По словам Митчела, настройка систем аудиоанализа становится такой же простой задачей, как и изменение контрастности камеры или задание события в системе управления.
Эти основополагающие обновления аппаратного и программного обеспечения подготавливают почву для перехода к простой аудиоаналитике. Ван дер Форст считает, что упрощенная установка, калибровка и настройка делают системы аудиоанализа привлекательными для более широкой аудитории.
По мнению Митчела, некоторые типовые приложения, не требующие дополнительного оборудования, сложных систем или существенных затрат, способны распознавать агрессию в рамках сценариев взаимодействия с клиентами, например в регистратуре или справочных службах больниц, аэропортов или пунктов розничных продаж. Другие настройки включают распознавание автомобильной сигнализации на плохо освещенных общественных или офисных парковках.

Распознавание агрессии
Утомленный охранник может пропустить или не обратить внимания на основные импликации, присутствующие при разговоре, во время мониторинга некоторых событий, особенно при наличии нескольких дисплеев с видеоматериалом. По мнению ван дер Форста, можно привести большое количество примеров, когда аудиоанализ оказался эффективным средством. Ниже представлены некоторые сценарии, в которых аудиоанализ имеет перспективы для развития в качестве системы видеонаблюдения – в некоторых ситуациях счет идет на секунды.
*Исправительные учреждения. Система зафиксировала драку, уловив соответствующие звуки. Тюремные надзиратели получили предупреждение до обострения конфликта, в результате чего они смогли вовремя вмешаться. Кроме того, был зафиксирован факт нанесения ножевого ранения, что помогло спасти жизнь пострадавшего.
*Городские системы наблюдения. Были обнаружены драки в центре города, что позволило полиции вовремя вмешаться и остановить конфликт. Еще один пример – это ограбление, зафиксированное системой, которая уловила крик пострадавшего, – полиции удалось поймать и арестовать нападавшего.
*Регистратура. Поскольку регистратура является основным и самым людным местом многих учреждений, важно предотвратить развитие конфликтов у их истоков.
*Здравоохранение. Были распознаны случаи агрессивного поведения в психиатрических лечебницах, в результате чего персонал службы безопасности получил соответствующий сигнал и смог прийти на помощь медсестрам. Также можно использовать сигналы на базе индивидуальных звуковых профилей пациентов, страдающих эпилепсией, – каждый приступ представляет смертельную опасность, поэтому своевременное распознание приступа может спасти жизнь.
По словам ван дер Форста, активно обсуждаемый вопрос о сохранении тайны личной жизни, возникающий у некоторых клиентов, не имеет реальных обоснований. Система не записывает аудиосигнал постоянно, и ей неинтересно, о чем говорят люди. Система анализирует только диапазон звучания голоса, но не слова.

Претворяя в жизнь
Аудиоаналитика дает определенные преимущества в различных окружающих условиях, однако она еще не получила должного признания. В процессе разработки всегда сложно выйти на новый рынок, что особенно характерно для аналитических технологий.
Ван дер Форст полагает, что часть проблемы кроется в том, что коллеги из компаний, занимающихся разработкой видеоаналитики, дают слишком много обещаний, которые впоследствии не могут выполнить. Исходя из опыта прошлых лет, у многих представителей данной отрасли сформировалось несколько скептическое мнение о видео- и аудиоаналитике.
Вспоминая пример VCA bubble, нетрудно понять, каким образом чрезмерная реклама может негативно сказаться на развитии бизнеса. Сегодня многие потенциальные клиенты выказывают некоторую настороженность по отношению к самопровозглашенным «интеллектуальным» решениям с недостижимой функциональностью. Те, кто уже обжегся на этом, не будут спешить экспериментировать с новыми технологиями.
«Некоторые пользователи справедливо осторожничают, исходя из своего прошлого опыта использования новейших технологий, поэтому все усилия должны быть сосредоточены на упрощении интеграции и настройки, а также на демонстрации преимуществ для конечного пользователя, – говорит Митчел. – Только системы, которые действительно способствуют реализации поставленных задач специалистов-системотехников и пользователей, могут получить широкое распространение. И только те компании, которые имеют представление о поставленных задачах и которые поддерживают специалистов и конечных пользователей на ранних этапах оценки продукта, могут выдержать это испытание».
По словам Митчела, полномасштабное применение достигается посредством идентификации и организации площадок, где основные участники рынка смогут оценить потенциал аудиоаналитики во всем многообразии его приложений и условий окружающей среды. Дальновидные производители оборудования и специалисты-системотехники уже участвуют в процессе – ведется планирование нескольких действительно интересных площадок, предназначенных для различных сфер, например розничная торговля, банковское дело, игровой бизнес и общественная безопасность. Некоторые производители камер усиленно трудятся над интеграцией аудиоаналитики, которая становится основной функцией их продукции следующего поклонения.
Ван дер Форст считает, что единственный серьезный барьер в процессе освоения данного рынка – это образование, поскольку относительно малое количество людей осознает тот факт, что внедрение дополнительного источника восприятия в систему видеонаблюдения способствует существенному увеличению уровня эффективности. Просвещение рынка по вопросам не только возможностей, но и ограничений является особенно важной задачей в рамках стратегии повсеместного распространения аудиоаналитики.
По мнению ван дер Форста, лучше перевыполнить, нежели недовыполнить обещания. Он приводит такой пример: недавно в Брюсселе и Брюгге прошли тендеры на поставку систем городского наблюдения, одним из основных требований которого являлось наличие аудиоаналитики. В тендерной документации было представлено описание, согласно которому аудиоаналитическое решение должно обеспечивать формирование минимум 10% реальных сигналов. Это означает, что заказчики согласны принять 90% ложных сигналов. И хотя такое описание представляет собой существенную недооценку технологии, оно все же демонстрирует, что некоторые клиенты не только осведомлены о недостатках аудиоаналитики, но и имеют реальное представление о преимуществах ее использования.
Хотя аудиоаналитика может обладать многочисленными возможностями, существуют некоторые ситуации, когда уровень ее использования будет далек от оптимального. «В очень шумных местах, например в условиях ночного города, будут иметь место случаи неверного распознавания звуков, – считает ван дер Форст. – Что касается новых технологий, важно правильно сформировать ожидания клиента».
Некоторые клиенты полагают, что каждый сигнал будет свидетельствовать о реальной драке или как минимум о разговоре на повышенных тонах. Ван дер Форст предупреждает, что это не совсем верно, поскольку система может отреагировать и на другие звуки: «Несмотря на то что система может с точностью различать повышенные тона, человеческие голоса и нечеловеческие звуки, используемый алгоритм малоэффективен для определения разницы между группой выпивших и громко смеющихся людей (повышенные тона) в условиях шумного города и группой кричащих людей». Тут сигнализация сработает в обоих случаях, а что касается сигналов машин, строительных шумов, сирен «скорой помощи» и других громких механических звуков, то они будут определены совершенно точно.
Ван дер Форст считает, что компьютер никогда не сможет сравниться с человеческим мозгом, поэтому всегда будут возникать сигналы, на которые оператор не должен реагировать. «Аудиоаналитика, – отмечает он, – это система раннего предупреждения, а необходимая реакция всегда требует проверки оператором. Поскольку аудиоаналитические системы являются частью последовательности операций, выполняемых оператором, проверка сигнала займет всего лишь несколько секунд».
Кроме того, потенциальные покупатели должны понять, что данная технология – это не магия. Некоторые клиенты пытаются оборудовать огромные площади всего несколькими датчиками. Использование небольшого числа датчиков ограничивает зону покрытия, в результате чего инциденты, возникающие за пределами этой зоны, автоматически выпадают из поля зрения.

Развитие
По словам Митчела, некоторые из последних преимуществ и возможностей, созданных за счет использования аудиоаналитики, представляют огромный интерес, однако интеграторам потребуется время, чтобы полностью их изучить и набраться опыта. «Расширение области применения аудиоаналитики, – считает он, – возможно на основе получения системными интеграторами личного опыта, обучения и повышения доверия конечных пользователей к возможностям данной технологии». Наличие постоянной обратной связи и конкуренция всегда приветствуются, поскольку они помогают управлять будущими разработками новых решений, которые могут определять звуки и обеспечивать защиту в различных условиях. Повышение функциональности и надежности будет способствовать расширению области применения аудиоанализа, стимулируя быстрое развитие рынка.

Источник – журнал AS MAG




Внимание! Копирование материалов, размещенных на данном сайте допускается только со ссылкой на ресурс http://www.tzmagazine.ru

Рады сообщить нашим читателям, что теперь нашем сайте работает модуль обратной связи. Нам важна ваша оценка наших публикаций! Также вы можете задавать свои вопросы.Наши авторы обязательно ответят на них.
Ждем ваших оценок, вопросов и комментариев!

Комментарии:
Добавить комментарий или задать вопрос

Правила комментирования статей

Версия для печати

Средняя оценка этой статьи: 0  (голосов: 0)
Ваша оценка:

назад
|
Реклама
Подписка на новости
Имя
E-mail
Анти-спам код
Copyright © 2008 —2022 «Технологии защиты».