Явление Deep Learning продолжает волновать мир ИТ, с вычислительной мощностью сейчас на том уровне, где его можно надлежащим образом использовать в практических приложениях. Hikvision уже выпустила свой первый набор продуктов, которые используют силу искусственного интеллекта (AI).
Явление Deep Learning продолжает волновать мир ИТ, с вычислительной мощностью сейчас на том уровне, где его можно надлежащим образом использовать в практических приложениях. Hikvision уже выпустила свой первый набор продуктов, которые используют силу искусственного интеллекта (AI).
Концепция глубокого обучения вдохновляет на то, как работает человеческий мозг. Наш мозг можно рассматривать как очень сложную модель глубокого обучения. Мозговые нейронные сети состоят из миллиардов взаимосвязанных нейронов; глубокое обучение имитирует эту структуру. Эти многоуровневые сети могут собирать информацию и выполнять соответствующие действия в соответствии с анализом этой информации.
За последние два года технология превзошла в распознавании речи, компьютерном видении, голосовом переводе и многом другом. Он даже превзошел человеческие возможности в области проверки лица и классификации изображений; следовательно, он высоко ценится в области видеонаблюдения для индустрии безопасности.
Его способность повышать узнаваемость людей, например, отличая их от животных, делает технологию отличным дополнением к арсеналу безопасности. Это особенно актуально в мире, где ложные тревоги составляют 94% -99% всех аварийных сигналов, согласно статистическим данным полиции и пожарной службы!
Как работает глубокое обучение
Глубокое обучение по сути отличается от других алгоритмов. Способ устранения недостатков традиционных алгоритмов охватывает следующие аспекты.
Алгоритмическая модель глубокого обучения имеет гораздо более глубокую структуру, чем традиционных алгоритмов. Иногда количество слоев может достигать более ста, что позволяет обрабатывать большие объемы данных в сложных классификациях. Глубокое обучение очень похоже на процесс обучения человека и имеет поэтапный процесс абстракции. Каждый слой будет иметь разное «взвешивание», и это взвешивание отражает то, что было известно о компонентах изображений ». Чем выше уровень слоя, тем более конкретные компоненты. Подобно человеческому мозгу, исходный сигнал в глубоком обучении проходит через слои обработки; далее, он принимает частичное понимание (неглубокое) к общей абстракции (глубокой), где он может воспринимать объект.
Глубокое обучение не требует ручного вмешательства, но полагается на компьютер для извлечения функцийсамо по себе. Таким образом, он способен извлекать как можно больше функций из цели, включая абстрактные функции, которые трудно или невозможно описать. Чем больше функций есть, тем точнее будет признание и классификация. Некоторые из самых прямых преимуществ, которые могут принести алгоритмы глубокого обучения, включают в себя достижение сопоставимой или даже лучшей, чем человеческая точность распознавания образов, сильные антиинтерференционные возможности и способность классифицировать и распознавать тысячи функций.
Проблемы существующих систем
Обычные системы наблюдения в основном обнаруживают движущиеся цели без дальнейшего анализа. Даже интеллектуальные IP-камеры могут отображать отдельные точки на фигуре один за другим, что затрудняет калибровку некоторых функций (например, лоб или щеку), что снижает точность.
Например, для защиты периметра другие технологии могут использоваться (и используются) для обеспечения более полной безопасности. Но все они имеют свои недостатки. Инфракрасные детекторы излучения могут «перепрыгивать», но также подвержены ложным тревогам, вызванным животными. Электронные ограждения могут представлять опасность для безопасности и ограничены в определенных областях. Некоторые из этих решений также могут быть дорогими и сложными для установки.
Объект, такой как животные, листья или даже свет, может вызывать ложные тревоги, поэтому возможность идентифицировать присутствие человеческой формы действительно повышает точность функций VCA периметра. Частые ложные тревоги всегда являются проблемой для конечных пользователей, которым необходимо потратить время на исследование каждого из них, что потенциально задерживает любой необходимый ответ и в целом влияет на эффективность.
Представьте себе, например, сценарий, где он относительно тихий - место ночью, где мало машин и людей. Даже здесь ночью может быть 50 ложных тревог. Предполагая, что для проверки ложной тревоги требуется 2-3 минуты, и только 3 из 50 ордеров больше внимания - скажем, по 15 минут каждый. Охранник либо должен проверить систему, либо оглянуться назад на предупреждение, либо кто-то должен быть отправлен в место и осмотреться, проверяя, действительно ли кто-то «ввел без разрешения». В большинстве организаций они также должны быть зарегистрированы / записаны, добавив общее время, затрачиваемое на эту «ложную тревогу». Таким образом, эти 50 ложных тревог могут стоить более двух часов каждую ночь впустую в этом сценарии.
Однако глубокое обучение имеет большое значение. Благодаря большому количеству качественных данных от камер и других источников, таких как Научно-исследовательский институт Hikvision, и более чем сотню членов команды по очистке данных для маркировки видеоизображений, накоплены данные по образцам с миллионами категорий в отрасли. Благодаря этому большому количеству качественных данных обучения модели распознавания образов человека, транспортных средств и объектов становятся все более точными для использования в системах видеонаблюдения.
Основываясь на серии экспериментов, точность распознавания решений с использованием алгоритма Deep Learning повысила точность на 38% - применяя это к предыдущему примеру, это экономия почти на один час каждую ночь. Это делает технологию Deep Learning отличным преимуществом в решении для защиты периметра, с гораздо более точным пересечением линии, вторжением, обнаружением входа и выхода.
Другие виды использования
Значение технологии Deep Learning простирается дальше, чем традиционная безопасность. Например, отслеживание моделей движения отдельных лиц может видеть, являются ли они «ложными» и потенциальной угрозой в будущем. Порог может быть установлен в радиусе действия пяти метров, или десять секунд пребывания в одном месте. Если человек проходит любой порог, может быть запущен сигнал тревоги. Решение отслеживает человека и сравнивает это поведение с базой данных, чтобы узнать, распознает ли он шаблон.
Другое приложение будет в сценарии, где «падение» может представлять угрозу, например, дома престарелых. Если порог высоты был установлен на уровне 0,5 м и длительностью 10 секунд, например, решение могло бы увидеть, как человек падает (как они идут ниже 0,5 м) и может быть в беде (если они «остаются вниз» для более 10 секунд). Решение использует параметры, установленные для сравнения с его базой данных и повышающие уровень тревоги.
Благодаря таким функциям и преимуществам легко понять, сколько интеллектуальных приложений может удовлетворить технология Deep Learning