Якщо ви трохи втомилися чути про потенціал штучного інтелекту (ШІ) в повсякденності та роботі, ви не самотні! ШІ був одним з модних слівець останніх кількох років, і, як і всі модні слова, надмірне використання та неправильне розуміння можуть змусити людей скептично ставитися до його істинного потенціалу. Хоча це і зрозуміло, не можна дозволити цьому перешкодити нам визнати справжній потенціал ШІ в конкретних додатках відеоаналітики на основі машинного навчання (МН) та глибокого навчання (ГН).

Визначення штучного інтелекту, машинного та глибокого навчання в відеоспостереженні

Штучний інтелект — це галузь комп'ютерних наук, що вивчає та розробляє методи, які дають комп'ютерам моделювати інтелектуальну поведінку. Якщо говорити глобально, ШІ — це розширене поняття, але в конкретному контексті відеоаналітики основна увага приділяється підвищенню операційної продуктивності та цінності шляхом автоматичної обробки та аналізу відеопотоків.

У цьому контексті більш актуальна така категорія ШІ, як машинне навчання. Як випливає з назви, машинне навчання дає комп'ютерам покращувати алгоритми шляхом «навчання» на реальних прикладах. Потім поліпшені алгоритми використовуються для аналізу зображень або відео-послідовностей для генерації сигналізації, метаданих або іншої інформації.

Зовсім нещодавно увага звернулася на таку підкатегорію машинного навчання, як Deep learning, яке описує алгоритми, засновані на модельованих нейронних мережах. Ідея алгоритмів такого типу була натхненна системою зору людини, звідси і назва — нейронні мережі. У мережах ГН рівні операцій організовані в ієрархію складних та абстрактних рівнів, кожен з яких використовує інформацію з попереднього, щоб зробити остаточний висновок.

Моделі ГН дозволяють використовувати більш складні аналітичні алгоритми та зазвичай досягають більшої точності, ніж традиційні. У комплектах відеоспостереження вони використовуються, перш за все, для виявлення, класифікації та розпізнавання різних типів об'єктів. Однак одним з недоліків алгоритмів ГН вважається те, що вони вимагають більшої обчислювальної потужності та більшої кількості математичних операцій в порівнянні з традиційними алгоритмами.

Попит на Deep learning у великій кількості даних

МН та ГН вимагають відповідних обсягів вхідних даних для навчання, щоб досягати вражаючих результатів. Якщо для навчання є досить релевантні дані та обчислювальні потужності, методи на основі МН та ГН здатні продуктивно обробляти їх для досягнення алгоритмів з підвищеною точністю. Комп'ютер може аналізувати тисячі зображень, щоб знайти деталі, які характеризують конкретні об'єкти у всіляких сценаріях. Якщо дані та інформація про них якісні, значить, додаток на основі ГН здатний досягти ще більшої точності. Але доступність високоякісних даних може стати проблемою.

Можливо, всупереч загальному сприйняттю ШІ, чинним технологіям все ще не вистачає обізнаності або того, що можна було б назвати загальним інтелектом. У додатках, де використовується технологія, вона фокусується на конкретних проблемах в лімітованих областях. Наприклад, щоб голосовий додаток, такий як Siri або Alexa, зміг вірно відповісти на питання користувача, йому потрібно задавати конкретні та ясні питання. В іншому випадку він отримає абсолютно незрозумілу відповідь. Так само і в камерах відеоспостереження: поганий опис зображень, що використовуються для навчання, призведе до додатків зі зниженою точністю.

З огляду на поточні обмеження в точності цих технологій і те, що до правильного й контекстного розуміння сцени в деталях з відео ще далеко, ми повинні проявляти обережність відносно того, як і де використовувати ці технології. Чинна технологія підвищує продуктивність, але кінцеве прийняття рішення в сценарії відеоспостереження як і раніше має залишатися за охоронцем або оператором. Слід тримати «людину в курсі».

Сценарії використання відеоспостереження

По мірі розвитку будь-якої нової технології за межами першого ажіотажу, слабкі сторони і обмеження технології стануть очевидними, і тільки в тих областях, де вона забезпечує цінність, буде помітне і зростання. У питаннях відеоспостереження важливо починати зі сценарію використання: яку проблему ви намагаєтеся вирішити або якого ефекту хочете досягти? Грунтуючись на хорошому розумінні конкретного варіанту використання, доцільно застосувати МН та ГН для досягнення вражаючого результату.

Хоча ми все ще на початку шляху ШІ в області IP камер відеоспостереження, передбачені додатки та варіанти використання, в яких аналітика ГН вже приносить користь організаціям. Наприклад, при перегляді великих обсягів записаного матеріалу в пошуках конкретних об'єктів або подій — те, що ми часто називаємо судово-медичним пошуком.

Аналітичні додатки та використання комплектів відеоспостереження з відеоаналітикою Deep learning будуть розширюватися, але необхідний обережний підхід. Справжнє розуміння сценаріїв використання, обмежень технології, а також ретельне тестування та оцінка, що дозволяють переконатися в досягненні наміченого результату, мають вирішальне значення.

Якісні зображення з камер відеоспостереження, як основа

Фундаментальним для здатності аналізувати відео вважається якість відеокамери та зображення, або так звана «зручність використання зображення»: якість зображення безпосередньо відбивається на якості точності відеоаналітики. Відеокамери в комплектах відеоспостереження повинні працювати цілодобово, 365 днів на рік, реагувати на коливання температури та різні умови освітлення, при цьому правильно аналізуючи зображення в поточному часі.

Одна з галузевих тенденцій полягає в тому, що просунуте програмне забезпечення з відеоаналітикою переміщається на периферійні пристрої, а додатки працюють на самих камерах відеоспостереження. В цьому є ряд переваг: наприклад, економія смуги пропускання (оскільки з камери повинні передаватися тільки витягнуті дані), вирішення проблем конфіденційності, економія на дорогому серверному обладнанні та більш точна аналітика. Інтелектуальна відеоаналітика на периферії відкриє масу опцій для додатків, які ще більше підвищать безпеку та захищеність, і принесуть додаткові переваги в операційній продуктивності.

Терпіння — це чеснота

Як правило, після першого ажіотажу з приводу інновацій в області технологій настає практично неминучий період розчарування, коли вони не виправдовують очікувань. Але будьте впевнені, багато людей працюють "за лаштунками", щоб гарантувати, що штучний інтелект (а точніше машинне навчання та Deep learning) з часом розкриє їх потенціал.