Багато фахівців з відеоспостереження стикалися з такими поняттями, як штучний інтелект (AI), машинне навчання (ML) та глибоке навчання (DL). Але що означають ці терміни та як вони впливають на камери відеоспостереження?

ШІ — це термін, який вагомою мірою відноситься до застосування людського інтелекту до комп'ютерних програм або дозволяє програмам вчитися з плином часу, з метою отримання дивовижних результатів у процесі навчання. Машинне навчання — це техніка, що використовується для досягнення рівня штучного інтелекту. Глибоке навчання — це еволюція машинного навчання. Простіше кажучи, Deep Learning — це просунута, складна техніка машинного навчання, і обидві є методами досягнення рівня штучного інтелекту.

У сегменті відеоспостереження та програмного забезпечення з відеоаналітикою використовуються методи машинного й глибокого навчання для ідентифікації об'єктів, класифікації та визначення їх властивостей. Всякий раз, коли люди отримують нову інформацію, наш мозок намагається порівняти дані з аналогічними елементами, щоб зрозуміти їх. Цей порівняльний підхід вважається тією ж концепцією, яку використовують алгоритми машинного й глибокого навчання.

Алгоритми машинного та глибокого навчання розрізняються по тому, як вони запрограмовані для визначення того, що складає потрібний об'єкт. Машинне навчання вимагає більшого втручання з боку програміста, щоб встановити бажані параметри для досягнення бажаного результату. Deep Learning визначає атрибути об'єкта незалежно та може враховувати характеристики, які не будуть враховувати програмісти.

Що ж машинне навчання та Deep Learning означають для відеоаналітики? Обидва підходи описують методи програмування, в яких пристрій навчається на основі набору даних. При машинному навчанні атрибути даних, які шукає система, встановлюються або виправляються програмістами-людьми. Наприклад, технологія може бути запрограмована на те, щоб розмежувати конкретний об'єкт та позначити його як «людину». Deep Learning вважається переважаючим машинне навчання, частково тому, що програмісти можуть не розпізнавати відповідні критерії: використовуючи попередній алгоритм для ідентифікації, людина що сидить або нерухома, може не ініціювати точне виявлення.

За допомогою технології Deep Learning алгоритми ПЗ для відеоспостереження з відеоаналітикою отримують великий набір даних, що представляють об'єкт. Цей крок називається навчанням, коли алгоритм навчається розпізнавати тип об'єкта. Наприклад, камери відеоспостереження подають тисячі зображень людей різної статі, етнічного походження, а також зображень, знятих під різними кутами та іншого.

Алгоритм обчислює атрибути, які схожі й розрізняються, а також визначає, як зважувати релевантність цих характеристик. Після аналізу тисяч зображень алгоритм здатний розрахувати, що більшість зображень включають об'єкт трикутної форми поблизу верхньої частини зображення з двома затемненими овальними плямами біля його дна, які ми могли б розглядати як ніс на чиємусь обличчі. Так, алгоритм можливо ідентифікував масу інших таких характеристик, про які люди не задумалися б.

Навчання системи проводиться розробниками програмного забезпечення до того, як воно буде використане споживачем. Процес займає вагому кількість обчислювальної потужності; набагато більше, ніж потрібно для виявлення й класифікації об'єктів при використанні в польових умовах. Результатом вважається файл, на який посилається пристрій, щоб визначити, чи відповідає виявлений об'єкт класифікації.

Оскільки процес глибокого навчання використовує машину для визначення характеристик об'єкта, він привів до аналітики, яка здатна забезпечити детальну класифікацію. Наприклад, старі підходи можуть бути в змозі виявити людину, але відеоаналітика з Deep Learning здатна визначити, чи є людина чоловіком, жінкою або дитиною. Технологія також може бути в змозі виявити пов'язані характеристики людини, а також тип транспортного засобу або марку.

Розумні технології — дивовижні результати

Як правило, штучний інтелект в сегменті відеоспостереження навчається під час розробки та, в окремих випадках, не стає поступово «розумнішим» при використанні в польових умовах. Однак, у Deep Learning та машинного навчання передбачена така опція, якщо використовується відеоаналітика, яка може навчатися з плином часу.

IP камери відеоспостереження видають вагомі обсяги даних. Моніторинг та фільтрація такої дивовижної кількості інформації робить задачу прискореної ідентифікації інцидентів безпеки й пошуку доказів складнішою, ніж раніше. Інтелектуальні системи безпеки, що використовують Deep Learning, можуть допомогти людям швидше виявляти докази та аналізувати відео в режимі поточного часу, щоб попередити про підозрілі події, забезпечуючи дивовижні результати.