Нова доповідь, опублікована дослідницькою компанією Companies and Markets, прогнозує, що світовий ринок технологій розпізнавання голосу стане більш диверсифікованим і продемонструє значне зростання, завдяки поліпшенню точності функціонування програмного забезпечення.

У доповіді під назвою "Міжнародний ринок систем розпізнавання голосу: новий погляд" йдеться про те, що, за прогнозами, цей ринок досягне значення 133 мільярдів доларів до 2017 року, завдяки тому, що такі технологічні гіганти як Google, Facebook, Apple і Microsoft продовжують інвестувати в програмне забезпечення розпізнавання голосу.

Наприклад, компанія Facebook нещодавно придбала програмне забезпечення Wit.ai, яке дозволяє розробникам створювати API для створення інтерфейсів, які активізуються за допомогою голосу.

Крім того, такі компанії, як Nuance Communications, Microsoft Corp. і ValidSoft Ltd, поряд з Agnitio, Advanced Voice Recognition Systems, Auraya Systems, LumenVox, Raytheon BBN Technologies, Voice Biometrics Group, Voice Trust і Voxeo - були визнані в якості міжнародних лідерів в сфері розробки і виробництва систем розпізнавання голосу.

У доповіді підкреслюється, що на сьогоднішній день головне завдання світового ринку розпізнавання голосу - подолання неточності в системах розпізнавання мови.

Аналітики пояснюють, що для того, щоб працювати в системах контролю доступу, програми розпізнавання голосу повинні бути високочутливі до звуків. Беручи це до уваги, можна стверджувати, що при використанні в галасливому повсякденному середовищі величезний вплив має точність технології розпізнавання мови.

Експерти ринку вважають, що складові рішень розпізнавання мови - технології аналізу звуку і візуального аналізу - повинні бути повністю об'єднані для того, щоб підвищити точність системи розпізнавання мови в майбутньому, йдеться в доповіді.

У доповіді також підкреслюється робота, що проводиться дослідниками щодо технології читання по губах, такими як йорданець Ахмад Хассанат або Ясухіро Оікава з університету Васеда в Японії, які займаються розробкою методів моніторингу руху горла говорить для того, щоб точно інтерпретувати мову.

Розвиток цих видів візуальних технологій дозволить підвищити точність системи контролю доступу з технологією розпізнавання мови шляхом диференціації схожих за звучанням слів і скорочення збоїв, викликаних зовнішнім шумом, йдеться в доповіді.

Джерело www.biometricupdate.com. Переклад новини виконала адміністратор сайту Олена Пономаренко.