한국   대만   중국   일본 
Релиз свободной системы распознавания речи Simon 0.4 ? Викиновости Перейти к содержанию

Релиз свободной системы распознавания речи Simon 0.4

Материал из Викиновостей, свободного источника новостей

31 декабря 2012 года

После двух лет разработки представлен релиз системы распознавания речи Simon 0.4 , позволяющей организовать управление десктопом при помощи голосовых команд без необходимости использования клавиатуры и мыши. Средства для голосового управления рабочим столом доступы для Windows и окружений на базе X11. Код системы распространяется под лицензией GPLv2. Разработка Simon ведётся в рамках проекта KDE в составе рабочей группы KDE Accessibility.

В составе проекта развиваются инструменты для создания голосовых и акустических моделей, распознавания речи и организации управления голосом. Кроме функций управления рабочим столом наработки проекта Simon также используются в таких областях как аутентификация по голосу, голосовые диалоговые системы, организация голосового управления роботами и различными аппаратными устройствами. Ключевой областью применения Simon является предоставление средств для работы с компьютером людей с ограниченными возможностями. Из интересных проектов, реализованных на базе Simon можно отметить робота ECHORD для помощи по дому и медиа-центр для дома престарелых.

Процесс распознавания в Simon построен на статических алгоритмах - для начала поддержки нового языка достаточно сформировать акустическую и языковую модели, которые в совокупности составляют речевую модель. Если речевая модель уже создана, для начала распознавания команд достаточно пятиминутной тренировки для адаптации системы к особенностям речи конкретного пользователя. Simon может быть легко адаптирован для голосового управления любым приложением, в том числе для организации голосового ввода текста, что, например, позволяет обездвиженным людям с ограниченными возможностями просматривать сайты и отправлять электронные сообщения.

Ключевые особенности новой версии:

  • Проведена большая работа по улучшению юзабилити. Интерфейс стал более удобен и понятен, как для новичков, так и для давно знакомых с системой пользователей. Проведена реорганизация основного окна управления Simon, наиболее важные опции вынесены на основной базовый экран;
  • Поддержка нового формата (.sbm) для хранения базовых голосовых моделей и средства для интеграции с online-репозиториями базовых моделей GHNS существенно упростили начальную конфигурацию системы голосового управления. Для настройки Simon от установки до получения полностью работающей конфигурации теперь требуется менее пяти минут без проведения каких-либо предварительных действий;
  • Обеспечение поддержки CMU SPHINX в качестве бэкенда для распознавания речи. Поддержка ранее доступных бэкендов для систем HTK и Julius продолжена в полном объёме, тем не менее новые скомпилированные для Simon модели по умолчанию рассчитаны на использование бэкенда SPHINX. Для сборки собственных речевых моделей больше нет необходимости в установке проприетарного пакета HTK. Необходимый для работы Simon бэкенд выбирается автоматически в зависимости от конфигурации текущей системы;
  • Ключевой проблемой открытых систем распознавания речи всегда было отсутствие свободнодоступных высококачественных речевых моделей. Основным источником свободных акустических моделей для различных языков уже много лет является проект Voxforge , но качество этих моделей оставляет желать лучшего. Поэтому, кроме возможности работы с уже готовой моделью от проекта Voxforge, в версии Simon 0.4 добавлены средства для участия в улучшении акустических моделей Voxforge. В частности, Simon позволяет отправлять на сервер Voxforge результаты локальной тренировки голосовых моделей.
  • Средства для учёта контекста в процессе распознавания речевых команд. В зависимости от изменения текущей ситуации для увеличения точности Simon может на лету переконфигурировать себя, включать и выключать дополнительные сценарии, микрофоны и данные, полученные в результате тренировки модели;
  • Новая диалоговая система, позволяющая определять сценарии взаимодействия на языке JavaScript, интегрируемая с движками обработки данных Plasma, поддерживающая задание шаблонов и предоставляющая возможности по озвучиванию текста (text-to-speech);
  • Для пользователей KDE представлен новый плазмоид "Simonoid" для запуска и управления Simon.

Источники [ править ]

Creative Commons
Creative Commons
Эта статья содержит материалы из статьи ≪ Релиз свободной системы распознавания речи Simon 0.4 ≫, опубликованной OpenNET и распространяющейся на условиях лицензии Creative Commons  Attribution (CC BY) ? указание автора, источник и лицензию .
Эта статья загружена автоматически ботом NewsBots в архив и ещё не проверялась редакторами Викиновостей .
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии [ править ]

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.