До распознования речи конечно далеко, но....
Недавно столкнулась с такой штукой, как VoiceXML - стандарт для создания голосовых приложений.
Идея проста:
Создаеться vxml файлик в котором указывается все, что должно уметь ваше голосовое приложение.Затем он помещается куда-нибудь для общего доступа, но даже при открытии странички в браузере приложение не начнет с вами разоваривать. Для этого нужно привязать vxml к телефонному номеру. Для тестировани и разработки Voxeo предлагает бесплатную службу отображения.
после чего voxeo выдаст привязанные телефонные номера. Самый простой способ удостовериться, что приложение таки работает - позвонить по скайпу и попробывать поговорить.
Пример vxml файла (взят с Voxeo.com)
<?xml version="1.0" encoding="UTF-8"?>
<vxml version="2.0" xmlns="http://www.w3.org/2001/vxml">
<form>
<field name="drink">
<prompt>
Would you like coffee, tea, milk, or nothing
</prompt>
<grammar src="drink.grxml" type="application/srgs+xml"/>
</field>
<block>
<submit next="http://www.drink.example.com/drink2.asp"/>
</block>
</form>
</vxml>
Что иллюстрирует сие
C (computer): Would you like coffee, tea, milk, or nothing?
H (human): Orange juice.
C: I did not understand what you said. (a platform-specific default message.)
C: Would you like coffee, tea, milk, or nothing?
H: Tea
C: (continues in document drink2.asp)
Вариантов где развернуться на самом деле уйма. Создаем сервлеты, которые загружают(генерируют) наши vxml файлы из бд, по времени суток...
применение - первое, что приходит- call-центры...



октября 31, 2007 в 10:34 am
Главное чтоб было понятно что это не человек отвечает
ноября 1, 2007 в 1:01 pm
а качество распознавания?
ноября 1, 2007 в 6:51 pm
на английском - отлично.
с транслитом сложнее