僕は発展途上技術者

VoiceXML


amazon でこの本を購入


Voicexml: 10 Projects to Voice Enable Your Web Site (Gearhead Press Point-To-Point) を読んで、VoiceXML で遊んでいる。本の中で紹介されている http://cafe.bevocal.com/ では無料で自分の VoiceXML アプリケーションを作ることができる。日本だとVoizi Lab! といったサイトで開発できるようだ。


VoiceXML は、HTML と同じように簡単に書けるタグ形式の言語。この VoiceXML を使うと電話を入力そして出力手段とするアプリケーションを簡単に作ることができる。


例えば、Hello World と書いた HTML ファイルをサーバーに置くと、それにアクセスしたブラウザ上には Hello World が出力される。これと同等のことが VoiceXML の世界ではどうなるかというと、Hello World と書いた VoiceXML ファイルをサーバーに置き、これにアクセスするためのフリーダイアルに電話をかけると、Text to Speech と呼ばれるテキスト読み上げエンジンが 「Hello World」と読み上げてくれるのだ。それだけではない。ブラウザ上に表示されたフォームに何かを入力する、ということが VoiceXML の世界では、電話口で言った言葉を音声認識でアプリケーションの入力として認識する、ということに置き換わる。つまり電話がブラウザの代わりとなるのだ。


これってすごい!!例えば、電話口で発声した英単語を認識し、これを入力として、辞書サイトを検索、結果を読み上げるというような電話辞書アプリケーションがいとも簡単に作れるじゃないか、と一人興奮していた。けれども、Google で VoiceXML をキーワードにして日本語のページを検索しても、blog サイトや情報サイトが思ったほどヒットせず、世の中の反応はいまいちのよう。なんでだろう?日本の携帯電話にはインターネット接続機能があたりまえのように付いているから、英単語を調べるという作業は、何も音声認識にしなくても、直接辞書サイトに行って検索するという使い方で充分可能だからなのだろうか。



プロフィール

株式会社まちクエスト代表、つくる社LLC代表。

Scratchで楽しく学ぶ アート&サイエンスRaspberry Piではじめる どきどきプログラミングを書きました。

オンラインコンテンツ: 大人のためのScratch

Amazonから図書館検索 Libron、iPhoneアプリ ひらがなゲーム かなぶん を作っています。

Email: webmaster at champierre dot com

Twitter @jishiha

最近のエントリー

アーカイブ