僕は発展途上技術者

音声認識でハンズフリーレストラン検索「声探」

ちょっと今までにない一風変わったサービスを作ってみました。


Skype を使って、声で HotPepper.jp のレストラン検索ができるハンズフリーな Web サービス、「声探」です。「食い探」に続く○探シリーズ第二弾。


koetan.jpg


マイクに向かって駅名を言うと、近くのレストランを検索してブラウザに表示します。


音声アプリケーションが英語版のため、ガイダンスが英語ですが、山手線の駅名を認識できるように作ってみました。


実際にどんな感じか見てもらったほうが早いので動画のデモを作りました。


「渋谷」と言えば、渋谷に近いレストランを表示します。↓


次の結果を出したり、前に戻る、再検索する、といったアクションも声だけでできます。キーボードに触る必要がない、というわけで「ハンズフリーWebサービス」。


「Next」と言えば、次の検索結果を表示します。キーボードには触っていません。↓


実用性はまだまだいまいちですが、これまでにない新感覚の実験的サービスです。


Skype ID を既に持っていれば登録なしにすぐに使えます。よろしかったら使ってみてください。


» 音声認識でハンズフリーレストラン検索 「声探」


以下もう少し詳しいマニアックな話や苦労話など。


音声アプリケーション開発環境 Voxeo


異なるサービスのAPIを組み合わせて作るマッシュアップ。登場した最初のころはなかなか新鮮でしたが、最近はちょっと食傷気味。


大抵どのサービスも Google Maps や検索エンジンのAPIと組み合わせたもので、新鮮味に欠けてしまっている感があります。(まあ、その組み合わせが一番スタンダードで便利だということなのですが)


そこで、まったく新しいコンビネーションのマッシュアップに挑戦してみようと思い立ちました。


HotPepper.jp + Skype という組み合わせに加え、緯度・経度の情報を取得するのに Google Maps の Geocoding、そして Skype で接続できる音声アプリケーションの作成には米 Skype と提携している Voxeo のサービスを利用しました。


Voxeo は VXML という開発言語を使って音声アプリケーションを作ることができる開発環境を提供しています。


今のところ英語にしか対応していないため、音声認識部分には、日本語の駅名に聞こえる英語の音の組み合わせを使う、といった一工夫が必要でした。


たとえば「渋谷」なら、


she bu ya


という音をあてることで、なんとか認識できるようになっています。


駅名によっては認識が難しいものもあります。ゆっくり言ってみるか、それでも駄目な時は、ダイアルパッドから駅に対応した番号をプッシュして入力できるように、駅名コードというものを用意したので、そちらを使ってみてください。


Voxeo が日本語に対応してくれたり、Skype が日本語に対応した音声アプリケーション開発環境を持ったパートナーと組んでくれると、もっと面白くて有用なサービスが作れそうです。


Skype さん、ぜひぜひ検討していただきたい。


リアルタイムな Web アプリケーションを実現する Comet


クリックしていないのに勝手に画面が更新される部分は、ブラウザだけでチャットができる Lingr なども使っているという Comet という技術を使っています。


これも、なかなか面白い技術だと思うのですが、利用例としてチャットくらいしかこれまで見たことがなかったので、そうじゃない変わった使い方をしてみました。


juggernaut を改良した tigerbaumkuchen (綴りが難しい)という Rails のプラグインを使ったら割とすんなり実装できました。


こういう面倒そうな部分もさくっと作れてしまう Ruby on Rails はやっぱり良い!!


プロフィール

株式会社まちクエスト代表、つくる社LLC代表。

Scratchで楽しく学ぶ アート&サイエンスRaspberry Piではじめる どきどきプログラミングを書きました。

Amazonから図書館検索 Libron、iPhoneアプリ ひらがなゲーム かなぶん を作っています。

Twitter @jishiha

最近のエントリー

アーカイブ