2013年9月19日木曜日

Ruby + google音声認識APIによるRaspberryPIでの音声認識

「googleの日本語音声認識を自由に呼び出して使う方法」を参考にRubyからgoogle音声認識APIを叩いてみた。

まず事前準備として

RaspberryPIにUSBマイクで音声入力を参考に、録音
$ arecord -D plughw:1,0 -d 10 -f cd test.wav
ffmpegパッケージでtest.wavをtest.flacに変換
$ ffmpeg -i test.wav -vn -ac 1 -ar 16000 -acodec flac test.flac
あとは以下のスクリプトを実行。

----
----

実行結果
$ ruby gvoicerecog.rb
#<Net::HTTPOK 200 OK readbody=true>
{"status":0,"id":"1b69aa31b6bfac4059d6409566f4950e-1","hypotheses":[{"utterance":"あいうえお","confidence":0.5210862},{"utterance":"あ い う え お"},{"utterance":"アイウエオ"},{"utterance":"あいうえお aa"},{"utterance":"あいうえお うー"}]}

juliusと違ってかなりの認識精度

それにRaspberryPIの負荷もほとんどない・・・

便利すぎる。

ただ家電コントローラ的にはリモコン操作に慣れてしまったのでもはや使い所がない。
うーむ。ちょっと利用方法を考える。

  • 人口無脳的チャット
  • 自由記述による検索
  • 天気予報とかwikipediaとか(出力が音声だと使いにくくない?)
ぬぬー。求むアイディア。

0 件のコメント:

amazonアソシエイト