![]() |
ノート/音声認識再訪_2017-02-20https://pepper.is.sci.toho-u.ac.jp:443/pepper/index.php?%A5%CE%A1%BC%A5%C8%2F%B2%BB%C0%BC%C7%A7%BC%B1%BA%C6%CB%AC_2017-02-20 |
![]() |
ノート/ノート
訪問者数 692 最終更新 2017-02-22 (水) 10:17:50
に従って試す。サンプルは動いた。
Audacityで音声ファイルを加工・切り出し。長さを短くし、モノラルにした。ビットレートは元と同じ44100のまま。短いサンプルは動いた。
curl -X POST --data-binary @'speech.wav' --header 'Content-Type: audio/l16; rate=44100;' 'https://www.google.com/speech-api/v2/recognize?output=json&lang=ja-JP&key=********************************' {"result":[]} {"result":[{"alternative":[{"transcript":"channelajer 小倉の皆様こんにちは","confidence":0.44419184},{"transcript":"タネ ラジオ 小倉の皆様こんにちは","confidence":0.65578681},{"transcript":"channelajer 小倉 宮さま こんにちは","confidence":0.89999998},{"transcript":"実ラジオ 小倉の皆様こんにちは","confidence":0.65546846},{"transcript":"たね ラジオ 小倉の皆様こんにちは","confidence":0.65578681}],"final":true}],"result_index":0}
本当には、「チャンネルアジアをご覧の皆様、こんにちは」である。
curl -X POST --data-binary @'speech.wav' --header 'Content-Type: audio/l16; rate=16000;' 'https://www.google.com/spee ch-api/v2/recognize?output=json&lang=ja-JP&key=AIzaSyAnXeUw-1Ttz5LsyplpgDcOf1hK6 TgLVRU' {"result":[]} {"result":[{"alternative":[{"transcript":"チャンネル情報 グランド 皆様こんにちは 今週もけんせい歯科で","confidence":0.52488989},{"transcript":"チャンネル情報 グランド 皆様 今日は今週もけんせい歯科で","confidence":0.63099253},{"transcript":"チャンネル情報 グランド 皆様こんにちは 今週も憲政史家で","confidence":0.68730837},{"transcript":"チャンネルアジア小倉の皆様こんにちは 今週もけんせい歯科で","confidence":0.63229752},{"transcript":"チャンネル情報 グランド 皆様こんにちは 今週 も 先生 歯科で","confidence":0.58615464}],"final":true}],"result_index":0}
curl -X POST --data-binary @'speech.wav' --header 'Content-Type: audio/l16; rate=16000;' 'https://www.google.com/speech-api/v2/recognize?output=json&lang=ja-JP&key=AIzaSyAnXeUw-1Ttz5LsyplpgDcOf1hK6TgLVRU' {"result":[]} {"result":[{"alternative":[{"transcript":"おととい おかしなことになりました しかし今から嘘のクライム 先生の話にはなお 現在その 脈々と続いている","confidence":0.6202212},{"transcript":"物事におかしなことになりました しかし今から嘘のクライム 先生の話にはなお 現在その 脈々と続いている","confidence":0.66391671},{"transcript":"昔のことになりました しかし今から嘘のクライム 先生の話にはなお 現在その 脈々と続いている","confidence":0.6303215},{"transcript":"もとい おかしなことになりました しかし今から嘘のクライム 先生の話にはなお 現在その 脈々と続いている","confidence":0.6202212},{"transcript":"おととい おかしなことになりました しかし今から 嘘のクライム 先生の話にはなお 現在その 脈々と続いているの","confidence":0.62502784}],"final":true}],"result_index":0}
本当は、
ほんと遠い昔のことになりましたが、しかし多分今からその倉山先生のお話には、なお現在脈々と続いている
Google Speech API をストリームで利用してみた
元は
Google Cloud Speech API Python Samples
ここで、Setupに従うと、Google Cloud SDKが欲しいというので、
https://cloud.google.com/sdk/docs/#rpm:Google Cloud SDK ドキュメントに従って、
sudo tee -a /etc/yum.repos.d/google-cloud-sdk.repo << EOM [google-cloud-sdk] name=Google Cloud SDK baseurl=https://packages.cloud.google.com/yum/repos/cloud-sdk-el7-x86_64 enabled=1 gpgcheck=1 repo_gpgcheck=1 gpgkey=https://packages.cloud.google.com/yum/doc/yum-key.gpg https://packages.cloud.google.com/yum/doc/rpm-package-key.gpg EOM
を実行。
yum install google-cloud-sdk
を実行。
gcloud init
を実行。