ノート/ノート
訪問者数 151      最終更新 2017-02-22 (水) 10:17:50

Google設定

プログラム例

Google Speech APIを使えるようになるまで

に従って試す。サンプルは動いた。

Audacityで音声ファイルを加工・切り出し。長さを短くし、モノラルにした。ビットレートは元と同じ44100のまま。短いサンプルは動いた。

curl -X POST --data-binary @'speech.wav' --header 'Content-Type: audio/l16; rate=44100;' 'https://www.google.com/speech-api/v2/recognize?output=json&lang=ja-JP&key=********************************' {"result":[]} {"result":[{"alternative":[{"transcript":"channelajer 小倉の皆様こんにちは","confidence":0.44419184},{"transcript":"タネ ラジオ 小倉の皆様こんにちは","confidence":0.65578681},{"transcript":"channelajer 小倉 宮さま こんにちは","confidence":0.89999998},{"transcript":"実ラジオ 小倉の皆様こんにちは","confidence":0.65546846},{"transcript":"たね ラジオ 小倉の皆様こんにちは","confidence":0.65578681}],"final":true}],"result_index":0}

本当には、「チャンネルアジアをご覧の皆様、こんにちは」である。

curl -X POST --data-binary @'speech.wav' --header 'Content-Type: audio/l16; rate=16000;' 'https://www.google.com/spee ch-api/v2/recognize?output=json&lang=ja-JP&key=AIzaSyAnXeUw-1Ttz5LsyplpgDcOf1hK6 TgLVRU' {"result":[]} {"result":[{"alternative":[{"transcript":"チャンネル情報 グランド 皆様こんにちは 今週もけんせい歯科で","confidence":0.52488989},{"transcript":"チャンネル情報 グランド 皆様 今日は今週もけんせい歯科で","confidence":0.63099253},{"transcript":"チャンネル情報 グランド 皆様こんにちは 今週も憲政史家で","confidence":0.68730837},{"transcript":"チャンネルアジア小倉の皆様こんにちは 今週もけんせい歯科で","confidence":0.63229752},{"transcript":"チャンネル情報 グランド 皆様こんにちは 今週 も 先生 歯科で","confidence":0.58615464}],"final":true}],"result_index":0}

curl -X POST --data-binary @'speech.wav' --header 'Content-Type: audio/l16; rate=16000;' 'https://www.google.com/speech-api/v2/recognize?output=json&lang=ja-JP&key=AIzaSyAnXeUw-1Ttz5LsyplpgDcOf1hK6TgLVRU' {"result":[]} {"result":[{"alternative":[{"transcript":"おととい おかしなことになりました しかし今から嘘のクライム 先生の話にはなお 現在その 脈々と続いている","confidence":0.6202212},{"transcript":"物事におかしなことになりました しかし今から嘘のクライム 先生の話にはなお 現在その 脈々と続いている","confidence":0.66391671},{"transcript":"昔のことになりました しかし今から嘘のクライム 先生の話にはなお 現在その 脈々と続いている","confidence":0.6303215},{"transcript":"もとい おかしなことになりました しかし今から嘘のクライム 先生の話にはなお 現在その 脈々と続いている","confidence":0.6202212},{"transcript":"おととい おかしなことになりました しかし今から 嘘のクライム 先生の話にはなお 現在その 脈々と続いているの","confidence":0.62502784}],"final":true}],"result_index":0}

本当は、

ほんと遠い昔のことになりましたが、しかし多分今からその倉山先生のお話には、なお現在脈々と続いている

Stream

Google Speech API をストリームで利用してみた

元は

Google Cloud Speech API Python Samples

ここで、Setupに従うと、Google Cloud SDKが欲しいというので、

https://cloud.google.com/sdk/docs/#rpm:Google Cloud SDK ドキュメントに従って、

sudo tee -a /etc/yum.repos.d/google-cloud-sdk.repo << EOM
[google-cloud-sdk]
name=Google Cloud SDK
baseurl=https://packages.cloud.google.com/yum/repos/cloud-sdk-el7-x86_64
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://packages.cloud.google.com/yum/doc/yum-key.gpg
       https://packages.cloud.google.com/yum/doc/rpm-package-key.gpg
EOM

を実行。

yum install google-cloud-sdk

を実行。

gcloud init

を実行。


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2017-02-22 (水) 10:17:50 (214d)