VOSK
voskとかいう音声認識をする仕掛けがあるそうな.そして更新したそうな.
更新結果,現在のところRPiの64ビットOSには pip install 出来なかった.
インストールはwhlから行い,モデルはなければダウンロードされる形になった.
curl https://github.com/alphacep/vosk-api/releases/download/v0.3.42/vosk-0.3.42-py3-none-linux_aarch64.whl
sudo pip install vosk-0.3.42-py3-none-linux_aarch64.whl
sudo pip install sounddevice
sudo pip install libportaudio2
インストールは
pip install vosk
モデルは
にあり,マイクを使った例があり,好ましいコード.
test_microphone.py
sounddeviceからキューに送られたデータを,53行目のmodel = vosk.Model(lang="en-us")のen-usをjaにすると自動で日本語モデルがダウンロードされる.-mオプションで指定したモデルを使って解釈し,79行目の rec.Result() で一塊の日本語を返し続ける.
wget https://github.com/alphacep/vosk-api/raw/master/python/example/test_microphone.py
sed -i -e 's/en-us/ja/' test_microphone.py
cmdlist={.keyword1.func1, 'keyword2':func2,...}のようにキーワードをリスト化しておいてrec.Result()中にキーワードがあるかチェックしてあればcmdlist['keyword1']()のようにして処理する関数を仕込んでみた.キーワードがない場合はopen-jtalkでそのままおうむ返しにし,"停止"というキーワードがある場合は「停止します」と言って処理を停止させた.
夕刻追記:windowsではうまく動かなかった.サンプルコードは11時間前に新しいのに書き換わってる.さすが新しくて人気のコード.
0コメント