VOSK

voskとかいう音声認識をする仕掛けがあるそうな.そして更新したそうな.

更新結果,現在のところRPiの64ビットOSには pip install 出来なかった.



インストールはwhlから行い,モデルはなければダウンロードされる形になった.

curl https://github.com/alphacep/vosk-api/releases/download/v0.3.42/vosk-0.3.42-py3-none-linux_aarch64.whl

sudo pip install vosk-0.3.42-py3-none-linux_aarch64.whl

sudo pip install sounddevice

sudo pip install libportaudio2


インストールは

pip install vosk

モデルは

から日本語を持ってくる.


サンプルコードは

にあり,マイクを使った例があり,好ましいコード.

test_microphone.py

sounddeviceからキューに送られたデータを,53行目のmodel = vosk.Model(lang="en-us")のen-usをjaにすると自動で日本語モデルがダウンロードされる.-mオプションで指定したモデルを使って解釈し,79行目の rec.Result() で一塊の日本語を返し続ける.

wget https://github.com/alphacep/vosk-api/raw/master/python/example/test_microphone.py

sed -i -e 's/en-us/ja/' test_microphone.py


cmdlist={.keyword1.func1, 'keyword2':func2,...}のようにキーワードをリスト化しておいてrec.Result()中にキーワードがあるかチェックしてあればcmdlist['keyword1']()のようにして処理する関数を仕込んでみた.キーワードがない場合はopen-jtalkでそのままおうむ返しにし,"停止"というキーワードがある場合は「停止します」と言って処理を停止させた.

夕刻追記:windowsではうまく動かなかった.サンプルコードは11時間前に新しいのに書き換わってる.さすが新しくて人気のコード.

0コメント

  • 1000 / 1000