2022.05.25 00:00

VOSK

voskとかいう音声認識をする仕掛けがあるそうな．そして更新したそうな．

更新結果，現在のところRPiの64ビットOSには pip install 出来なかった．

vosk

Offline open source speech recognition API based on Kaldi and Vosk

PyPI

インストールはwhlから行い，モデルはなければダウンロードされる形になった．

curl https://github.com/alphacep/vosk-api/releases/download/v0.3.42/vosk-0.3.42-py3-none-linux_aarch64.whl

sudo pip install vosk-0.3.42-py3-none-linux_aarch64.whl

sudo pip install sounddevice

sudo pip install libportaudio2

~~インストールは~~

~~pip install vosk~~

~~モデルは~~

VOSK Models

Accurate speech recognition for Android, iOS, Raspberry Pi and servers with Python, Java, C#, Swift and Node.

VOSK Offline Speech Recognition API

~~から日本語を持ってくる．~~

サンプルコードは

GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and server

Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node - GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi ...

GitHub

にあり，マイクを使った例があり，好ましいコード．

test_microphone.py

sounddeviceからキューに送られたデータを，53行目のmodel = vosk.Model(lang="en-us")のen-usをjaにすると自動で日本語モデルがダウンロードされる．~~-mオプションで指定したモデルを使って解釈し，~~79行目の rec.Result() で一塊の日本語を返し続ける．

wget https://github.com/alphacep/vosk-api/raw/master/python/example/test_microphone.py

sed -i -e 's/en-us/ja/' test_microphone.py

cmdlist={.keyword1.func1, 'keyword2':func2,...}のようにキーワードをリスト化しておいてrec.Result()中にキーワードがあるかチェックしてあればcmdlist['keyword1']()のようにして処理する関数を仕込んでみた．キーワードがない場合はopen-jtalkでそのままおうむ返しにし，"停止"というキーワードがある場合は「停止します」と言って処理を停止させた．

夕刻追記：windowsではうまく動かなかった．サンプルコードは11時間前に新しいのに書き換わってる．さすが新しくて人気のコード．

N.Ish's.

Exam.,Memo,Dist.

0コメント

1000 / 1000