はじめに
今回はAIを使って自動文字起こしを試してみたいと思います。
Whisperは日本語もかなり高い精度で認識してくれるので、その辺の有料の文字起こしサービスよりも優秀です。今回は、グラボを積んでいないPCでも試せるように、Google Colabでの使い方を説明したいと思います。
また今回はプログラムも無しで、一番シンプルな方法です。
使い方
1.「ノートブックの設定」の「ハードウェア アクセラレータ」をGPUに設定してください。
2.下記を実行し、グラフィックボードが選択されていることを確認します。
!nvidia-smi
3.下記を実行し、必要なパッケージをインストールします。
!pip install git+https://github.com/openai/whisper.git
4.文字起こししたい動画や音声をGoogle Colabにアップロードします。
5.下記を実行し、必要なパッケージをインストールします。(hoge.mp3がファイル名)
!whisper hoge.mp3 --language Japanese --model base
まとめ
いかがだったでしょうか?今回は一番シンプルな方法をご紹介しました。
これを応用してPythonで色々とプログラムを組んでみるのも面白そうですよね。
また機会があれば、そんなプログラムも紹介したいと思います。
コメント