Google ColabでWhisperを試してみよう

IT

はじめに

今回はAIを使って自動文字起こしを試してみたいと思います。
Whisperは日本語もかなり高い精度で認識してくれるので、その辺の有料の文字起こしサービスよりも優秀です。今回は、グラボを積んでいないPCでも試せるように、Google Colabでの使い方を説明したいと思います。
また今回はプログラムも無しで、一番シンプルな方法です。

使い方

1.「ノートブックの設定」の「ハードウェア アクセラレータ」をGPUに設定してください。

2.下記を実行し、グラフィックボードが選択されていることを確認します。

!nvidia-smi

3.下記を実行し、必要なパッケージをインストールします。

!pip install git+https://github.com/openai/whisper.git

4.文字起こししたい動画や音声をGoogle Colabにアップロードします。

5.下記を実行し、必要なパッケージをインストールします。(hoge.mp3がファイル名)

!whisper hoge.mp3 --language Japanese --model base

まとめ

いかがだったでしょうか?今回は一番シンプルな方法をご紹介しました。
これを応用してPythonで色々とプログラムを組んでみるのも面白そうですよね。
また機会があれば、そんなプログラムも紹介したいと思います。

コメント

タイトルとURLをコピーしました