文字起こしの自動化。whisperの利用方法

文字起こしは動画からでも完全無料でできてしまう時代になってしまいました

https://github.com/openai/whisper

では早速、コマンドプロンプトで・・・

pip install -U openai-whisper
pip install git+https://github.com/openai/whisper.git
pip install –upgrade –no-deps –force-reinstall git+https://github.com/openai/whisper.git
pip install setuptools-rust
pip install ffmpeg-python

この時、pipでffmpeg、python-ffmpegなどはinstallしてはいけないようです。競合するらしい。ffmpeg-pythonだけにしましょう。

そしてwindowsなら、ffmpegをダウンロード

C直下にフォルダを作る

パスを通す。環境設定→path。ffmpeg.exeのある場所を指定

あとは以下のpythonを実行します。実行時間もおまけでつけています

import whisper
import ffmpeg
import datetime
import time
import atexit

audio_file = "sample.mp3"
model = whisper.load_model("large-v2")
result = model.transcribe(audio_file, verbose=True, language="ja")

# 時間計測用
start_time = time.time()

# 終了時に関数を実行する。エラーでもなんでも実行するらしい
def exit_handler():
    end_time = time.time()
    elapsed_time = end_time - start_time
    print(f"経過時間:{elapsed_time:.2f}秒")

atexit.register(exit_handler)

# ファイル用現在の日付と時間を取得
now = datetime.datetime.now()

# ファイル名を作成
filename = now.strftime("%Y%m%d%H%M%S") + ".txt"

# ファイルを開く
with open(filename, "w") as file:
    # ファイルに書き込む
    file.write(result["text"])

# ファイルを閉じる
file.close()

簡単ですね

あとはこれをchatGPTに投げると、要約まで作ってくれます

凄い時代ですね

未分類

Posted by admin8admin