文字起こしの自動化。whisperの利用方法
文字起こしは動画からでも完全無料でできてしまう時代になってしまいました
https://github.com/openai/whisper
では早速、コマンドプロンプトで・・・
pip install -U openai-whisper
pip install git+https://github.com/openai/whisper.git
pip install –upgrade –no-deps –force-reinstall git+https://github.com/openai/whisper.git
pip install setuptools-rust
pip install ffmpeg-python
この時、pipでffmpeg、python-ffmpegなどはinstallしてはいけないようです。競合するらしい。ffmpeg-pythonだけにしましょう。
そしてwindowsなら、ffmpegをダウンロード
C直下にフォルダを作る
パスを通す。環境設定→path。ffmpeg.exeのある場所を指定
あとは以下のpythonを実行します。実行時間もおまけでつけています
import whisper
import ffmpeg
import datetime
import time
import atexit
audio_file = "sample.mp3"
model = whisper.load_model("large-v2")
result = model.transcribe(audio_file, verbose=True, language="ja")
# 時間計測用
start_time = time.time()
# 終了時に関数を実行する。エラーでもなんでも実行するらしい
def exit_handler():
end_time = time.time()
elapsed_time = end_time - start_time
print(f"経過時間:{elapsed_time:.2f}秒")
atexit.register(exit_handler)
# ファイル用現在の日付と時間を取得
now = datetime.datetime.now()
# ファイル名を作成
filename = now.strftime("%Y%m%d%H%M%S") + ".txt"
# ファイルを開く
with open(filename, "w") as file:
# ファイルに書き込む
file.write(result["text"])
# ファイルを閉じる
file.close()
簡単ですね
あとはこれをchatGPTに投げると、要約まで作ってくれます
凄い時代ですね
ディスカッション
コメント一覧
まだ、コメントがありません