通过Autosub为音频视频自动生成字幕文件
Autosub是一个字幕自动生成工具。它能使用Auditok来自动检测语音区域,通过ffmpeg根据语音区域来切割音频,通过多个API将语音转为文字,以及通过py-googletrans将字幕文本翻译。
autosub
autosub 原本使用 python 2.X 开发,仅支持 linux 和 macos 系统,现已停止维护
其原理是对音视频文件进行语音活动检测以查找说话的区域,然后并行调用 Google Web Speech API 进行转录,(可选)翻译成目标语言,并将结果存储下来。
autosub3
基于 autosub,升级到 python 3.X 版本,并添加了对 windows 系统的支持。
源码库:Github
安装
依赖 ffmpeg 进行音频提取,需要自己手动安装,并添加到系统环境变量中。
autosub3 的安装非常简单,执行以下命令即可:
pip3 install autosub3 |
注意
由于要调用 google speech 的 API,请自行翻墙。
使用
autosub abc.mp4 |
即可在 abc.mp4 同目录下生成 abc.srt 的字幕文件。
指定语言为中文:
autosub -S zh-CN -D zh-CN videoplayback.mp4 |
查看参数说明:
autosub --help |
使用说明
请参见Github autosub库的
使用说明
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 叶落花开的博客!
评论