《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目,包括技术、学习、实用与各种有趣的内容。本期推荐的是一个文本字幕生成器AutoCut。 AutoCut 将视频中对应的片段裁切
《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目,包括技术、学习、实用与各种有趣的内容。本期推荐的是一个文本字幕生成器——AutoCut。
AutoCut 将视频中对应的片段裁切并保存,你无需使用视频编辑软件,只需要编辑文本文件即可完成剪切。
使用例子
假如你录制的视频放在 2022-11-04/ 这个文件夹里。那么运行
autocut -d 2022-11-04提示:如果你使用OBS录屏,可以在 设置->高级->录像->文件名格式 中将空格改成/,即 %CCYY-%MM-%DD/%hh-%mm-%ss。那么视频文件将放在日期命名的文件夹里。
AutoCut 将持续对这个文件夹里视频进行字幕抽取和剪切。例如,你刚完成一个视频录制,保存在 11-28-18.mp4。AutoCut 将生成 11-28-18.md。你在里面选择需要保留的句子后,AutoCut 将剪切出 11-28-18_cut.mp4,并生成 11-28-18_cut.md 来预览结果。
你可以使用任何的 Markdown 编辑器。例如我常用 VS Code 和 Typora 。下图是通过 Typora 来对 11-28-18.md 编辑。
全部完成后在 autocut.md 里选择需要拼接的视频后,AutoCut 将输出 autocut_merged.mp4 和对应的字幕文件。
安装
首先安装 Python 包
pip install git+https://github.com/mli/autocut.git上面将安装 pytorch。如果你需要GPU运行,且默认安装的版本不匹配的话,你可以先安装Pytorch。
另外需要安装 ffmpeg
# on Ubuntu or Debian sudo apt update && sudo apt install ffmpeg # on Arch Linux sudo pacman -S ffmpeg # on MacOS using Homebrew (https://brew.sh/) brew install ffmpeg # on Windows using Scoop (https://scoop.sh/) scoop install ffmpeg提示
- 讲得流利的视频的转录质量会高一些,这因为是 Whisper 训练数据分布的缘故。对一个视频,你可以先粗选一下句子,然后在剪出来的视频上再剪一次。
- 最终视频生成的字幕通常还需要做一些小编辑。你可以直接编辑 md 文件(比 srt 文件更紧凑,且嵌入了视频)。然后使用 autocut -s 22-52-00.md 22-52-00.srt 来生成更新的字幕 22-52-00_edited.srt。注意这里会无视句子是不是被选中,而是全部转换成 srt。
- 最终视频生成的字幕通常还需要做一些小编辑。但srt里面空行太多。你可以使用 autocut -s 22-52-00.srt 来生成一个紧凑些的版本 22-52-00_compact.srt 方便编辑(这个格式不合法,但编辑器,例如VS Code,还是会进行语法高亮)。编辑完成后,autocut -s 22-52-00_compact.srt 转回正常格式。
- 用 Typora 和 VS Code 编辑 markdown 都很方便。他们都有对应的快捷键 mark 一行或者多行。但 VS Code 视频预览似乎有点问题。
- 视频是通过 ffmpeg 导出。在 Apple M1 芯片上它用不了 GPU,导致导出速度不如专业视频软件。