内嵌字幕视频（硬字幕）提取转外挂字幕软件VideOCR

菜鸟999 发表于 2025-11-29 19:34:32

有谁知道这个软件，菜鸟式软件，挺好用的，vcd那种低分辨率模糊不清的字幕也能提取。

默认参数可能会丢失视频中连接比较紧的和只有1个字的字幕，我试了一下，把跳帧数设置成0，把ssim参数设置成95以上就可以了。
还可以同时提取视频中两个任意区域字幕合并成一个。
https://github.com/timminator/VideOCR/releases

FansCooler 发表于 2025-11-29 21:35:38

之前折腾着用过vse，不过提取出来质量很差，错误率高，后面就没再接触这类工具了

菜鸟999 发表于 2025-11-29 22:08:38

本帖最后由菜鸟999 于 2025-11-29 22:14 编辑

FansCooler 发表于 2025-11-29 21:35
之前折腾着用过vse，不过提取出来质量很差，错误率高，后面就没再接触这类工具了
...

这个质量还可以，ocr引擎使用的是百度的PaddleOCR最新版。

这个PaddleOCR我下载百度官方版识别图文文本质量不是太好，有不少错字。
反而这个VideOCR自带的ocr引擎识别图片字幕反而很不错，哪怕VCD这种字幕比较模糊的视频提取出来的错字也不多，就是这种模糊字幕视频提出来有几个地方出现重复
还可以提取视频中任意的一个时间段的字幕，时间轴和视频相同。

rgnnzswwjrnhhh 发表于 2025-11-30 00:30:13

vse、videocr用的都是paddleocr，但是前者是v3，版本很老了，所以识别的错误率不理想。
paddleocr从v4还是v5开始，识别的错误率下降了一些。

nyaru 发表于 2025-11-30 01:14:12

本帖最后由 nyaru 于 2025-11-30 02:17 编辑

已编辑。。

op200 发表于 2025-11-30 01:30:45

nyaru 发表于 2025-11-30 01:14
PaddleOCR V5要比4和3好多了，看到v3感觉可以直接无视，或者去提要求可以切换版本 ...

PaddleOCR 最新的 release 才 v3.3.2 ，哪来的 4 和 5 ¿

nyaru 发表于 2025-11-30 02:16:33

op200 发表于 2025-11-30 01:30
PaddleOCR 最新的 release 才 v3.3.2 ，哪来的 4 和 5 ¿

说错了。看了下包含了v3和v5模型

晃晃无事 发表于 2025-12-1 14:27:51

简单地用了几次，用了最新模型准确率倒没啥大问题，支持双区域字幕提取确实是个亮点，不然一个字幕提取两遍确实效率就降低了。但是显卡占用率没提上去，我这边一直低于50%的占用，也不支持批量字幕提取。

菜鸟999 发表于 2025-12-9 17:14:59

晃晃无事发表于 2025-12-1 14:27
简单地用了几次，用了最新模型准确率倒没啥大问题，支持双区域字幕提取确实是个亮点，不然一个字幕提取两遍 ...

你去跟做这个软件的作者提提建议，我不会外文不然就我就去提了

页: [1]

苏伯泰特论坛（2026.04.01）'s Archiver

内嵌字幕视频（硬字幕）提取转外挂字幕软件VideOCR