内嵌字幕视频(硬字幕)提取转外挂字幕软件VideOCR
有谁知道这个软件,菜鸟式软件,挺好用的,vcd那种低分辨率模糊不清的字幕也能提取。默认参数可能会丢失视频中连接比较紧的和只有1个字的字幕,我试了一下,把跳帧数设置成0,把ssim参数设置成95以上就可以了。
还可以同时提取视频中两个任意区域字幕合并成一个。
https://github.com/timminator/VideOCR/releases
之前折腾着用过vse,不过提取出来质量很差,错误率高,后面就没再接触这类工具了
本帖最后由 菜鸟999 于 2025-11-29 22:14 编辑
FansCooler 发表于 2025-11-29 21:35
之前折腾着用过vse,不过提取出来质量很差,错误率高,后面就没再接触这类工具了
...
这个质量还可以,ocr引擎使用的是百度的PaddleOCR最新版。
这个PaddleOCR我下载百度官方版识别图文文本质量不是太好,有不少错字。
反而这个VideOCR自带的ocr引擎识别图片字幕反而很不错,哪怕VCD这种字幕比较模糊的视频提取出来的错字也不多,就是这种模糊字幕视频提出来有几个地方出现重复
还可以提取视频中任意的一个时间段的字幕,时间轴和视频相同。 vse、videocr用的都是paddleocr,但是前者是v3,版本很老了,所以识别的错误率不理想。
paddleocr从v4还是v5开始,识别的错误率下降了一些。 本帖最后由 nyaru 于 2025-11-30 02:17 编辑
已编辑。。 nyaru 发表于 2025-11-30 01:14
PaddleOCR V5要比4和3好多了,看到v3感觉可以直接无视,或者去提要求可以切换版本 ...
PaddleOCR 最新的 release 才 v3.3.2 ,哪来的 4 和 5 ¿
op200 发表于 2025-11-30 01:30
PaddleOCR 最新的 release 才 v3.3.2 ,哪来的 4 和 5 ¿
说错了。看了下包含了v3和v5模型
简单地用了几次,用了最新模型准确率倒没啥大问题,支持双区域字幕提取确实是个亮点,不然一个字幕提取两遍确实效率就降低了。但是显卡占用率没提上去,我这边一直低于50%的占用,也不支持批量字幕提取。 晃晃无事 发表于 2025-12-1 14:27
简单地用了几次,用了最新模型准确率倒没啥大问题,支持双区域字幕提取确实是个亮点,不然一个字幕提取两遍 ...
你去跟做这个软件的作者提提建议,我不会外文不然就我就去提了
页:
[1]