【字幕提取工具】望言OCR，作者来发个介绍帖，也欢迎反馈使用建议

nhjydywd 发表于 2025-12-23 15:03:51

大家好，我是硬字幕提取工具《望言OCR》的作者。

这个工具主要用来提取视频里的硬字幕，做字幕相关工作，或者喜欢抄字幕的朋友应该会用得上。

主要功能：从视频画面中提取烧录的硬字幕，输出成 SRT / ASS / TXT；支持 PGS/SUP、IDX/SUB 等图形字幕识别；100+ 语言支持，中日韩英都可以。

速度方面，用 M 系列 Mac 或 N 卡的话会比较快，45分钟的视频大概1-2分钟能跑完。普通电脑会慢一些，但也比手扒快很多。

支持批量处理，可以把整季视频拖进去挂机跑，适合一次处理一季的情况。

中文识别准确率还可以，大部分情况不需要太多手动修改。软件里有内置编辑器，可以边看视频边改字幕，改完直接导出。

下载地址：
Windows：https://pan.baidu.com/s/1muf9eM9BtGFKKtMCQpZ6WQ?pwd=w2ei
Mac：https://apps.apple.com/cn/app/id6738074717
官网：https://www.subocr.cn
文档：https://www.subocr.cn/doc
新用户有 7 天免费体验，可以先试试效果。

工具还在持续更新中，如果使用中遇到问题或者有功能建议，欢迎在帖子里回复，我会尽量改进。谢谢大家。

温馨提示：提取的字幕仅供个人学习/工作使用，请勿用于可能侵犯他人权益的行为。

newyorker 发表于 2025-12-23 22:21:24

日文呢，对中日双语字幕的效果怎么样？

菜鸟999 发表于 2025-12-24 02:47:15

本帖最后由菜鸟999 于 2025-12-24 02:52 编辑

收费的？
那还是用开源免费的VideOCR吧，集成PaddleOCR 3.2，PaddleOCR 3.2支持什么语音VideOCR就支持提取什么语言

nyaru 发表于 2025-12-24 06:33:21

吃相难看

shinichi2050 发表于 2025-12-24 16:08:27

本帖最后由 shinichi2050 于 2025-12-24 16:10 编辑

免费的一点都不好用，收费的还不如用开源的软件。

IcyW1zard 发表于 2025-12-25 01:08:55

   用了一下，批量操作比较方便，优点是快，但我设置成50帧每秒大概也要四五分钟一集。望言v2在不少场景下被PaddleOCR吊打，，我用的高达00第一季做的测试，OP ED的识别可以用惨不忍睹来形容，一句话只能识别一个字或半个字是很常见的。好在也有PaddleOCR的选项给我一句一句去纠正。。同屏识别上下两句时，时轴非常差，不如VideOCR。
   不过总的来讲能提高初步识别的效率。
   双语识别有点灾难了，用高达ZZ做的测试，两个框选范围标的很死了，但每一句话都能多上下两个空白行变成四行，加一些杂七杂八部首偏旁，修正搞得我恼火。。
   我是觉得想法不错但简单的字幕你能做开源也能做，复杂的字幕你自己的模型还不如开源的模型，目前想做一个收费软件还不太撑得住。。

waecy 发表于 2025-12-27 00:16:11

建议免费版的加上检测空格功能,最实用就这个

waecy 发表于 2025-12-27 00:18:14

菜鸟999 发表于 2025-12-24 02:47
收费的？
那还是用开源免费的VideOCR吧，集成PaddleOCR 3.2，PaddleOCR 3.2支持什么语音VideOCR就支持提取 ...

已亲测, VideOCR若能提高速度就好了,目前是根据CPU一张张生图,几十分钟生成字幕,且不支持检测空格,会连在一起, 部分时轴生成还不如楼主发那个免费版,虽然也不支持检测空格,但时轴基本生成挺准

菜鸟999 发表于 2025-12-27 00:40:37

本帖最后由菜鸟999 于 2025-12-27 00:43 编辑

waecy 发表于 2025-12-27 00:18
已亲测, VideOCR若能提高速度就好了,目前是根据CPU一张张生图,几十分钟生成字幕,且不支持检测空格,会连在 ...
使用gpu版本吧，cpu版本实在有点慢，可以勾选高精度试试。

搜了下望言免费版本很久前从1.3版本后就已经停更了，以后可能都是收费的

waecy 发表于 2025-12-27 01:46:28

菜鸟999 发表于 2025-12-27 00:40
使用gpu版本吧，cpu版本实在有点慢，可以勾选高精度试试。

这倒提醒我了,先前用「videocr-cli-GPU-v1.3.2-CUDA-11.8」是选高精度生成挺慢的
下载最新「videocr-cli-GPU-v1.3.2-CUDA-12.9」试试

PS: 啥时候能用AI模型可以一键识别内嵌字幕.生成SRT就好了如同whisper模型,把视频音频转字幕

页: [1] 2

苏伯泰特论坛（2026.04.01）'s Archiver

【字幕提取工具】望言OCR，作者来发个介绍帖，也欢迎反馈使用建议