【字幕提取工具】望言OCR,作者来发个介绍帖,也欢迎反馈使用建议
大家好,我是硬字幕提取工具《望言OCR》的作者。这个工具主要用来提取视频里的硬字幕,做字幕相关工作,或者喜欢抄字幕的朋友应该会用得上。
主要功能:从视频画面中提取烧录的硬字幕,输出成 SRT / ASS / TXT;支持 PGS/SUP、IDX/SUB 等图形字幕识别;100+ 语言支持,中日韩英都可以。
速度方面,用 M 系列 Mac 或 N 卡的话会比较快,45分钟的视频大概1-2分钟能跑完。普通电脑会慢一些,但也比手扒快很多。
支持批量处理,可以把整季视频拖进去挂机跑,适合一次处理一季的情况。
中文识别准确率还可以,大部分情况不需要太多手动修改。软件里有内置编辑器,可以边看视频边改字幕,改完直接导出。
下载地址:
Windows:https://pan.baidu.com/s/1muf9eM9BtGFKKtMCQpZ6WQ?pwd=w2ei
Mac:https://apps.apple.com/cn/app/id6738074717
官网:https://www.subocr.cn
文档:https://www.subocr.cn/doc
新用户有 7 天免费体验,可以先试试效果。
工具还在持续更新中,如果使用中遇到问题或者有功能建议,欢迎在帖子里回复,我会尽量改进。谢谢大家。
温馨提示:提取的字幕仅供个人学习/工作使用,请勿用于可能侵犯他人权益的行为。
日文呢,对中日双语字幕的效果怎么样? 本帖最后由 菜鸟999 于 2025-12-24 02:52 编辑
收费的?
那还是用开源免费的VideOCR吧,集成PaddleOCR 3.2,PaddleOCR 3.2支持什么语音VideOCR就支持提取什么语言 吃相难看 本帖最后由 shinichi2050 于 2025-12-24 16:10 编辑
免费的一点都不好用,收费的还不如用开源的软件。 用了一下,批量操作比较方便,优点是快,但我设置成50帧每秒大概也要四五分钟一集。望言v2在不少场景下被PaddleOCR吊打,,我用的高达00第一季做的测试,OP ED的识别可以用惨不忍睹来形容,一句话只能识别一个字或半个字是很常见的。好在也有PaddleOCR的选项给我一句一句去纠正。。同屏识别上下两句时,时轴非常差,不如VideOCR。
不过总的来讲能提高初步识别的效率。
双语识别有点灾难了,用高达ZZ做的测试,两个框选范围标的很死了,但每一句话都能多上下两个空白行变成四行,加一些杂七杂八部首偏旁,修正搞得我恼火。。
我是觉得想法不错但简单的字幕你能做开源也能做,复杂的字幕你自己的模型还不如开源的模型,目前想做一个收费软件还不太撑得住。。
建议免费版的加上检测空格功能,最实用就这个 菜鸟999 发表于 2025-12-24 02:47
收费的?
那还是用开源免费的VideOCR吧,集成PaddleOCR 3.2,PaddleOCR 3.2支持什么语音VideOCR就支持提取 ...
已亲测, VideOCR若能提高速度就好了,目前是根据CPU一张张生图,几十分钟生成字幕,且不支持检测空格,会连在一起, 部分时轴生成还不如楼主发那个免费版,虽然也不支持检测空格,但时轴基本生成挺准
本帖最后由 菜鸟999 于 2025-12-27 00:43 编辑
waecy 发表于 2025-12-27 00:18
已亲测, VideOCR若能提高速度就好了,目前是根据CPU一张张生图,几十分钟生成字幕,且不支持检测空格,会连在 ...
使用gpu版本吧,cpu版本实在有点慢,可以勾选高精度试试。
搜了下望言免费版本很久前从1.3版本后就已经停更了,以后可能都是收费的
菜鸟999 发表于 2025-12-27 00:40
使用gpu版本吧,cpu版本实在有点慢,可以勾选高精度试试。
这倒提醒我了,先前用「videocr-cli-GPU-v1.3.2-CUDA-11.8」是选高精度生成挺慢的
下载最新「videocr-cli-GPU-v1.3.2-CUDA-12.9」试试
PS: 啥时候能用AI模型可以一键识别内嵌字幕.生成SRT就好了 如同whisper模型,把视频音频转字幕
页:
[1]
2