如果用office2007的OCR内核 错字就会非常稀少
本帖最后由 klv48384 于 2021-12-1 15:34 编辑
来学习一下{:4_684:}
请问大佬,一个时间轴内有两行字幕的要怎么处理,不同人说话,一个人对话的字幕还没结束,另一个人对话的字幕出现在这行字幕上方这种情况。
本帖最后由 好运升 于 2022-9-4 22:09 编辑
我按照楼主的方法,用软件打开视频,托盘区显示LAV的图标,白蓝红都有,但就是没有视频预览,请问如何解决?
搞明白了,原来“视频预览”指的是【字幕-过滤器】。
太强了,考虑github仓库起个项目吗?
感谢{:4_683:}
独行 发表于 2022-1-2 14:03
请问大佬,一个时间轴内有两行字幕的要怎么处理,不同人说话,一个人对话的字幕还没结束,另一个人对话的字 ...
这种情况,如果出现的次数不多,就单独拉出去打个轴。如果非常多,大概需要换个工具。
现在有一些基于AI技术做的识别软件,或许某些场合里,比主楼中的这些老古董要好使一些
video-subtitle-extractor
https://github.com/YaoFANGUK/video-subtitle-extractor
视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。
darkangel0224 发表于 2023-6-17 00:06
这种情况,如果出现的次数不多,就单独拉出去打个轴。如果非常多,大概需要换个工具。
非常感谢,我去试下{:13_909:}
{:4_675:}感觉好复杂
darkangel0224 发表于 2023-6-17 00:06
这种情况,如果出现的次数不多,就单独拉出去打个轴。如果非常多,大概需要换个工具。
试了一下,两小时多的视频,自动模式漏了至少1/3的字幕{:4_689:}