找回密码
 立即注册
查看: 4617|回复: 9

又一个硬字幕提取器

2

主题

14

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
2841
Chrysoberyl 发表于 2022-2-3 10:28:19 | 显示全部楼层 |阅读模式
本帖最后由 Chrysoberyl 于 2022-2-3 23:48 编辑

最近从某论坛看到一个新的硬字幕提取器,采用了AI模型,无需第三方API,直接本地识别。试用了一下感觉速度和正确率都不错,最大的问题是快速模式丢字幕,特别是那种两三个字的字幕,很容易丢,需要后期校对;如果用精确模式又慢到令人发指。折腾了一下命令行,似乎参数改了没发现有什么区别,可能是姿势不对没有生效(
个人测试是300-400条字幕里会丢10-20条,当然和字幕长度也有关系。错字不多,校对时很轻松,找漏掉的字幕很痛苦。
Github指路:video-subtitle-extractor (https://github.com/YaoFANGUK/video-subtitle-extractor)

视频教程(https://www.bilibili.com/video/bv11L4y1Y7Tj)
此项目有GUI傻瓜版,感觉很有前途,可以插个眼,解决丢字幕的问题之后就相当完美了。总之多一个工具还是不错的,推荐给大家。


评分

参与人数 1活跃度 +666 收起 理由
vandoge + 666

查看全部评分

回复

使用道具 举报

21

主题

265

回帖

759

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
184381

崭露头角新人登场活跃达人

skylimiter 发表于 2022-2-3 11:56:37 | 显示全部楼层
本帖最后由 skylimiter 于 2022-2-3 13:01 编辑

哇 居然不用第三方api
体积上面也才300多MB
晚些试试看

===编辑1
精准模式真的很慢
但是挂着让他跑
就跑了接近一小时

===编辑2
有看到srt档
但还显示处理中...
已经处理十分多钟了
偶尔手抄、偶尔渣翻、无限當咕咕乃常态
回复

使用道具 举报

0

主题

2

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
11249
hdg007 发表于 2022-2-3 13:53:19 | 显示全部楼层
能识别繁体字吗,大兄弟
回复

使用道具 举报

2

主题

14

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
2841
Chrysoberyl  楼主| 发表于 2022-2-3 23:48:11 | 显示全部楼层
hdg007 发表于 2022-2-3 13:53
能识别繁体字吗,大兄弟

可以的摘自Github项目页:
  • 多语言:支持中文/英文、繁体中文、日语、韩语、法语、德语、俄语、西班牙语、葡萄牙语、意大利语字幕的提取

回复

使用道具 举报

0

主题

5

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
2824
echoli08 发表于 2022-2-4 08:12:04 | 显示全部楼层
能識別繁體的話...
找天來試試重新提取一下秀逗泰山的字幕...
回复

使用道具 举报

21

主题

265

回帖

759

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
184381

崭露头角新人登场活跃达人

skylimiter 发表于 2022-2-4 13:54:58 | 显示全部楼层
整体来说简体繁体使用精准模式

精准識别度很高

但是相对的 花费时间挺长,也是目前我认为的缺点。
可能闲暇时会挂着让他跑,正式使用时我可能不考虑使用这款...

后面人工校对,基本上轻松很多,还是有漏,段落重复,时间轴错误的状况

我环境是win11 打开exe过程以及执行过程中挺卡顿的。。。。不知道是不是个例?
偶尔手抄、偶尔渣翻、无限當咕咕乃常态
回复

使用道具 举报

2

主题

14

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
2841
Chrysoberyl  楼主| 发表于 2022-2-4 13:59:26 | 显示全部楼层
skylimiter 发表于 2022-2-4 13:54
整体来说简体繁体使用精准模式

精准識别度很高

如果确定要人工精校的话,不如直接用快速模式,23分的片子也就几分钟的事,省下的时间足够人工看一遍校对了。
如果加上一些奇技淫巧的话,甚至可以进一步降低漏字幕的情况,比如一边校对一边看Aegisub里的音轨,比如如果两条字幕之间明显有人声部分可以直接检查一下,覆盖不全的可以看看是不是时间轴有点问题之类。个人体验是加上这些技巧之后20分钟,300-400条字幕的片子大概可以控制在丢10条字幕左右。

点评

这技巧我来试试hhhh 谢谢lz  发表于 2022-2-4 14:14
回复

使用道具 举报

2

主题

28

回帖

10

VC币

荣誉会员

Rank: 14Rank: 14Rank: 14Rank: 14

积分
93138
wzdc 发表于 2024-7-13 00:09:09 | 显示全部楼层
本帖最后由 wzdc 于 2024-7-13 00:13 编辑

精准模式,两分钟视频耗时15分钟... 字幕识别的倒是没啥问题就是有些字幕的时轴对不上
回复

使用道具 举报

2

主题

14

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
2841
Chrysoberyl  楼主| 发表于 2024-7-16 12:45:58 | 显示全部楼层
wzdc 发表于 2024-7-13 00:09
精准模式,两分钟视频耗时15分钟... 字幕识别的倒是没啥问题就是有些字幕的时轴对不上 ...

不建议用精准模式,实际上准确度并无明显提升,时间倒是长了不少,而且有时会引入时间轴问题。只推荐用快速模式,反正后期校对是少不了的,还不如搞快点
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表