找回密码
 立即注册
楼主: arition

Freyja: 使用深度学习的视频硬字幕提取工具,更加方便的手抄字幕(21/01/11 更新,减少资源占用)

15

主题

41

回帖

40

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
284315

小有所成崭露头角BD!

arition  楼主| 发表于 2020-11-29 21:18:18 | 显示全部楼层
vbr9d 发表于 2020-11-29 20:25
并不是楼上,提供一下我不能打开的视频
[Lilith-Raws]搬运的baha源视频全部时间轴都会异常地长,尝试把视 ...

Lilith-Raws搬运的视频的视频合并都有点问题,导致合并出来的帧数不太对。目前按照我说明里写的用ffmpeg转码一遍就行了,remux没用。然后那个crash问题,可以尝试调整裁剪大小,多试几次就能成功。
除开crash的问题,我看了一下你这个截图,这种字体我没有训练过,所以估计识别出来结果会很差。如果你知道这是什么字体的话可以告诉我,我下次训练的时候加入这个字体
回复

使用道具 举报

52

主题

93

回帖

102

VC币

荣誉会员

Rank: 14Rank: 14Rank: 14Rank: 14

积分
98634

崭露头角新人登场

AsexualityK 发表于 2020-11-29 21:24:57 | 显示全部楼层
太难了 显卡不匹配 慢出天际
回复

使用道具 举报

11

主题

137

回帖

46

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
224019
vbr9d 发表于 2020-11-29 22:23:54 | 显示全部楼层
arition 发表于 2020-11-29 21:18
Lilith-Raws搬运的视频的视频合并都有点问题,导致合并出来的帧数不太对。目前按照我说明里写的用ffmpeg ...

嗯,基本上都是要转码才能用
黑五那个我调了好几遍都没用,字体我也不知道,不过我也就测试用,这种字体做字幕很少见,没什么必要特地训练一个了



回复

使用道具 举报

7

主题

44

回帖

40

VC币

金牌会员

Rank: 6Rank: 6

积分
43186
softfuttery 发表于 2020-11-30 08:33:31 | 显示全部楼层
arition 发表于 2020-11-29 19:38
能给个无法打开的视频的例子嘛?任意一个都行,给个链接啥的,不方便公开的话可以私信 ...

就是随便从b站找一段视频下载,转成mp4,还是打不开,包括从vcb下载的的暗杀教室也是,只会显示最开始的一段图片,怀疑是调度问题吧,显卡根本没在工作
https://vcb-s.com/archives/13457

b站的是下了这个第八集
https://www.bilibili.com/bangumi/play/ss34230/
屏幕截图(24).png
回复

使用道具 举报

4

主题

177

回帖

80

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
418712
xfdz 发表于 2020-11-30 08:38:37 | 显示全部楼层
手抄字幕进入人工智能时代!
回复

使用道具 举报

头像被屏蔽

8

主题

58

回帖

0

VC币

禁止发言

积分
11616
web0316 发表于 2020-11-30 11:25:54 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

15

主题

41

回帖

40

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
284315

小有所成崭露头角BD!

arition  楼主| 发表于 2020-11-30 15:04:52 | 显示全部楼层
web0316 发表于 2020-11-30 11:25
macOS 那个models 放哪里啊?

MacOS版现在没法用,下一版会修复
回复

使用道具 举报

0

主题

6

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
2334
silly1stupid 发表于 2020-11-30 19:14:33 | 显示全部楼层
好……好猛
回复

使用道具 举报

15

主题

41

回帖

40

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
284315

小有所成崭露头角BD!

arition  楼主| 发表于 2020-12-1 14:12:53 | 显示全部楼层
softfuttery 发表于 2020-11-30 08:33
就是随便从b站找一段视频下载,转成mp4,还是打不开,包括从vcb下载的的暗杀教室也是,只会显示最开始的一 ...

这个版本应该修复了mkv的视频时间问题,可以试一下
fix duration on mkv sources · freyjaSubOCR/freyja-sub-ocr-electron@2ad0c51 (github.com)

可能需要登录github账号才能看见下载
回复

使用道具 举报

15

主题

41

回帖

40

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
284315

小有所成崭露头角BD!

arition  楼主| 发表于 2021-1-11 18:39:28 | 显示全部楼层
本帖最后由 arition 于 2021-1-11 18:42 编辑

2021/01/11 版本更新 V0.4.0

新版使用了更新后的OCRV3模型。新的OCRV3模型相比旧的OCR模型来说运行速度更快,也更加准确。新模型使用的GPU内存较少,所以默认的批次大小从8个变更为32个。在Surface book 2笔记本上(i7-8650U,GTX 1060 Max-Q),新版本处理一段24分钟的视频只需要10分钟。
新版不需要以前的对象检测模型,也统一了CPU和GPU模型。
新的模型需要框选更准确的字幕边界,否则准确度会很差。下一个版本主要会优化视频解码和播放。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表