找回密码
 立即注册
楼主: hx168

硬字幕提取工具10.0 - 超好用(”语音提词2.0”发布了!欢迎试用)

0

主题

2

回帖

0

VC币

新手上路

Rank: 1

积分
151
木摆水灯 发表于 2025-3-20 23:23:01 | 显示全部楼层
win11系统,离线版本突然打不开了,重新解压也没有用。不支持离线识别的版本可以正常打开使用,有人遇到过么
回复

使用道具 举报

0

主题

2

回帖

0

VC币

新手上路

Rank: 1

积分
12
10362227 发表于 2025-6-17 02:26:03 | 显示全部楼层
可以更新了

PaddleOCR v3.0.0 整体识别精度相比上一代提升13个百分点。
回复

使用道具 举报

0

主题

2

回帖

0

VC币

新手上路

Rank: 1

积分
12
10362227 发表于 2025-9-1 10:27:24 | 显示全部楼层
百度OCR好像更新了api地址,产生一系列bug,连离线ocr也用不了了
回复

使用道具 举报

0

主题

2

回帖

0

VC币

新手上路

Rank: 1

积分
106
麥香綠茶 发表于 2025-9-30 17:05:08 | 显示全部楼层
本帖最后由 麥香綠茶 于 2026-2-27 22:40 编辑

PP-OCRv5的server繁體中文很準確,希望製作者優化
建議你檢測框,上下兩行就行了,不要有一行一長一短的檢測框
例如以下這樣對白,會有一長一短的,不準確,直接一行長的檢測框全部框起來反而更準確
-你知道他回家了嗎?    -他?

自己有訓練一個PP-OCRv5的server微調版本,能否加入替換
回复

使用道具 举报

1

主题

215

回帖

0

VC币

白金会员

Rank: 12Rank: 12Rank: 12

积分
51264
hx168  楼主| 发表于 2026-3-13 12:29:00 | 显示全部楼层
麥香綠茶 发表于 2025-9-30 17:05
PP-OCRv5的server繁體中文很準確,希望製作者優化
建議你檢測框,上下兩行就行了,不要有一行一長一短的檢 ...

一直没时间更新,因为平时太忙了!

不知您对这个python程序有没有做维护的兴趣,计划开源到github

点评

有兴趣做维护的请联系Q 726947858 说明来意  发表于 2026-3-13 12:58
回复

使用道具 举报

1

主题

215

回帖

0

VC币

白金会员

Rank: 12Rank: 12Rank: 12

积分
51264
hx168  楼主| 发表于 2026-3-16 02:39:07 | 显示全部楼层
近期将会迎来一次重大代码重构+功能更新,除了人工校对更轻松,还支持一键AI硬字幕提取(不是语音识别),敬请期待!工具后续计划开源到github,平时没有太多时间管理,有兴趣做代码维护的朋友可联系我(文末Q)
回复

使用道具 举报

0

主题

2

回帖

0

VC币

新手上路

Rank: 1

积分
106
麥香綠茶 发表于 2026-3-23 23:47:50 | 显示全部楼层
hx168 发表于 2026-3-16 02:39
近期将会迎来一次重大代码重构+功能更新,除了人工校对更轻松,还支持一键AI硬字幕提取(不是语音识别), ...

我在PP-OCRv5_server基礎上訓練微調了11500張繁體中文硬字幕圖片
我權限不夠不能貼連結
精研字幕有發表訓練模型
回复

使用道具 举报

0

主题

5

回帖

0

VC币

新手上路

Rank: 1

积分
118
gts3666 发表于 2026-3-30 18:43:29 | 显示全部楼层
现在的PaddleOCR-VL-1.5模型很精准,识别准确率基本99%
回复

使用道具 举报

1

主题

113

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
13722
晃晃无事 发表于 2026-3-30 19:26:15 | 显示全部楼层
提下跟其他字幕ocr工具的不足,主要还是调用VideoSubFinder,截图和筛选有字幕的图片更繁琐。而且对于ocr动画字幕来说,双区域框选确实很有必要,更能节约时间。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表