豆包扒字幕真好用。。。
手抄字幕的时候突发奇想,想着现在AI这么强大是不是可以实现用AI直接扒字幕然后生成字幕文件抱着试一试的态度试了试deepseek,果不其然不行,限制太多,随即又想到了豆包,然后试了试
然后,还真行啊,虽然上传不了视频文件,但是只要给个视频链接就可以实现扒字幕,准确的要命我靠
再不济的话,上传音频文件也可以自动扒(还没试,但豆包说可以)
我怎么早没想起来试。。。
等等,好像也不对劲,生成的字幕内容怎么和视频内容对不上。。。 好吧,当我没说,还是失败了,这玩意儿还是我想多了,视频内容根本无法识别。。。 是发展进步了,不过要真正替代人做任何事还有很长的路要走吧 还是用本地whisper模型加在线ai翻译快捷点,翻译准确度还是可以的 SAOKiller 发表于 2026-1-31 23:56
还是用本地whisper模型加在线ai翻译快捷点,翻译准确度还是可以的
只不过还是有点不太好用就是了,我现在就是mpv脚本调用whisper large3,接的qwen3max的api,翻译质量还是有点怪怪的 ai的幻想被当真了吗 llm 不是许愿箱...
如果它真能扒字幕,那背后肯定得有人提供完整的各种软硬件 API 调用... 理论上豆包背靠抖音大数据是完全能做的,但免费版想无限制识别视频肯定是不可能的,免费版所谓的视频识别本质上是从评论区分析视频内容大概讲了啥。 录音丢进去,字幕出来后,后面调时间轴不就好了,也就前后几秒的差别吧,总不能豆包跟不上视频语速吧
【提取音频也不是不行】
页:
[1]