阿里听悟通问不错,识别率很高

2024-01-27 09:19:51 +08:00
 justincnn
才发现有这种好工具,效率提升太快了。
2216 次点击
所在节点    OpenAI
10 条回复
EngAPI
2024-01-27 09:33:40 +08:00
感谢推荐,请问下大致是用来干嘛的?
justincnn
2024-01-27 09:39:43 +08:00
@EngAPI 会议录音,记录,总结
chitanda
2024-01-27 11:28:57 +08:00
看了下,似乎只能电脑 web 上用
zhouxiaodi
2024-01-27 12:14:28 +08:00
通义听悟?
hanqian
2024-01-27 12:35:32 +08:00
感觉这名字像绕口令,听悟通问,通义听悟,通义千问……
RichardChou
2024-01-27 14:09:51 +08:00
我主要用两个功能。

一是 视频转文字 ,生成一些视频教程的字幕。用过剪映、openai 的 whisper ,感觉很一般。whisper 的英文非常强,中文不太行。
二是 实时语音转文字 ,记录一些实时的感悟。以前用科大讯飞输入法,发现识别率不太行。

这俩功能在阿里云都是要钱的,但在通义听悟免费,而且效果非常好。

以下是我的邀请链接,有兴趣的可以看看:

https://tingwu.aliyun.com/u/zj78qpje6lwqxdpa
bravecarrot
2024-01-27 15:31:10 +08:00
千问系列都不错, 搞个几百条数据 LORA 微调效果就很好了
Vitta
2024-01-27 20:37:50 +08:00
试试飞书妙记,也不错
jsshwqz
2024-01-29 00:21:30 +08:00
@Vitta p 这个倒还没用过,特色是什么啊
Vitta
2024-01-29 08:34:35 +08:00
@jsshwqz 很久以前是视频加字幕,点击字幕跳转对应时间的视频

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/1011967

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX