计算机行业点评报告:OpenAI发布WhisperAPI,再添新收费产品

[复制链接]
查看: 17|回复: 0

2

主题

2

帖子

8

积分

新手上路

Rank: 1

积分
8
刘雯蜀 发表于 2023-3-6 00:00:00 | 显示全部楼层 |阅读模式
事件
北京时间3月2日,OpenAI宣布开放ChatGPTAPI,价格为每1000tokens0.002美元,较GPT-3.5模型价格降低90%。同时,OpenAI还推出Whisper官方API,Whisper模型可实现语音-文本(Speech-to-Text)的跨模态任务,使用者可实现语音的转录和翻译,费用为每分钟0.006美元。
投资要点
微软宣布开放WhisperAPI接口,AI多模态进程加速
1、Whisper支持语音转录和翻译两项功能并接受各种语音格式,模型中、英、法、德、意、日等主流语言上取得85%以上的准确率,完全符合工业准确率标准,未来有望打开商业化空间;
2、Whisper模型根据参数量和语言不同,共有9种版本,可适应不同使用者的需求。在中文语料测试下,模型在语音识别、语气识别、自动断句等方面表现出色,可满足各类使用场景需求;
3、多模态将成为AI大模型发展的重要趋势,Whisper模型在跨模态任务上的出色表现,有望为AI大模型多模态化发展奠定重要基础。
Whisper模型拆解,性能优异应用场景丰富
1、Whisper模型的编码/解码器架构仍基于Transformer,通过不同大小和类型的数据输入,实现模型的缩放性能,以及各项语音-文本任务的泛化性和鲁棒性;
2、Whisper模型较之前的语音识别模型有多项改进,在识别准确率、断句、漏音等维度上均有显著优化。目前已有Speak为代表的产品使用WhisperAPI提升服务质量,未来看好Whisper在更多商业场景中的深度应用。
投资建议:关注具备底层算法模型核心技术优势的厂商
1、推荐标的:拓尔思(中文NLP龙头厂商),科大讯飞(智能语音处理及合成);
2、建议关注:谷歌(DeepMind),微软(ChatGPT,Whisper),Meta(OPT模型),百度(“文心”模型),腾讯;
风险提示
1、AI技术迭代不及预期的风险;2、AI商业化产品发布不及预期;3、政策不确定性带来的风险;4、下游市场不确定性带来的风险;

【点击查看PDF原文】
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright   ©2015-2023  中国最佳CEO  技术支持:腾讯云