人工智能语音转文字来了:每分钟收费4分钱 中文还不太行

作为当前最火的AI应用,ChatGPT在积累了1亿用户之后开始尝试商业运营了,昨天正式发布了API,企业可以付费接入,75万单词只要2美元,成本比之前降低了90%。实际上昨天开放的业务还有一个,那就是语音转文字的API,基于公司的Whisp

作为当前最火的AI应用,人工智能在积累了1亿用户之后开始尝试商业运营了,昨天正式发布了API,企业可以付费接入,75万单词只要2美元,成本比之前降低了90%。

实际上昨天开放的业务还有一个,那就是语音转文字的API,基于公司的Whisper大模型,去年9月份首次推出Whisper Large-v1模型,12月开源了升级版的Whisper Large-v2模型。

这次商业化之后,Whisper API的收费也很低廉,每分钟只要0.006美元,**币约为4分钱,预计会让很多语音相关的企业压力很大。

Whisper API支持对语音文件进行转录和翻译,并支持包括英语、中文、**语、日语、德语、西班牙语等几十种语言。

不过不同语言的准确率差别不小,Whisper large-v2模型在识别西语、英语、意大利语、德语等语言单词错误率都能控制在5%以内,这种语言转文字之后只需要用户简单修改就好。

至于中文,v1模型的错误率就有19.6%,v2略微提升到14.7%,改进不大,错误率比英文、西语之类的高很多,用户使用起来有些麻烦,需要校正的地方就多。

至于为何有这样的差距,除了中文自身的特点之外,很可能跟训练使用的中文语料较少有关,毕竟网上的内容主要还是外文。
 

本文由小编网络转载而成,原文来源:http://www.techweb.com.cn/it/2023-03-03/2921449.shtml,如有侵权,请联系删除

作为当前最火的AI应用,人工智能在积累了1亿用户之后开始尝试商业运营了,昨天正式发布了API,企业可以付费接入,75万单词只要2美元,成本比之前降低了90%。

实际上昨天开放的业务还有一个,那就是语音转文字的API,基于公司的Whisper大模型,去年9月份首次推出Whisper Large-v1模型,12月开源了升级版的Whisper Large-v2模型。

这次商业化之后,Whisper API的收费也很低廉,每分钟只要0.006美元,**币约为4分钱,预计会让很多语音相关的企业压力很大。

Whisper API支持对语音文件进行转录和翻译,并支持包括英语、中文、**语、日语、德语、西班牙语等几十种语言。

不过不同语言的准确率差别不小,Whisper large-v2模型在识别西语、英语、意大利语、德语等语言单词错误率都能控制在5%以内,这种语言转文字之后只需要用户简单修改就好。

至于中文,v1模型的错误率就有19.6%,v2略微提升到14.7%,改进不大,错误率比英文、西语之类的高很多,用户使用起来有些麻烦,需要校正的地方就多。

至于为何有这样的差距,除了中文自身的特点之外,很可能跟训练使用的中文语料较少有关,毕竟网上的内容主要还是外文。
 

本文由小编网络转载而成,原文来源:http://www.techweb.com.cn/it/2023-03-03/2921449.shtml,如有侵权,请联系删除

作为当前最火的AI应用,人工智能在积累了1亿用户之后开始尝试商业运营了,昨天正式发布了API,企业可以付费接入,75万单词只要2美元,成本比之前降低了90%。

实际上昨天开放的业务还有一个,那就是语音转文字的API,基于公司的Whisper大模型,去年9月份首次推出Whisper Large-v1模型,12月开源了升级版的Whisper Large-v2模型。

这次商业化之后,Whisper API的收费也很低廉,每分钟只要0.006美元,**币约为4分钱,预计会让很多语音相关的企业压力很大。

Whisper API支持对语音文件进行转录和翻译,并支持包括英语、中文、**语、日语、德语、西班牙语等几十种语言。

不过不同语言的准确率差别不小,Whisper large-v2模型在识别西语、英语、意大利语、德语等语言单词错误率都能控制在5%以内,这种语言转文字之后只需要用户简单修改就好。

至于中文,v1模型的错误率就有19.6%,v2略微提升到14.7%,改进不大,错误率比英文、西语之类的高很多,用户使用起来有些麻烦,需要校正的地方就多。

至于为何有这样的差距,除了中文自身的特点之外,很可能跟训练使用的中文语料较少有关,毕竟网上的内容主要还是外文。
 

本文由小编网络转载而成,原文来源:http://www.techweb.com.cn/it/2023-03-03/2921449.shtml,如有侵权,请联系删除

作为当前最火的AI应用,人工智能在积累了1亿用户之后开始尝试商业运营了,昨天正式发布了API,企业可以付费接入,75万单词只要2美元,成本比之前降低了90%。

实际上昨天开放的业务还有一个,那就是语音转文字的API,基于公司的Whisper大模型,去年9月份首次推出Whisper Large-v1模型,12月开源了升级版的Whisper Large-v2模型。

这次商业化之后,Whisper API的收费也很低廉,每分钟只要0.006美元,**币约为4分钱,预计会让很多语音相关的企业压力很大。

Whisper API支持对语音文件进行转录和翻译,并支持包括英语、中文、**语、日语、德语、西班牙语等几十种语言。

不过不同语言的准确率差别不小,Whisper large-v2模型在识别西语、英语、意大利语、德语等语言单词错误率都能控制在5%以内,这种语言转文字之后只需要用户简单修改就好。

至于中文,v1模型的错误率就有19.6%,v2略微提升到14.7%,改进不大,错误率比英文、西语之类的高很多,用户使用起来有些麻烦,需要校正的地方就多。

至于为何有这样的差距,除了中文自身的特点之外,很可能跟训练使用的中文语料较少有关,毕竟网上的内容主要还是外文。
 

本文由小编网络转载而成,原文来源:http://www.techweb.com.cn/it/2023-03-03/2921449.shtml,如有侵权,请联系删除

原创文章,作者:小编,如若转载,请注明出处:http://www.wangguangwei.com/120426.html