当前位置:首页 >文章发布 > 正文
OpenAI升级Whisper语音转录AI模型,不牺牲质量速度快8倍
来源:IT之家 作者:
佚名
2024-10-09 10:51:44
近日消息,OpenAI在10月1日举办的DevDay活动日中,宣布推出了Whisperlarge-v3-turbo语音转录模型,共有8.09亿参数,在质量几乎没有下降的情况下,速度比large-v3快8倍。
近日消息,OpenAI在10月1日举办的DevDay活动日中,宣布推出了Whisperlarge-v3-turbo语音转录模型,共有8.09亿参数,在质量几乎没有下降的情况下,速度比large-v3快8倍。
Whisperlarge-v3-turbo语音转录模型是large-v3的优化版本,并且只有4层解码器层(DecoderLayers),作为对比large-v3共有32层。
Whisperlarge-v3-turbo语音转录模型共有8.09亿参数,比7.69亿参数的medium模型稍大,不过比15.5亿参数的large模型小很多。
OpenAI表示Whisperlarge-v3-turbo的速度比large模型快8倍,并且所需的VRAM为6GB,而large模型需要10GB。
免责声明:本文系网络转载,版权归原作者所有。本文所用图片、文字如涉及作品版权问题,请联系删除!本文内容为原作者观点,并不代表本网站观点。
编辑:乔帅臣