Whisper 是一个基于 680,000 小时从网页收集的多语言和多任务有监督数据的开源自动语音识别系统。它旨在应对各种口音、背景噪声和技术语言,并能够将语音转录成多语言并翻译成英语。它采用了一种端到端的变压器(Transformer)实现方式,易于使用并具有高准确性。它还具备语言识别和短语级时间戳功能。该系统旨在让开发者能够轻松地在更多应用中添加语音接口。
全球排名
#26 4
国家/地区排名
82 2
行业排名
4
访问量
1.5B
跳出率
42.24%
每人访问页数
4.36
平均访问时长
00:04:22