Whisper (OpenAI)

Whisper 是一个基于 680,000 小时从网页收集的多语言和多任务有监督数据的开源自动语音识别系统。它旨在应对各种口音、背景噪声和技术语言,并能够将语音转录成多语言并翻译成英语。它采用了一种端到端的变压器(Transformer)实现方式,易于使用并具有高准确性。它还具备语言识别和短语级时间戳功能。该系统旨在让开发者能够轻松地在更多应用中添加语音接口。

访问量: 1.5B
国家: United States
AI听写识别 Open Source

评论

登录 After Sign In, you can make comments