Meta公布AI语音模型支持4000种语言，可用于AR及VR

行业动态

分享至

2023-05-24 11:22:50　来源: 书生家电网　浏览次数：

　　脸书今天公布，旗下大规模多语言语音模型，可识别超过4000种口语表达的语言，识别量是既有技术的40倍；文字语音互转技术的应用范围，从100种语言增加至1100种，且可用于AR及VR。

　　世界上许多语言正面临消失的危机，而现有的语言识别与生成技术上的限制更加快此趋势。Meta今天发布新闻稿指出，Meta发布一系列的，希望帮助用户以自己习惯的语言，更轻松获取资讯及使用电子设备。

　　Meta表示，公司研发的大规模多语言语音（简称MMS）模型，扩展文字转语音及语音转文字技术的应用范围，从最初的100种语言，至今已可转换超过1100种语言，超越过去的10倍。还能识别超过4000种口语语言，是过去的40倍。

　　应用案例方面，从VR（虚拟现实）、AR（增强现实技术）至信息服务，不仅能使用偏好语言操作，更可理解每个人的声音。

　　Meta指出，将开源这项技术的源代码及模型，让研究社群能够以现有的工作成果为基础继续开发，一同保存全球的语言，并拉近人们间的距离。

　　过去最大型的语音数据库最多仅涵盖100种语言，因此开发此技术所面临的第一个挑战即为“搜集数千种语言的语音训练资料”。为了克服这项挑战，Meta使用已翻译成多种语言、译文已被广泛阅读及研究的宗教经典，例如“圣经”，作为语言的文字训练资料。

　　Meta表示，圣经译文有多种语言的公开录音档，作为大型多语言语音模型计划的一部分，Meta创造的资料集，搜集超过1100种语言的“新约圣经”有声读物资料集，平均为每种语言提供32小时的语音训练资料，后续又加入其他未标注的基督教有声读物后，可用的语言训练资料已涵盖超过4000种语言。

　　Meta强调，将持续扩增大规模多语言语音模型的涵盖范围，以支持更多语言的转换及识别，并努力克服现有语音技术难以处理方言的挑战。

THE END

AR增强现实技术原理 AR游戏是什么意思 VR虚拟现实眼镜哪个好

Meta营收预测偏低 AI支出增加

程志亮

Meta推新一代开放式大型语言模型推理能力更强

姜鑫

Open AI和Meta将推出有推理能力的AI模型

程志亮

五月起Meta标记AI生成内容

程志亮

英伟达推出新款AI芯片 Meta预计今年稍后收到首批出货

库存太多，传索尼暂停生产头戴式装置PSVR2

程志亮

TikTok受欢迎母公司有望取代Meta成全球最大社交媒体

姜鑫

Arm推新车用处理器缩短汽车开发周期达2年

佳能进入IDC MarketScape首次可持续发展评估“领导者”类别

佳能官网

苹果上调Apple Card储蓄账户余额上限至100万美元

苹果发布Safari技术预览版190浏览器更新

华为P70Art影像规格曝光或搭载索尼IMX989

程志亮

谢晓燕

谢晓燕

Caviar推出定制款iPhone15Pro

谢晓燕

苹果下架13英寸MacBook Pro 终结Touch Bar

谢晓燕

开机出现invalid partition是什么

Intel Arc A580显卡终亮相

数码评测

Meta公布AI语音模型支持4000种语言，可用于AR及VR

最新热点

数码评测

iPhone“电池健康度狂掉”？达人教维持100%秘诀

TCL空调怎么样质量怎么样

传苹果iPhone 16将全面改用触控按键

苹果真的要推12.9英寸iPad Air

iPhone 16最新长相曝光！镜头变这样了

苹果又改策略？iPhone 17 Plus传将“缩小”屏幕

苹果iPhone 16 Pro相机配置将升级　外媒曝四大亮点

关注我们

Meta公布AI语音模型支持4000种语言，可用于AR及VR

最新热点

数码评测

iPhone“电池健康度狂掉”？ 达人教维持100%秘诀

TCL空调怎么样质量怎么样

传苹果iPhone 16将全面改用触控按键

苹果真的要推12.9英寸iPad Air

iPhone 16最新长相曝光！镜头变这样了

苹果又改策略？iPhone 17 Plus传将“缩小”屏幕

苹果iPhone 16 Pro相机配置将升级 外媒曝四大亮点

关注我们

iPhone“电池健康度狂掉”？达人教维持100%秘诀

苹果iPhone 16 Pro相机配置将升级　外媒曝四大亮点