“通晓”逾30种方言 中国首发语音辨识大模型

立即订阅亚视新闻 YouTube,即时掌握时事发展。

中国电信公司星期六(5月25日)发布“星辰超多方言语音辨识大模型”,能辨识30多种方言。

中新社报导,该模型能辨识粤语(广东话)、上海话、四川话、温州话等,还能理解方言,是中国目前“通晓”最多方言的语音辨识大模型。

报导指出,中国电信旗下的人工智能研究院于福建福州举行的数字中国建设高峰会上,发布“星辰超多方言语音辨识大模型”,打破了单一模型只能辨识单一方言的困境。此模型可同时辨识和理解粤语、上海话、四川话、温州话等30多种方言。

中国电信人工智能研究院已建置超过30种超过30万小时的高品质方言资料库,方言资料库在性质多元、性能等层面均居于业界前列。

此外,中国电信的研发团队首创“蒸馏加膨胀”联合训练演算法,解决超大规模多场景资料集和大规模参数条件下,预训练坍缩的问题。

中国电信表示,星辰语音大模型已广泛应用落实,在福建、江西、广西、北京、内蒙古等地的中国电信“10000智能客服”试办应用。

中国电信指出,接入星辰大模型以后,智能客服秒懂30种方言,实现日均处理约200万通电话。此外,星辰语音大模型还落地多地市的“12345平台”。

Back to top button