查看: 934|回复: 2
收起左侧

[IT业界] 微软自定义神经语音技术已允许用户创建高度逼真、类似于人类的声音

[复制链接]
蓝天二号
发表于 2021-3-4 10:55:49 | 显示全部楼层 |阅读模式
IT之家3月4日消息 据微软官方发布,近期,Azure 认知服务中的语音服务的一部分——自定义神经语音 (Custom Neural Voice)——文本到语音功能已普遍推出。该功能将允许用户使用微软开创性的神经文本到语音模型,为应用创建高度逼真、类似人类的自定义语音。由于创建的语音非常逼真,微软限制了访问权限,以便用户负责任地使用这项技术。
20210304_101304_248.png
微软表示,

“作为微软对负责任的人工智能承诺的一部分,我们设计和发布自定义神经语音的目的是保护个人和社会的权利,促进透明的人机交互,抵制有害的深层伪装和误导性内容的扩散。为此,我们对自定义神经语音的访问和使用进行了限制。”

IT之家获悉,要创建自定义语音,你只需录制音频并上传作为训练数据即可。Azure 语音服务将为你的录音创建一个独特的语音调整。自定义神经语音的声音逼真自然,可以代表品牌,让用户以自然的方式与应用进行对话互动。

微软强调,以下客户已经在使用这项最新的 TTS 功能。

AT&T / 华纳兄弟:他们最近在德克萨斯州达拉斯的 AT&T 体验店推出了一个首创的创意和互动体验,客户可以直接与兔八哥对话。

Progressive:利用标志性的 Progressive 保险发言人 Flo 的声音,创建了 Flo 聊天机器人,以简化客户咨询流程,提供个性化体验。

Duolingo:为了让学习一门新的语言感到可实现性和适用性,Duolingo 使用课程创建了多样化的风格化声音。
ejji
发表于 2021-3-4 15:31:18 | 显示全部楼层
edge的tts的确不错
cnseatech
发表于 2021-3-4 20:32:24 | 显示全部楼层
微软的语音技术确实不错
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2024-4-28 04:28 , Processed in 0.131495 second(s), 19 queries .

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表