突破次元壁!Azure AI 神经网络版定制声音全新体验Azure 云平台汇集的产品和云服务超过 200 种,旨在帮助你将新解决方案付诸实践,以便解决当今的难题,并创造未来。 本次为大家介绍的是Azure 神经网络版定制语音服务,让您可以DIY一套属于自己的独一无二的声音模型! • 什么是神经网络定制语音? 神经网络定制声音是一种文本转语音功能,使你可以为应用程序创建独一无二的定制合成声音。 利用神经网络定制声音,你可以通过提供自己的音频样本作为训练数据来生成高度自然的语音。 • 神经网络定制语音的组成 文本分析器、神经网络声学模型和神经网络声码器。 为了从文本生成自然合成语音,文本会首先输入到文本分析器中,后者以音素序列的形式提供输出。 音素是一种基本声音单位,可区分特定语言中的不同字词。 音素序列定义文本中提供的字词的发音。 使用神经网络定制语音的前提 教程 1. 首先,申请测试账号,分配订阅 2. 向微软提交申请使用定制语音服务的表单 如何创建一个神经网络语音系统? 教程 滑动查看 1. 创建语音服务 2. 进入Speech Studio页面,创建定制声音 3. 创建项目 4. 录制声音,录完并点击训练模型 5. 部署模型,在部署模型前需要录制一段音频授权发音人给对应企业用于商业用途。 为什么填申请表单? 因为相关政策原因及一些安全因素(防止他人借助定制语音进行诈骗等行为) |