Azure的认知服务-语音服务

Azure的功能很广泛,今天带大家了解如何基于Azure 的认知服务将文本合成语音或者将语音转化问文本!

• 什么是“认知”?

认知,是指人们获得知识或应用知识的过程,或信息加工的过程,这是人的最基本的心理过程。它包括视觉、听觉、判断、想象和语言等。

• 什么是Azure认知服务?

Azure认知服务提供视觉、语音、朗读、搜索、语言理解(LUIS)和决策辅助的功能,可让用户将这些功能嵌入到自己的应用,并用于实际生活中。


Azure认知服务有哪些?


1

语音转文本

01

• 聊天语音转成文本

• 语音输入法

• 会议纪要

2

语音转文本





02

• 电影中的语音转成字幕

1

文本转语音

02

• 将书籍中的文本转成有声阅读

• 新闻播音稿

• 短视频配音

2

文本转语音


02

• 制作语音合成工具,输入文本输出不同语音

3

文本转语音




03

• 可以根据需要定制语音输出,其中包含超过 215 条的内置语音、60 多种语言和方言以及自定义语音。


使用方法&参考链接


语音转文本:

https://azure.microsoft.com/zh-cn/services/cognitive-services/speech-to-text/#overview

文本转语音:

https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech/#features



参考链接-1

https://azure.microsoft.com/zh-cn/services/cognitive-services/speech-to-text/#overview



参考链接-2

https://docs.microsoft.com/zh-cn/azure/cognitive-services/speech-service/speech-sdk?tabs=windows%2Cubuntu%2Cios-xcode%2Cmac-xcode%2Candroid-studio



参考链接-3

https://docs.microsoft.com/zh-cn/azure/cognitive-services/speech-service/rest-speech-to-text


• 微软提供SDK及Rest API两种方式供开发者调用,SDK支持C#、C++、Go、Java、JavaScript、Objective-C/Swift、Python等丰富的编程大礼包,满足你的coding欲望。

• 还可以通过Speech   Studio可视化的快速合成以及调试音频,轻松变成调音大师。

教程

1. 首先,登录azure.cn(中国版)或azure.com(国际版)申请一个免费Azure账号(白嫖200USD)

2. 申请通过后,访问portal.azure.com,输入申请账号及密码,进入Azure门户。

3. 搜索栏搜索“认知服务”,点击并创建语音服务

4. 找到密钥终结点,将相关信息填入到代码里即可完成此服务调用