猜你喜欢
智能语音开发——从入门到实战

智能语音开发——从入门到实战

书籍作者:声智科技 ISBN:9787512431850
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:8664
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

本书基于声智科技SoundAI Azero智能操作系统,详细介绍智能语音交互开发的全过程,包括智能语音趋势、智能系统基础、技能开发实践等,以及如何在SoundPi智能开发魔盒上进行设备和技能开发。SoundPi是声智科技按照消费电子产品标准研发设计的开发套件,内置SoundAI Azero,支持快捷二次开发,开放多种硬件接口,支持IoT设备控制,是开发者体验智能、验证产品、扩展应用的标准参考硬件。书中的开发教程为使用者提供直接、高效的学习和实践方式,帮助快速打造具有语音交互功能的智能产品,为下一步的高阶开发奠定基础。

本书是智能语音开发的入门书籍,可供学生、初学者和开发爱好者进行智能语音开发时参考。


前言

人工智能赋予了机器自主决策的能力,将带动各个行业从电气化、自动化升级到智能化时代,是带动全球经济增长的关键技术创新。这已经是全球的共识,其重要性毋庸置疑。但是人工智能怎样才能像互联网一样成为引领一个新兴时代的核心推动力呢?这其实也是全球创新组织进行技术迭代和商业探索的困惑:技术做到什么程度才是重大突破?技术应用到行业是“+AI”还是“AI+”?技术在商业实践中扮演什么角色?其实,人工智能与互联网的发展历程类似。目前,人工智能处于早期阶段,当下最为重要的任务是普及人工智能知识,培养人工智能人才,这才是我国人工智能发展的关键,也是我国人工智能引领全球的基础。

核心技术的竞争归根结底还是人才的竞争,我国把人工智能提升为国家战略。2018年教育部印发的《高等学校人工智能创新行动计划》,明确指出当前人工智能人才还存在巨大缺口以及分布不均的问题。人工智能人才在产业链的分布上可以划分为三个层次:基础层、技术层、应用层。其中,基础层主要包括数据、芯片、算法三个方面,技术层主要是计算机视觉、智能语音交互、知识图谱、机器学习等,应用层则覆盖了汽车、安防、金融、医疗、家居、教育等应用场景。人工智能的兴起必须依赖全产业链条的人才储备。我国各高校已经开始这项伟大的工程,目前有超过一百家高校开设了人工智能相关专业和课程,包括清华大学、北京大学、中国科学院大学、中国科学技术大学、北京航空航天大学、中国人民大学等。与此同时,人工智能也逐渐进入中小学课堂进行试点教育。可以预见,不久之后人工智能将会成为大中小学生的必修课程,人工智能技术将成为未来职场人士必备的知识和技能之一。

但是,人工智能普及基础教育的周期较长,大中小学和职业教育的学生也需要一个即时应用的示范,这就需要在应用教育方面寻求一个突破口。智能语音作为人工智能的基础技术和入口,也是人工智能应用的关键所在,而且在消费电子领域以智能音箱为代表在全球引领了人工智能的场景示范,孕育了从传感、芯片、系统到方案的成熟产业链,囊括了全球包括亚马逊、苹果、谷歌、微软、百度、华为、阿里、腾讯等著名公司,不仅是入门人工智能行业的快速通道,而且也是谋求职业转型的优先选择。

智能语音是一个复杂冗长的链条技术,融合了声学、语音和语言三大学科。即便最简单的人机对话,至少也需要声学算法、语音唤醒、端点检测、语音识别、语言理解和语音合成等,仅仅声学算法就包括了回声抵消、噪声抑制、声源定位、混响消除、波束形成等具体算法。显然,智能语音的这种技术复杂性大幅增加了学习和开发的成本,不利于行业应用和场景落地。因此,我国有必要建设一套以操作系统为核心的中间层AI作为基础设施,并以此为契机加强人工智能领域的教育培训,抓住人工智能技术和行业与国外同步发展的契机。

SoundAI Azero是声智科技基于全球领先的远场语音交互技术,是为企业、个人及第三方开发者免费开放的全链条AI操作系统,致力于连接有价值的信息、服务与设备,让智能服务随处可享。Azero经过了数十亿次人机交互真实场景的规模验证,可为家居、办公、车载、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力。Azero默认集成了信息查询、影音娱乐、IoT控制等200+项常用技能与服务,同时提供简单好用的语音技能开发工具和一站式智能语音软硬件方案,可以极大地降低AI行业应用的开发难度和使用门槛,快速满足不同用户和行业群体的个性化需求。

本书作为SoundAI Azero智能操作系统的参考用书,侧重开发基础和应用实践,适合中学及高等院校的师生学习和实践,相应内容也将及时在SoundAI Azero网站同步更新。

由于作者水平有限,书中错误与不妥之处在所难免,恳请广大读者批评指正。

声智科技董事长兼CEO:陈孝良

2019年5月7日


目录

第一部分 智能语音技术入门

第1章 智能语音技术时代的来临

1.1智能语音的趋势与挑战

1.2如何学习智能语音开发

第二部分 如何开发语音交互技能

第2章 技能接入

2.1技能概述

2.1.1什么是技能

2.1.2技能的类型

2.1.3如何与技能交互

2.2技能交互设计规范

2.2.1技能场景定义

2.2.2技能语料设计

2.2.3技能引导设计

2.2.4多轮对话设计

2.2.5技能风格设计

2.2.6技能发布设计

第3章 技能接入案例研究

3.1自定义技能案例

3.1.1技能接入条件

3.1.2初级技能案例分析

3.1.3中级技能案例分析

3.1.4相关接口介绍

3.2内容信源技能案例

3.2.1技能创建流程

3.2.2相关接口介绍

3.3智能家居技能案例

3.3.1智能家居介绍

3.3.2技能接入条件

3.3.3技能创建流程

3.3.4相关接口介绍

第三部分 如何升级成智能语音硬件产品

第4章 设备接入

4.1设备接入介绍

4.2 设备接入流程

第5章 设备接入协议

5.1 设备介绍

5.1.1 设备简介

5.1.2 设备特点

5.2 设备架构协议介绍

5.2.1底层架构图

5.2.2应用层架构图

5.3 设备业务接口介绍

5.3.1 设备开发架构

5.3.2 通用接口

5.3.3 micbasex业务接口

5.4 设备基础业务介绍

5.4.1主程序业务

5.4.2 Basex业务

5.5 设备集成并使用Demo

5.5.1交叉编译

5.5.2 Demo运行

第四部分 开发套件

第6章 SoundPi Cube智能开发魔盒

6.1 认识SoundPi

6.1.1 设备基本参数

6.1.2 设备包装清单

6.1.3 设备接口说明

6.2 使用SoundPi

6.2.1 安装与配置

6.2.2 使用设备功能

6.2.3 安装最新的Azero apk

6.3 重置SoundPi

6.3.1 固件安装

6.3.2 卸载Azero app

第7章 SoundPi Mini Board开发套件

7.1 认识SoundPi Mini Board开发套件

7.1.1 设备基本参数

7.1.2 设备接口说明

7.2 使用SoundPi Mini Board

7.2.1 连接设备

7.2.2 使用设备功能

7.3 重置SoundPi Mini Board

7.3.1 固件安装

7.3.2 结束Azero app

7.3.3 更新网络


产品特色