猜你喜欢
机器学习实战:基于Sophon平台的机器学习理论与实践

机器学习实战:基于Sophon平台的机器学习理论与实践

书籍作者:星环科技人工智能平台团队 ISBN:9787111642657
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:6403
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

本书内容覆盖了机器学习领域从理论到实践的多个主题-总共分为10章。

第1章为导论-介绍机器学习的背景、定义和任务类型-构建机器学习应用的步骤-以及开发机器学习工作流的方式。

第2章详细介绍数据预处理和特征工程技术-并辅以实例进行验证。

第3~6章介绍回归模型、分类模型、模型融合和聚类模型-这些内容是机器学习理论和实践中的传统重点。其中不仅介绍各种常见数据类型的处理方法-还针对删失数据进行了专门的综述和实践。

第7章介绍机器学习领域较难的图计算话题-并从工业界视角解读如何将图计算落地。

第8章针对特征工程、建模过程中大量调参的场景介绍自动机器学习的理论和应用-并细致比较和测试了各种自动特征工程算法在不同数据上的表现。

第9章介绍自然语言处理(词向量、序列标注、关键词抽取、自动摘要和情感分析)技术-使用新闻文本数据搭建文本分类的流程。

第10章介绍计算机视觉中图像分类和目标检测的应用以及车辆检测的落地案例。

本书既适合作为高等院校计算机、软件工程、人工智能等相关专业的教学用书-同时也可供从事机器学习相关领域的工程技术人员阅读和参考-帮助他们掌握机器学习相关的算法原理-并能通过专业工具平台快速搭建各类模型-构建机器学习的行业应用。


作者简介

星环科技人工智能平台团队

星环科技人工智能平台团队由五十多位优秀的研发工程师和算法工程师组成,逾八成具有国内外名校硕士及以上学历。其中研发子团队的工作重心为一站式人工智能建模平台Sophon;算法子团队则负责基础算法的研发及改进,并在数据挖掘、传统机器学习、计算机视觉、自然语言处理、知识图谱等领域进行前瞻性研究以及项目实施落地。星环科技人工智能平台团队一直致力于“把中国人自主研发的领先创新技术赋能全世界各行各业,促进社会可持续发展,通过科技让人类的生活更美好”。目前产品应用已覆盖金融、安防、电力、交通、教育等数十个行业和领域,申请专利近三十个。

编辑推荐
适读人群 :机器学习工程师、算法工程师、大数据分析师、智能系统架构师、人工智能产品经理

(1)星环科技人工智能平台团队合著,凝结星环科技人工智能和大数据团队丰富的实战经验

(2)从技术视角提供当前人工智能相关技术的深入介绍,不仅讲解人工智能知识体系的理论基础,也可以指导基于实战的平台环境进行操作。

(3)针对各种类型的机器学习问题,基于星环自研的人工智能平台(Sophon)环境,结合真实案例,依照数据、分析、建模的演进历程进行系统化阐述并进行实战讲解。


前言

人工智能技术的快速发展,带来了技术平台和行业应用的繁荣,从Caffe、CNTK、CoreML到TensorFlow、TensorRT,从CPU、GPU到TPU、FPGA、ARM,从图形处理、视觉识别到自然语言处理,技术体系越来越复杂,开发门槛越来越高;大量的技术人员需要不断授受技术更新,更多的应用需要考虑额外的迁移成本,更多的市场需要投入大量的资源以充分体现人工智能赋予的价值。

目前产业界开始出现少量技术使用门槛低、应用开发方便的机器学习平台(Machine Learning Platform,MLP)或者数据科学平台(Data Science Platform, DSP),但这些平台大部分还局限在特定行业的有限算法应用,需要不断进行架构优化、模型扩展和算法增强,提供多种场景下的应用迁移工具,才能形成较为成熟的产品化平台。

星环科技作为国内大数据和人工智能平台的领航者,自2013年成立以来,专注于企业级容器云计算、大数据和机器学习核心平台的研发和服务,拥有一批来自国内外著名高科技企业和科研院校的优秀专业人才,是国内大数据领域最早掌握核心技术的企业,也是最早开展机器学习平台理论与实践的公司之一,产品在政府、金融、公安等行业得到大规模应用。

星环科技人工智能平台Sophon是从大数据到人工智能演进过程中诞生的一款创新性机器学习技术平台。用户可以基于该平台快速完成从特征工程、模型训练到模型上线的机器学习全生命周期开发工作。

Sophon平台具有以下技术特点:

q采用去中心化的全分布式架构、性能线性扩展,满足海量数据处理模式下的快速训练和精准推理要求。

q一站式的机器学习集成开发平台,支持自动化开发、图形化操作及可视化建模,可快速构建行业应用解决方案。

q支持多种复杂算法,支持自定义模型和算法导入,可适应多种特定应用场景的复杂建模和模型迁移要求。

q集成大量面向行业领域的分析工具,如实体画像、视频分析、自然语言处理等,便于第三方应用快速定制开发。

q支持深度学习的知识图谱,能够便捷实现含图结构的应用建模,支持实体间多关系图的分析展示和演进变化,发现更有价值的图谱关系。

随着使用机器学习平台的用户越来越多,应用场景日益广泛,非常需要一本关于机器学习理论总结和实践指导的专业图书,不仅可以讲解整体知识体系的理论基础,也可以作为使用星环人工智能平台(Sophon)工具的指导手册。

目前市面上销售的机器学习相关书籍,要么偏重原理介绍和公式推导,要么重点描述开源算法的实现调用,无法满足二者兼顾的要求。为此,我们结合理论分析和实践指导要求,编写了这本面向机器学习一线工程技术人员的专业书籍。它既能帮助读者深入理解相关算法原理,也有助于读者学会利用专业工具平台快速搭建模型,构建机器学习的行业应用。

本书内容覆盖了机器学习领域从理论到实践的多个课题,总共分为10章。

第1章为导论,介绍机器学习的背景、定义和任务类型,构建机器学习应用的步骤,以及开发机器学习工作流的方式。

第2章详细介绍数据预处理和特征工程,并辅以实例进行验证。

第3~6章介绍回归模型、分类模型、模型融合、聚类模型,这些内容是机器学习理论和实践中的传统重点。其中不仅介绍对各种常见数据类型的处理方法,还针对删失数据进行了专门的综述和实践。

第7章介绍机器学习领域较难的图计算,并从工业界视角解读如何将图计算落地。

第8章针对特征工程、建模过程中大量调参的场景介绍自动机器学习的理论和应用,并细致比较和测试了各种自动特征工程算法在不同数据上的表现。

第9章介绍自然语言处理(词向量、序列标注、关键词抽取、自动摘要和情感分析),使用新闻文本数据搭建文本分类的流程。

第10章介绍计算机视觉中图像分类和目标检测的应用以及落地案例(车辆检测)。

书中的第1~2章是基础内容,建议读者认真阅读,其他章节则可根据需要选择性地阅读。

全书由孙元浩和杨俊统一主持和整理,参与编写的作者还包括杨一帆、裴瑞光、林木丰、乐向楠、陆增翔、蒲瑜琪、李祥祥、曾宪宇、赵文谦、林晨、浦锦毅、安磊、许凯琪、孙乐飞和吴香莲。

本书从雏形到定稿,历时近一年,非常感谢参与本书编纂校对工作的算法工程师和架构师,没有他们无私的理论分享和实践指导,本书是难以高质量完成的。在此我们对所有编者表示衷心的感谢和敬意。


孙元浩

2019年7月


目录

前言

丛书前言

本书编委会

前言

第1章 机器学习导论

1.1 什么是机器学习

1.1.1 机器学习的背景

1.1.2 机器学习的定义

1.1.3 机器学习的任务类型

1.1.4 构建机器学习应用的步骤

1.2 开发机器学习工作流的方式

第2章 数据预处理与特征工程

2.1 特征提取

2.1.1 探索性数据分析

2.1.2 数值特征

2.1.3 类别特征

2.1.4 时间特征

2.1.5 文本特征

2.1.6 过滤方法

2.1.7 封装方法

2.1.8 嵌入方法

2.1.9 自动化特征工程

2.2 交互式数据预处理

2.3 本章小结

第3章 回归模型

3.1 回归任务概述

3.2 回归算法原理

3.2.1 线性回归

3.2.2 决策树回归

3.2.3 生存回归

3.3 Sophon 案例

3.4 本章小结

第4章 分类

4.1 分类任务概述

4.2 分类算法原理

4.2.1 逻辑回归

4.2.2 因子分解机

4.2.3 XGBoost

4.3 使用 Sophon 建立分类模型

4.3.1 场景介绍

4.3.2 建模过程

4.3.3 结果分析

4.4 本章小结

第5章 模型融合

5.1 集成学习理论

5.1.1 集成学习基本概念

5.1.2 个体学习器

5.1.3 基学习器集成

5.1.4 常用的集成学习方法

5.2 常用融合方法

5.2.1 平均法

5.2.2 学习法(Stacking 方法)

5.3 使用 Sophon 进行模型融合

5.3.1 场景与数据集介绍

5.3.2 建模过程

5.3.3 结果分析

5.4 本章小结

第6章 聚类 78

6.1 聚类任务概述

6.2 聚类算法原理

6.2.1 K-Means

6.2.2 Fuzzy C-Means

6.2.3 Canopy

6.2.4 高斯混合

6.3 聚类模型实例

6.3.1 场景介绍

6.3.2 建模过程

6.3.3 结果分析

6.4 本章小结

第7章 图计算

7.1 背景和问题描述

7.2 常用算法介绍

7.2.1 PageRank

7.2.2 标签传播

7.2.3 中心性检测

7.2.4 图嵌入

7.3 落地案例

7.3.1 场景介绍

7.3.2 建模过程

7.3.3 结果分析

7.4 本章小结

第8章 自动机器学习

8.1 场景介绍

8.2 自动化特征工程

8.2.1 自动多表特征扩展

8.2.2 自动特征构建

8.3 建模过程

8.4 结果分析

8.5 真实测试案例

8.5.1 数据集

8.5.2 前置设置

8.5.3 测试结果分析

8.5.4 Abalone 和 Airfoil Self-Noise 数据集的增强测试

8.5.5 小结

8.6 本章小结

第9章 自然语言处理

9.1 自然语言处理算法原理

9.1.1 词向量

9.1.2 序列标注

9.1.3 关键词抽取

9.1.4 文本自动摘要

9.1.5 文本情感分析

9.2 使用 Sophon 建立自然语言处理模型

9.2.1 场景介绍

9.2.2 建模流程

9.2.3 模型评估

9.3 落地案例

9.4 本章小结

第10章 计算机视觉

10.1 计算机视觉概述

10.2 计算机视觉算法原理

10.2.1 图像分类

10.2.2 目标检测

10.3 计算机视觉模型示例

10.3.1 图像预处理

10.3.2 图像分类算法建模

10.3.3 目标检测算法建模

10.4 落地案例

10.5 本章小结

附录A 企业级人工智能应用平台Sophon

A.1 产品架构

A.2 技术特点

A.3 组件介绍能

A.4 Sophon Edge 边缘计算

A.5 Sophon EP 实体画像

A.6 Sophon KG 知识图谱

A.7 Sophon CV 图像分析

A.8 Sophon NLP 自然语言处理

A.9 Sophon Cloud 服务管理

产品特色