实用机器学习

书籍作者：Henrik	ISBN：9787111569220
书籍语言：简体中文	连载状态：全集
电子书格式：pdf,txt,epub,mobi,azw3	下载次数：1394
创建日期：2021-02-14	发布日期：2021-02-14
运行环境：PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板

内容简介

本书介绍了实用机器学习的工作流程，主要从实用角度进行了描述，没有数学公式和推导。本书涵盖了数据收集与处理、模型构建、评价和优化、特征的识别、提取和选择技术、高级特征工程、数据可视化技术以及模型的部署和安装，结合3个真实案例全面、详细地介绍了整个机器学习流程。后，还介绍了机器学习流程的扩展和大数据应用。

本书可以作为程序员、数据分析师、统计学家、数据科学家解决实际问题的参考书，也可以作为机器学习爱好者学习和应用的参考书，还可以作为非专业学生的机器学习入门参考书，以及专业学生的实践参考书。

作者简介

　　HenrikBrink（亨里克·布林克）是一名数据科学家，对应用机器学习进行工业和学术应用开发有着丰富的经验。

　　JosephRichards（约瑟夫W理查兹）也是一位数据科学家，具有应用统计和预测分析方面的专业知识。Henrik和Joseph是Wise.io的联合创立者，Wise.io是一家提供工业机器学习解决方案的开发商。

　　MarkFetherolf（马克·弗特罗夫）是数据管理和预测分析公司NuminaryDataScience的创始人和总裁。他曾在社会科学研究、化学工程、信息系统性能、容量规划、有线电视和在线广告应用等方面担任统计师和分析数据库开发人员。

编辑推荐

随着阿尔法狗在围棋领域高奏凯歌，人工智能领域已成为当前引人注目的风口，而机器学习又是这风口中的风头劲的热点。本书从实战角度剖析了机器学习的知识原理，读者无需担心遇到难懂的数学公式和推导，就能够将机器学习的知识应用在自己熟悉的领域。《实用机器学习》还包含了三个机器学习真是应用的综合案例，本书所有代码资源都可以通过网络下载，读者还可以登录GITHUB与全球的机器学习爱好者共同交流本书的学习体验。

前言

　　《实用机器学习》的读者对象是针对想要把机器学习应用于实际问题的人。它详细阐述了机器学习的主要组成部分：工作流程、算法和工具。关注点是著名算法的实际应用，而不是创建一个算法。构建和使用机器学习模型的每个步骤都有详细描述，并有从简单到中等复杂的实例与之对应。

　　主要内容

　　第1部分，“机器学习工作流程”介绍基本的机器学习工作流程，并分章节对每个步骤加以介绍。

　　第1章，“什么是机器学习”介绍机器学习的应用领域和用途。

　　第2章，“实用数据处理”，详细介绍机器学习流程中的数据处理和准备工作。

　　第3章，“建模和预测”，介绍构建简单的机器学习模型，并利用应用广泛的算法和库进行预测。

　　第4章，“模型评估和优化”，深入研究机器学习模型，并对其进行评估和性能优化。

　　第5章，“基础特征工程”，介绍利用领域知识对原始数据进行提高的常用方法。

　　第2部分，“实际应用”，介绍模型规模化和从文本、图片和时间序列数据中提取特征的技术，来提高绝大多数现代机器学习的性能。本部分包括3个有完整实例的章节。

　　第6章，“实例：NYC出租车数据”，这是第一个完整实例章节，会预测乘客的倾向性行为。

　　第7章，“高级特征工程”，包含高级特征工程过程，介绍从自然语言的文本、图片和时序序列数据中提取有价值的数据。

　　第8章，“NLP高级案例：电影评论情感预测”，运用高级特征工程知识预测在线电影评论的情感。

　　第9章，“扩展机器学习流程”，介绍扩大机器学习系统的数据规模、预测吞吐量和降低预测间隔的技术。

　　第10章，“案例：数字显示广告”，构建大型数据的模型，预测数字广告点击行为。

　　如何使用本书

　　如果你是机器学习新手，第1~5章将引导你学习研究和准备数据、特征工程、建模和模型评估过程。Python实例采用流行的数据处理、pandas和Scikit-Learn机器学习库。第6~10章，包括3个实际机器学习案例、高级特征工程和优化的话题。由于学习库封装了大部分的复杂性，因此代码示例可以很容易地应用到你自己的机器学习系统中。

　　目标读者

　　本书可以使程序员、数据分析师、统计学家、数据科学家和其他专业人士将机器学习应用于实际问题，或者简单地理解它。他们将获得实用数据建模、优化和开发机器学习系统的经验，而没必要了解特定算法的理论推导。机器学习的数学基础是针对感兴趣的人的，某些算法在较高的层次上进行解释，本书提供给那些想深入学习的人，我们的焦点是获得实际结果以解决手头的问题。

　　代码约定，下载和软件需求

　　本书包含许多示例源代码，或者以编号的清单出现，或者嵌入在正文中，但无论哪种情况，都以固定宽度的这种字体显示，以区别于正常的文本。

　　源代码使用Python，pandas和Scikit-Learn编写。与章节相应的iPython笔记文件可在GitHub上下载，地址为https://githubcom/brinkar/real-world-machine-learning，也可以通过关注机械工业出版社计算机分社官方微信订阅号“IT有得聊”，输入5位数号“56922”后获得资源下载链接，还可以登录golden-book.com搜索本书并进行下载。

　　笔记文件（扩展名为ipynb）与章节相对应。样本数据包含在data文件夹中，只要必需的库随iPython一起安装，那么所有的笔记文件都能执行。图形由matplotlib和Seaborn的pyplot模块生成。

　　在有些情况下，由iPython产生的图形被提取出来作为本书的插图（为了适应打印质量和电子书显示，有些已经做了修改）。

实用机器学习

内容简介

作者简介

编辑推荐

前言

目录

标签

产品特色