大数据实战——大数据、数据科学和人工智能在商务决策中的应用
书籍作者:大卫·斯蒂芬森 |
ISBN:9787300271927 |
书籍语言:简体中文 |
连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 |
下载次数:7630 |
创建日期:2021-02-14 |
发布日期:2021-02-14 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
内容简介
大数据远不止于简单的数据和技术,大数据更侧重于其在商业、科学和社会等领域的应用。
《大数据实战:大数据、数据科学和人工智能在商务决策中的应用》基于作者近20年大数据领域的咨询经验,分析了大数据的来源,数据范式的改变,人工智能、机器学习与大数据的关系等;通过对大数据相关的工具、应用和处理方法的总结,构建了一套大数据应用方法和体系,帮助人们构建大数据生态系统、形成大数据组织战略、选择模型和数据库、为大数据解决方案选择合适的技术、组建大数据团队等;还阐述了隐私原则、数据保护、监管合法性和数据治理等议题,并通过案例分析了因使用数据不当而陷入困境的公司;最后,结合一个备受瞩目的项目失败案例,阐述在组织中成功部署大数据应用的实践,以及在如何使组织转型为数据驱动、如何在组织中部署数据分析人员、如何有效地使用资源以整合数据方面给出建议。
作者简介
大卫·斯蒂文森(David Stephenson) 美国宾夕法尼亚大学沃顿商学院教授,数据科学和大数据分析领域国际知名咨询家。凭借近20年行业经验,以专业的视角和实用的工具指导了价值百亿美元以上的商务决策。同时,他还是**投资、私人资产和管理咨询公司的专业顾问。他领导了跨越六大洲公司的全球分析项目。
前言
你可能经常听到大数据这个词,但你真的知道大数据究竟是什么吗?大数据为什么如此重要?大数据能否对你的组织造成影响,从而带来改进和竞争优势?是否存在这种可能——不使用大数据会让你在竞争中处于劣势?
本书的目的在于解析“大数据”这一名词,同时向你提供用数据科学和机器学习来充分利用这些数据的实践方法。
大数据是一类新的数据,具有以下特点:数据量大,并且数据量还在持续、迅速地增长,同时,其数据结构并不符合传统的数据结构。“大”这个字眼是一种轻描淡写的说法,它并不能充分地说明实际情况的复杂程度。我们所处理的数据不仅仅是比传统的数据量大,更是与传统的数据有本质上的区别,就好比一辆摩托车并不是大一点的自行车,一片海洋也并非大一点的游泳池。大数据带来了新的挑战,创造了新的机会,模糊了传统的竞争界限,因而需要新的方法来帮助我们从数据中获取有形的价值。海量数据与为处理此类数据而开发的技术结合,提供了对大规模数据的洞察角度,由此掀起了一股机器学习的浪潮,产生了由计算机驱动汽车的无人驾驶系统、比医生更为精确的心脏病预测系统,以及比人类更精通复杂游戏(如围棋)的计算机系统。
为什么大数据是一个规则的改变者?正如我们将看到的,通过大数据,我们可以获得对数据更深层次的洞察力,从而理解促进消费者购买的因素以及生产线效率降低的原因。大数据不仅可以让商家实时地为全球数以百万计的用户提供高度个性化的体验,而且能够为诸如癌症研究、航天、粒子物理学等领域提供同时分析十亿量级数据的计算能力。大数据还提供了数据和计算资源,使得人工智能重新崛起,其中最具代表性的就是引领全球的基于深度学习的技术。
没有局限于数据本身,在过去的二十年里,研究者和工程师们还开发出了硬件和软件结合的一整套生态系统,来收集、存储、处理和分析这些丰富的数据。本书将这些硬件和软件工具统称为大数据生态系统。这一生态系统能够帮助我们从大数据中挖掘出巨大的价值并将其应用于商业、科学和健康领域。想要利用大数据,你需要将大数据生态系统中的各个部分整合在一起,并选择出适合你的应用场景的最佳解决方案。
目录
目录
第一部分大数据揭秘
第1章大数据的故事
到了21世纪初,是什么发生了改变
数据为什么变得这么多
产生数字化数据设备的广泛应用
正在迅速下降的磁盘存储成本
RAM成本的直线下降
处理能力成本的直线下降
为什么大数据成为如此火热的话题
成功的大数据先驱者
开源软件为软件开发人员提供了竞争环境
云计算让启动和扩展计划变得更加容易
小贴士
问题
第2章人工智能、机器学习和大数据
什么是人工智能和机器学习
人工智能的起源
为何近来人工智能又再次兴起
人造神经网络和深度学习
人工智能如何帮助分析大数据
一些谨慎的话
小贴士
问题
第3章为什么大数据有用
全新的数据使用方式
一种新的数据思维方式
遵循数据驱动的方法
更强的数据工具
小贴士
问题
第4章大数据分析的应用案例
A/B测试
推荐引擎/下一个最佳购物建议
预测:需求和收入
节省IT成本
市场营销
社交媒体
定价
客户维系/客户忠诚度
购物车弃置管理(实时)
转化率优化
商品定制化(实时)
重新定位(实时)
诈骗检测(实时)
减少客户流失
预测维护
供应链管理
顾客终身价值
线索评分
人力资源
情绪分析
小贴士
问题
第5章理解大数据生态系统
什么让数据变“大”
分布式数据存储
分布式计算
快速数据/流数据
雾计算/边缘计算
开源软件
许可
代码分发
开源的好处
大数据中的开源软件
云计算
小贴士
问题
第二部分将大数据生态系统应用到组织中
第6章大数据如何指导组织战略
你的客户
获取数据
使用数据
你的竞争者
外部的因素
你的产品
小贴士
问题
第7章形成大数据和数据科学的战略
项目团队
启动会议
启动输出
范围界定阶段
小贴士
问题
第8章实施数据科学――分析、算法和机器学习
四种分析方法
模型、算法和黑箱
人工智能和机器学习
分析软件
分析工具
敏捷分析
小贴士
问题
第9章选择技术
交付给最终用户
选择技术时需要考虑的方面
小贴士
问题
第10章组建团队
数据科学家
你需要的数据角色
领导力
雇用数据团队
大规模招聘和收购创业公司
外包
对于小型公司而言
小贴士
问题
第11章数据治理与法律遵从
个人数据
数据科学和隐私披露
数据治理
治理报告
小贴士
问题
第12章在组织中成功部署大数据
我们的项目为何失败了
总结
小贴士
问题
术语