书籍作者:李鑫 | ISBN:9787121336959 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:5942 |
创建日期:2021-02-14 | 发布日期:2021-02-14 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
当产品经理遇上大数据时代,数据产品经理应运而生。新时代的新岗位自然也有新要求。数据思维、数据预处理、数据统计、数据挖掘、数据可视化等是产品经理的必备技能。懂产品、懂运营、懂市场、懂表达、懂管理则是数据分析师的技能外延。《数据产品经理必修课:从零经验到令人惊艳》正是为有志于从事数据产品岗位的人士提供掌握上述技能的必修课。
让我们通过《数据产品经理必修课:从零经验到令人惊艳》,在大数据的浪潮中乘科技与人文的扁舟,驶过数据产品经理的港湾,驶向数据科学家的彼岸。
李鑫,于中国科学技术大学获计算机科学博士学位,悉尼科技大学访问学者,大数据分析与应用安徽省重点实验室研究员,中国互联网协会青年专家。现任科大讯飞研究院研究主管,先后负责大数据与人工智能技术在教育、脑科学等领域落地的业务,在国际知名学术会议与期刊发表论文近30篇。
由于各大公司开展大数据战略,而原有的产品经理在转型数据产品经理的过程中先天缺失数据思维与相应技能,因而在进行数据产品规划时具有短板。为了弥补各大公司数据产品经理在技术领域的短板,本书应时而生。
√ 面向传统行业产品经理转型
√ 彻底打破高深数学公式的入门门槛
√ 兼顾软硬技能,融合知识体系化与实战经验化
数据产品是什么
倘若我提出这样一个问题:数学中的1、2、3分别代表什么?你心中会有什么样的思考,又会有什么样的答案呢?早在2500年前的古希腊,毕达哥拉斯学派就已经给出了答案:点、直线与平面是对这三个数字的几何描述;源头、两性与稳定则是对它们深层次内涵的诠释。由此看来,数学有着神秘的意义。难怪古希腊数学家普洛克拉斯会说:“哪里有数学,哪里就有美。”
数据一词事实上是按照宾语前置的方式来构词的,所以我们可以理解为“据数”或“以数为据”,意思是把数据当成考究的凭证。正如数学是人类早期复杂贸易催生的结果,数据先天也带有商业的属性。从结绳记账到珠算发明,从证券股票到数字广告,我们甚至可以模仿先贤的口吻说道:“哪里有数据,哪里就有商业。”
历史的车轮已滚过千年,但数据的概念并未行将迟暮,垂垂老矣,反而老当益壮,焕发生机,这都要归功于“大数据”概念的产生。对于大数据这一概念,行业中有人将其归功于某家公司,有人将其产生与某位学者联系起来,但他们更多地是这个概念的精神作者,大数据真正的作者应该是接受并使用它的人,从这点来说,消费者才是其真正的衣食父母。
然而数据毕竟是一个虚构的概念,当我们谈论数据的时候,我们并没有办法在物理世界中找到一个实物来说明其客观存在。也许你会拿出刚打印出的报表,并反驳我说:“难道这不是数据吗?”可是你指的究竟是白色的纸还是黑色的油墨呢?由此可见,数据之名,需要借以载体之实才可以发挥价值,我们身边的产品就是这样一类载体。这么看来,打印出来的报表,包括邮寄上门的水电费单据,都是数据产品。
数据产品的内涵应该不止这么肤浅,要不然岂不是“人人都懂数据产品”了?数据产品最为重要和关键的价值是驱使行动。水电费单据驱使我们缴费,推荐系统驱使我们阅读,财务指标驱使公司制定战略,就连菜市场用于标注商品价格的黑板也能驱使人们采购。如此看来,一个不能够驱使行动的数据产品其价值可能要大打折扣了。
让我们再次回顾一下数据产品这个概念,人的行动产生贸易,贸易产生数据,数据通过产品展现,数据产品驱动人的行动,人的行动又产生数据……周而复始,形成闭环。这才是一个完整的数据产品。
为什么要写此书
有关产品经理的著作有很多,仅在2017年,我拜读过的就不下15本。从琳达?哥乔斯到苏杰,从乔克?布苏蒂尔、卢克?米勒到陈峻锐、闫荣、后显慧、刘飞,我的产品思维便是从他们的荟萃中汲取的营养,因此你也许会从本书中读到他们的部分观点。关于大数据技术的书更是数不胜数,倘若将概念扩展到数据挖掘与机器学习领域,光是近几年出版的书籍便已不胜枚举。
如此说来,市场上似乎并不缺少有关数据产品的书,读者只需要兼读两者即可。那么为什么我又要写这本书呢?
著书并非我的本意,我的初心只是分享,这些内容最初被我写在我的个人头条号上,因为我信仰“分享是最好的学习方式”。在分享的过程中当然会受到质疑,但回答质疑乃至承认错误也是学习与进步的一部分。著书不过是分享的一种渠道罢了。
依我有限的阅读量和浅见来看,大多数技术类书籍充满了大量面向“圈内人”的专业术语,每一个术语都像是横梗在读者通往知识彼岸道路上的一座大山。并不是所有的读者都需要,或者愿意,甚至有能力“逢山开路”。“知识若庞杂到无法在民众中普及,则极易沦为经院哲学,甚至演化为民众对权威的盲目迷信”,威尔?杜兰特如是说。因此美国历史学家詹姆斯?哈维?罗宾逊号召“拆除壁垒,还知识于民众”,我仅仅是众多拥趸者之一罢了。
恰逢此时,我拜读了英国作家赫伯特?乔治?威尔斯(Hebert George Wells)的《世界史纲》,这本装订成上下册的历史界的“红宝书”可以算是开了“概论”的先河,行文有趣,笔法生动,让我一个在历史方面十分愚钝的人也感起兴趣来。我也拜读了吴军老师与涂子沛老师几乎所有的著作,书中所介绍的科技背后的历史桥段让我反复咂摸。《吴晓波频道》和《罗辑思维》对我也颇有启迪。或许,将理性的数据用感性的故事进行呈现,是一种更易于让读者接纳的方式。我不禁这样想。
数据冷酷得像一个法官,故事却像富有温情的妇人,理性与感性的矛盾不言而喻。不仅如此,科技与人文的较量,非虚构与文学的角力,也都正在进行。尽管美国作家菲茨杰拉德告诉过我们:“测验一个人的智力是否属于上乘,只看脑子里能否同时容纳两种相反的思想,而无碍于其处世行事。”但知易行难。
为了获得这样的智慧,我们需要找到途径和方法。好在查理?芒格、赫伯特?西蒙(司马贺)以及小泉英明各自都著书立说,为我们提供了工具与方向。这是一种被称为多学科交叉的思考方式,我也希望用这种方式来写作与分享,让这本书在丰富内容之余兼具有趣的灵魂。
本书内容
全书分四大部分,共计15章,每部分及每章的具体内容如下。
第一部分 产品经理的前世今生
第1章 产品经理的前世
产品经理一词究竟是何意义?该岗位从何而来?广义与狭义上有何区别?当前互联网行业的产品经理究竟做些什么?本章将为你一一揭晓。
第2章 产品经理的今生
提出管理动机、广义竞品分析与交互设计这样的对产品经理的更高要求。另外,本章也将梳理产品经理在产品、团队、公司层面必须迈过的雷池。
第3章 产品经理的入行
“宽进严出”是产品经理岗位的特色,低门槛使得初入此行甚是轻松,高要求则使得出类拔萃愈加困难。本章将介绍从事产品经理的人员该具备什么样的视野,又该在工作中如何学习。
第二部分 古往今来的数据思维
第4章 历史中的数据思维
数据埋点、数据可视化、数据产品落地、数据驱动决策、利用数据降本增效、统计分析以及打通数据孤岛这些老生常谈的话题似乎可以在过往的岁月中找到关联。本章向历史溯源,给出老概念的新故事,诉说新时代的旧往事。
第5章 行业拥抱数据思维
从蓝色星球到960万平方公里的泱泱大国,从与政府密切联系的科教文卫体到与民生息息相关的衣食住行,本章将介绍大数据渗透到的每一处角落。
第6章 当产品经理遇见数据思维
当产品经理遇见数据思维的时候,不仅有“眼前的苟且”——数据产品经理,还有“诗和远方”——数据科学家。从现实到理想的距离,本章将为你搭梯。
第三部分 数据产品经理的技能进阶
第7章 面向产品经理的数据预处理
“磨刀不误砍柴工”,做好数据预处理可以为数据分析与挖掘过程节省许多时间。本章从数据清洗、数据集成、数据变换以及数据规约四个角度全面阐述数据预处理的相关知识。
第8章 面向产品经理的统计分析
本章从非时序数据与时序数据、分类数据与连续数据的角度,介绍数据统计与数据分析的概念及技巧。
第9章 面向产品经理的数据挖掘
本章旨在讲清楚数据挖掘的方方面面,内容包括回归、分类、聚类、关联分析和时间序列分析等数据挖掘算法,以及在此基础上的集成学习、文本挖掘、社交挖掘、排序算法、推荐系统以及用户画像。最后以这些算法中蕴含的哲学内涵作为结束。
第10章 面向产品经理的数据可视化
数据可视化是“技术与美”的最好结合。本章分别介绍“高大上”与“接地气”的两类数据可视化,并从数据展现和逻辑修饰两个层面介绍识别数据“说谎”的技巧,最后给出数据可视化的终极形式——数据报告的制作方法。
第11章 向数据科学家再迈一步
本章介绍与数据产品岗位相关的另外三个岗位,分别是运营、研发与市场。在通往数据科学家的铸鼎之路上,这三足必不可少。
第四部分 数据产品经理的自我修养
第12章 学习力:借方法论加速
本章系统介绍工作中遇到的各种方法论,并概括总结诸多方法论的“模板”,最后提出笔者自己的学习方法论,帮助读者建立工作中的“理论自信”。
第13章 表达力:用逻辑学帮衬
本章从“为国考正名”谈到“名著中的名言警句”,详细介绍产品经理日常工作与案头写作的心得,以及汇报与分享中极具感染力的“故事思维”。
第14章 领导力:以经济学诠释
本章在经济学原理中找到管理学中领导力的跨学科基础——无论是团队制定目标时的“举旗定向”,还是实际工作时的“谋篇布局”;无论是团队内部配合的“取长补短”,还是团队之间协作的“互利共赢”。
第15章 软实力:靠心理学打造
本章通过心理学中的若干现象与小实验,介绍帮助数据产品经理灵活驾驭本职工作的若干心得与技巧。
第一部分 产品经理的前世今生
第1章 产品经理的前世
1.1 产品经理究竟是什么 4
1.1.1 咬文嚼字说产品经理 4
1.1.2 产品经理的历史溯源 5
1.2 泛产品经理与产品经理 6
1.2.1 产品经理的专业取向 7
1.2.2 产品经理的泛化 8
1.3 互联网产品经理的规定动作 12
1.3.1 需求调研 12
1.3.2 竞品分析 14
1.3.3 原型设计 16
第2章 产品经理的今生
2.1 卖家秀:自我提升的几项技能 20
2.1.1 从需求文档到动机文档 20
2.1.2 从竞品分析到广义竞品分析 22
2.1.3 从原型设计到交互设计 24
2.2 买家秀:弄垮团队的若干“要领” 28
2.2.1 越过产品雷池 28
2.2.2 踏入团队雷池 29
2.2.3 迈向公司雷池 30
第3章 产品经理的入行
3.1 入行做产品的几种可能 34
3.1.1 源自技术岗 34
3.1.2 源自业务岗 35
3.1.3 源自应届生 36
3.2 上岗后的第一件事 37
3.2.1 产品全图 38
3.2.2 行业全图 39
3.2.3 产业全图 40
3.3 工作中如何学习 41
第二部分 古往今来的数据思维
第4章 历史中的数据思维
4.1 人口普查:最早的数据埋点策略 46
4.1.1 埋点的技术视角 46
4.1.2 埋点的时机与策略 48
4.2 命令与征服:可视化最早的用意 49
4.2.1 可视化大家说 50
4.2.2 可视化与历史 51
4.3 科技革命:助力数据产品落地 54
4.3.1 手工统计 55
4.3.2 机械统计 55
4.3.3 电子统计 57
4.4 数据驱动决策的历史溯源 57
4.4.1 美国建立时用数据分权 58
4.4.2 南北战争时用数据进军 59
4.4.3 经济发展时用数据裁判 60
4.5 管理咨询:使用数据降本增效 61
4.5.1 咨询指引数据产品方向 62
4.5.2 管理启迪思维模式更新 63
4.6 聊聊统计学 64
4.6.1 政治算术 64
4.6.2 频率学派 65
4.6.3 概率学派 66
4.7 LEHD:美国的第一个大数据项目 67
4.7.1 信息逐步开放 67
4.7.2 大数据项目开展 68
4.8 历史给我们数据思维的启示 69
4.8.1 用数据说话 69
4.8.2 向贤者取经 69
4.8.3 渐进性创新 70
4.8.4 需求创造供给 70
第5章 行业拥抱数据思维
5.1 大数据从何而来 72
5.1.1 大数据历史 73
5.1.2 自身发展 75
5.2 大数据的全球格局与中国面貌 76
5.2.1 全球格局 76
5.2.2 中国面貌 77
5.2.3 行业概览 78
5.3 大数据+“治理与交通” 81
5.3.1 治理 81
5.3.2 交通 83
5.4 大数据+“零售与金融” 84
5.4.1 零售 84
5.4.2 金融 88
5.5 大数据+“体育与教育” 89
5.5.1 体育 89
5.5.2 教育 91
5.6 大数据+“医疗与旅游” 93
5.6.1 医疗 93
5.6.2 旅游 94
5.7 大数据+“农业与制造” 96
5.7.1 农业 96
5.7.2 制造 97
5.8 大数据行业成熟了吗 97
5.8.1 行业成熟度 98
5.8.2 大数据理念 99
5.8.3 大数据趋势 100
5.9 大数据在产业中的位置 103
5.9.1 行业组成 104
5.9.2 产业构成 106
第6章 当产品经理遇见数据思维
6.1 下一站:数据科学家 110
6.1.1 数据科学的历史由来 110
6.1.2 数据科学与商业智能 111
6.1.3 数据科学的职业分类 112
6.1.4 数据分析的技能进阶 114
6.2 数据产品经理的职业新要求 115
第三部分 数据产品经理的技能进阶
第7章 面向产品经理的数据预处理
7.1 数据分析的标准姿势 128
7.2 淘洗数据沙砾(数据清洗) 130
7.2.1 缺失值 130
7.2.2 异常值 132
7.2.3 归一化 133
7.3 聚细沙成佛塔(数据集成) 135
7.3.1 实体识别 135
7.3.2 冗余性识别 136
7.4 换个姿势再来一次(数据变换) 137
7.4.1 离散化 137
7.4.2 属性构造 139
7.5 少即是美(数据规约) 139
7.5.1 特征规约 140
7.5.2 样本规约 141
第8章 面向产品经理的统计分析
8.1 说有信息量的话(非时序数据的统计量) 144
8.1.1 集中趋势 145
8.1.2 离散趋势 146
8.1.3 数据分布 148
8.2 股票指数是什么(时序数据的统计量) 148
8.2.1 “三比” 149
8.2.2 股票指数 150
8.3 男女真的有别吗(分类数据的统计量) 152
8.3.1 卡方是什么 152
8.3.2 卡方怎么算 153
8.4 相关性不是因果性(连续数据的统计量) 156
8.4.1 Pearson 156
8.4.2 Spearman 157
8.4.3 Kendall 158
8.5 数据不能承受之“熵” 159
8.5.1 物理中的“熵” 159
8.5.2 信息中的“熵” 160
第9章 面向产品经理的数据挖掘
9.1 学数据挖掘,只需要高中数学 164
9.1.1 重温“加减乘除” 164
9.1.2 重温“比值” 165
9.1.3 重温“函数” 165
9.1.4 重温“符号” 165
9.2 线性回归:人为什么没有严重两极分化 166
9.2.1 优生学趣闻 166
9.2.2 空间中的直线 167
9.3 逻辑回归:种群增长的S型曲线 169
9.3.1 种群的增长曲线 169
9.3.2 S型曲线的秘密 171
9.4 朴素贝叶斯:面相占卜工作原理 172
9.4.1 外貌协会与街头看相 173
9.4.2 无处不在的贝叶斯 174
9.5 决策树:爱情选择背后的心理学意义 176
9.5.1 爱情选择条件多 177
9.5.2 不纠结的小技巧 178
9.6 K-means:寻找物理学上的质心 181
9.6.1 向中心看齐 181
9.6.2 站错队的后果 183
9.7 层次聚类:分而治之与抱团取暖 184
9.7.1 分而治之 185
9.7.2 抱团取暖 185
9.8 DBScan:帝国崛起的定居、建国与扩张 186
9.8.1 密度打败划分 187
9.8.2 相似的帝国发展路径 188
9.9 关联规则挖掘:“啤酒和尿布”是个谎言 188
9.9.1 讹传已久的商业故事 189
9.9.2 关联规则的三重门 190
9.10 时间序列分析:聊聊《周易》 192
9.10.1 时间序列分析的玄妙 192
9.10.2 时间序列分析的正经 194
9.11 集成学习:三个臭皮匠赛过诸葛亮 195
9.11.1 多拜师与拜大师 196
9.11.2 向大家与失败学习 197
9.12 文本挖掘:让机器读懂你 199
9.13 社交网络:隐私无处遁形 202
9.14 排序:简约而不简单的事 205
9.14.1 排序的规则方法 205
9.14.2 排序的操作机理 207
9.15 推荐系统:“今日头条”背后的秘密 208
9.16 用户画像:隐私是个“伪命题” 213
9.17 算法思想中的哲学内涵 216
第10章 面向产品经理的数据可视化
10.1 别人家的可视化:阳春白雪 222
10.2 工作中的可视化:下里巴人 227
10.3 用可视化“说谎” 230
10.3.1 数据的误导 230
10.3.2 逻辑的谬误 234
10.4 准备一份数据报告 238
第11章 向数据科学家再迈一步
11.1 能文:陪运营跟踪产品看效果 244
11.1.1 传统运营的基本功 245
11.1.2 数字化运营“三”话你知 248
11.2 能武:追研发把控进度出成果 251
11.2.1 数据采集 251
11.2.2 数据存储 254
11.2.3 数据计算 256
11.2.4 数据分析 258
11.3 能聊:跟随销售面向市场找思路 258
第四部分 数据产品经理的自我修养
第12章 学习力:借方法论加速
12.1 方法论知多少 266
12.1.1 概念阐述 266
12.1.2 分类总结 267
12.2 学习过程的“满灌”与“脱敏” 269
12.2.1 理解提炼 269
12.2.2 我的方法论 271
第13章 表达力:用逻辑学帮衬
13.1 写得一手好文案 274
13.1.1 为公务员考试正名 274
13.1.2 写作实战简明教程 275
13.2 讲故事给同事听 278
第14章 领导力:以经济学诠释
14.1 事情背后的选择 285
14.1.1 选择价值链上游:剪刀差效应 285
14.1.2 学会审时度势:美林时钟 286
14.1.3 谨慎选择别人的经验:推绳子效应 286
14.1.4 平衡是一个难题:萨伊定律与凯恩斯法则 287
14.2 人员之间的协同 288
14.2.1 你闪开,让我来:绝对优势与相对优势 288
14.2.2 无条件开放:零和博弈与合作共赢 289
14.2.3 教会团队成员什么是沉没成本 290
第15章 软实力:靠心理学打造
15.1 向内求:耐心、谦逊、热心 294
15.1.1 让自己“延迟满足” 294
15.1.2 对表扬免疫 295
15.1.3 不怕丢脸地分享 297
15.2 对外看:大局、妥协、有趣 297
15.2.1 看问题需要“上帝视角” 298
15.2.2 率真对内,圆滑对外 298
15.2.3 一切从简,有趣有梦 299