前 言
为什么要写这本书作为互联网大数据行业的从业者,笔者将自己在这个行业中所掌握的知识、在日常工作中遇到的问题以及积累的项目经验整理成书,在这里和大家分享。希望通过本书能给读者一些新的理解和应用的思路,如果书中的内容能让你有些许收获,能够解决你工作中的一两个问题,那将是笔者的荣幸。
本书特色本书从实践出发,结合工作中数据运营经验,以应用案例为主线,通过业务分析+代码实践这种更“接地气”的方式讲述数据的应用。书中对搭建数据监控指标体系、数据分析、数据挖掘、AB Test、埋点策略、用户画像建模等常见数据运营方式做了详细介绍。
根据读者的阅读习惯,本书由浅入深地分为基础篇、应用篇和提高篇三部分。
基础篇讲解数据运营常见场景、运营方式与数据运营人员的工作职责。
应用篇讲解数据分析方法与应用方式,并通过5个实际数据分析挖掘案例帮助读者深入理解数据运营方式。在内容编排上先提出案例应用背景和目标,再阐述分析方法和建模流程,最后完成数据的处理和业务上的应用。
提高篇讲解当下热门的“用户画像建模”,从建模流程、标签开发到画像应用,并辅以案例,讲解如何用HQL语言建立一个图书电商场景的用户标签体系,以帮助读者更深入地理解用户画像是如何建模打标签的。
本书没有过多复杂的理论公式,所讲案例操作步骤详细,可作为数据分析运营人员在解决实际问题中参考的“action book”。
本书适用对象对数据分析及数据挖掘感兴趣的大专院校师生及其他初学者对互联网行业数据分析、用户画像建模感兴趣的数据运营人员互联网行业的产品运营人员及产品经理各行各业的数据分析师如何阅读本书本书以互联网企业中常见的数据运营场景为切入点,以工作中实际面临的问题为案例,从方法、技术、业务、实践4个维度讲述数据运营的场景及应用方式。全书共分10章,各章的主要内容如下:
第1章介绍企业中数据的应用方式、企业数据职能架构与组成、数据运营人员的工作职责和应掌握的技能。
第2章介绍数据运营规划,常见的运营场景以及如何结合数据展开用户运营和流量运营工作。
第3章讲述如何结合业务搭建数据监控指标体系,从搭建模板到自动化数据报表,做好日报、周报、月报、专题分析报告等日常数据运营工作。
第4章是本书的重点章节,讲述了数据分析中常用的方法及其应用场景,包括常见营销理论、数据分析思路、AB Test分析以及埋点策略与分析。对数据分析感兴趣的人员可着重看此章节。
第5~9章是数据分析挖掘中的几个具体案例,从数据运营的实际应用场景出发,以案例的形式讲述了如何在某些常见的业务需求背景下,分析项目需求,厘清思路,展开数据分析并输出报告和结论。案例中的关键步骤都附上了详细的代码说明。
第10章是本书的重点章节,先介绍了什么是用户画像、应用场景、开发流程,然后以案例的形式讲解了用户画像建模过程中的需求分析、建立模型、打标签、计算标签权重、画像数据管理、用户画像应用等环节,并为案例附上了详细的代码说明。想要了解如何在用户画像建模过程中建模打标签的人员可着重看此章节。
勘误和支持由于笔者水平有限,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。为此,读者可通过邮箱(
[email protected])或微信(administer-00001)反馈有关问题,笔者将尽全力为读者提供解答。书中的源代码可以从Github网站(https://github.com/HunterChao/book)下载。
致谢在本书的编写过程中,得到了许多朋友的帮助,感谢天善智能创始人梁勇的支持与帮助,感谢为本书撰写推荐的朋友们,感谢你们的支持及专业的建议。
感谢机械工业出版社华章公司的杨福川副总编,本书从2017年4月开始筹划,从确定基本框架到后期的写作,杨总编不断地给笔者以指导,感谢杨总编的帮助与支持,与他的合作总是十分愉快!感谢机械工业出版社编辑李艺老师,李艺老师用严谨的态度孜孜不倦地帮助我们修改稿件。
谨以此书献给众多互联网运营人员和数据分析师们!