猜你喜欢
谁说菜鸟不会数据分析(R语言篇)

谁说菜鸟不会数据分析(R语言篇)

书籍作者:方小敏 齐德胜 张文霖 ISBN:9787121389689
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:1395
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

本书从解决工作实际问题出发,提炼并总结工作中R 语言常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习和理解的前提下,尽可能地避免使用晦涩难懂的R 语言编程、统计术语或模型公式。如果读者需要了解相关的知识,可查阅相关的图书或资料。

本书的定位是带领R 语言数据分析初学者入门,并解决在学习、工作中使用R 语言进行数据分析的大部分问题或需求。如果读者在入门后还需要进一步学习,可自行扩展阅读相关图书或资料,因为学习是永无止境的,正所谓“师傅领进门,修行在个人”。


作者简介

方小敏,“数据分析实战”公众号主理人,资深机器学习工程师;曾服务于BAT等知名互联网企业,熟练掌握Python、R、Spark、Hive、TensorFlow等工具进行机器学习。

齐德胜,“玩转Python数据”公众号主理人,资深商业智能工程师,略懂Python、R、SQL等。

张文霖,新浪博客“小蚊子数据分析”博主,资深数据分析师,曾服务于国内知名市场研究公司、中国移动等公司,具有多年移动互联网数据分析经验,略懂Excel、PPT、SPSS、水晶易表等工具。


前言

前  言

《谁说菜鸟不会数据分析》系列图书自上市以来,已拥有数十万读者与粉丝,经过口口相传,已成为职场人士案头必备的参考用书。同时,该系列图书非常荣幸地获得了“全行业优秀畅销品种”称号,这离不开广大读者的厚爱与支持。有读者告诉我们,每次阅读都会有新的体会与收获,这让我们很开心。

随着云计算、互联网、电子商务和物联网的飞速发展,世界已经逐步迈入大数据时代。数据分析、机器学习等数据科学技术开始流行起来,R 语言也越来越被大家熟悉和认可,成为数据分析师的“新宠儿”,特别是在互联网行业。

目前,市面上关于R 语言数据分析的图书大多涉及很多晦涩难懂的R 语言编程、统计术语或模型公式。而实际上这些在大多数人的日常工作中基本不会被用到,却会增加阅读难度,大大提高学习门槛,让非专业的朋友学起来较为痛苦。

鉴于此,本书作者于2015 年开始提炼和总结工作中R 语言常用的数据处理、数据分析实战方法与技巧,并录制成视频课程“R 语言数据分析实战”,发布于网易云课堂。课程在上线后,受到了大量学员的支持与肯定。同时,作者还根据大量热心学员的宝贵反馈意见,对课程不断进行升级更新。

通过视频课程“R 语言数据分析实战”的录制、升级,作者沉淀了大量的R 语言数据分析实战教学经验。同时,大量的学员与读者不断来信咨询并希望早日出版《谁说菜鸟不会数据分析(R 语言篇)》。经过两年时间的打磨,这本书终于与读者见面了。整个写作过程是艰辛的,但是令人很有成就感。

本书从解决工作实际问题出发,与其他《谁说菜鸟不会数据分析》系列图书一样,力求通俗易懂地介绍相关知识,在不影响学习和理解的前提下,尽可能地避免使用晦涩难懂的R 语言编程、统计术语或模型公式。如果读者需要了解相关的知识,可查阅相关的图书或资料。

本书的定位是带领R 语言数据分析初学者入门,并解决在学习、工作中使用R 语言进行数据分析的大部分问题或需求。如果读者在入门后还需要进一步学习,可自行扩展阅读相关图书或资料,因为学习是永无止境的,正所谓“师傅领进门,修行在个人”。

本书结构

本书以数据分析的主要流程为主线,介绍如何用R 语言进行数据分析。

第1 章 数据分析概况:主要通过2W1H 模型介绍了数据分析的相关知识,让读者了解与认识数据分析。

第2 章 R 语言概况:主要介绍了什么是R 语言、R 语言的特点、R 语言包、R语言的使用场景、R 软件和RStudio 的下载与安装,以及RStudio 的使用,让读者了解与认识R 语言。

第3 章 编程基础:主要介绍了使用R 语言进行数据分析所需要的编程基础,包括数据类型、赋值和变量、数据结构、向量化运算、for 循环,以及R 语言编程注意事项,让读者对R 语言在数据分析方面的使用有一个基本的了解与认识。

第4 章 数据处理:主要介绍了如何使用R 语言进行常用的数据处理操作,包括数据导入与导出、数据清洗、数据转换、数据抽取、数据合并、数据计算,让读者能够使用R 语言进行常用的数据处理操作。

第5 章 数据分析:主要介绍了如何使用R 语言进行常用的数据分析操作,包括对比分析、基本统计分析、分组分析、结构分析、分布分析、交叉分析、RFM 分析、矩阵分析、相关分析、回归分析等常用分析方法,让读者能够使用R 语言进行常用的数据分析操作。

第6 章 数据可视化:主要介绍了如何使用R 语言进行常用的数据可视化图形绘制,包括散点图、矩阵图、折线图、饼图、柱形图、条形图,让读者能够使用R 语言进行常用的数据可视化图形绘制。

适合人群

★ 需要提升自身竞争力的职场新人

★ 从事咨询、研究、分析等工作的专业人士

★ 在产品、市场、用户、渠道、品牌等工作中需要进行数据分析的人士


目录

第1 章 数据分析概况

1.1 数据分析的定义(What)

1.2 数据分析的作用(Why)

1.3 数据分析的步骤(How)

1.3.1 明确分析目的和思路

1.3.2 数据收集

1.3.3 数据处理

1.3.4 数据分析

1.3.5 数据展现

1.3.6 报告撰写

1.4 数据分析的三大误区

1.5 常用的数据分析工具

1.5.1 Excel

1.5.2 SPSS

1.5.3 Python

1.5.4 R 语言

第2 章 R 语言概况

2.1 R 语言简介

2.2 R 语言的特点

2.3 R 语言包

2.3.1 函数

2.3.2 包

2.4 R 语言的使用场景

2.5 RStudio 简介

2.6 R 软件和RStudio 的下载与安装

2.6.1 下载R 软件

2.6.2 安装R 软件

2.6.3 下载RStudio

2.6.4 安装RStudio

2.7 RStudio 的使用

2.7.1 RStudio 界面简介

2.7.2 项目管理

2.7.3 新建R 代码文件

2.7.4 代码提示

2.7.5 变量浏览

2.7.6 图形绘制

2.7.7 帮助文档

第3 章 编程基础

3.1 数据类型8

3.1.1 数值型

3.1.2 字符型

3.1.3 逻辑型

3.2 赋值和变量

3.2.1 赋值和变量

3.2.2 变量命名规则

3.3 数据结构

3.3.1 向量

3.3.2 因子9

3.3.3 数据框

3.3.4 列表

3.3.5 四种数据结构的区别

3.4 向量化运算

3.5 for 循环

3.6 R 语言编程注意事项

第4 章 数据处理

4.1 数据导入与导出

4.1.1 数据导入7

4.1.2 数据导出

4.2 数据清洗

4.2.1 数据排序

4.2.2 重复数据处理

4.2.3 缺失数据处理

4.2.4 空格数据处理

4.3 数据转换

4.3.1 数值转字符

4.3.2 字符转数值

4.3.3 字符转时间

4.4 数据抽取

4.4.1 字段拆分

4.4.2 记录抽取

4.4.3 随机抽样

4.5 数据合并

4.5.1 记录合并

4.5.2 字段合并

4.5.3 字段匹配

4.6 数据计算

4.6.1 简单计算

4.6.2 时间计算

4.6.3 数据标准化

4.6.4 数据分组

第5 章 数据分析

5.1 对比分析

5.2 基本统计分析

5.3 分组分析

5.4 结构分析

5.5 分布分析

5.6 交叉分析

5.7 RFM 分析

5.8 矩阵分析

5.9 相关分析

5.10 回归分析

5.10.1 回归分析简介

5.10.2 简单线性回归分析

5.10.3 多重线性回归分析

第6 章 数据可视化

6.1 数据可视化简介

6.1.1 什么是数据可视化

6.1.2 数据可视化常用图表

6.1.3 通过关系选择图表

6.2 散点图

6.3 矩阵图

6.4 折线图

6.5 饼图

6.6 柱形图

6.7 条形图


短评

送货快,服务好,活动力度大!

2020-06-02 14:33:02

产品特色