数据可视化是一种非常重要的技能,能够帮助人们快速理解信息,分析数据中存在的趋势,识别关系中的模式。当人们有了新的见解后,往往需要将这些见解传达给其他人,在传达的过程中,使用图表、图形或其他对视觉有影响的表现形式非常重要,因为这些表现形式吸引人并可以迅速传达信息。
R是由统计学家设计的专门用于统计计算的语言,它也是一种非常好的数据可视化工具。随着技术的进步,数据公司或研究机构对数据的收集变得越来越复杂,许多人已经采用R语言作为分析数据的首选语言。R语言适用于机器学习、数据分析、数据可视化及科学计算等领域。它有多个主题的软件包,如计量经济学、金融学和时间序列等,也拥有一流的可视化、报告和交互性工具。这些工具对于企业和科学研究都非常重要,被科学家、工程师和商业人士广泛使用。
笔者多年来一直以R语言为工具从事数据可视化、数据分析、统计建模和机器学习等数据科学工作,在工作中积累了大量的经验,对R语言的原理和应用有比较全面和深入的认识,尤其在数据可视化方面更是有独到的见解。R语言提供了强大的数据可视化功能,可以生成高质量的图形,如条形图、直方图、散点图、动态图和数学符号,甚至可以用很少的代码来实现自己设计的全新图形。R语言有很多数据可视化包,如ggplot2、ggivs和plotly等,使用这些包可以非常轻松地绘制出令人印象深刻的数据可视化图表。其中,plotly包提供了一套绘制交互式图形的工具,所绘制的图形非常有表现力。另外,R语言的文档资源很丰富,而且质量很高,这对学习R语言有很大的帮助。
为了帮助广大相关从业人员和数据技术爱好者快速掌握R语言数据可视化技术,笔者编写了本书。本书主要介绍如何使用R语言绘制常见的统计图形,如直方图、散点图和箱线图等,另外也介绍了如何绘制一些不常见但很实用的统计图形,如桑基图、和弦图和时间序列图等。
本书不但介绍了普通的统计图形的绘制,而且介绍了交互式图形及动画图形的绘制,另外还介绍了如何使用Shiny工具包进行数据探索与可视化。相信通过阅读本书,读者可以在较短时间内比较系统地掌握R语言数据可视化技术。
本书特色
1.内容全面,理论结合实践
本书全面介绍如何利用R语言绘制各种统计图形,涵盖普通的统计图形绘制、高级统计图形绘制、交互式图形绘制、动画图形绘制,以及统计图形的细节调整。另外,本书还介绍了如何利用Shiny进行数据探索与可视化,是一部理论与实践紧密结合的数据可视化学习宝典。
2.零基础入门,学习门槛低
阅读本书不需要读者具备太多的预备知识,只要有基本的数学与统计学知识即可,学习门槛很低,零基础即可入门。
3.实例丰富,实用性强
本书在讲解的过程中给出了大量的R语言绘图实例,这些实例涵盖单变量图形绘制、两个同类型变量的图形绘制、分类变量和连续变量的图形绘制、高维图形绘制等。这些例子都非常实用,可以比较容易地迁移到实际工作中。
4.绘图代码详细,效果精美
本书中的绘图实例都给出了详细的实现代码,读者可以按照代码和操作步骤亲自动手实现每一个实例的效果,而且这些绘图实例的效果非常精美,让人赏心悦目。
本书内容
本书共分为13章,各章内容简单介绍如下:
第1章主要介绍R语言的基本概念、Rstudio跨平台集成开发环境及常见的统计图形等。
第2章主要介绍一些数据处理与数据探索的方法,如数据转换和数据重塑等,因为在数据可视化之前需要先对数据进行处理。
第3章主要介绍在不进行更多细节调整的情况下如何快速地进行数据可视化。
第4章主要介绍面积图、密度图、直方图和频率图这几种单变量图形的绘制。这类图形往往只涉及数据集的一个变量。
第5章主要介绍两个同类型变量的图形绘制,包括散点图、抖动点图、连续二维分布图和线图。
第6章主要介绍分类变量和连续变量的图形绘制,包括箱线图、小提琴图、棒棒糖图、条形图、圆形条形图、饼图和甜甜圈图。
第7章主要介绍高维图形的绘制,包括气泡图、三维散点图、流型图、相关矩阵图、树状图、圆形包装图和树形图。
第8章主要介绍其他类型的统计图形绘制,包括和弦图、桑基图、网络图、旭日图、雷达图、词云、平行图、时间序列图、交互式图形及动画图。这些图形并不是很常见,但是非常有用,使用这些高级图形能够让数据可视化的效果更加引人注目。
第9~11章主要介绍图形的细节调整,如添加图形元素、图形的颜色调整、线条类型调整、坐标轴范围调整、删除面板边框和网格线、合并多幅图形等。一幅优秀的统计图形往往需要许多细节上的调整,通过调整细节,可以让图形更具表现力。
第12、13章主要介绍一些扩展内容,包括ggfortify绘图包和Shiny工具包,它们可以实现数据可视化的一些高级功能,如交互式图形绘制和动画图形绘制等。
读者对象
* 数据可视化从业人员;
* 统计学、数学、经济学、计算机和财经等专业的本科生和研究生;
* 互联网从业人员,如产品经理;
* R语言数据可视化初学者与进阶者;
* 对数据可视化感兴趣的人员;
* 相关培训机构的学员。
配套资源
本书的所有实例源代码文件及彩色效果图等相关资源需要读者自行下载。方法是:在华章公司官网www.hzbook.com上搜索到本书,然后单击“资料下载”按钮,即可在本书页面上找到“配书资源”下载链接。
售后支持
本书涉及的内容比较庞杂,R数据可视化技术也是日新月异,加之作者水平和成书时间所限,书中难免有一些疏漏和不当之处,敬请读者指正。阅读过程中若有疑问,请发E-mail至
[email protected],以获得帮助。