R数据可视化手册(第2版)
上QQ阅读APP看书,第一时间看更新

第1章 R基础知识

本章包括以下基础知识:安装包、使用包和加载数据。

本书中的大多数技巧需要安装ggplot2、dplyr和gcookbook包(gcookbook包包含了本书部分示例所使用的数据集,但在实际工作时该包并不是必需的)。如果想快速上手,可以运行下面的命令来安装:

install.packages("tidyverse")
install.packages("gcookbook")

然后,在每个R会话中,需要在运行本书的示例之前先加载它们:

library(tidyverse)
library(gcookbook)

运行library(tidyverse)会加载ggplot2、dplyr和很多其他包。如果想要让R会话更加流畅高效,可以分别加载ggplot2、dplyr和gcookbook:

library(ggplot2)
library(dplyr)
library(gcookbook)

 

图片 401 

如果想更深入地理解ggplot2是如何工作的,可以参见附录,获取与ggplot2相关概念的解释。


 

R中的包是一些为了便于分发而封装在一起的函数和(或)数据(可以没有数据集)的集合。在计算机上安装包,便可以扩展R的功能。如果一个R用户编写了一个包并觉得这个包对其他R用户可能有用,那么,这位R用户就可以通过包仓库将该包发布。发布R中的包的最主要的包仓库称为CRAN(Comprehensive R Archive Network),不过也有其他的仓库,如基因组数据相关包的专用仓库Bioconductor。

如果你学习R已经有一段时间了,你也许听说过tidyverse这个用于共享应该如何构建和使用数据等常识的R包合集。基础R包通常是在下载和安装R之后就自动导入的。而tidyverse是一组R插件,它可以使进行数据处理和可视化的相关操作更加简单。本书在多数情况下使用tidyverse,因为我相信它会让你更加快速和方便(但不会影响处理效果!)地使用数据。

如果你以前没有使用过tidyverse,那么你一定要看一下1.7节中的技巧,它可以帮你理解一种陌生的句法——%>%,也就是所谓的管道操作符。