
上QQ阅读APP看书,第一时间看更新
第1章 R基础知识
本章包括以下基础知识:安装包、使用包和加载数据。
本书中的大多数技巧需要安装ggplot2、dplyr和gcookbook包(gcookbook包包含了本书部分示例所使用的数据集,但在实际工作时该包并不是必需的)。如果想快速上手,可以运行下面的命令来安装:
install.packages("tidyverse")
install.packages("gcookbook")
然后,在每个R会话中,需要在运行本书的示例之前先加载它们:
library(tidyverse)
library(gcookbook)
运行library(tidyverse)
会加载ggplot2、dplyr和很多其他包。如果想要让R会话更加流畅高效,可以分别加载ggplot2、dplyr和gcookbook:
library(ggplot2)
library(dplyr)
library(gcookbook)
如果想更深入地理解ggplot2是如何工作的,可以参见附录,获取与ggplot2相关概念的解释。
R中的包是一些为了便于分发而封装在一起的函数和(或)数据(可以没有数据集)的集合。在计算机上安装包,便可以扩展R的功能。如果一个R用户编写了一个包并觉得这个包对其他R用户可能有用,那么,这位R用户就可以通过包仓库将该包发布。发布R中的包的最主要的包仓库称为CRAN(Comprehensive R Archive Network),不过也有其他的仓库,如基因组数据相关包的专用仓库Bioconductor。
如果你学习R已经有一段时间了,你也许听说过tidyverse这个用于共享应该如何构建和使用数据等常识的R包合集。基础R包通常是在下载和安装R之后就自动导入的。而tidyverse是一组R插件,它可以使进行数据处理和可视化的相关操作更加简单。本书在多数情况下使用tidyverse,因为我相信它会让你更加快速和方便(但不会影响处理效果!)地使用数据。
如果你以前没有使用过tidyverse,那么你一定要看一下1.7节中的技巧,它可以帮你理解一种陌生的句法——%>%
,也就是所谓的管道操作符。