R语言读取Excel的神器——openxlsx
这篇文章讲得是如何用R语言优雅地读取excel,当然前提是用R语言花式读excel,然后最优雅。
作为非程序猿的各位同志们,可能最擅长的数据整理软件或者统计软件就是——嗯,没有错,它就是集万千宠爱于一身的E~~~~X~~~~O。
咳咳咳,好了。隆重推出我们的主角——Excel
事实上,Excel是个super强大的软件。基本上用它已经能完成大量的统计分析了。
For example
各类数理统计
线性规划(LINGO表示欲哭无泪,你丫的抢我饭碗)。
当然,很久很久之前有这门本神书:
陈彦光. 基于Excel的地理数据分析[M]. 科学出版社, 2010.
当然,作为新时代的研究生,我们怎么能仅用Excel来完成一切的科研任务呢?用老师的话说,你们用Excel做的图,人家审稿都嫌low。这个时候R就登场了。
关于R的简介我就不提了。欢迎各种度娘,扯了这么久的淡。终于要进入正题了。
今天讲的是R语言的第一步,读数据——读Excel的数据。
以下有三种方法:
1.将Excel转存为csv格式文件,读csv文件。
a<-read.csv("exercise1.csv",header = T)
2.用RODBC包读取Excel。
ab<-odbcConnectExcel2007("exercise1.xls")#连接excel,32位系统使用odbcConnectExcel函数
sqlTables(ab)
根据需求读取对应的sheet1
a<-sqlFetch(ab,"Sheet1$")
odbcClose(ab)#关闭句柄,此句是必须。
3.用openxlsx包读取Excel
a<-read.xlsx("exercise1.xlsx",sheet=1)#文件名+sheet的序号,简单粗暴
综合来看,openxlsx的方法简单粗暴,而且经多名骨灰级玩家证明,罕有bug出现。乃R语言和Excel读取的绝对神器。不过笔者也发现,openxlsx包仅适用于.xlsx格式文件。前期的xls格式文件可能还需要前两种方法来读取。除了以上三种方法,还有类似的包如xlsx、readxl。此处依旧强推神器openxlsx。首先,.xlsx文件存储行数大大提升,从65536行数据提升到了104万条数据。其次,它十分便捷,函数所需参数较少。当然最后的最后,它可能需要的R的版本比较的新,下一篇的预告:如何通过一行代码升级R。
最后贴出全文的代码。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#设置工作路径
setwd("F:/R/applicationstatics")
#第一种方法:读取csv
a<-read.csv("exercise1.csv",header = T)
#第二种方法:RODBC包
#安装载入RODBC包,如果已安装,请跳过第一句语句
install.packages(RODBC)
library(RODBC)
ab<-odbcConnectExcel2007("exercise1.xls")#连接excel,32位系统使用odbcConnectExcel函数
sqlTables(ab)
a<-sqlFetch(ab,"Sheet1$")
odbcClose(ab)#关闭句柄,此句是必须。
#第三种方法:openxlsx
install.packages(openxlsx)
library(openxlsx)
a<-read.xlsx("exercise1.xlsx",sheet=1)#文件名+sheet的序号,简单粗暴
当然文末小福利:《基于Excel的地理数据分析》的电子版。需要的童鞋可以在评论区留邮箱或在我的主页(友情链接里面)搜索下我的邮箱。。