用Ubuntu和RStudio Server搭建一个R语言的云平台

前一段介绍过利用Windows系统的Ubuntu子系统搭建数据科学平台,此番来介绍下除了jupyter之外的另外一个数据科学神器:RStudio Server。同时基于Ubuntu和RStudio Server搭建一个R语言的云平台,用于数据分析。

1 RStudio Server简介

RStudio Server 是 RStudio 公司打造的一款基于 Web 的开源编辑器。在实际的工程中,我们的服务器大多是基于Linux的,比如常见的 ubuntu、centos 等。这些操作系统有时并不提供图形化界面,这时候RStudio的服务器版本就派上用场了。启动RStudio Server后,进入在浏览器中进入某一个页面后就可以像桌面版一样使用RStudio编辑器。当R的代码在服务器上出现bug了,线上的hotfix是在所难免的,这时候就需要用到 RStudio Server。–百度百科。

事实上就是一个Web版的RStudio。

2 R语言云平台搭建

闲话少说,就来搭建平台吧。首先,这次我是在我自己的办公室的工作站上搭建,因此受到局域网限制,我主要是方便于使用办公室的工作站,某种意义上是个伪云平台。如果真的想搭建一个网络访问式的,必须购买服务器。阿里云等都是可以的。其次除了搭建平台外,由于平常主要在做一些空间分析类的处理,因此搭建完成后还会有一个小的样例代码就当是hello world。

事实上平时使用工作站时,通常就是利用笔记本和XShell连接,然后就开始像六指琴魔一样疯狂敲击键盘,尤其是vim之类的编辑器。

当然有些时候我们需要所见即所得的分析。因此搭建一个平台的需求就出来了。现在Xshell搭建平台。第一步是事实上是安装基础的R语言。这一步我们之前的博客已经介绍过了,不了解的同学可以看一下这篇博客。

在Ubuntu中安装R的几种方式总结

接着就安装gdebi-core。在Xshell里输入如下代码。

1
sudo apt-get install gdebi-core

接着下载RStudio Server的deb文件。

1
wget https://download2.rstudio.org/rstudio-server-1.1.447-amd64.deb

下载完毕后,用gdebi安装并运行即可。

1
sudo gdebi rstudio-server-1.1.447-amd64.deb

可以输入命令查看后台RStudio Server运行情况。

1
ps -fel | grep rstudio-server

这里不建议用root账户来使用RStudio,类似之前搭建WSL里的数据科学环境,这里添加一个普通用户来使用。

1
sudo adduser rstudio

接着就需要输入密码,根据自己需求输入密码,这就是等等页面里需要输入的用户和密码。这一步结束之后,可以直接打开对应的IP地址加上8787,RStudio默认在8787端口运行。

http://:8787

http://192.81.132.143:8787/auth-sign-in

登陆即可。

3 Hello World

当然需求展示一下一个栅格数据。基于raster包,R语言里的神包。因此需要先安装raster,而此包又依赖于rgdal,而rgdal则要求必须安装GDAL。GDAL版本也有要求,因此这一块配置也是个需要花费一些功夫的地方。当然GDAL本身就是一个很棒的开源GIS库。这里就列一下资源。关于GDAL安装配置等以后找个时间专门讲。

1
2
3
library(raster)
filerall <- raster("/home/Workspace/python/Xiamenair/data/pm25halfyear.tif")
spplot(filerall)

参考资料:

Configure Rstudio Server on Ubuntu 16.04

Urban Data Science — Ex 1: Tools

python GDAL 2.1 installation on Ubuntu 16.04

python GDAL 2.1 installation on Ubuntu 16.04

How To Install GDAL/OGR Packages on Ubuntu

Rstudio-server的安装与使用

在Ubuntu升级R版本