Coding and Paper Letter(十三)

资源整理。

1 Coding:

1.R语言包mapdeck,使用mapbox GL和deck.gl的交互式地图可视化包。

mapdeck

2.R语言包spatsoc,检测GPS轨迹重定位里的时空分组的包,从而构建基于邻近度的网络。

spatsoc

3.R语言包rstanarm,贝叶斯应用回归建模包。

rstanarm

4.R语言包rstan,stan的R接口。stan是一个统计建模和高性能计算平台。

rstan

5.R语言包nlrx,提供了一些在R语言中用netlogo建模的工具。

nlrx

6.开源项目斯坦福机器学习课程的备忘录。吴恩达大大的课,后面有空一定要来介绍学习成果(挖坑)。

stanford cs 229 machine learning

7.R语言包mapsapi,与谷歌地图API兼容的接口。

mapsapi

8.王江浩老师在GeoSTAT2018上报告的ppt,上一篇也有一位汇报者的ppt,就不一一列出了,GeoSTATA是一个暑期学校,主题是关于联合地理与统计建模。具体介绍见官网。从内容来看,非常不错。希望明年有机会可以前往学习。王江浩老师的汇报题目是Urban Sensing and Computing - Big Data Analytic with Open Source Software,也就是城市感知与计算——基于开源软件的大数据分析。

GeoSTAT2018

9.同样是来自GeoSTAT2018的报告ppt,包括课程和汇报的材料,主题是基于环境监测数据的机器学习案例。

Geostat2018

10.R语言包fasterize,高性能的栅格转换格式包。

fasterize

11.R语言包sendmailR,R语言用于发邮件的包。

sendmailR

12.AGU2018会议上的presentation,题目是Coupled Interpolation of Three-component GPS Velocities,三分量GPS速度耦合插值。

agu2018

13.R语言包corrr,相关系数可视化的包。

corrr

14.基于Julia编写的气候科学工具包。

ClimateTools.jl

15.R语言包lazyraster,这个包的作用是通过GDAL按照需求获取指定分辨率栅格。

lazyraster

2 Paper:

1.Mapping daily evapotranspiration based on spatiotemporal fusion of ASTER and MODIS images over irrigated agricultural areas in the Heihe River Basin, Northwest China/基于ASTER和MODIS影像时空融合的黑河流域灌区农牧区日蒸散量制图

持续监测日蒸散量(ET)对于干旱地区灌溉农业区的水资源分配和管理至关重要。在这项研究中,使用表面能量平衡系统(SEBS)通过融合具有高时间分辨率的中分辨率成像光谱仪(MODIS)图像和先进的星载热发射反射辐射计(ASTER)来估算90米空间分辨率的连续每日具有高空间分辨率的ET。使用空间和时间自适应反射融合模型(STARFM)获得这些传感器的时空特征。通过自动气象系统(AMS)和涡度协方差的现场观测,在农田,住宅,林地,水,戈壁沙漠,沙漠,沙漠草原和湿地区域覆盖的异质绿洲 - 荒漠地区验证了该方法的性能。 (EC)系统位于中国西北黑河流域中游。在基于STARFM的数据融合过程中引入的误差在90米空间分辨率下的预测LST的可接受范围内。使用SEBS基于预测的遥感数据估算的表面能量通量结合MODIS和ASTER的时空特征,与使用EC系统观测到的所有土地覆盖类型的表面能量通量很好地吻合。李新老师团队的成果,发表于农林科学top的Agricultural and Forest Meteorology,基于时空融合模型STARFM,高时间分辨率的MODIS,高空间分辨率的ASTER融合了高时空分辨率的ET。并利用实测数据做验证。非常坚实的定量遥感与生态水文研究,另外不得不感慨黑河流域数据的恢弘啊。

2.Wind dynamics over a highly heterogeneous oasis area: An experimental and numerical study/高度异质性的绿洲地区的风力动态模拟:实验和数值研究

发表于JGR的一篇文章,采用了综合方法,将计算流体动力学(CFD)方法与k - ɛ湍流模型和高分辨率地面测量数据相结合,以分析高度地表异质性的绿洲上的风力动态。具体来说,1)天气研究和预测模型(WRF)数据被用作边界条件来启动模拟; 2)根据机载激光扫描(ALS)数据估算的冠层叶面积密度(LAD)作为动量和湍流输运方程的源项,它代表了绿洲地区高度异质的植被结构。 CFD模拟的风场结果与通量观测矩阵数据(在5.5 km×5.5 km实验区域中的17个塔测量)一致。成功捕获了受异质地表影响的风场的时空变化。 CFD模拟的风场也清楚地显示了在高度异质的陆地表面上的“挡风效果”,其中在防护林带的迎风侧和背风侧存在更短和更长的风速减少区域有助于保护农田和果园免受风侵蚀。此外,目前基于高分辨率CFD模拟风廓线估算空气动力学粗糙度长度(z0m)的方法被证明是捕获异质表面上的风力动力学的有前景的方法。数值模拟(WRF,CFD)+地面观测数据的一个研究,非常有意思,也可以看到目前在小尺度很多数值模拟的研究越来越成熟,而且通常需要融合多个数值模拟模型与地面观测数据。

3.Exploring evapotranspiration dynamics over Sub-Sahara Africa (2000-2014)/探索撒哈拉以南非洲的蒸散量变化(2000-2014)

监测蒸散量(ET)的变化有助于管理灌溉农业景观中的水资源,以及评估干旱脆弱地区的作物压力和植被状况。这项研究探讨了MODIS(中分辨率成像光谱仪)衍生的ET(2000-2014)在大部分撒哈拉沙漠以南非洲(SSA)的变化。对SSA的ET的多变量分析显示,ET中观察到的动态的四种主要模式,占总变异性的约90%,主要来自Sudano-Sahel和刚果盆地的一些部分。根据Man-Kendall的统计数据,观察到中非共和国和萨赫勒地区大部分地区ET的显着正趋势(α= 0.05)。尽管如此,在刚果盆地的大部分地区,ET显示出广泛的负面趋势的显着(α= 0.05)分布。 ET的这些趋势被发现与模型土壤水分的观测变化一致,但并非在所有位置都是如此,可能是由于最大降雨量和地表温度的趋势不一致。然而,时空干旱分析的结果证实,刚果盆地广泛的ET损失在某种程度上是由土壤水分亏缺引起的。在ET的其他主要驱动因素中,ET对SSA陆地生态系统的动态似乎是一种可能超越自然气候变化的更复杂现象。我想这个文章最大特色可能是长时间大洲尺度研究,并且是非洲的案例。很好地响应SDGs的实证研究。

4.Urban Land Extraction Using VIIRS Nighttime Light Data: An Evaluation of Three Popular Methods/利基于三种流行方法与VIIRS夜光数据提取城市土地的评价

使用夜光数据及时准确地提取城市土地面积对于城市研究非常重要。然而,对提取城市土地的现有方法的综合评估仍然不足。该研究选择了三种利用夜间光照数据提取城市土地面积的流行方法。这些方法包括局部优化阈值(LOT),植被调整夜光城市指数(VANUI),综合夜光数据,归一化差异植被指数和地表温度支持向量机分类(INNL-SVM)。然后,我们根据中国不同自然和社会经济条件的七个评价区域的VIIRS夜光数据,评估了这些提取城市土地面积的方法的表现。我们发现INNL-SVM具有最佳性能,平均kappa为0.80,比LOT高6.67%,比VANUI高2.56%。 INNL-SVM的卓越性能主要归功于夜间光线,植被覆盖和地表温度信息的整合。这种集成有效地减少了由VIIRS夜间光数据的溢出效应和低光亮度引起的错误。此外,INNL-SVM可以更轻松地提取城市土地面积。因此,我们建议INNL-SVM具有很大的潜力,可以用大规模的VIIRS夜光数据有效地提取城市土地。夜光数据的研究越来越重要,另外珞珈一号的应用也值得关注。

5.Comparison of Two Satellite-Based Evapotranspiration Models of the Nagqu River Basin of the Tibetan Plateau/青藏高原那曲河流域两种卫星蒸散模型的比较

蒸发蒸腾(ET)是能量和水循环的主要不确定组成部分之一,是在无云条件下基于遥感数据和大气表层(ASL)观测得出的那曲河流域。两个基于过程的模型用于确定ET:基于Priestley-Taylor(PT)的模型和地形增强的表面能平衡系统(TESEBS)模型。将改进的宽带反照率,向下短波辐射通量和重建归一化差异植被指数(NDVI)耦合到TESEBS模型和基于PT的模型中以估计实际ET。 ASL气象数据,SPOT植被(VGT)数据和中分辨率成像光谱仪(MODIS)数据被用作10天ET计算的输入。将模型估计结果与通过组合方法计算的基础事实进行比较。结果表明,两种模型确定的ET均符合实际ET。然而,TESEBS模型显示出比PT模型更好的性能,具有更低的平均偏差误差和更低的均方根误差。尽管PT模型计算简单并且需要的参数很少,但NDVI的强烈加权可能会导致一些过高估计,特别是在生长季节。两种模型确定的蒸散量很好地符合实际值。 TESEBS表现出比PT模型更好的性能。虽然PT模型计算简单且参数很少,但NDVI的强加权可能会导致一些过高的估计。蒸散一直是生态水文和生态建模的关键,尤其是耦合遥感数据和遥感模型的一个关键要素。可以对这两个模型做些研究。本文的两个蒸散模型还是很经典的。其次,青藏高原的研究也更有意思些。

6.Modeling the Distributions of Brightness Temperatures of a Cropland Study Area Using a Model that Combines Fast Radiosity and Energy Budget Methods/利用结合快速光能传递和能量预算方法的模型对农田区域的亮度温度分布进行建模

从遥感数据中获得的地表温度(LSTs)对于监测作物和城市热岛的状况至关重要。然而,由于反演到的LST仅代表像素的平均温度状态,因此各个像素内的温度分布仍然未知。这些数据不能满足精准农业等应用的要求。因此,在本文中,我们提出了一种模型,该模型结合了快速光能传递模型,适用于多孔单个对象(RAPID)模型的光能传递和能量预算方法,以动态模拟复杂曲面上的亮度温度(BT)。该模型代表了一种基于模型的工具,可用于使用精细尺度的可见光以及近红外(VNIR)数据和气象条件的时间变化来估计温度分布。所提出的模型在中国西北地区的人工绿洲的研究区域进行了测试。模拟的BT与先进的星载热辐射和反射辐射计(ASTER)测量的BT很好地吻合。此外,与叶面积指数(LAI)相比,该模型在验证期间显示出对风速的高灵敏度。尽管可以采用简化以用于特定模拟,但是该提出的模型可用于支持原位测量并提供异质植被表面上的参考数据。柳钦火老师团队的成果,亚像元级定量热红外遥感研究。值得关注。

7.Impacts of spatial heterogeneity on crop area mapping in Canada using MODIS data/空间异质性对加拿大作物区域MODIS数据制图的影响

由于存在各种空间异质性,使用粗空间分辨率遥感图像精确地绘制作物区域是具有挑战性的。该研究分析了受空间异质性影响的作物分类和面积估计的准确性,尤其是样本杂质和景观异质性。从中分辨率成像光谱仪(MODIS)MOD09Q1 8天计算的归一化差异植被指数(NDVI)时间序列用于对加拿大曼尼托巴省的作物区域进行分类。分类和回归树(CART)方法应用于分类。将具有30米空间分辨率的加拿大农业和农业食品(AAFC)土地覆盖数据集用作确定研究区域和训练和验证样本的基础图。结果可以得出结论:(1)MODIS影像的分类精度对样本杂质和景观异质性都很敏感。样品中的纯度限制会对分类准确性产生很大影响。具有更均匀像素的区域更可能被准确地分类,反之亦然; (2)作物面积估计误差对样品杂质不敏感。它不仅取决于培养样品的纯度,还取决于作物类型的实际纯度条件。最纯粹的训练样本组与最低误差不相符; (3)构型异质性对面积估计的影响比构成异质性的影响更大。总体而言,样本杂质和景观异质性都可以在很大程度上影响分类准确性,而只有构型异质性对作物面积估计有显着影响。地表异质性是老生常谈的话题,任何地学研究都难以避免,这篇文章利用两套数据做了一些异质性造成的不确定性和误差的分析。

8.Spatiotemporal Fusion of Multisource Remote Sensing Data: Literature Survey, Taxonomy, Principles, Applications, and Future Directions/多源遥感数据的时空融合:文献调研,分类,原理,应用和未来方向

具有高空间分辨率的卫星时间序列对于监测异质景观中的陆地表面动态是至关重要的。尽管遥感技术近年来经历了快速发展,但从单个卫星传感器获得的数据往往无法满足我们的需求。因此,在过去十年中,来自不同传感器的数据的综合使用变得越来越流行。已经开发了许多时空数据融合方法以从两种类型的卫星图像,频繁的粗分辨率图像和稀疏的精细分辨率图像产生具有高空间和时间分辨率的合成图像。这些方法是根据不同的原则和策略设计的,因此表现出不同的优势和局限。这种多样性为用户选择适合其特定应用和数据集的方法带来了困难。为此,本综述文章研究了当前时空数据融合方法的文献,对现有方法进行了分类,讨论了这些方法的基本规律,总结了它们的潜在应用,并提出了该领域未来研究的可能方向。遥感影像时空融合的综述,写得还是很详细的,对这个领域的做了些较为系统的回顾,做了文献计量分析。这里推荐一篇笔者翻译的黄波老师的论文(原作为黄波老师团队赵涌泉博士,译文首发于一览众山小·可持续城市与交通)。

有GIS有意思︱针对复杂地表变化的鲁棒自适应时空影像融合模型

9.Mapping China’s Ghost Cities through the Combination of Nighttime Satellite Data and Daytime Satellite Data/通过夜间卫星数据与日间卫星数据相结合绘制中国鬼城

中国大陆城市化进程产生的副作用之一是“鬼城” - 一般被定义为废弃建筑群或住房结构 - 但是对于与这种现象有关的基本特征,如尺寸,显然缺乏研究。增长,水平,分布,规模,强度,模式和决定因素。通过结合夜间卫星数据和日间卫星数据作为有用的代理,在本文中,我们展示了过去二十年中国鬼城的空间格局和时间演变。夜间灯光在新建区域的变化率是基于DMSP / OLS和归一化差异建立指数来评估城市的黑暗。结果显示鬼城问题是真实的,但至少到目前为止,仅限于22个较小的城市。然而,进一步分析显示,新建区域的夜间灯光发生变化,大城市倒U型曲线表示近年来趋势从正值回归到负值。通过在我们的研究中使用DMSP / OLS和Landsat数据之间的时间互补特征的方法证明可以作为确定和量化这种社会经济现象的直接证据。一个基于夜间灯光和普通Landsat数据结合的应用研究。鬼城识别,是一个非常有意思的问题研究。这篇文章利用不同时间成像卫星的互补做了识别。相比于几年前北大刘瑜老师与百度大数据实验室合作的,基于VGI数据的鬼城识别,可能可以做一个比较。

10.Linking Heat Source–Sink Landscape Patterns with Analysis of Urban Heat Islands: Study on the Fast-Growing Zhengzhou City in Central China/联结热源-汇景观格局与城市热岛分析-快速发展的中部地区郑州市案例研究

在全球范围内,城市热岛(UHI)效应是一个主要问题,导致城市居民遭受不利的城市生态环境和严重的健康风险。了解城市景观特征对热环境的影响一直是各个研究领域的重点。本研究的目的是利用中国中部快速发展的郑州市作为案例研究,分析城市热源-汇景观格局对城市热岛的影响。应用Landsat数据(在1996年,2006年和2014年捕获),各种地理空间方法和相关性分析以促进分析。基于城市景观对地表温度(LST)的贡献,我们根据经验确定了热源和热汇。然后,通过景观和等级的一系列空间度量来估计热源和汇景观的构成和配置。结果表明,研究区域的总平均地表温度(LST)从1996年到2014年增加了2.72°C。观察到的总体平均LST的增加趋势与研究区域的快速城市化过程一致,由不透水表面的显着增加和植被覆盖的大量损失证明。通常,如所观察到的,景观组成对LST的影响比景观配置更强。对于热源,斑块的比例,大小,聚集和密度对LST有积极影响,而调整城市景观的空间分布和丰度是控制UHI效应的有效方法。相比之下,散热片的百分比,大小,密度和聚集对LST有负面影响。此外,在减轻UHI效应时,应考虑增加总贴片边缘和形状复杂性的影响。这些发现有助于进一步了解城市景观格局如何影响UHI,并有助于优化城市景观格局,减轻UHI效应,促进研究区的可持续发展。总的来说,这篇文章主要做的就是景观指数与LST的分析,可能比较关键的是热源汇景观的概念提出。前一段广州大学吴志峰老师团队发表了一篇中文名为人为热排放源的分析,印象中是基于WRF和排放源的一个研究,可能可以做些类比和探究。

11.predictSLUMS: A new model for identifying and predicting informal settlements and slums in cities from street intersections using machine learning/预测SLUMS:一种利用机器学习从街道交叉口识别和预测城市非正规住区和贫民窟的新模型

确定城市内当前和未来的非正规区域仍然是发展中国家政策制定者和政府的关键问题。在城市中识别这些区域的划分过程需要大量资源。虽然有各种研究基于卫星图像分类识别非正式定居点,依赖于有监督或无监督的机器学习方法,但这些模型要么需要多个输入数据才能运行或需要在精度方面进一步发展。在本文中,我们介绍了一种仅使用街道交叉口数据来识别和预测非正规住区的新方法,无论城市形态,楼层数量,建筑材料或街道宽度的变化如何。通过这种最小的输入数据,我们试图为规划者和政策制定者提供一个有助于识别城市非正规区域的实用工具。该模型的算法基于空间统计和机器学习方法,使用多项Logistic回归(MNL)和人工神经网络(ANN)。拟议的模型依赖于根据两个普遍存在的特征定义非正规住区,这些区域倾向于填充相对于当地环境中的正式区域的较小的细分住房,以及这些住区边界内的服务和基础设施的缺乏。需要相对较大的批次。我们在埃及和印度的五个主要城市应用了该模型,这些城市具有非正式性的空间结构。这些城市分别是埃及的大开罗,亚历山大,赫尔格达和明亚以及印度的孟买。预测SLUMS模型显示出高度有效性和准确性,用于识别和预测模型在相同城市内或在不同类似环境中训练的非正规性。机器学习地理学应用,可以说还是蛮有意思的,无论是使用的特征,或者是识别的目标。

12.Understanding road congestion as an emergent property of traffic networks/将道路拥堵理解为交通网络的新兴属性

尽管对通过公路网络的交通流量建模进行了大量研究,但对导致和加剧城市道路拥堵的条件的清晰理解仍然是难以捉摸的。本文提出将拥塞识别为驾驶员与驾驶员之间相互作用的无意识紧急属性。它描述了人类行为是城市驾驶的一个恒定和重要的内在属性,以及这些相互作用如何导致明确的现象。提出了一个框架,用于进一步分析三个空间级别的拥塞,以及在每个空间级别可能最重要的驾驶员行为。在此模型的基础上,本文介绍了在伦敦高度拥挤的黑墙隧道进行的案例研究。在为本文所述的一些概念提供证据时,案例研究展示了人类行为如何导致道路拥堵的出现。本文提出的概念和框架为进一步理解和最终模拟道路拥堵的发生和传播提供了一个强有力的起点。交通拥堵也是笔者一直比较关心的一个研究问题,这个研究的概念和框架是一个很有意思的点,可以说类似于逆向思维的一个研究。

13.Evaluation of machine learning techniques with multiple remote sensing datasets in estimating monthly concentrations of ground-level PM 2.5/利用多个遥感数据集评估不同机器学习技术估算地面PM 2.5的月浓度的效果

细颗粒物(PM2.5)已被公认为可影响人口健康风险的关键空气污染物,特别是在野火等极端情况下。以前的研究已经应用地理空间技术,如土地利用回归来绘制地平面PM2.5,而最近的一些研究发现,从卫星影响和机器学习技术得到的气溶胶光学深度(AOD)可能是两个可以改善时空的元素预测。然而,缺乏研究评估使用不同的机器学习技术与AOD数据集来映射PM2.5,特别是在PM2.5的高时空变异性的区域。在本研究中,我们将八种预测算法的性能与使用多种遥感数据集(包括卫星衍生的AOD数据)进行比较,以预测地面PM2.5浓度。根据结果,Cubist,随机森林和极限梯度提升算法具有更好的性能,而Cubist是最好的。变量重要性分析表明,建模贡献最高的预测因子是月度AOD和海拔。总之,适当选择机器学习算法可以改善地面PM2.5估计,特别是对于PM2.5与复杂地形引起的预测因子之间存在非线性关系的区域。卫星导出的数据,如AOD和地表温度(LST),也可以替代从气象站检索到的传统数据集,特别是对于站点分布稀疏和不均匀的地区。这篇文章结合多源遥感和机器学习做PM2.5制图,数据很全面,包括站点数据、MODIS产品(AOD,Albedo,NDVI,LST,Vapor)、NCEP再分析资料(气象数据)。还用了多种机器学习算法,包括时下流行的随机森林和梯度提升类的算法。结论上有一点跟笔者参与的一个研究比较类似,海拔是有比较显著的影响。