Coding and Paper Letter(四十五)

资源整理。

1 Coding:

1.Python库gempy,一种基于Python的开源三维结构地质建模软件,它允许从界面和方向数据隐式(即自动)创建复杂的地质模型。 它还支持随机建模以解决参数和模型的不确定性。

gempy

2.Tangram是一个JavaScript库,用于使用WebGL在Web浏览器中实时渲染2D和3D地图。

tangram

3.R语言包gdalcubes R,gdalcubes的R包,与之前的gdalcubes包区别在哪,目前不确定。但都是用于处理栅格大数据的。

gdalcubes R

4.R语言包pointblank,用于验证表格数据的R包。

pointblank

5.用于可视化BERT自映射层的工具,BERT模型在去年年底的时候突然火爆。

bertviz

6.Python库yellowbrick,可视化分析和诊断工具,方便机器学习模型选择。

yellowbrick

7.Python库dtw,动态时间扭曲用作在时间序列之间测量的相似性。

dtw

8.R语言包sparksf,sparksf提供了对sparklyr中空间功能的访问。

sparksf

9.一个小型Docker容器,用于将R和TensorFlow用作企业API。

r tensorflow api

10.用于制作神经网络图的Latex代码。

PlotNeuralNet

11.基于PyTorch中Backprop贝叶斯变分推理的贝叶斯卷积神经网络。

PyTorch BayesianCNN

12.机器人操作元系统。

ros2

13.“开放图像”是一个数据集,其中约有900万个URL,这些网址已使用超过6000个类别的标签进行注释。 此页面旨在为Open Images Dataset提供下载说明和镜像站点。

open images dataset

14.用最新的论文改进YOLO V3。

YOLO V3

15.“通过参数共享进行高效神经架构搜索”论文的TensorFlow代码。

enas

16.谱聚类。

spectral clustering

17.gbdxtools是一个用于在DigitalGlobe的GBDX平台上订购图像和启动工作流程的软件包。

gbdxtools

18.GMSimViz是一种自动化工具,可生成地质断层,地面运动和其他地震相关数据的动画三维可视化。

GMSimViz

19.亚马逊云上USGS LiDAR公开数据集的工作存储库。

usgs lidar

20.亚马逊云上公开可用数据集。

open data registry

21.练习“R for Data Science”的解决方案。

r4ds exercise solutions

22.传感器集成到Waggle中。看着应该是以树莓派为基础的传感器改造。

sensors

23.用于无头浏览器的Firefox,Splinter和Selenium的Docker镜像。

firefox splinter docker

24.多变量混合成员资格建模:推断特定于域的风险概况。

MMM tutorial

25.Rstudio 2019年会高级R Markdown研讨会材料。

arm workshop rsc2019

26.上一篇博客有简单介绍过这门课。这应该是UCL地理学院陆地碳循环:建模与监测这门课的完整课程。

GEOG0133

27.WRF模型的官方仓库。

WRF

28.地理处理高级课程的材料。课程由多伦多大学Alec Jacobson教授设计,并得到Klint Qinami和哥伦比亚大学Eitan Grinspun教授的协助。

geometry processing

29.Euler是大规模分布式的图学习框架,配合TensorFlow或者阿里开源的XDL等深度学习工具,它支持用户在数十亿点数百亿边的复杂异构图上进行模型训练。

euler

30.学习OpenCV:C ++和Python示例。

learnopencv

31.一种快速且无监督的使用小波和超顺磁聚类进行尖峰检测和分类的算法。

wave clus

32.Underworld 2是Underworld代码的python友好版本,它为在并行HPC环境中运行的代码的所有功能提供可编程且灵活的前端。 UWGeodynamodynamics模块使用Underworld促进地球动力学模型的原型设计。 它可以被视为地下世界生态系统中的一组高级功能。

UWGeodynamics

underworld2

2 Paper:

1.Atmospheric observation-based estimation of fossil fuel CO2 emissions from regions of central and southern California/基于大气观测的加州中部和南部地区化石燃料二氧化碳排放估算

化石燃料的燃烧是加利福尼亚向大气排放温室气体的主要来源。在这里,我们描述了放射性碳(14CO2)测量和大气反演模型,以估算2009-2012年加利福尼亚州中部地区的化石燃料CO2(ffCO2)排放,以及2013年6月至2014年5月来自南加州两个地点的排放。基于区域大气传输模型(WRF-STILT)足迹和每小时ffCO2先前的排放图(Vulcan 2.2)计算先验预测的ffCO2混合比。利用加利福尼亚中部地区观测的区域反演表明,旧金山湾区(SFBA)的排放量在冬季较高,夏季较低。综合考虑所有年份,从2009年到2012年,平均总共15个3个月的倒置表明SFBA的ffCO2排放量在该区域的先验估计值的6±35%范围内,其中后排放不确定性报告为95%置信度间隔。 2013年6月至2014年5月在洛杉矶南海岸空气流域(SoCAB)使用测量值进行的4个3个月倒置的结果表明,SoCAB的排放量在该区域的先验估计值的13±28%范围内,边际检测到季节性。虽然SFBA和SoCAB城市地区的排放量(包含加利福尼亚州先前排放量的约50%)受到观测资料的限制,但其余地区的排放受到的限制较少,这表明额外的观测结果对于更准确地估算总的ffCO2排放量是有价值的。加州作为一个整体。结合了碳排放制图、大气观测数据和WRF模型的研究,非常不错。

2.Comparison of Global Downscaled Versus Bottom-Up Fossil Fuel CO 2 Emissions at the Urban Scale in Four US Urban Areas/美国四个城市地区城市范围内全球降尺度与自下而上化石燃料二氧化碳排放的比较

Spatiotemporally解决城市化石燃料二氧化碳(FFCO2)排放对城市碳循环研究和城市气候政策至关重要。已经采用两种一般的科学方法来估计时空显性的城市FFCO2通量,这里称为“降尺度”和“自下而上”。自下而上的方法可以特定地描述城市中二氧化碳排放基础设施的特征,但是需要建立劳动密集型,并且目前在美国的少数几个城市可用。通常在全球范围内可用的降尺度方法需要代理信息来分配或分配排放,从而导致额外的不确定性。我们将四个缩小的FFCO2排放数据产品(ODIAC)与美国四个城市地区的自下而上估算(Hestia)进行比较,以更好地隔离和理解这些方法之间的差异。我们发现整个城市的差异从-1.5%(洛杉矶盆地)到+ 20.8%(盐湖城)不等。在1 km x 1 km的空间尺度上,比较揭示了由夜间光空间代理饱和驱动的ODIAC的低排放限制。在该分辨率下,两种方法的中位数差异在47%至84%之间,具体取决于城市,相关性范围为0.34至0.68。发现大型点源和陆上部门存在最大差异,表明通过纳入独立的大型点源估算和使用相关空间替代物估算陆上源,可以改善降尺度的FFCO2数据产品。逐步粗化空间分辨率可以提高一致性,但大于约25平方公里,协议收益递减,表明在使用降尺度的方法时实际解决问题。分析了目前城市化石燃料二氧化碳时空制图的两类方法,比较二者在美国区域的制图不确定性。

3.Exploring spatiotemporal nonstationary effects of climate factors on hand, foot, and mouth disease using Bayesian Spatiotemporally Varying Coefficients (STVC) model in Sichuan, China/利用中国四川贝叶斯时空变异系数(STVC)模型探索气候因素对手足口病的时空非平稳效应

背景:一般认为小儿手足口病(HFMD)与气候有关。然而,关于这种关联如何在时空上变化的知识是非常有限的,特别是在考虑当地社会经济条件的影响时。本研究旨在确定多源HFMD环境因素,并进一步量化各种气候因素对手足口病发生的时空非平稳效应。方法:我们提出了一种创新的方法,在贝叶斯分层建模框架下,称为时空变异系数(STVC)模型,用于在控制社会经济效应后探索气候协变量的空间和时间非平稳效应。我们使用2009年至2011年中国四川省每月县级手足口病发生数据和相关气候和社会经济变量数据进行实验。结果:交叉验证实验表明,与普通(68.27%),时间(72.34%),空间(75.99%)和时空(77.60%)生态模型相比,STVC模型达到了最佳平均预测准确率(81.98%)。在贝叶斯模型评估中,STVC模型也优于这些模型。在这项研究中,STVC模型能够将风险指标优势比(OR)空间化为局部OR,以表示空间和时间变化的疾病 - 气候关系。在中国四川,我们检测了36个月内疾病发生和疾病 - 气候协会的局部时间非线性季节趋势和空间热点。在六个典型的气候变量中,温度(OR = 2.59),相对湿度(OR = 1.35)和风速(OR = 0.65)不仅与手足口病发生率的增加有关,而且还表明其局部的时空变化。与手足口病有关。结论:我们的研究结果表明,县级手足口病干预措施可能需要考虑不同的地方范围的时空疾病 - 气候关系。我们提出的贝叶斯STVC模型可以捕获时空非平稳暴露 - 响应关系,用于详细的暴露评估和高级风险绘图,并为更广泛的环境科学和空间统计提供新的见解。分析健康的时空变异效应以及影响疾病的因子,利用贝叶斯模型构建,当然我们也可以考虑类似GWR之类的方法,但是时空非平稳性将会在未来的时空统计当中成为重要的制约要素。

4.Aerosol-driven droplet concentrations dominate coverage and water of oceanic low level clouds/气溶胶驱动的液滴浓度主导海洋低层云的覆盖和水

对海洋上的云凝结核(CCN)气溶胶缺乏可靠的估计严重限制了我们通过反射太阳辐射来量化它们对云特性和冷却程度的影响的能力 - 这是人为气候强迫的一个关键不确定因素。 在这里,我们介绍了一种方法,用于将云属性归因于CCN,并将气溶胶效应与气象效应隔离开来。 其应用表明,对于给定的气象学,CCN解释了云辐射冷却效应的3/4变化,主要是通过影响浅云覆盖和水路径。 这表明云辐射对CCN的敏感性比先前报道的要大得多,这意味着如果将其纳入目前的气候模型中,则会产生过多的冷却。 这暗示了未知的补偿气溶胶升温效应,可能是通过深层云层。上一篇博客介绍了很多关于气溶胶光学厚度的论文,这里提供了一篇发表于Science的论文,事实上阐述的是气溶胶造成的升温效应,其实这也是目前对这块关注的另一个点,除了造成了大气污染之外,阻隔太阳辐射造成的气候变化,升温效应也是一个很值得关注的问题。这一点应该之前有介绍过,可以关注植物所刘玲莉老师团队的成果。

5.A Simple but Quantifiable Approach to Dynamic Price Prediction in Ride-on-demand Services Leveraging Multi-source Urban Data/一种简单但可量化的方法,用于利用多源城市数据的按需服务中的动态价格预测

Uber和滴滴等按需乘车(RoD)服务越来越受欢迎,在这些服务中,动态价格在平衡供需方面发挥了重要作用,使驾驶员和乘客受益。然而,动态价格也引发了担忧。对于乘客而言,“不可预测的”价格有时会阻止他们做出快速决策:如果他/她选择等待一段时间,人们可能会怀疑是否有可能获得更低的价格。有必要向他们提供更多信息,预测动态价格是一种可能的解决方案。对于交通运输行业和政策制定者而言,人们也担心RoD服务与地铁,公共汽车和出租车等更传统的对应物之间的关系:它们是否相互影响以及如何相互影响。在本文中,我们通过使用多源城市数据预测动态价格来解决这两个问题。价格预测可以帮助乘客了解他们是否可以在相邻位置或在短时间内获得更低的价格,从而减轻他们的担忧。该预测基于来自多个来源的城市数据,包括RoD服务本身,出租车服务,公共交通,天气,城市地图等。我们训练具有高维复合特征的简单线性回归模型以执行预测。通过将简单的基本特征组合成复合特征,我们可以弥补由于缺乏非线性而导致的线性模型中表现力的损失。此外,使用多源数据和线性模型使我们能够通过检查模型中不同特征的权重来量化和解释多种运输方式之间的关系。我们希望这项研究不仅可以作为一个准确的预测,使乘客更满意,而且还可以揭示对行业或政策制定者的不同交通工具之间关系的关注。北航王静远老师团队的成果。基于Uber和滴滴的RoD服务与价格研究,面向政策制定者和乘客。基于大数据的MAAS类服务的一个研究基础。该文章应当是发表于计算机顶会ACM的会议论文。

6.Dynamic Price Prediction in Ride-on-demand Service with Multi-source Urban Data/基于多源城市数据的按需乘车服务动态价格预测

Uber和滴滴(中国)等按需乘车(RoD)服务越来越受欢迎,在这些服务中,动态价格在平衡供应(即汽车数量)和需求(即,乘客请求的数量)使司机和乘客受益。然而,动态价格也引起了乘客的担忧:“不可预测的”价格有时会阻止他们轻松做出快速决策。人们可能想知道如果他/她选择等待一段时间是否有可能获得更低的价格。为乘客提供更多信息有助于解决这一问题,预测价格是一种可能的解决方案。在本文中,我们基于多源城市数据进行动态价格预测。价格预测可以帮助乘客了解他们是否可以在相邻位置或在短时间内获得更低的价格,从而减轻他们的担忧。该预测基于来自多个来源的城市数据,包括RoD服务本身,出租车服务,公共交通,天气,城市地图等。使用多源城市数据的理由是RoD的动态价格可能受到不同数据源中发现的不同因素的影响。我们训练神经网络来执行预测,并评估使用多源城市数据的不同组合的预测准确性。我们的研究结果表明,使用多源城市数据确实有助于提高预测精度,不同的数据集可能会对动态价格产生不同的影响。与上一篇基本类似,也是基于多源数据的实时服务动态价格预测,也是王静远老师团队的成果。同样发表于ACM会议,上文用了一个简单线性模型,本文用了一个神经网络。这些都是未来MAAS类服务的关键基础计算。

7.An improved merge scheme for MODIS Collection 6.1 Dark Target and Deep Blue combined aerosol products/MODIS Collection 6.1 Dark Target和Deep Blue组合气溶胶产品的改进合并方案

我们之前的研究表明,操作中分辨率成像光谱仪(MODIS)集合6.1暗目标(DT)和深蓝(DB)组合产品(表示为DTB0)在大多数地区并不总是最好的不合适的合并方法。因此,本研究的目的是开发一种改进的合并方案,以增加时空数据覆盖范围并降低估计不确定性。为此,根据DT和DB算法的高性能和弱点,进行了三次测试,即土地利用型测试,陆地表面测试和气溶胶型测试。对于最新的气溶胶自动监测网络(AERONET)版本3 Level 2.0测量,保证检索(针对DT的QA = 3,针对DB的QA≥2)。基于此,生成新的合并的DT和DB产品(表示为DTB1)。 Terra和Aqua DTB1产品随后在现场,大陆和全球范围内的279个站点进行AERONET测量,并在2013年至2017年期间针对不同的下垫面和高架地形进行验证。收集同期的DTB0产品用于比较。超过90%的站点现在拥有更多的数据点,并且DTB1产品的性能得到改善,数据百分比增加到预期误差[±(0.05 + 15%)]范围内,并减少了平均绝对误差和与大多数站点的DTB0产品相比,均方根误差。单独和相等数字比较表明,DTB1产品显着改善了数据覆盖范围和数据质量。新的合并产品比操作产品更精确,受表面结构变化的影响更小。这些结果表明改进的合并方法更加稳健,可用于生成更准确的全球气溶胶产品。因为DT和DB目前是主流的AOD反演算法,然而这两种算法却都有各自缺点(植被和水体区域反演),导致在反演过程的产品有各自的缺陷,因此将二者组合起来的方案目前也被大家广泛认可,这个产品值得进一步研究。

8.Quantification of the ecosystem carrying capacity on China’s Loess Plateau/中国黄土高原生态承载力量化

植被重造,特别是植树造林,已成为控制荒漠化的重要工具。然而,在水资源有限的地区重新植被将不可避免地减少社会经济系统的可用水量,这在可持续生态系统管理决策中考虑不周。本文提出了一个框架,以确定植被生产力的阈值(即生态系统承载能力),对应于黄土高原上生态系统的可用水资源(即年降水量减去社会经济系统的水需求)。 1982-2012年的年平均生态承载力(ECC)为577±124,空间梯度从西北向东南增加。岩石山区的植被最大值为833±200。因子分析表明,降水量和人类用水量的变化分别占区域ECC多年代际变化的55%和45%。同时,由于植被恢复,黄土高原上26个县,主要是东南部和东部,在研究期间已超过ECC阈值。另外138个县在生态系统和社会经济系统之间的水竞争潜力很大。在区域范围内,有9年(约30%的研究期),其间已超过ECC门槛,特别是在1997年之后。考虑到未来气候变化和社会经济系统对水的需求不断增长,相应的ECC门槛将提高6-36%。我们认为,这些研究结果可为政策制定者提供参考,以便在满足人类对水资源的需求的同时制定生态系统可持续政策。这篇文章讲述的是生态承载力的量化,这里选用的是可用水资源,事实上个人觉得将这个作为生态承载力指标,可能正在黄土高原可以适用,但是当研究区域变化的时候,个人觉得不再适用,因为黄土高原生态系统受到的关键制约确实是水。这篇文章也发表于生态指标的top期刊,Ecological Indicators,但是我个人认为关于生态承载力的量化依旧是值得研究的内容。

9.Combined effects of rainfall regime and plot length on runoff and soil loss in the Loess Plateau of China/黄土高原降雨量与小区长度对径流和土壤流失的综合影响

本文的目的是研究降雨方式和坡长对不同土地利用下径流和土壤流失的相互作用。从2008年到2016年,黄土高原地区的森林,灌木和草地的事件径流和土壤流失量均为5,9和13米。共记录了59次侵蚀性降雨事件,分为3种降雨状况。首先,结果表明,径流系数为草>灌木>森林,土壤流失为草>林>灌木,但径流中森林与灌木和草与林之间土壤流失的差异未达到显着水平。其次,降雨制度对不同土地利用下的径流和土壤流失具有重要影响。灌木林地和林地中的最低径流系数和最高土壤流失分别与灌木林和林地的土壤流失量最大,总体上,降雨量1的径流系数最高,为0.84-2.06%,其次是3为0.33-0.88%,方案2为0.04-0.06%。森林和草地的土壤流失具有不同的制度顺序3>制度1>制度2.第三,径流系数和土壤流失都随着地块长度的增加而减少,而边坡长度对径流/土壤流失的影响受到土地利用类型和降雨方式。在黄土高原上研究降雨量及不同土地利用对于土壤流失的影响,比较有典型的研究。

10.Cooling effect of trees on microclimatic comfort in urban green space: A review of literature/树木对城市绿地小气候舒适度的降温效应 - 文献综述

在过去的十年中,许多研究提出了“绿化”城市开放空间的树种选择指南,作为缓解气温上升和城市热岛效应的方法,使城市成为气候“热点”。树种的降温效果可分为两个部分;冷却强度和冷却延伸。这两个组成部分受到不同因素的影响。这篇文献综述揭示了树种对温度和周围环境的影响。在此基础上,确定了影响冷却强度和冷却延伸的两个组成部分:内部因素和外部因素,这对于人类活动和福祉的城市开放空间的小气候舒适度的有效性是必不可少的。提取的内部因素或指标如下;尺寸指数,形状指数,树种和树冠覆盖率是大多数研究中最常见的指标。外部因素可分为气候和当地环境参数。对已审查研究的讨论反映了每个指数对冷却强度和冷却延伸的影响。本文还从1950年到2018年的各种同行评审技术论文,期刊和报告中考虑了确定这些指标的现有方法和技术。此外,本研究还确定了未来景观建筑研究的空白和前进方向。通过本地树木对城市开放空间小气候舒适度的降温作用,减缓热量的其他相关学科,使得印度热带城市的气候变为“热点”。关键词:树木,减热,冷却延伸,冷却强度,小气候舒适度。关于热岛效应的总数研究,重点研究树木对于区域小气候的影响,包括热舒适度的研究,这方面应该是未来热岛研究的一大热点。

11.Measuring the Vibrancy of Urban Neighbourhoods Using Mobile Phone Data with an Improved PageRank Algorithm/用改进的PageRank算法利用手机数据测量城市社区的活力

邻域是空间互动的共享空间。邻里的活力代表了一个地方的人,活动和价值观之间的协同作用,增加了社区的活力并刺激了经济机会。它可以在质量和数量上进行调查。然而,准确绘制活力图存在技术挑战。随着通信技术的最新进展和诸如移动电话的位置感知设备的普及,可以大规模地收集和分析各个轨迹。在先前的研究中,对应于不同轨迹的活力的权重没有区别。在这项研究中,提出了一种改进的使用加权二分图的PageRank算法来从不同的角度测量城市社区的活力,这突出了不同类型公民产生的活力之间的差异。这种方法将土地与人类活动更紧密地联系起来,为城市资源配置和城市规划提供了新的视角和指导。利用PageRank算法测度城市活力,城市活力是当前城市领域一个很热的话题,这篇文章是篇很不错的研究案例。

12.Spatial Heterogeneity in the Determinants of Urban Form: An Analysis of Chinese Cities with a GWR Approach/城市形态决定因素的空间异质性 - 基于GWR方法的中国城市分析

研究塑造可持续城市形态的城市形态的决定因素具有重要意义。以前的研究一般认为,在不考虑空间异质性的情况下,城市形态的决定因素在空间单元中没有变化。为了推进对城市形态决定因素的理论认识,本研究试图利用地理加权回归(GWR)方法研究289个中国地级城市城市形态决定因素的空间异质性。结果揭示了城市形态与其潜在因素之间的空间变化关系。人口增长被发现促进了大多数中国城市的城市扩张,并降低了部分中国城市的城市紧凑程度。行政区域较大的城市更有可能分散城市形态。事实证明,工业化对位于中国东部沿海地区的城市的城市扩张没有影响,中国是该国最发达的地区。发现地方财政收入加速了许多中国城市的城市扩张和城市形态的不规范。结果发现,固定投资对城市扩张产生了双向影响。此外,城市道路网络和公共交通也被确定为一些城市的城市形态的决定因素,这支持了复杂的城市系统(CUS)理论。这项研究产生的政策含义在于为中国的决策者和城市规划者塑造可持续的城市形态。地级市尺度的城市形态研究,基于GWR的研究。

13.Suicide mortality and natural environments – Authors’ reply/自杀死亡率和自然环境 - 作者的答复

我们欢迎BenceMátyás关于我们关于自杀死亡率与绿色和蓝色空间之间关系的文章的评论.1在此,我们想回应他的两个观点。

首先,Mátyás评论说我们的研究不是“同类中的第一个”,并且在参考Nutsford和同事的2016年回顾性研究时证实了这一陈述。经过仔细考虑后,我们得出结论,他的观察结果只是部分有效,因为他正确在他们的通信中,Nutsford和同事的研究将蓝色空间与心理压力联系起来,但与自杀死亡率无关。正如我们在文章中所做的那样,我们承认,关于蓝色空间对心理健康的潜在致痛作用的证据越来越多。但是,我们强调这一证据是否适用于自杀死亡率仍然是一个悬而未决的问题。

其次,Mátyás质疑我们心理健康模型的缺失。他的观察是正确的,正如在官方统计的任何生态学研究中一样,困难在于通常不存在这样重要的个人水平变量。实际上,由于这些限制,我们并没有试图就这些问题得出最终结论,尽管我们确实将它们作为进一步研究的主题,以了解其潜在机制。

作者回复,与其他学者的一个argue的过程。同时讲述了蓝绿空间与人群健康的关系。

14.Urban Structure Accessibility Modeling and Visualization for Joint Spatiotemporal Constraints/城市结构可达性建模与联合时空约束的可视化

在现代城市,服务提供商希望识别难以从多个消防站到达的区域,公民希望在靠近每个人的餐馆中与朋友会面,并且管理员想要查找远离两个公交车站的区域是否需要新的一个。这些任务涉及研究城市结构在多个地理空间和时间约束下的动态可达性,这是地理科学和城市交通中的一个重要课题。在本文中,我们提出了一个新的计算模型和一个可视化系统,帮助领域用户交互式研究共同约束的可访问区域,街道段和兴趣点(POI)。特别是,城市结构可达性可视化系统建立在新的Min-Max联合集模型之上,其中专门设计的集合操作不仅代表可访问区域,而且还根据联合约束计算城市结构的最小和最大访问时间。计算和可视化由新的图模型支持,该模型适应真实世界的动态交通状况以及城市街道段和POI的地理设置。可视化系统允许用户方便地构建和管理可访问区域并可视地探索其内部的城市结构。在当前大数据时代下,动态可达性分析研究成为了非常重要的一环,替代了传统的基于路网的的静态可达性分析。