Coding and Paper Letter(六十七)

资源整理。

1 Coding:

1.matplotlib的初学者教程。

matplotlib tutorial

2.加州大学伯克利分校IT研究主页。

ucb-rit.github.io

3.最新教程材料的仓库来自华盛顿大学2019年ICESat-2 Hack Week。

ICESat2 hackweek tutorials

4.强化学习算法的实现。 Python,OpenAI Gym,Tensorflow。 练习和解决方案。

reinforcement learning

5.李宏毅机器学习笔记。

leeml notes

6.Grid studio是一个基于Web的电子表格应用程序,完全集成了Python编程语言。它旨在提供用于加载,清理,操作和可视化数据的集成工作流程。 这是通过用Go编写的电子表格后端实现的,其中集成了Python运行时来操作其内容。最近横空出世的一个神器,号称可以代替excel。

gridstudio

7.分位数回归的回归诊断与可视化。

quokar

8.用于RStudio Server和空间分析包的Dockerfile。

docker rstudio spatial

9.R语言包enmSdm,更快,更好,更智能的生态位模型和物种分布建模工具。

enmSdm

10.Rmarkdown简介,以及如何使用它来更有效地编写。

Manuscripts in Rmarkdown

11.密度估计算法的Pytorch实现:BNAF,Glow,MAF,RealNVP,平面流。

normalizing flows

12.城市信息学与可视化课程资料,来自于加州大学伯克利分校城市与区域规划系,授课教授为Paul Waddell。这是一个实践课程,培训学生分析城市数据,开发指标,并使用Python编程语言,开源工具和公共数据创建可视化和地图。 本课程将首先介绍Python编程的基础知识,然后再进行数据分析/可视化工具和技术的调查。 课堂会议将包括讲座和研讨会。 一系列练习将强化所呈现的技能和主题,最终项目将为学生提供机会,从开放数据门户收集数据到合成和分析这些数据以探索问题或问题,从而开发更完整的项目。 在Web地图和博客中传达他们的结果,以及最终的演示。

urban informatics and visualization

13.用于在Derek M. Jones的“基于证据的软件工程:基于公开数据”中创建示例的代码和数据。

ESEUR code data

14.R语言包rcrossref,适用于各种CrossRef API的R客户端。

rcrossref

15.R语言包openintro,“OpenIntro”资源的补充功能和数据,包括openintro.org上的开源教科书和介绍性统计资源。 该软件包包含我们的开源教科书中使用的数据集以及用于复制书籍图形的自定义绘图功能。 该软件包还包含OpenIntro实验室中使用的数据集。

openintro r package

16.通过Docker和ShinyProxy部署Shiny Apps的模板。

deploy shiny app

17.link2GI提供了一些功能,使得将常见的开源GIS软件包直接连接到R-biotop变得容易一些。它支持使用包装程序包和通过系统调用直接使用API。它侧重于Linux和WindowsX操作系统,但它也应该与OSX一起使用。

link2GI

18.该软件包是一组越来越多的工具,用于使用NHDPlus数据模型处理水文数据。

nhdplusTools

19.此仓库包含由Earth Engine用户社区提交和/或维护的内容。

earthengine community

20.可配置,易于维护的个人网站。

Topaz

21.R用于可重复的科学分析,使用Gapminder数据对非程序员的R介绍。

scu r intro 2019

22.Slide:矢量到栅格
Slide是一种将矢量数据与栅格数据混合的算法/方法。 我们的想法是对栅格数据进行粗略近似,并让算法将折线滑动到“图像”。 结果是正确采样的矢量折线与栅格数据的轮廓匹配。

slide

23.2019年美国环保局R用户组研讨会议程。

epa r workshop 2019

24.R语言包expss,expss计算并显示支持“SPSS”样式标签,多个/嵌套横幅,权重,多响应变量和显着性测试的表格。

expss

25.从Dockerfile为R 3.5.3构建mxnet框架。

r mxnet

26.使用所有可用的Landsat数据为土地覆盖的连续变化检测和分类(CCDC)开发的算法。

CDCC

27.Microsoft Cognitive Toolkit(CNTK),一个开源的深度学习工具包。

CNTK

28.U-GAT-IT的官方Tensorflow和Pytorch实现:具有自适应层实例规范化的无监督生成注意网络,用于图像到图像的转换。

UGATIT

UGATIT pytorch

29.现代统计图形书籍。

MSG Book

30.R语言包moveability,可移动性:全球城市的可步行性和自行车可达性性指标。

moveability

31.分布式系统资源。

awesome distributed system

32.深入浅出分布式基础架构。

Distributed Infrastructure Series

2 Paper:

1.Effects of plantation age and precipitation gradient on soil carbon and nitrogen changes following afforestation in the Chinese Loess Plateau/黄土高原人工林年龄和降水梯度对造林后土壤碳氮变化的影响

退化土地的造林显着影响土壤有机碳(SOC)和总氮(STN)的封存。种植年龄和气候梯度对造林后SOC和STN变化的相互作用尚不清楚。在本研究中,黄土高原沿着降水梯度(410~600 mm yr-1)选择了5个地点。在不同种植年龄的农田和刺槐(Robinia pseudoacacia L.)森林中测量了0-200cm深度的SOC和STN储量,即幼林(<15年),中年森林(15-25)年)和老森林(> 25年)。幼林,中龄林和农田0-200 cm剖面的SOC和STN库存均显着增加,年平均降水量(p <0.05),而老林SOC库存增加趋势不明显,表明降水梯度中SOC和STN储量随年龄变化的变化。造林后的SOC库变化(ΔSOC)随着年轻森林年平均降水量的增加而增加,但在中老龄森林中呈下降趋势。三个森林的STN库变化(ΔSTN)在大多数地点都是负的,并且它们都沿着降水梯度下降。 ΔSOC与ΔSTN之间存在显着正相关(p <0.01),1 g STN库存积累分别伴有8.40 g,6.10 g和10.48 g幼龄林,中龄林和老林的SOC累积。 SOC和STN库变化的不同模式应纳入土壤C和N建模和估算。分析退化土地造林后,人工林年龄和降水梯度对土壤碳氮库的影响,傅伯杰院士团队成果,发表于LDD。森林不仅仅本身是一个重要的碳库和氮库,同时影响土壤的碳库和氮库。

2.Polycentric urban development and economic productivity in China: A multiscalar analysis/中国多中心城市发展与经济生产力:多尺度分析

“城市多中心”已成为捕捉新兴经验现实的概念框架和欧洲,美国以及最近中国城市采用的空间规划愿景。尽管关于多中心的学术文献正在蓬勃发展,但只有有限的尝试来探讨不同空间尺度的多中心城市发展是否以及如何影响城市经济。在本文中,我们实证分析了中国不同空间尺度的城市多中心是否以及如何与城市经济绩效相关联。为此,我们扩展了Cobb-Douglas生产函数,并包括城市间和城市内多中心的度量,以解释劳动生产率的差异。该分析将城市内单中心和城市间多中心与劳动生产率水平联系起来。此外,分析指出了聚集溢出效应,以及城市内和城市间多中心之间潜在的弱正相互作用效应。本文最后总结了对中国空间发展的政策含义。城市多中心的多尺度分析研究,分析城市多中心性与城市经济的关系。

3.Bike-sharing or taxi? Modeling the choices of travel mode in Chicago using machine learning/自行车共享还是出租车?使用机器学习模拟芝加哥出行模式的选择

在许多大城市,自行车共享系统(BSS)和出租车在运输服务中发挥着关键作用。它们都提供按需运输选项,并允许灵活的骑行计划和路线。以前的文献已将BSS和出租车与其他交通方式(如公共交通和私人汽车)进行了比较,但对影响这两种方案之间旅行选择的时空因素知之甚少。了解BSS和出租车的出行模式对于交通需求分析和可持续交通规划至关重要。此外,深入研究旅行行为的模式,特别是当人们选择出租车上的BSS时,将提供有关人类流动性和积极生活研究的宝贵见解。在这项研究中,我们调查了2014年至2016年芝加哥BSS和出租车行程的时空模式。为了模拟BSS和出租车之间的出行选择,我们应用机器学习技术来模拟基于环境和时间因素的交通工具。结果显示了BSS的季节性旅行变化和出租车行程的下降趋势。 BSS速度相对稳定,而滑行速度的变化主要是由于时间和地点。基于随机森林模型,其已证明最适合高处理速度,行程距离和公园和娱乐设施的数量似乎是旅行选择的关键空间预测因素。根据任何时间和地点,该模型可以为用户推荐BSS和出租车之间的出行选择。这项研究表明了机器学习技术在城市交通研究中的重要性。研究结果可能有助于人们的交通决策,并促进可持续的交通规划。使用机器学习来模拟芝加哥城市居民出行模式的选择,分析人类流动时空模式的文章。

4.Energy and air pollution benefits of household fuel policies in northern China/中国北方家庭燃料政策的能源和空气污染效益

除了最近为减少能源生产,工业和交通运输产生的排放而采取的许多措施外,还在北京,天津和中国北方的其他26个城市开展了以住宅固体燃料替代电力或天然气的新活动,旨在解决该地区严重的环境空气污染。定量分析表明,该活动可以显着加快住宅能源转型,如果能够实现计划目标,预计到2021年将有超过60%的家庭去除固体燃料,相比之下,没有这项活动的人数不到20%。主要空气污染物的排放量将大幅减少。实现了60%的替代,2021年初级PM 2.5的排放和环境PM 2.5浓度的贡献预计分别为30%和41%。通过60%的替代,冬季客厅平均室内PM 2.5浓度预计将从209(190到230)μg/m³降低到125(99到150)μg/m³。考虑到可以实现60%或100%的替代,人口加权的PM 2.5浓度可以从2014年的140μg/m³降低到2021的78μg/m³或61μg/m³。尽管该活动最初的重点是解决环境空气质量问题,但减少暴露的原因更多来自室内空气质量的改善,因为农村人口每日暴露的90%可归因于室内空气污染。女性比男性受益更多。PNAS上的文章,研究北京、天津和中国北方的其他26个城市关于家庭燃料政策实施下的能源和空气污染效益。这是自大气十条以及大气治理开始后,中国北方重要的一项政策,评估政策的环境和经济效益是非常重要的。这篇文章做了一个很有意义的研究。

5.Optimising Citizen-Driven Air Quality Monitoring Networks for Cities/优化城市公民驱动的城市空气质量监测网络

几十年来,空气质量对公共健康,环境以及最终对各国经济产生了重大影响。有效减轻城市地区的空气污染需要准确的空气质量暴露信息。传感器技术的最新进展以及志愿地理信息(VGI)的日益普及为城市空气质量暴露评估开辟了新的可能性。然而,公民及其传感器被放置在被认为主观感兴趣的区域(例如,公民居住的地方,他们的孩子的学校或工作空间),并且这导致在最佳空气质量暴露评估方面错失机会。此外,虽然目前有关VGI的文献已经广泛讨论了数据质量和公民参与问题,但很少有工作,如果有的话,提供微调VGI贡献的技术,以进行最佳的空气质量暴露评估。本文介绍并测试了一种最小化公民贡献数据的土地利用回归预测误差的方法。使用来自德国斯图加特市的数据集(N = 116个传感器)评估该方法。现有网络设计与优化方法选择的位置组合之间的比较表明空间平均预测误差下降了52%。本文中提出的想法对于系统部署VGI空气质量传感器非常有用,可以帮助创建更高分辨率,更真实的城市空气质量监测地图。空气污染始终是一个很重要的环境问题,无论是国内或者是发达国家,VGI数据为城市空气污染制图提供了新的数据集,本文就是考量VGI数据如何优化的问题。非常有意思的一篇文章,也预示着公众科学这类研究越来越受到重视。

6.Empowering A star Search Algorithms with Neural Networks for Personalized Route Recommendation/利用神经网络为A星搜索算法提供个性化路由推荐

个性化路线推荐(PRR)旨在响应用户的路线查询生成用户特定的路线建议。早期研究将PRR任务作为图表上的寻路问题,并通过整合启发式策略采用自适应搜索算法。虽然这些方法在某种程度上是有效的,但它们需要通过启发式设置成本函数。另外,在搜索过程中难以利用有用的上下文信息。为了解决这些问题,我们建议使用神经网络自动学习PRR任务的经典启发式算法的成本函数,即A星算法。我们的模型由两部分组成。首先,我们采用基于注意力的递归神经网络(RNN),通过结合有用的上下文信息来模拟从源位置到候选位置的成本。 RNN组件不是学习单个成本值,而是能够学习用户的移动状态的时变矢量化表示。其次,我们建议使用价值网络来估算从候选地点到目的地的成本。为了捕获结构特征,通过结合用户的移动状态和其他上下文信息,在改进的图注意网络之上构建价值网络。这两个组件以原则方式集成,以获得候选位置的更准确成本。三个真实世界数据集的广泛实验结果表明了该模型的有效性和鲁棒性。

7.Fusion of Change Vector Analysis in Posterior Probability Space and Postclassification Comparison for Change Detection from Multispectral Remote Sensing Data/后验概率空间变化向量分析与多光谱遥感数据变化检测后分类比较的融合

后分类比较(PCC)已被广泛用作变化检测方法。 PCC算法直观且易于应用于所有卫星图像,无论它们是从相同的传感器获取还是在相同的环境条件下获取。但是,PCC容易出现累积错误,这是由分类错误引起的。或者,后验概率空间中的变换向量分析(CVAPS),其基于比较像素的后验概率向量来解释变化,可以减轻PCC中存在的分类误差累积。 CVAPS根据变化向量的方向识别变更类型。但是,变换向量可以转换为特征空间内的新位置;因此,CVAPS可以使用相同的方向测量来描述多种类型的变化,这是不可想象的。我们提出的方法通过使用CVAPS和PCC的融合来识别土地覆盖过渡。在提出的算法中,与CVAPS相反,不需要指定阈值以提取变化。此外,所提出的方法使用随机森林作为可训练的融合方法,以便直接在从CVAPS和PCC获得的特征空间中获得变化图。换句话说,不需要指定阈值以通过CVAPS方法获得变化图,然后将其与从PCC方法获得的变化图组合。与其他关注融合多种变化检测方法的变化检测方法相比,这是一个优势。此外,所提出的方法基于CVAPS和PCC的融合识别不同类型的土地覆盖转变,以改善变化类型确定的结果。该方法适用于Landsat和Quickbird采集的图像。得到的图确认了所提出的方法作为变化检测/标记工具的效用。例如,在确定不同类型的变化时,新方法在CVAPS和PCC上的总体准确度和kappa系数相对改善平均分别为7%和9%。来自黄波老师团队的成果,。

8.Origin-Destination Flow Maps in Immersive Environments/沉浸环境中的OD流向图

沉浸式虚拟和增强现实头戴式耳机可以将平面图像覆盖在任何表面上,或者在用户周围的空间中悬挂虚拟对象。该技术正在迅速改进,并且从长远来看,可以在许多情况下取代传统的平板显示器。当显示器不再是固有的平面时,我们应该如何使用用户周围的空间进行抽象数据可视化?在本文中,我们就全球地理环境中的OD流量数据提出这个问题。我们报告了三项研究的结果,这些研究探索了流向图的不同空间编码。第一个实验侧重于平面地图上流动的不同2D和3D编码。我们发现,参与者对于升高的流动路径更加准确,其高度与流动距离成比例,但对于传统的直线2D流动而言最快。在我们的第二和第三个实验中,我们比较了平面地图,3D地球仪和我们称之为MapsLink的新颖交互式设计,涉及一对链接的平面地图。我们发现参与者使用MapsLink所花费的时间远远多于其他流向图,而具有凸起流量的3D地球是最快,最准确且最受欢迎的方法。我们的工作表明,仔细使用第三个空间维度可以解决复杂流向图中的视觉混乱。关于OD流向地图可视化的一篇文章,讲述了目前新兴的VR,AR技术所营造的沉浸环境可视化与2D可视化的比较。

9.Many-to-Many Geographically-Embedded Flow Visualisation: An Evaluation/多对多地理嵌入式流程可视化:评估

显示多个地理位置之间的人员和资源流是一个具有挑战性的可视化问题。 我们进行了两项定量用户研究,以评估这种密集的多对多流的不同视觉表示。 在我们的第一项研究中,我们将捆绑的节点链接流图表示和OD映射与我们称之为MapTrix的新可视化进行了比较。 与OD Maps一样,MapTrix克服了与传统流图相关的混乱,同时提供了标准OD矩阵表示中缺少的地理嵌入。 我们发现OD Maps和MapTrix具有相似的性能,而捆绑的节点链接流图表示完全没有扩展。 我们的第二项研究将参与者表现与OD Maps和MapTrix在较大的数据集上进行了比较。 表现再次非常相似。这篇文章依旧是可视化相关的论文,并且提到了一个新的OD流向图可视化方法MapTrix方法,这个方法详见本文作者前面的论文,是一个很不错的可视化方法,结合了OD图和相关矩阵热图方法。

10.Maps and Globes in Virtual Reality/虚拟现实中的地图和地球仪

本文探讨了在虚拟现实(VR)中渲染全球地理地图的不同方法。我们比较:(a)3D外星球,用户的观点在全球范围之外; (b)平面地图(渲染至VR中的飞机); (c)以自我为中心的三维地球仪,以及全球范围内的观点; (d)曲线图,通过将地图投影到围绕用户弯曲的球体部分而创建。在所有四个可视化中,可以使用标准手持VR控制器平滑地调整地理中心,并且用户通过头部跟踪的耳机可以在可视化中物理移动。对于距离比较,exocentric globe比egocentric globe和flat map更准确。对于区域比较,与平面和曲线地图相比,外心和自我中心地球需要更多时间。对于方向估计,exocentric globe比其他视觉呈现更准确,更快速。我们的研究参与者对外星中心的偏好较弱。通常,弯曲地图比平面地图有益处。几乎在所有情况下,自我中心地球被发现是效率最低的可视化。总的来说,我们的结果支持在混合现实中使用外心地球可视化进行地理可视化。基于VR的全球地图可视化方法对比,VR技术很好地改变了当前数据可视化方面的方式。

11.Dynamic Changes in Long-Term Exposure to Ambient Particulate Matter and Incidence of Hypertension in Adults: A Natural Experiment/长期暴露于环境颗粒物的成人高血压发病率动态变化:一项自然实验

在过去几十年中,许多国家致力于减少空气污染。然而,人们对空气质量改善如何影响健康知之甚少。因此,我们进行了当前的研究,以调查大型纵向队列中长期暴露于环境颗粒物(PM2.5)和高血压发病率的动态变化。我们在2001年至2014年期间招募了134 978名18岁或以上的成年人。所有参与者都接受了一系列标准体检,包括血压测量。使用基于卫星的时空模型以高分辨率(1×1km 2)估算PM2.5浓度。长期暴露于PM2.5(ΔPM2.5)的变化定义为随访期间和前一次访视期间测量值之间的差异,负值表示PM2.5空气质量的改善。时变Cox模型用于检查ΔPM2.5与高血压发展之间的关联。结果表明,2002,2003和2004年PM2.5浓度增加,但2005年开始下降。接触PM2.5时每5μg/ m3变化(即ΔPM2.5为5μg/ m3)与高血压发病率变化16%相关(风险比,0.84; 95%CI,0.82-0.86)。分层和敏感性分析通常产生类似的结果。我们发现PM2.5暴露的改善与高血压发病率降低有关。我们的研究结果表明,减少空气污染是降低心血管疾病风险的有效策略。PM2.5暴露对于高血压发病率的影响研究一直在医学地理和健康地理是有县里的,这篇文章结合了大型纵向队列医学调查数据分析得到的PM2.5暴露对高血压发病率的影响。

12.Projecting impacts of climate change on global terrestrial ecoregions/预测气候变化对全球陆地生态区的影响

世界自然基金会(WWF)利用陆地生态区,包括关键生态区(CE),脆弱的生态区(VEs)和完整的生态区(IE)对全球生物多样性进行分类,并受到气候变化的影响,气候变化被认为是一个对生物多样性保护的主要威胁。然而,未来气候变化对代表性浓度路径(RCP 2.6,4.5和8.5)下的温度,降水和云层覆盖的变化均值和极端影响对这些生态区域的特征尚未完全了解。本研究采用动态全球植被模型以及当前和未来气候情景设计,研究温度,降水和云量变化的平均值和极值对五种生态指标的影响,包括净初级生产力(NPP),碳储量生态区域的径流,野火风险和栖息地转换。对整个地面生态区以及CE,VE和IE的特定子集进行了分析。结果表明,当将2071-2100的值与基线进行比较时,未来的气候情景(无论是RCP 2.6,4.5或8.5)是否会增加所有生态区域类型的平均NPP,径流,野火风险和栖息地转换(1971-2000年)期间。相反,估计TEW,VE和CE中的平均碳储存量从基线降至RCP 2.6和RCP 4.5下的值,然后增加到RCP 8.5下的最大值。估计在RCP 8.5下IE中的平均碳储存量仍然低于基线期值。在RCP 2.6,RCP 4.5和RCP 8.5下,温度,降水和云量覆盖的变化均值和极值的气候变化通常是NPP,碳储存,径流,野火风险和栖息地转型变化的重要驱动因素。气候变化指标和五个生态指标的动态对气候变化中的生物多样性保护具有重要意义。分析气候变化对于全球陆地生态区的英雄爱能够,分析了主要的几个驱动因素。全球生态区划是一个很重要的研究。