Coding and Paper Letter(六十八)

资源整理。

1 Coding:

1.Python库heartrate,用于简单实时地可视化Python程序的执行。

heartrate

2.Python库clusterpy,空间约束聚类算法库。

clusterpy

3.2020年APS介绍R研讨会的材料。

APS IntroR 2020

4.使用空间数据的统计和机器学习模型的超参数调整和性能评估。

pathogen modeling

5.R语言包NHSRdatasets,用于培训和学习的免费NHS和医疗保健相关数据集R。

NHSRdatasets

6.图片分类资源集合。

awesome image classification

7.关于人体姿势估计的资源集合。

awesome human pose estimation

8.车道检测资源。

awesome lane detection

9.语义分割资源。

awesome semantic segmentation

10.R语言包landmap,提供了用于自动映射的方法,即使用Ensemble Machine Learning的空间插值和/或预测(扩展了mlr包的功能)。

landmap

11.目标检测资源。

awesome object detection

12.分布式爬虫从零开始教程。

Python crawler tutorial starts from zero

13.这是用R编程语言编写的脚本集合,以及解释脚本如何工作的指南。 该脚本是使用图像分割和随机森林分类器编写的图像分类。 目的是提供强大的图像分类方法,可供具有适度遥感体验的人使用。

RandomForestForRemoteSensing

14.机器学习的交互可视化。

machine learning interactive visualization

15.机器学习实验的图像增强。

imgaug

16.R语言包bbsBayes,bbsBayes是一个对北美育种鸟类调查(BBS)数据进行分层贝叶斯分析的软件包。 ‘bbsBayes’将对您选择的一个或多个物种进行完整的模型分析,或者您可以采取更多控制并指定数据应如何分层,为JAGS准备或建模。

bbsBayes

17.正在进行的研究培训大规模转换语言模型,包括:BERT。

Megatron LM

18.GeoDist函数用于估计样本之间的测地距离。

GeodesciDistance

19.rasterio的xarray扩展。

rioxarray

20.R north conference 2019会议演讲者材料。noRth针对中级到高级R用户,包括为期半天的Shiny短期课程和一天的互动式会谈。

2019Talks

21.来自瑞士联邦统计局(SFSO)的瑞士土地统计数据集的扩展pandas界面。

swisslandstats geopy

22.这个仓库包含作者(Allison Horst)推特账户上共享的#rstats,数据科学和统计插图,非常不错的插图资源,这里就不放图片了,欢迎大家点击下面的链接关注。

stats illustrations

23.教程“用matplotlib创建出版品质图片”的讲义。

matplotlib for papers

24.引爆github的华为鸿蒙系统。

HarmonyOS

25.python模拟登陆一些大型网站,还有一些简单的爬虫。

awesome python login model

26.仪表板探索美国生态学会2019年会议的推文(#ESA2019)。

tweets ESA2019

27.R语言包vapour,R的轻量级GDAL API包。

vapour

2 Paper:

1.Using Low-Cost Air Quality Sensor Networks to Improve the Spatial and Temporal Resolution of Concentration Maps/利用低成本空气质量传感器网络提高浓度图的时空分辨率

我们提出了一种分析来自“低成本空气质量监测仪”(LCAQM)网络的细颗粒物(PM2.5)数据的方法,以获得精细分辨的浓度图。在该方法中,基于扩散模型,我们首先识别源的可能位置,然后通过将浓度的模型估计拟合到相应的测量来估计来自这些源的排放的大小。然后使用排放来估计覆盖感兴趣区域的网格上的浓度。然后使用克里金法将监测器位置处的模型估计值与测量浓度之间的残差内插到网格点。我们通过将其应用于位于南加州帝王谷的20个LCAQM网络来说明这种方法。使用扩散模型估算潜在的平均浓度场,可以比直接克里金观测值更准确地估算PM2.5浓度的空间分布。这篇文章实现空气质量时空制图的思路与回归克里格的思路比较类似,但是又有所不同,回归克里格是利用回归模型预测浓度接着插值观测样本上的残差。而这篇文章利用了一个扩散模型先预测观测样本上的预测浓度,后面那步同样是插值。这是个蛮有意思的思路。事实上扩散模型可以作为一个重要的辅助模型。

2.Measuring Bandwidth Uncertainty in Multiscale Geographically Weighted Regression Using Akaike Weights/使用Akaike权重测量多尺度地理加权回归中的带宽不确定性

带宽是地理加权回归模型中的关键参数,与正在检查的基础空间异构过程发生的空间尺度密切相关。通常,基于某些标准(例如Akaike信息准则(AIC))选择单个最佳带宽(地理加权回归)或一组协变量特定的最佳带宽(多尺度地理加权回归),然后参数估计和推断是条件的。这个带宽的选择。在本文中,我们发现带宽选择在单尺度和多尺度地理加权回归模型中都存在不确定性,并证明可以测量和计算这种不确定性。基于模拟研究和凤凰城肥胖率的经验实例,我们表明可以通过Akaike权重定量测量带宽不确定性,并且可以获得带宽的置信区间。了解带宽不确定性可提供有关不同过程运行的规模的重要见解,尤其是在比较协变量特定带宽时。另外,可以基于Akaike权重来计算带宽选择不确定性的无条件参数估计。来自ASU的Li Ziqi博士的文章,关于分析GWR的带宽及其不确定性文章。带宽是GWR非常重要的参数,也是地理学尺度效应的一种定量化体现。

3.Spatiotemporal Changes in PM 2.5 and Their Relationships with Land-Use and People in Hangzhou/杭州市PM 2.5的时空变化及其与土地利用和人口的关系

中国城市空气污染程度和程度的增加已经成为公众关注的主要问题和政府的负担。虽然有大量文献关注空气污染的现状,变化和原因(特别是PM 2.5和PM 10),但人们对它们的影响却知之甚少。在这项研究中,我们使用中国杭州作为我们的测试平台来评估PM 2.5对更容易受到污染的年轻人群的直接影响。我们使用中等分辨率成像光谱仪(MODIS)的气溶胶光学厚度(AOT)产品和空气质量的地面监测数据,对2015年PM 2.5的时空变化进行了研究。我们进一步探讨了这些分布的土地覆盖,人口密度和学校(幼儿园,小学和中学)探索寻求潜在缓解方案的潜在影响。我们发现PM 2.5浓度的季节变化是冬季>春季>秋季>夏季。在杭州,暴露于PM 2.5>50μgm-3的土地面积占冬季的59.86%,春季的56.62%,秋季的40.44%和夏季的0%,而PM 2.5的土地面积<35μg夏季,冬季,秋季和春季的m -3分别为70.01%,5.28%,5.17%,4.16%。至于土地覆盖,森林的PM 2.5为35-50μgm-3(即低于其他覆盖类型),可能是由于森林的潜在过滤和吸收功能。更重要的是,基于人口加权暴露水平(pwel)的定量指数表明,只有9.06%的人口生活在符合国家空气质量标准的地区。只有1.66%(14,055)的婴儿和青少年生活在PM 2.5 <35μgm-3的区域。考虑到PM 2.5长期的遗留影响,我们强烈建议改善空气质量和人员(即健康状况)的监测系统,特别注意婴儿和青少年。基于MODIS的AOD数据和地面监测站点分析,分析了不同土地利用以及人口暴露情况。可以作为后续分析的先验知识。

4.Spatio-temporal patterns of traffic-related air pollutant emissions in different urban functional zones estimated by real-time video and deep learning technique/通过实时视频和深度学习技术估算不同城市功能区交通相关空气污染物排放的时空格局

本文的目的是通过交通监控视频和图像识别中收集的实时交通数据,探讨不同城市功能区内车辆类型和数量的时空格局与交通相关的大气污染物排放之间的关系。使用基于视频的检测技术分析数据,同时通过污染物排放系数量化空气污染。结果表明:(1)交通污染物排放顺序为高速公路>商业区>工业区>居住区>港口; (2)每个污染物的日最大排放量发生在工作日和周末的不同功能区。除高速公路外,商业区平日排放的CO,HC和VOC排放量最高,而所有污染物(CO,HC,NOx,PM2.5,PM1.0和VOC)排放量最高的是周末。工业区平日排放的NOx,PM2.5和PM1.0排放量最高; (3)除港口地点外,所有功能区的污染物排放(CO,HC,NOx,PM2.5,PM1.0和VOC)在早晚峰值达到峰值; (4)汽车和摩托车是与交通有关的污染物排放的主要来源。通过基于视频的车辆检测以更精细的时空分辨率收集数据,是一种经济有效的方法,可以映射与交通相关的空气污染的时空模式,从而有助于城市规划和气候变化研究。在当前深度学习大热背景下的一篇文章,利用视频识别技术来分析交通数据从而推断出PM2.5等大气污染物,得到区域大气污染物排放的时空格局。

5.Impact of China’s Air Pollution Prevention and Control Action Plan on PM2.5 chemical composition over eastern China/中国大气污染防治行动计划对中国东部地区PM2.5化学成分的影响

中国于2013年颁布了“大气污染防治行动计划”(行动计划),并制定了严格的控制措施,以减轻细颗粒物(PM2.5)的污染。在这里,我们使用基于卫星的PM2.5化学成分数据,使用CMAQ模拟和卫星输入,研究了2013-2017期间与中国东部相关的PM2.5化学成分变化。由于PM2.5中所有化学物质的减少,PM2.5浓度在此期间显着下降。中国东部的人口加权平均浓度从SO42-的11.1降至6.7μgm-3,NO3-为13.8-13.1μgm-3,NH4 +为7.4-5.8μgm-3,9.9-8.4μgm-3对于OM,对于BC为4.6-3.8μgm-3,对于PM2.5中的其他物种为12.9-9.6μgm-3。 SO42-的降幅最大,为40%,而NO3-的降低幅度最小,为5%,导致PM3.5中NO3-的比例较大,SO42-的比例较小。在三个主要地区中,京津冀的PM2.5及其化学成分减少幅度最大。 SO4 2浓度的下降与二氧化硫排放量的减少一致,二氧化硫减排的主要驱动因素是工业部门。 NO3-浓度的降低是有限的,因为SO2排放的减少和稳定的NH3排放促进了HNO3形成NO3-,这部分地抵消了电力部门驱动的NOx排放的减少。为了更有效地减轻PM2.5污染,未来需要努力减少NH3排放。分析大气行动政策政策对PM2.5化学成分的影响。结合了CMAQ模拟和卫星数据。式中来说工业部门仍旧是排放的主要源头。但是从评估结果而言,政策执行后,PM2.5浓度整体是下降的。当然这篇文章利用的化学传输模式与卫星结合的方法是值得我们关注的。

6.AMSR2 snow depth downscaling algorithm based on a multifactor approach over the Tibetan Plateau, China/基于多因素方法的青藏高原AMSR2积雪深度降尺度算法

准确动态测量青藏高原(TP)的积雪深度(SD)对于了解当地气候系统和地表水文循环具有重要意义。目前,被动微波遥感是用于监测SD中时空变化的最有效方法。然而,现有SD产品的大的不确定性和低空间分辨率导致在具有复杂地形条件,强季节转换和大的时空异质性的区域(例如TP)中不太令人满意的被动微波遥感。在这项研究中,评估了地理位置,地形,积雪天数和亮度温度。然后,关键因素被用于开发先进的微波扫描辐射计2(AMSR2)SD降尺度模型。结果表明:(1)SD受地理位置,积雪天数,地形参数和亮度温差的影响很大。表面粗糙度与地面观测结果具有最佳相关性,反映了SD的变化的44%; (2)结合AMSR2亮温数据和其他辅助数据的新型多因素功率SD降尺度模型,具有更高的精度和稳定性,与SD地面观测密切相关,反映了80%的SD变化; (3)与日本宇宙航空研究开发机构(JAXA)发布的AMSR2上升和下降轨道SD产品以及中国西部环境与生态科学数据中心(WESTDC)的SD数据集相比,提出的缩减SD数据集为TP大大提高,均方根误差(RMSE)和平均绝对误差(MAE)大大降低(分别为2.00 cm和0.25 cm); (4)TP的缩小SD数据集在SD <3 cm的区域显示出良好的准确度(RMSE = 0.58 cm); (5)缩小的SD产品的最差监测精度是草原,RMSE为2.07厘米。降尺度SD产品的最佳精度是在裸地覆盖条件下发现的,RMSE仅为0.41cm。青藏高原的积雪深度产品的降尺度算法研究,发表于RSE上,分析了多个不同因子对于积雪深度的影响,然后利用这些因子构建降尺度模型,从结果而言还是很不错的。

7.基于众源数据挖掘的中国饮食口味 与慢性病的空间关联

慢性病是全球最主要的死亡原因,在所有慢性病风险因素中,不健康饮食因素居于首位,也是影响最广泛的风险因素。尽管已有许多关于饮食行为的研究,但在饮食口味与慢性病关联方面尚缺乏定量研究。鉴于此,利用众源网络菜谱数据,提取菜系中多维口味信息,结合不同地区分类的餐饮类兴趣地点(POI)数据,定量分析不同地区人群口味偏好;使用地理探测器方法,从空间分异性角度建立7种口味与出血性卒中、胰腺癌、上呼吸道感染3种慢性病的关联,得到饮食口味对慢性病空间分布的解释能力度量值。结果表明:在7种口味中,过咸是出血性卒中的首要口味风险因子;一定程度的甜是胰腺癌的首要口味风险因子,且甜的程度与胰腺癌风险并非呈简单线性关系;过辛是上呼吸道感染的首要口味风险因子,三者在统计上均表现显著。本文首次提出了基于众源数据挖掘的潜在健康风险因素定量研究方法,可以应用于病因的探索性分析,并有助于公共卫生部门制定相应的干预措施。来自于团队的成果,分析当前新兴的POI大数据与慢性病的空间关联,使用了地理探测器进行分析,发表于地理学报。

8.Volatile organic compounds at a rural site in Beijing: Influence of temporary emission control and wintertime heating/北京农村地区挥发性有机化合物:临时排放控制和冬季取暖的影响

虽然住宅煤/生物质燃烧可能是PM2.5的一个主要且未被充分认识的排放源,特别是在冬季,但燃烧的固体燃料是否对环境挥发性有机化合物(VOCs)有很大影响,后者是二次有机气溶胶的前体。 (冬季雾霾事件中通常对颗粒物质有较高贡献的(SOA)。在本研究中,环境空气样本于2014年10月25日至12月31日在北京东北部中国科学院(UCAS)校园的农村地点进行收集,用于VOCs分析。由于11月3日至12日实施了临时干预措施,以改善11月5日至11日在北京举行的亚太经济合作组织(APEC)峰会的空气质量,11月15日亚太经合组织峰会后,北京集中供暖于11月15日开始实施。这个样品采集期提供了一个很好的机会来研究临时控制措施和冬季加热对环境VOCs的影响。由于11月3日至12日(第二阶段)实施的临时干预措施,非甲烷碳氢化合物的总混合比平均为11.25ppb,比第一期(10月25日)的23.41ppb低约50%。 11月)和第三期(11月13日至12月31日)的21.71ppb。在相对于时期I的时段II期间,臭氧和SOA形成电位分别降低50%和70%,SOA形成电位的较大降低归因于主要来自溶剂使用的对芳烃的更有效控制。后向轨迹分析表明,在I,II和III期,南风气团中VOCs的平均混合比分别是北方气团的2.3,2.3和2.9倍;所有的VOC事件都是在南风的影响下发生的,这表明南部城市化地区的排放强于北部农村地区。基于正矩阵分解(PMF)受体模型,交通排放和溶剂使用的改变贡献可分别解释周期II中相对于时期I的环境VOC减少的47.9%和37.6%,表明临时控制车辆排放和溶剂使用的措施可有效降低VOC的环境水平。煤炭/生物质燃烧,汽油废气和工业排放是主要来源之一,它们在第一,第二和第三期分别贡献了60.3%,78.6%和78.7%的挥发性有机化合物。煤炭/生物质燃烧,主要是住宅燃煤,成为主要来源,占冬季采暖期间挥发性有机化合物的45.1%,南风气候的平均贡献百分比(38.2%)明显低于北方气团(48.8)。 %)。结果表明,工业和交通部门的排放控制在降低非采暖季节的环境活性VOC方面更为有效;然而,在冬季采暖季节,减少固体燃料的住宅燃烧产生的排放将更加重要,并且可以通过降低室内和室外空气污染来获得健康的共同利益。分析了北京农村地区VOCs受临时排放控制(如APEC之类的大型活动)以及冬季取暖的影响。本研究采用的是当前大气污染溯源比较主流的几个关键方法,后向轨迹分析,正交矩阵分解(PMF)。结果上表明住宅燃煤是主要来源,尤其在冬季供暖期间。工业和交通部门排放则是非供暖季节的重要控制源头。

9.Impacts of climate change on future air quality and human health in China/气候变化对中国未来空气质量和人类健康的影响

近年来,空气污染每年在中国造成100多万人死亡,成为公共卫生工作的重点。然而,未来的气候变化可能会通过增加增加空气污染暴露的天气条件的频率和持续时间来加剧这种对人类健康的影响。在此,我们结合气候,空气质量和流行病学模型,在代表性浓度路径4.5(RCP4.5)下评估气候变化中的未来空气污染死亡。我们发现,假设污染排放和人口保持在当前水平不变,到本世纪中叶,气候变化将对中国85%以上的人口(约占土地面积的55%)的未来空气质量产生不利影响,并且会增加细颗粒物(PM 2.5)和臭氧的人口加权平均浓度分别为3%和4%。因此,我们估计每年将增加12,100和8,900中国人(95%置信区间:分别为10,300至13,800和2,300至14,700),分别来自PM 2.5和臭氧暴露。重要的潜在气候机制是极端条件的变化,如大气停滞和热浪(分别对死亡率的增加贡献了39%和6%)。此外,中国人口老龄化的脆弱性将进一步增加2050年PM2.5和臭氧的死亡人数,分别为1和3倍。我们的研究结果表明,气候变化和更加剧烈的极端事件可能会增加中国严重污染事件的风险。因此,在气候变化中管理中国的空气质量将变得更具挑战性。发表于PNAS的一篇论文,分析气候变化对空气质量以及人类健康的影响。结合了气候、空气质量和流行病学模型的集成研究,非常不错的一篇文章。

10.Space-for-time substitution in geomorphology: A critical review and conceptual framework/地貌中的时空替代:一个重要的综述和概念框架

在某些自然环境条件下,地貌演化通常呈现“年轻到老”分布的空间格局,从而对空间序列中的地貌类型和特征进行采样可以为个体地貌的演变和变化提供证据。这种所谓的时空替代一直是地貌研究的一种方法论。本文首先介绍了时空替代的基本概念和背景,然后对基于时空替代的地貌演化的近期研究进展进行了全面回顾,如河流地貌,结构地貌,河口地貌和沿海地貌。最后,开发了地貌中时空替代的基本原理。本综述旨在介绍使用时空替代方法进行地貌演化研究的成果,并指出关键的研究需求,以便更好地理解和预测未来的地貌演化。汤国安老师团队的成果,分析地貌演化的综述和概念框架。

11.Using matrix models to estimate aboveground forest biomass dynamics in the Eastern USA through various combinations of LiDAR, Landsat, and Forest Inventory Data/利用矩阵模型通过LiDAR,Landsat和森林资源清查数据的各种组合估算美国东部地上森林生物量动态

通过不同的时间,空间和生态系统测量(例如,森林结构与土壤有机碳)协调数据来源以创建陆地碳基线的能力对于改进陆地碳储量和库变化的监测至关重要。在这项研究中,我们开发并研究了矩阵模型的短期(5年)和长期(30年)性能,用于结合光探测和测距(LiDAR)条带样品和时间序列Landsat表面反射高级数据产品通过现场清查测量来预测美国东部 - 明尼苏达州(MN),缅因州(ME),宾夕法尼亚州 - 新泽西州(PANJ)和南卡罗来纳州(SC)的研究地点的地上生物量(AGB)动态。矩阵的行和列是根据库存图和物种组和直径等级分类的林分密度(即每单位面积的树木数量)。通过短期模型比较,我们发现三个矩阵模型预测的平均林分基面积(B)均落在观测值的95%置信区间内。三个矩阵模型基于(i)仅实地清查变量(清单),(ii)LiDAR和Landsat衍生的指标与现场库存变量(LiDAR + Landsat +清查)相结合,以及(iii)仅Landsat衍生的指标相结合实地清查变量(Landsat +清查)分别为。从长期来看,使用LiDAR + Landsat +库存和Landsat +库存变量的预测AGB具有与2015年至2045年仅清查变量的矩阵模型预测的AGB模式(7.2 Mg ha-1之间的差异)相似。从模糊集中,到2045年,所有三个矩阵模型都具有相似的AGB(在7.6 Mg ha-1之间的差异)。因此,矩阵模型的使用使得LiDAR,Landsat和现场数据的各种组合,特别是Landsat数据,能够估算大-scale AGB动态(即碳储量监测的核心组成部分),仅使用森林清单中的变量而不会降低准确性。这些研究结果表明单独使用Landsat数据包括海拔(E),地块坡度(S)和方位(A)以及场地生产力(C)可以产生适当的AGB动态估计(范围从67.1到105.5 Mg ha-1)在2045年)使用矩阵模型实际的AGB动态。这样的框架可以提供对陆地碳储量和清单变化的精确监测和估计,从空间明确到空间显性和空间连续估计,并提供时间灵活性和Landsat时间序列的连续性。构建了一个矩阵模型结合LiDAR,清查数据以及Landasta数据来实现森林AGB的估计。从结果证明,效果最好的还是三种数据的组合,事实上这也是当前的一个重点,结合LiDAR,卫星遥感和地面调查的AGB估计。