Coding and Paper Letter(七十)
资源整理。
1 Coding:
1.JupyterHub的流量模拟器。
2.前端面试手册。
3.Python学习课程。
4.从ArcGIS/ESRI格式中提取栅格数据。从Readme来看,似乎在寻求GDAL大佬加持共同构建程序。
5.OCP-Hack项目是为参加OCP HackFest的伙伴准备的动手实验指导,主要是帮助伙伴在Azure上快速了解和运用Azure IoT Services, Azure Cognitiver Services, Azure Machine Learning等。本项目会持续更新以方便伙伴学习到最新的Azure内容。
6.PaddlePaddle (PArallel Distributed Deep LEarning) 是一个简单易用、高效灵活、可扩展的深度学习平台,最初由百度科学家和工程师共同开发,目的是将深度学习技术应用到百度的众多产品中。
7.“通过逐步堆叠高效培训BERT”的源代码。
8.纽约女子机器学习与数据科学scikit learn研讨会资源。
9.PySAL与Python数据栈的地理数据科学。
10.R语言包StatsBombR,可以使用您的登录凭据轻松地从API流式传输StatsBomb数据,也可以从Open Data GitHub存储库免费获取到R中。
11.R语言包mapscanner,用于打印地图,绘制地图,扫描它们,然后转换为空间对象。
12.机器学习的监督学习——以R语言为例课程。
supervised ML case studies course
13.R语言包comat,comat的目标是基于空间数据创建共生矩阵,包括加权共生矩阵(wecoma)和综合共生矩阵(incoma)。
14.Python项目车牌检测。
15.R语言包rcppexamples,简单的Rcpp例子。
16.网络爬虫学习。
17.一个简单的LaTeX模板,用于创建事件名称标签。
18.在任何Web浏览器中运行的开源虚拟星球Web应用程序,支持WebGL HTML5标准。
19.R语言包myspatial,在R中进行空间数据分析和建模的函数集合。来自Roozbeh Valavi。
20.X-DeepLearning(简称XDL)是面向高维稀疏数据场景(如广告/推荐/搜索等)深度优化的一整套解决方案。
21.关于机器阅读理解的必读文章。
22.容器里的kepler.gl,这是uber公司开源的webgl可视化神器。
23.机器学习算法的提升建模和因果推理。
24.一个用于Python的增压SQLite库。
25.写轮眼包的r slides转ppt样例。
26.XrViz是一个用于可视化浏览Xarrays的交互式图形用户界面(GUI)。 您可以沿各种维度查看数据数组,检查数据值,更改颜色映射,提取系列,在地图上显示地理数据等等。 它建立在Xarray,HvPlot和Panel上。 它可以与Intake一起使用,以平滑调查和加载数据集的过程。
27.80种方式遍布全球——制图教程:介绍如何使用地理数据和地图。
28.R语言可视化,日本火山的山体阴影。
29.一个R语言项目的proposal,全局地理空间分析。
30.R语言包ggnewscale,ggnewscale尝试在ggplot2中使用多个颜色和填充比例。
31.示例仪表化电子商务应用程序。
32.全新的小程序开发体验。
33.hmm是一个高度图网格划分实用程序。
34.应用机器学习来预测LendingClub.com上的贷款冲销。
35.StarQuant(中文名:易数交易系统)是一个轻量的、面向个人( 普通)用户的综合量化交易回测系统,目前主要用于期货期权程序化交易,后期会考虑加入股票交易的功能。
36.在ggplot2中构建绘制高质量质量图片的分步示例。
37.R语言包VICmodel,VICmodel是可变渗透能力(VIC)宏观分布式水文模型的R实现。
38.R语言包modelplotr,modelplotr包可以轻松创建大量有价值的评估图,以评估预测模型的业务价值。 使用这些图表,可以显示模型的实施将如何影响业务目标,如响应或广告系列的投资回报。
39.R语言包ggpointdensity,散点图和2D密度图之间的交叉。
40.CWATM是IIASA水计划的一个新的关键要素,用于评估全球和区域层面的供水,水需求和环境需求。
41.R语言包baRcodeR,baRcode生成器标签,用于生物样本的更多可重复工作流程。
42.“3D多目标跟踪基准”的官方Python实现。
43.R语言包wordcountaddin,一个RStudio插件,用于计算R markdown文档中文本中的单词和字符。 它还具有计算可读性统计信息的功能,因此您可以了解文档的读取容易程度或难度。
44.计算机视觉专用的数据集,变换和模型。
45.R语言包mlr3db,使用数据后端扩展mlr3包以透明地处理数据库。 内部依赖于包dplyr和dbplyr的抽象。
46.有关创建R建模包的建议。
model implementation principles
47.针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要新闻。
48.专门整理github的资源的资源仓库。
49.数学学习相关资源。
50.Jekyll的干净简约主题。
51.R语言包openeo,包含允许与openEO后端服务器交互的函数和类。
52.R语言包RSAGA,通过运行SAGA的命令行版本,从R内部访问地理信息系统(GIS)’SAGA’(自动地球科学分析系统)的地理计算和地形分析功能。
53.社会科学数据工匠研讨会。
54.R语言包slide,slide提供了一系列通用的“滑动窗口”功能。 API有目的地非常类似于purrr,这些函数的目标通常是计算滚动平均值,累积总和,滚动回归或其他基于“窗口”的计算。
55.用作编写和运行MOOSE PorousFlow模拟输入文件的python接口。
56.R语言包ceramic,目标是获得网络地图瓦片。 使用空间对象定义感兴趣的区域。
57.互联网上的免费书籍。
58.一种高效的深度学习集群动态资源调度器。
59.R语言包PMwR,实际管理金融投资组合的功能:回溯测试投资和交易策略,计算损益和回报,分析交易,报告等。 PMwR的目标是提供一小组可靠,高效和方便的工具,帮助处理和分析贸易/投资组合数据。
60.分析评估五大湖休闲海滩BMP可能引起的水质变化的数据。
61.Jupyter笔记本中的电子表格插件。
62.R语言包distill,Distill for R Markdown是一种针对科学和技术交流而优化的网络发布格式。
63.程序员技能图谱。
64.GDAL的Julia版本。
65.通过AlphaGo Zero方法学习国际象棋强化。
66.用于读取,写入和创建Dfs0,Dfs2,Dfs3和Res1D的Python方法。
67.PyTorch中的贝叶斯优化。
68.PySAL与Python数据栈的地理数据科学的书。
69.描述性的机器学习解释。
70.用于自然语言处理(NLP)的最先进的预训练模型库。
71.R语言包golem,是建立生产级shiny应用程序的固定框架。
72.在GitHub上使用的精彩动作的精选列表
73.H2数据库的空间扩展。
74.Flask的Rest API。
75.R语言包pmapply,pmapply的目标是在一系列向量上应用成对函数。
76.Gitalk是一个基于Github Issue和Preact的现代评论组件。
77.全国大学生数学建模竞赛 LaTeX 论文模板。
78.katiejolly的博客。一位数据科学家。
79.本网站包含PPHA 31002随附的为期5周的统计I编码研讨会的内容。该课程于2019年秋季学期为芝加哥大学哈里斯公共政策学院的学生讲授。
80.100天的机器学习课程。
81.R语言包waterquality,目标是将卫星反射图像转换为一系列预定义的水质算法,用于检测cholorophyll-a,蓝绿藻(藻蓝蛋白)和浊度。 该软件包能够处理以下传感器配置:WorldView-2,Sentinel-2,Landsat-8,MODIS,MERIS和OLCI。
82.最爱的R包集合。
83.一种机器学习程序,能够识别外汇或股票数据中的模式。
Forex and Stock Python Pattern Recognizer
84.与空间相关的代码,API,数据和其他资源的精选列表。
85.高级可视化教程。
86.南加州大学的城市信息学课程。
87.面向对象的纯Python B-Spline和NURBS库。
88.R语言包TraitMatching,如仓库名称的论文的代码。
89.递归voronoi图。
90.动手学深度学习一天训练营。
91.R语言包microsimulation,微观模拟是一种基于个体的随机模拟。
92.轻松的超参数优化和跨机器学习算法和库的自动结果保存。
93.Depthy显示具有3D视差效果的Google Camera Lens模糊照片,并从中创建动画GIF。 加上深度图提取,让您创建自己的深度图!
94.用于实时地形网格生成的JavaScript库。
2 Paper:
由于缺乏准确的灌溉信息,灌溉地区土壤水分,土壤温度和表面湍流通量的最佳估算受到限制。为了解决不精确灌溉量的输入不确定性,提出了一种改进的数据同化方案,即EnKS(Ensemble Kalman Smoother),通过膨胀和定位(称为ESIL)来估算灌溉土壤水分,土壤温度和表面湍流通量。通过同化多源观测来实现这些领域。位于黑河流域中游灌溉玉米农田的达曼站在本研究中被选中,以研究拟议的同化方案的性能。将第一层土壤中测得的地表温度(LST)和表层土壤水分(SSM)作为观测值,进行一系列数据同化试验,分析缺乏灌溉信息和多源观测组合的影响。估算土壤湿度,土壤温度和表面湍流通量。本研究证明了ESIL在改善未知灌溉条件下水热条件估算中的可行性。对于第一层土壤水分和土壤温度,与ESIL方法的系数相关系数(R)分别从0.342和0.703增加到0.877和0.830。同时,表面湍流通量显着提高。李新老师团队的成果,发表于农林科学top杂志农林气象。多源数据同化路面模型,使用黑河流域的数据。重点是针对土壤水分、土壤温度以及表面湍流通量的估算改进。这几个变量是地表建模以及未来气候变化建模研究的重要参数,尤其对于森林碳循环。
夜光遥感观测为我们提供了及时和空间明确的人类活动测量,因此可以实现诸如跟踪城市化和社会经济动态,评估武装冲突和灾害,调查渔业,评估温室气体排放和能源使用等一系列应用。夜光遥感新的和改进的传感器,算法和产品用于分析光污染和健康影响,与其他对地观测和辅助数据(例如,地理位置大数据)相结合,共同为深入理解人类活动和相关的环境后果提供了巨大的潜力。改变世界。本文回顾了夜光遥感传感器和产品的进展,并从两个方面(即人类活动和环境变化)探讨了夜光遥感对于感知变化世界的贡献。在对夜光遥感技术进展的历史回顾的基础上,总结了当前夜光遥感研究面临的挑战,提出了四个战略方向,包括:改善夜光数据;开发一系列一致的夜光数据;将夜光观测与其他数据和知识相结合;并促进对夜光观测的多学科和跨学科分析。包含余柏蒗老师、周成虎院士等人在内对夜光遥感卫星观测当前应用、进展、挑战和前景的阐述。回溯了当前夜光遥感重要的几个研究领域,也提出了很多展望。是一篇非常不错的夜光遥感入门文章。
已经假设城市树木有效地清洁空气颗粒物质(PM),而种间差异尚未明确定义,尤其是PM化学成分。在这项研究中,来自3种常绿树种(杜松:杜松;黑松:Pinus tabuliformis var.mukdeais;云杉:红皮云杉)的叶表面和蜡层的PM用于发现PM吸附及其组成性状的差异(表征通过X射线衍射,X射线光电子能谱,傅立叶变换红外光谱和电感耦合等离子体发射光谱法)。通过详细的整个城市树木普查和物种调整数据的不同情景,还评估了PM去除的可能改进。我们发现:1)杜松叶上PM的含量为5.73 g.m-2,比黑松和云杉高2-2.5倍(p <0.05)。其中,蜡层中有38.73%,38.22%和23.11%。 2)与PM数量的明显种间差异相比,更复杂的种间差异表现出不同成分性状的不同模式。通常,叶面PM具有较高的O,Si,Al,Fe,N,Pb,Cu,Ni,Cr和Cd,而蜡PM具有较高的C和Na含量(p <0.05)。 3)关联排序发现叶片尺寸越小,叶片含水量越低,单位质量叶面积越大,蜡含量越高,气孔开度越大,叶片PM吸附量越大,C = O伸展量越大,O,Si,Al,N,PM中Pb,Cu,Ni,Cr和Cd的重金属。 4)与其他2种物种相比,城市森林中杜松百分比的增加对于最大限度地从空气中去除PM更有效,伴随着更多的重金属去除,但PM中的结晶矿物质更少。我们的研究结果强调,城市绿化中适当的物种配置可以最大限度地提高空气PM去除能力。定量试验的城市树木滞尘研究,同时还结合了宏观的树木普查数据,可以为宏观森林滞尘提供一些参考。
地理建模的关键问题之一是准备足够且适合模型的输入数据。这需要相当多的时间,精力和专业知识,因为地理模型及其应用环境复杂多样。此外,数据和数据预处理工具都是多源,异构的,有时对于特定的应用程序上下文不可用。手动准备输入数据的传统方法不能有效地支持地理建模,尤其是对于复杂的集成模型和非专家用户。因此,迫切需要有效的方法,这些方法不仅能够为模型准备适当的输入数据,而且还易于使用。在本综述文章中,我们首先分析影响数据准备的因素,并讨论在开发地理模型的输入数据准备方法时应完成的三个相应的关键任务。然后,通过将地理模型的现有输入数据准备方法分类为三类:手动,(半)自动和智能(即,不仅(半)自动但也适应应用上下文)方法。在采用知识表示和推理技术的支持下,该领域的最先进方法指向地理模型的智能输入数据准备,其中包括知识支持的发现和数据预处理功能的链接,知识 - 数据预处理的驱动(半)自动工作流构建(或地理Web服务环境中的服务组合),以及基于人工智能规划的服务组合及其参数设置。最后,我们从以下几个方面讨论挑战和未来的研究方向:模型数据和工作流的共享和重用,数据发现和处理功能的集成,面向任务的输入数据准备方法,以及地理建模知识库的构建,所有这些通过智能输入数据准备,帮助开发易于使用的地理建模环境。朱阿兴老师团队的成果,一篇关于地理建模输入数据准备综述。事实上这个输入数据准备很像当前AI研究,从弱、半人工智能迈向全人工智能,地理学也正在随着大数据、人工智能而不断发展。
5.A Spatial Perspective on the Econometrics of Program Evaluation/程序评价计量经济学的空间透视
区域科学的实证研究对因果推理越来越感兴趣,利用计量经济学,统计学和相关领域的见解。这导致了几篇概念论文和实证论文。然而,在这种背景下,空间效应(例如空间依赖性(SD)和空间异质性(SH))的作用还不太清楚。这种空间效应违反了Rubin提出的所谓的稳定单位处理值假设,作为经验处理效果分析的基础框架的一部分。在本文中,我们更仔细地考虑空间效应的作用。我们简要概述了一些扩展现有计量经济学处理效果评估方法的尝试,并考虑了空间方面和概述,并说明了另一种方法。具体而言,我们提出了一个空间明确的反事实框架,利用空间面板计量经济学来解释治疗选择,治疗变异和治疗效果中的SD和SH。我们通过复制众所周知的治疗效果分析来说明这一框架,即1970 - 1984年期间美国各州最低法定饮酒年龄法对死亡率的评估效果,这是应用因果推理的经典教科书范例。我们复制了文献中的结果,并将这些结果与包含空间效应的一系列替代规范进行了比较。来自局部莫兰指数之父Lucas Anselin的一篇论著关于计量经济学以及空间效应的文章,经济地理与空间计量经济的因果推理典型案例解析。
农业景观树木在生态系统服务中发挥着至关重要的作用,包括支持人类生计的粮食安全。它们可以进一步提供适应和减缓之间的协同作用,以应对气候变化影响。了解地上树木生物量和沿海拔梯度的土壤有机碳储量为更好地管理碳库提供了机会。然而,关于海拔梯度如何影响农田的木质生物量碳和土壤的分散树木的土壤,特别是在干旱地区,人们知之甚少。方法:研究区域分为五类(500-1000,1000-1500,1500-2000,2000-2500和2500-3000m a.s.l)。从每个分层的海拔梯度中随机选择样方(100 m×50 m)。在每个采样点,在60 cm土壤深度采集一个复合土壤样品进行土壤有机碳分析。出于木质生物量估计的目的,使用针对类似区域开发的异速生长方程。最后,估算地上生物量碳(AGC),地下生物量碳(BGC),土壤有机碳(SOC)和总碳储量(TC)状态,并使用单因素方差分析(ANOVA)比较变量。结果:结果表明AGC,BGC,SOC和TC随海拔梯度变化显着(p <0.05)。高海拔(2500-3000米)AGC,BGC,SOC和TC储量估计分别为17.97 Mg C ha-1,6.53 Mg C ha-1,23.09 Mg C ha-1,47.59 Mg C ha-1 ,并且显着高于其他海拔梯度。结论:我们得出结论,农田上的零星树木具有很高的碳储存潜力,这可能极大地促进了气候适应性绿色经济战略,并应促进其保护。分析农田景观树木的碳储量潜力,事实上笔者在完成毕业论文的时候经评阅老师提醒发现IPCC2006年温室气体清单编制指南就已经将农田作为碳源计算,事实上农田的固碳潜力与其碳排放的关系当前没有多少研究做的准确,这篇文章虽然仅仅是利用简单的异速生长模型计算分析,但仍然具备很大的意义。
尽管近年来社会经济发展与PM2.5浓度之间的关系引起了多学科学者的极大关注,但PM2.5浓度与能量消耗,能源强度,经济增长和不同收入国家城市化之间的因果关系水平仍然知之甚少。本研究根据收入水平将国家分为四个小组,以调查1998-2014年期间能源消耗,能源强度,经济增长,城市化和PM2.5浓度之间的偶然关系。为实现这一目标,采用了平衡的面板数据和计量经济学方法。结果表明,在所有组中,PM2.5浓度与所研究的变量之间存在协整关系。基于矢量误差校正模型的面板格兰杰因果关系检验的结果表明,能源消耗,能源强度,经济增长和城市化导致长期PM2.5浓度增加。经济增长是影响全球小组,高收入小组和中高收入小组PM2.5浓度的主要变量。我们认为,除了那些属于低收入群体的国家外,所有国家的短期内能源强度都可以降低PM2.5浓度。相反,短期内降低城市化水平并不是减少PM2.5浓度的有效方法。我们的研究结果进一步表明,能源消费结构是影响中低收入和低收入国家PM2.5浓度的最大因素。PM2.5影响因子的研究,利用面板数据和计量经济学方法分析PM2.5与能源消费结构、能源强度、经济增长与城市化的关系。从结果而言,应该是如预期所料。而关于后续的政策分析还是具有更大的价值,指出不同发展层次的国家的污染控制政策强度与方向。
成功申办2022年冬季奥运会(北京2022年,官方称为第二十四届冬奥会),极大地激发了中国人对冬季运动参与的热情。因此,由于巨大的市场需求和政府支持,中国滑雪产业正在迅速蓬勃发展。但是,在不合理的地点投资滑雪场将从经济角度(在运营和管理方面)以及地理问题(如环境退化)方面造成问题。因此,根据科学指标评估滑雪场的适宜性已成为滑雪产业可持续发展的先决条件。在这项研究中,我们通过基于地理信息系统(GIS)空间分析结合遥感,在线和实地调查数据的线性加权方法,综合其自然和社会经济条件,评估中国滑雪场的位置适宜性。评估自然适宜性的关键指标包括积雪,气温,地形条件,水资源和植被,而社会经济适宜性则根据经济条件,交通的可达性,到旅游景点的距离以及到城市的距离来评估。因此,考虑到自然和社会经济条件,从0到1的度量被用于定义滑雪场开发的每个候选区域的适合性阈值。当位置综合指数小于0.5时,滑雪场被认为是一个令人沮丧的前景。结果显示,84%的现有滑雪场位于综合指数大于0.5的区域。最后,基于多标准指标提出了相应的决策者发展战略,这些指标将扩展到纳入未来气候变化和社会经济发展的潜在影响。但是,应使用具有本地数据的造雪模型来进一步分析特定滑雪场的适用性。比较有意思的研究,关于2022冬奥会的一篇文章,基于GIS手段分析当前滑雪场适宜性分析,结合了大量的遥感、实地调查数据。很接地气的研究。
以前的研究已经认识到边缘对犯罪的重要性。各种学者已经探索了一种特定类型的边缘如物理边缘或社会边缘如何影响犯罪,但很少研究复合边缘效应的重要性。为了解决这一差距,本研究介绍了Suomi国家极地轨道合作卫星(NPP-VIIRS)上的可见红外成像辐射计套件传感器的夜光数据,以测量复合边缘。本研究将边缘定义为夜间渐变 - 夜间光线从像素到其邻域的最大变化。利用夜间灯光梯度和道路水平的其他控制变量,本研究应用负二项回归模型来研究边缘对辛辛那提街头抢劫率和入室盗窃率的影响。模型的Akaike信息准则(AIC)表明,夜间渐变可以提高街头抢劫和盗窃模型的适用性。此外,夜间渐变对街头抢劫率产生积极影响,同时对入室盗窃率产生负面影响,这两者在α值为0.05时均具有统计学意义。对这两类犯罪的不同影响可以通过犯罪的性质和原地特征(包括夜灯)来解释。来自柳林老师团队的成果,分析夜间灯光对街头抢劫与入室盗窃的影响。这个研究相比于以前的犯罪地理研究加入了一个关键的因子:夜间灯光梯度。但是过去也有人研究街头灯光对犯罪的影响,但是从大尺度对地观测的研究,这还是笔者见到的第一篇研究,非常值得关注这一方面的未来进展。