追逐风暴的数据:机器学习会在美国有用的数据雷暴报告

雷暴的货架云靠近爱荷华州立校园。

雷暴的货架云靠近爱荷华州立校园。 放大。 通过法案鸡照片。

 

爱荷华州艾姆斯比尔 - 鸡已经知道追逐夏日风暴或两个。但他没有这样一个去后。

在2019年7月17日,一场雷雨走近美国沙巴体育官网的校园。鸡,教授 地质与大气科学为首要高于他在农学建筑的办公室屋顶。他没有忘记一个摄像头。

他的一张照片中显示的架子云标志着严重的雷雨大风的边缘。云计算的独特线平分照片中,低,夏普和气势,在这里没有蓬松。他的办公室外面平时工作繁忙奥斯本驱动大部分是空的 - 有几个人在街上被打开西北偏北,虎视眈眈的风暴。

“架子云的平滑度和低海拔使其成为一个令人印象深刻的视觉来观察,”鸡在照片的说明中写道。 “它形成,雷暴内快速移动的冷空气扩散出来,迅速提起温暖潮湿的空气在它上面”。

我们都看到了几十个雷暴。和 国家气象服务 尽职尽责地保留每个人的记录和分类及其在暴雨强度报告数据库。对于被标记雷暴“严重”,例如,它必须产生一个龙卷风,在直径或比风58英里每小时大于冰雹大于1英寸。

但大多数雷暴不超过隆隆管乐器。所以气象学家已经根据风暴的破坏估计风如大树倒了,吹走屋顶或大棚推倒。和大部分的时间,当被报道的那种风的伤害,雷暴简单地归类为严重,与之配套的指定没有真正的测量。

这是研究人员,如鸡谁需要良好的数据,以帮助他们开发更好的方法来预测严重,局部雷阵雨的一个问题。

 

大数据问题

当鸡来自爱荷华州的理论听到校园同事和应用数据的机器学习科学研究小组的谈话,他认为该技术的数据分析能力可以帮助他研究分析报告风暴数据库。也许计算机可以找到在报告中,可能会导致新的预测工具的关系或联系?

好了,没有这么快,说,科学家在 美国国家海洋和大气管理局(NOAA).

通过对环境信息的国家中心维持现有的强雷暴数据库将没有多大用处给鸡或其他研究人员在寻找风数据。风报告是不可靠的。所需要的报告进行清理,他们可能是强风的研究非常有用了。

研究小组
研究人员,从左至右,somak杜塔,詹妮弗·纽曼,
兰詹迈特拉,埃里克·韦伯,票据鸡,伊丽莎白tirone和
苏布拉提·贝尔。 放大。

所以这是鸡和一队美国爱荷华州立数据科学家要做的事情。通过一个为期三年,$ 650,000诺阿基金的支持,他们会使用电脑和机器学习工具冲刷的报告,并确定每一个实际上描述了强风雷暴的概率。

这是不小的任务 - 鸡说,科学家们将用12年的强雷暴报告开始。这其中大约18万人。

“和90%的那些18万份报告包含风估计,”鸡说。 “他们不是根据气象站的数据。他们中的大多数说的树木或四肢下来 - 叫别人说,““我的树砸了下去。”

通过这些报告排序引起各种数据的研究人员的挑战,埃里克·韦伯,一个项目的合作者和沙巴体育官网教授 数学.

第一,他说报告是完全由人收集,而不是精确,精密的仪器数据。报告还含有天然的日常用语。有成语,短语的转弯,甚至必须由机器学习用软件分析错别字。

第二,雷暴是非常复杂的。存在很多变数 - 空气上升,冷凝,降水,雷电和更多的温度 - 即必须收集,量化和分析,了解风暴。

韦伯 - 谁介绍的机器学习作为“使得基于它提供的信息连接”人工神经网络 - 说,计算机软件可以处理大量的数据风暴的会压倒人的团队。

机器学习软件也确实在很非人的方式。

“当我们看数据,我们试图了解该数据作为人类,”韦伯说。 “我们把我们的看法和偏见。主要原因机器学习中的一个被使用,因此现在成功的是它并没有带来预想的概念对数据的分析中。

“它可以找到潜在的关系,人类不能因为他们的先入之见。”

 

朝更好的预测

作为电脑制造与风暴报告进度,鸡说,他将提供在NOAA的年度,周之久的更新和示威 危险天气试验台 在诺曼,俄克拉何马州。该试验台是在5月的龙卷风季节,是一个机会,让研究人员和预报员使用最新的预测思路,工具和技术。

鸡希望炫耀的雷雨风研究的进展。他将收集的意见和建议。和所有最终可能导致一个新的预测工具,预测雷暴会产生强风的可能性。

“现在对于诺阿的主要需要的是清理数据库为更好的研究,”鸡说。 “但我们已经意识到,如果这个项目与机器学习顺利,我们可以看到它如何可能作为预测工具的工作。”