- 研究背景
(1)气传花粉是重要的大气生物污染物。在北京城区,花粉过敏患者的阳性率超过80%,表明花粉过敏已成为一个严重的公共卫生问题。
(2)现有的花粉预测模型存在诸多局限性,如未充分考虑季节性差异,气象因子的选择多依赖主观经验,且对极端事件的预测能力不足。
- 目的:建立分季节的气传花粉预测模型,提升现有花粉预测模型的精度,为花粉易感人群提供更有效的预警,从而降低相关疾病发生率。
- 对象:北京逐日花粉数量
- 方法:
数据来源:2021-2022两年间,北京6个气象站点(海淀、朝阳、石景山、丰台、昌平和顺义)的逐日花粉数量
【相关性分析】
证明春季与秋季气象因子的相关性存在显著差异,
【格兰杰因果检验】
从以往研究中选取17种气象因子,覆盖所有和花粉含量预测相关的气象因子,随后采取格兰杰检验,筛选出对花粉含量具有显著因果关系的16种滞后气象因子。
【训练模型】
训练集:北京城区 2021~2022 年花粉季逐日花粉含量及同期气象观测数据
训练方法:文中采用支持向量机和多元线性回归方法分别对逐日花粉含量进行建模
【测试模型】
测试集:北京城区2023年花粉季逐日花粉含量预测、监测数据
【对比模型】
同期气象因子预报产品,取自北京市气象局业务数值预报系统,用于验证模型性能
- 结果:
(1)花粉分布与气象因子的关系
①春季花粉含量高峰以木樨科、杨属、柳属为主,气象因子影响更复杂;而秋季则以菊科、藜科为主,气象因子较少。
②风速对春季花粉扩散影响显著,但对秋季草本花粉作用较弱。
③气象因子对花粉含量的直接影响主要集中在滞后1天,滞后2天相关性显著减弱。
(2)模型性能对比
①分季节建模的SVM模型在春季和秋季的预测准确率分别为61.2%和68.1%,线性模型为60.1%和66.7%,均显著优于未分季节的现有业务模型。
②对于重污染事件,分季节建模的模型表现更佳,能够更准确地预测六级极高污染事件。
- 亮点:
(1)分季节建立的预测模型:研究针对北京城区气传花粉的春秋季节性差异,建立了分季节的预测模型,显著提升了预测精度。
(2)科学筛选气象因子:研究通过格兰杰因果检验,从17种候选的气象因子中客观筛选出16种具有显著因果关系的气象因子,避免了传统方法依赖主观经验的局限性。
- 启发:
(1)“分而治之”:将相似但有差异的春季和秋季花粉预测场景分离,建立更有针对性的两个模型,以提升模型预测精度。
(2)特征选择:特征选择是机器学习模型构建的重中之重,先选取已有研究中涉及过的所有气象因子,再对它们进行格兰杰检验,既能防止特征的遗漏,又能保证无效特征的干扰。
这篇研究利用格兰杰因果检验筛选气象因子预测花粉含量,方法值得肯定。研究从17个气象因子中选出16个对花粉有显著预测作用的滞后因子,这对精准预测花粉浓度、指导过敏防护有实用价值。同时该研究也为我们了解新的研究方法开拓了视野。但是数据仅覆盖两年,长期气候变化对模型稳定性的影响需持续观察。总体而言,该研究为城市生物污染防控提供了兼具创新性与实用性的方法论范例。此外,这篇文章与当下的时节非常符合,我这学期也受到了花粉的困扰,皮肤会痛,但是去年秋季的时候就没有太受到花粉影响。文章与我们生活十分相关,也激发了我们的阅读兴趣。
为啥我的发言不见了??
该研究使用了格兰杰因果检验这类计量经济模型作为研究方法,这为我们提供了一种有效的工具来识别时间序列之间的潜在因果联系的新方法。如果在给定y的历史数据基础上,加入x的历史数据能够显著提高对y的预测能力,则称x格兰杰导致y。格兰杰因果性关注的是一个变量过去的信息对另一个变量的预测能力。这对我们研究教育中具有时间变化的因果变量提供新的分析角度。值得注意的是,格兰杰因果关系检验的结论只是一种预测,是统计意义上的“格兰杰因果性“,而不是真正意义上的因果关系,不能作为肯定或否定因果关系的根据。因此,它的解释性有待提升,在使用这个方法的时候需要辨明情况。