疫情最大的拐点,正跟随春天向我们走来

时间:2020-02-15  点击:
手机版

  整整一个春节假期,被COVID-19洗劫了。回头去数,我们窝在自己那一亩三分地里的日子已经超过20天。

  在这20多天里,大家拒绝串门,真正期待的来访客人只有一个,它的名字叫“拐点”,全名“疫情拐点”。

  钟南山院士在11日的一次远程视频谈论会议中说:从目前来看,疫情拐点还无法预测。不过,但峰值应该在二月中下旬出现。疫情拐点由返程高峰的防控情况决定。

  他同时表示,没有任何人可以作出一个严格的拐点预测。

  为什么拐点这么难以预测?预测拐点会遇到哪些困难?且让我们一起看一看。

  一、预测数据的采样

  预测需要数据支持,数据越详实,预测模型越贴近现实,预测结果就越准确。

  越精确越贴近现实的预测,需要越大的样本量支持,模型也越复杂。

  比如在流感数据预测中效果不错的机器学习法,其数据来源于几年乃至几十年的高质量样本,其预测结果才能相对令人满意。

  这次的新冠肺炎,是一个爆发中的全新的传染病疫情,它的现实状况是这样的:

  1、信息提供的时间窗太短,仅短短的几十天;

  2、公开数据的种类很少,几乎只有病例数可用。精确到每天的人群迁徙量、发热门诊量、呼吸疾病就诊量都很难得到;

  3、对构建数学模型而言,至关重要的患者何时感染、何时开始具有传染性等,都很难精确到“天”以下,所有病例数的时间序列都只有每天一个点,总共也就三四十个点。

  真正去采集数据样本,我们就会发现,可供使用的数据太贫瘠了。这样的情况采用机器学习法,显然不适合。这就好比我们只有几个香蕉,而眼前是一个猴群,怎么喂饱它们?

  拿着这样的数据,我们只能退而求其次,求助于对数据要求不那么高的,基于人群区组的SEIR模型了。

  二、SEIR预测

  SEIR模型相对简单,它假设:

  1、R0(基本再生数)从头到尾不变;

  2、每个感染者和每个易感者接触的概率完全相等(显然这是不可能的);

  3、不考虑超级传播者的存在;

  4、不考虑漏诊。

  结合现实情况,这个模型面临的问题不少:

  1、新冠病毒潜伏期也能传染。全国各地确诊人数无法客观反应实际患病人数;

  2、我国的疫情防控是随着疫情情况与地区而采取不同措施,导致湖北以外的省市人与人之间的接触频率与湖北地区有所不同,发现感染者的效率也与武汉乃至湖北有所差异。这些都对R0的取值有影响;

  3、1人导致4000人隔离的超级传播者已经出现;

  4、全国有14亿人!一个重庆小区里的确诊患者传染他邻居的概率,显然与传染遥远的新疆喀纳斯白哈巴村里的图瓦人的概率大不相同。

  于是,问题来了,如果希望数据预测尽量贴近现实,我们需要对各省市数据进行加权。我国采取的减少外出、延长休假等措施,还有超级传播者,以及不同人之间传播概率不同,又该如何在模型中反映?

  我们来到了传染病数学建模的关键一步,也是最考验一个人知识功底的环节:定参数设计模型。

  三、是不是接地气的高级数学家,得拉出来溜溜

  定参数设计模型,是一个主观能动性的过程。相对于1就是1,2就是2的冰冷数据的客观,如何设置模型参数,如何调整模型结构,是一个思考的主观。

  对于像流感、埃博拉这样反复出现的传染病,起码建模时还有经验可循,到新冠肺炎没有经验可以套用,它的流行病学特征独特,潜伏期长,潜伏期也会传染,传播力超强…

  如何构建模型结构,是个问题。

  就此次疫情的数学建模,便只有仰仗于建模者的知识层次,建模经验和他的谨慎态度了。

  事实上,目前网络上流传的几个预测相差悬殊,原因很大程度上就是这个自由裁量的环节出现了分歧。

  只有根据真实状况调整模型的结构与假设,尊重不确定性得出的模型才具有一定的参考价值。

  通过判断模型的假设和参数是否合理,并与事实对照,才能进行预测结果的采信与拒绝。

  当时间向前,疫情消散,回头检验,不排除会在这些参与预测的数学爱好者中出现高级数学家的身影。但现在,我们只能且行且看。

  做传染病流行病学的建模,有一句公认的名言:你永远不可能知道你是不是对的。

  现实情况不断变化,而且有些变化甚至还可能是由于你的模型结果公之于众导致的。时间拉得越长,发生变化的可能性就越高,你的预测还能说对的可能性就会越来越低。

  目前看来,通过预测,我们看不到拐点,千呼万唤出不来的拐点,其实不在预测中,而是在我们每个人的自律里,在前线医护人员的拼搏中。

  这个国家全民一致的不懈努力,就是这次疫情的最大拐点。它已经到来,跟着春天一起。

上一篇:停课不停教,停课不停学——河津三中在线直播教学顺利进
下一篇:北京迎来了2020年的第一场雪,快揣上好心情去打卡吧

街舞资讯热门