国金证券:疫情拐点将在2月7日前出现

时间:2020-02-15  点击:
手机版

  原标题:国金证券:疫情拐点将在2月7日前出现

  来源:国金证券

  基本结论

  新型冠状病毒(2019-nCov)疫情爆发以来,我们对国家及各省市卫健委披露的数据进行了持续跟踪与大量的交叉比对。虽然在有些方面仍存在提升的空间,但是就数据本身,无论质量还是可信度都达到了一个不错的水平。

  我们认为1月20日以来,国家及各省市卫健委公布的数据中,除了确诊数量、治愈数量、死亡数量外,最可靠、最有信息量的数据是密切接触者数量。近几日,无论湖北(武汉),还是全国,确诊数量与密切接触者数量之间的比例关系都趋于稳定。一方面表明前期的各项防控政策已经取得了显著效果,另一方面也预示着疫情防控或许进入了最关键的时期。

  我们对各省市公布的数据进行了截面数据及面板数据的比较,结果表明:

  疫情已经从武汉、湖北扩散到全国范围,多省市已经从输入型为主逐渐转变为本地扩散。

  浙江、广东、河南、湖南四省的疫情发展趋势与武汉市在1月24日及1月23日之前的数据呈现高度的相关性。

  数据表明,江西、山东、四川、广西、云南、河北、山西、黑龙江等省或许正处于疫情爆发的前期。

  我们使用SARS时期的经验参数,利用经典的SIR模型,对疫情发展进行了模拟预测,结果表明疫情的最高峰将于三月底出现,这既不符合当前强力防控政策下的现状,结果也不是社会与经济能够承受的。

  我们根据现实情况,对SIR模型进行扩展,提出了nV-SIR模型,使用本次疫情实际数据估计得出的相关参数,在乐观、中性、悲观三种情形下分别对湖北、全国的疫情发展趋势进行了模拟预测。结果表明,在乐观情形下,湖北每日新增确诊人数和累计确诊人数拐点分别出现在2月7日及2月16日。全国拐点分别出现在2月11日与2月18日。我们认为,随着防控措施效果的进一步显现,实际情况大概率上比我们模型的乐观情形假设更为乐观,即,存在较大概率,拐点早于我们的预测。

  风险提示:2019-nCoV病毒快速变异;“超级传播者”大量出现

  引言

  新型冠状病毒(2019-nCoV)疫情发生以来,国内外不少研究团队都在通过各种方式对疫情发展进行预测。本文在疫情数据分析、经典流行病学模型介绍的基础上,结合目前的实际情况,提出vN-SIR模型(variable-N Susceptible+Infectious+Recovered),对疫情的发展作出不同假设情境下的预测,为广大市场参与者提供参考。

  一、疫情数据分析

  自2020年1月20日,中国国家主席习近平对疫情作出重要指示以来,每日疫情数据成为社会最关注的信息。移动互联网高度发达的当下,各种信息展示与解读层出不穷,但是,更多的信息量,更多的对未来的启示,隐藏在数字的背后。

  1.1 数据披露情况概述

  非标、前后口径不一致,是数据分析者的“天敌”

  自2019年12月31日,武汉市卫生健康委员会(以下均简称卫健委)在其网站披露新型肺炎疫情以来,国家及各省、市卫健委网站发布的信息就是疫情数据的最官方来源。其中,武汉市卫健委从1月11日开始每日披露前一日疫情发展的最新数据,直到一月22日,武汉市卫健委发布《工作提示》,宣布从1月21日起的疫情数据都由湖北省卫健委统一发布,也正是从这一日起,国家卫健委及各省市卫健委均开始在其网站上定期发布疫情信息(至少一日一报,有些省市则是一日两报甚至个别日期,一日多报)。

  这是依据《中华人民共和国传染病防治法》有关规定,在突发公共卫生事件情况下,正常的应急响应与信息披露流程。但是,客观上,对于依靠公开信息进行相关分析的机构与个人,造成了下述一些问题:

  1、数据不连续:由于数据披露单位由武汉市卫健委上升到湖北省卫健委,1月10日-1月20日期间一些较有价值的数据信息,如确诊病人信息简述,武汉市范围内密切接触者数量等,在湖北省公布的数据中,便不再出现。尤其是1月21日的数据开始,密切接触者人数从武汉口径变成全湖北口径,这种数据的不连续,使得很多模型分析中缺失了病毒传染早期的宝贵信息。

  2、各地公布信息颗粒度不一:1月21日开始,国家卫健委每日披露的是全国汇总信息,主要包含确诊数、死亡人数、重症人数、治愈出院人数、疑似人数、密切接触者人数等。各省市卫健委的每日信息通报中,有些省市也即简单的公布上述数据,甚至个别项存在缺失,有些省市则会公布一些更多的信息,例如确诊者简要情况等,尤其是部分关键数据的缺失,对于进行地区比较,造成了障碍;

  3、数据普遍存在前后口径不一致、不同地区间口径不一致的问题:就国家卫健委发布的数据看,在1月21日后的开始几天,对于疑似病例的统计口径,存在数次漂移,前后出现“全国(不含湖北)”、“全国19省市”、“全国”等多种定语,极大降低了“疑似病例”这一数据的早期可用性;同时,各省市对于“密切接触者”这一数据的发布也存在较大差别,多数省市会公布累计密切接触者数量、尚在接受医学观察数量两项,而个别省市则只发布尚在接受医学观察数量一项,造成如上所述的进行地区比较时的困难。

  如同疫情防控过程中,每一天都价值 巨大一样,每一日的疫情数据,无论对于当前研究分析,还是未来经验总结,都是非常宝贵的社会财富。

  疫情面前,国人欣慰的看到,2003年SARS过去17年后的今天,我们无论在反应速度、信息透明度、防控能力上,都有了巨大提升。但是,如果说这一次疫情过后还有什么需要总结的经验教训,那么,信息发布的标准化毫无疑问是我们需要进一步改进的一个重要环节。

  虽然存在不足,但是21日以后的数据已经有了较大的意义与参考价值

  对于公布的数据本身,尤其是21日以后的数据,可信度较高:

  1、有效数据间的复杂相关关系较为合理,从逻辑上讲,基于前述的数据存在前后不连续、口径不一致等“低级失误“的状况,要”制造“出相对合理的数据,难度系数完全不在一个量级之上。

  2、确诊、疑似、密切接触者、治愈这些数据不仅有助于把握武汉、湖北、乃至全国的趋势,更对各地方的发展趋势具有较强的预测价值。

  1.2 全国、湖北及武汉的时间序列数据

  确诊病例变化:武汉存在波动,全国稳步攀升,比例关系趋于稳定,但拐点尚未出现。

  从1月20日之后的确诊病例数量时间序列数据看,武汉的数据日间变化存在一定程度的波动,而全国数据则相对稳定的攀升。

  这其中最可能的原因还是来自于,就武汉地区而言,医疗资源严重匮乏,综合这期间各种新闻报道及数据来看,距离潜在病患充分就医仍存在较大的距离;而就全国范围来看,供需则更佳平衡。

  从疑似病例的变化来看,除了个别日存在小幅波动外,基本也处于稳定攀升的趋势中。

  

  从比例关系而言,经过近半个月的发展,武汉及湖北相对于全国确诊数量的占比已经趋于基本稳定,武汉占全国的比例基本维持在25%-30%之间,而湖北全省占全国的比例则更稳定的停留在60%附近。

  我们认为,这种比例关系的稳定,明确表明前期防控措施已经取得了明显的效果。但同时,也要看到在湖北省外的一些其他地区,新增病例中,本地被传染的比例逐渐增加,一旦不能得到较好控制,有可能会进一步加速扩散,从数据上打破这样的稳定关系,从实际上,造成全国范围内蔓延情况的恶化。

  

  根据最近一段时间,对疫情数据的持续跟踪,我们认为判断疫情发展趋势最有效可靠的指标是密切接触者数量。主要理由如下:

  1、从流行病学角度看,密切接触者是最直接的潜在被传染者,所有传染病防治的措施,都首先从对密切接触者进行隔离观察开始;

  2、从此次疫情数据质量看,密切接触者数据在前后持续性、统一性上,仅次于确诊数、死亡数、治愈数,略高于疑似病例数。对该数据的持续跟踪,更利于把握疫情发展的趋势;

  3、从数据本身看,过去一段时间,密切接触者数量无论是一阶还是二阶变化率都比较稳定,与确诊病例数量的相关关系也较为稳定。一方面,利于我们更好的预测疫情发展,另一方面,未来,无论数据本身的变化率产生显著变化,还是与确诊病例数的相关关系产生显著变化,都有可能表明重要拐点的临近。

  从目前数据看,湖北省的密切接触者数量一阶与二阶保持稳定,但与确诊病例数量变化率的比例关系稳定下降,表明在强有力的防控措施下,病毒的实际传染率(平均每一个病患传染给健康人的数量)是下降的。

  全国范围看,则尚未看到明显的下降趋势,一方面与疫情扩散的规律有关(其他地区会滞后于湖北和武汉),另一方面,也与各地区防控措施的力度不同有关。

  

  从分布看,湖北相对全国数据的占比也基本保持稳定中略有下降的趋势,这与绝对数字中呈现出的规律一致。

  

  死亡及治愈数据:全国范围治愈数量加速上升,来自武汉的死亡数据却透露出一些不安。

  

  

  从治愈数据的变化看,全国情况显著好于湖北和武汉,一方面表明,虽然疫情在各地均有扩散,但是医疗资源的供求关系仍处于相对较好的水平,病患能得到更好的治疗;另一方面,说明武汉的医疗资源仍相对不足,后续的持续投入依然是控制疫情发展的重中之重。

  

  

  从武汉自身的治愈率与死亡率(对于死亡率的计算有多种方式,我们这里暂使用最简单直观的计算方法:累计死亡人数/累计确诊人数)来看,也许病毒的危害性比人们普遍预想的要高,正如同在疫情最开始时,大家普遍低估了其传染性一样。

  

  1.3 各地截面及面板数据的横向比较

  自1月20日起,各省市都开始常规披露疫情最新数据,至少一日一报,有些省市甚至一日两报以上。从披露信息的详细程度看,各地也存在较大差别,有些地区会持续披露每一个新增确诊病例的简要信息,而有些地区只披露了确诊病例、治愈人数、死亡人数等最重要的基础信息。我们尽可能保持各地数据口径的一致性,以方便横向比较。

  从截止2020年1月31日24时各省市披露的确诊人数及密切接触者人数来看:

  1、疫情在全国各地扩散的趋势在不断加强;

  2、数据上,广东等个别省份只披露正在进行医学观察人数数据,而并不披露累计密切接触者数量及解除医学观察者(解除医学观察,可能是因为确定没有感染,也可能是列入疑似或者确诊)数量;上海、北京则并不披露密切接触者数据(在数据处理上,我们只能根据全国的平均情况进行推测);

  从各省市公布的地级市(州、区)情况看,不仅在湖北外已经出现了例如浙江温州、广东深圳、广东广州、浙江台州、河南信阳等疫情已经扩散的城市,一些城市也露出了进一步扩散的苗头,防控形势仍不容乐观。

  

  为了更好的反映各地的现状,我们计算了两个指标:

  指标一:传播率,将当地的累计密切基础者人数/累计确诊人数,我们认为这个指标能够对未来的扩散可能性作出相对定量化的预测;

  指标二:高危城市数,将各省(自治区)下确诊病例超过50个的地级市列为高危城市,按省计算高危城市数量,我们认为该指标能够对每个省(自治区)的扩散程度进行更直观的度量。

  从指标一看,我们更需要关注的是那些绝对确诊数量不低、趋势上处于稳步上升,同时传播率居于高位的省市(自治区),这很可能代表这些地区处于疫情爆发的前夜。具体的,我们需要密切关注江西、山东、四川、广西、云南、河北、山西、黑龙江的发展趋势。需要特别指出的是,由于披露口径的原因,广东的传播率指标显著低于其他地区,这并不代表广东的风险程度下降,恰恰从这两日的趋势看,广东正处于疫情快速扩散的阶段,有时候,如果不去追究数据背后的信息,“数据也会骗人”。

  从指标二看,多省(自治区)均有一个以上高危城市,省会城市则往往包含其中,人口流动依然是疫情防控的最大难点。

  除湖北省外,浙江、广东、河南已经出现了两个及以上的“高危城市”,从流行病传播的基本原理和实际数据看,这些地区都不可避免的在某种程度上“复刻”湖北走势。

  

  横向角度看,湖北特别是武汉的情况确实严峻,且趋势上仍未显露拐点迹象,但是我们可能会更关心,全国范围内,是不是存在一些地区开始露出复制湖北或者武汉走势的迹象。

  在这种分析中,我们并没有使用相对复杂的时间序列模型,只是选用简单的方法,对武汉(因为1月10日至1月20日的早期数据也存在较大的参考价值)、浙江、广东、河南、湖南四地的确诊人数时间序列数据进行相关性分析。

  结果表明,截止2020年1月31日的数据,浙江和广东更可能处于武汉2020年1月24日及之前的状态,而河南、湖南两地更可能处于武汉2020年1月23日及之前的状态。

  同时,如果将浙江、广东从1月23日至1月31日的每日确诊人数(及累计确诊数的一阶变化)同时计算自相关系数,以及与武汉从1月16日至1月24日的每日确诊人数的相关系数;而对河南、湖南,则使用1月24日至1月31日数据,对应武汉1月16日至1月24日。

  无论从与武汉相关系数看,还是自相关系数看,都处于相对较高的水平(从流行病学看,每日确诊人数是一个变化量的概念,而对于变化量,很多实证分析中,相关系数超过0.3,都被认为存在显著的相关性)。自相关系数的显著表明这些省份的疫情发展已经呈现出了显著的流行病学传播规律,也就是说,已经由输入型,进入了本地扩散。与武汉数据的高相关性,说明这些地区正在复制武汉地区早中期的疫情发展趋势,如果不采取进一步的有效措施,结果可能会更严重。

  

  直观的从趋势图上看,浙江、广东、河南、湖南四省的走势也与武汉疫情的早中期发展高度吻合。

  

  二、流行病传染推演的经典模型:SIR

  2.1 SIR简介

  人类历史上一直就在同各种各样的传染病进行斗争,这种斗争推动医学水平不断进步的同时,也推动了一些试图解释、预测流行病发展趋势的数学模型的诞生。特别是过去一百多年来,这类模型为政府及公共卫生部门的决策提供了大量的信息与依据,不断扮演着疫情防治战役的“幕后英雄”。这类模型中,SIR(Susceptible,Infectious,Recovered)则是较为重要的代表。

  基础的SIR模型存在如下假设:

  1、人群被分为Susceptible即易感人群,Infectious即被感染人群,Recovered即被治愈人群(实际上,在实际使用中,死亡人群也被列入治愈人群,因为根据模型假设,一个人无论被治愈还是死亡,都不会在疫情发展期再次被感染);

  2、各人群都是开放式的,即易感人群并未采取任何防护措施,他们也终将被感染;

  3、根据模型的演化,稳定的结果是:易感人群数量降为零,所有人要么被感染,要么被治愈。而最终结果则是所有人要么被治愈,要么死亡。

  这个模型的实质是,一种传染病出现后,所有人口都会经历被传染、被治愈或者死亡的状态变迁。这当然是一个非常理想化的假设,但是试想,任何一种传染病流行的初期,采取防范措施的人是非常有限的,同时,政府及公共卫生部门也不会立即采取行动,这种现实状况其实与模型假设是非常相符的。

  也正因如此,利用SIR模型对传染病的流行发展趋势进行预测,对于社会理解当前传染病的危险程度,对于政府及公共卫生部门采取恰当的防控措施,具有非常大的价值。

  2.2 SIR模型的简单数学解释——基于SARS经验参数的模拟

  简单的SIR模型来自于三个人群数量基于时间的变化函数公式,在不考虑任何其他因素的情况下:

  

  其中,S、I、R分别代表每一时间点易感人群、感染人群、被治愈人群的数量,N代表人口总数,β可以理解为传染率参数,γ可以理解为治愈率参数。

  上述公示代表的是连续时间的情况,实际应用中,我们往往面对的是离散时间的情形,将上述连续时间的函数修改为离散时间下的形式,利用简单的工具,就可以进行模拟。

  我们通过查阅到的SARS时期的经验参数,并假设初始人口一千万,初始感染者是1月16日的45人,进行推演的结果如下:

  

  这也是互联网上最早开始传播的模拟结果。如果按照这样的模型推演,对于包含一千万人口的武汉市,不采取任何措施的话,三月底疫情发展至最高峰,七月底,疫情结束。这显然是一个中国经济不能承受的结果。

  2.3 SIR模型的常用扩展

  经典的SIR模型存在一些明显的缺陷,例如:1、众所周知,许多传染病是具有潜伏期的,而SIR则是假设没有潜伏期;2、SIR假设每一个被感染者的传染能力都是相同的,但是事实上,每一种传染病在传播期间,都存在“超级传染者”;3、SIR并不包含地理、人口流动等相关信息。

  一些常见的SIR模型扩展有:考虑潜伏期的SEIR模型;假设被治愈者仍可能被传染的SIS模型;假设有疫苗或者暂时性抗体存在的MSIR模型,等等。

  三、基于现实环境下的SIR模型扩展

  1月23日开始,全国各地都采取了非常严格的防控措施。在这些措施之下,基于经典SIR模型推演预测大概率将与现实情况产生巨大的偏差,如果依然以此预测作为决策依据,不仅不能准确的把握疫情发展趋势,更有可能因为相关政策不能及时调整,从而对社会与经济造成更大的影响。因此,为了更好的预测疫情发展趋势,需要结合实际情况,对SIR模型进行修改。

  3.1 现实情况的变化

  1月23日开始,各地均通过各种形式实质上采取了程度不同的隔离措施,这种隔离即降低了传染率,也通过流动性的降低大幅降低了事实上易感人群的数量规模;

  综合各种信息及数据表明:1、各地均有输入型病例;2、多地开始出现本地被传染的二代、三代甚至四代病例。

  3.2 修改SIR模型的依据

  事实上易感人群的大幅降低,需要我们更为谨慎的设定人口数量这一参数;

  事实上,全国各地已经变成一个个介于全封闭至半封闭状态的相对独立的 空间,一方面,地理信息的影响减弱,另一方面,不仅仅需要预测武汉市及湖北省的发展趋势,更需要预测全国的发展趋势,甚至有必要时,需要对各有代表性的地区进行独立预测,从而得到更可能接近真实的预测。

  3.3 vN-SIR模型

  基于上述分析,我们在经典SIR模型的基础上提出vN-SIR模型(variable N SIR),主要修改如下:

  1、考虑到目前的防控措施下,人口流动性大幅降低,绝大多数人群不再属于易感人群,同时,人口并非完全不流动,所以我们应当设定一个随时间及病情发展变化的人口参数N。在我们的模型中,考虑到无论湖北省还是全国,密切接触者数量与确诊者数量一直呈现出较为稳定的线形关系,我们假设N为一个随着预测确诊者数量及预测密切接触者数量变化而变化的函数。

  2、基于已经显著可见的防控措施效果的不断显现,及治疗水平的不断提高,我们也将传染率与治愈率参数设定为随时间变化的函数,以体现各种措施的积极效果。

  3、我们对人口函数N设定上限,对应综合各种外部信息后得出的乐观、中性、悲观的情形假设,并按照不同的情形假设,预测出未来疫情发展的可能趋势。

  4、根据我们修正的模型,对于湖北省及全国的疫情发展趋势推演结果如下:

  

  

  3.4 vN-SIR模型推演结果

  根据模型推演结果,在乐观情形下,湖北省确诊病例单日新增和累计数的拐点时间分别为(2020年2月7日,2020年2月16日),全国的拐点时间为(2020年2月11日,2020年2月18日)。

  中性情形下,时间点分别为(2020年2月9日,2020年2月18日)与(2020年2月12日,2020年2月20日)。

  悲观情形下的时间点则分别为(2020年2月11日,2020年2月20日)与(2020年2月15日与2020年2月23日)。

  需要说明的是:

  1、乐观、中性、悲观仅就模型本身而言。我们主要参数均是参照过去一段时间疫情的平均情况设定,实际上,最新的数据表明,一些防控措施已经取得了积极的效果,我们有理由相信,实际的情况会比我们预测的“乐观”情形更“乐观”一点;

  2、模型中涉及到的具体人数,只具备参考意义,因为模型假设相比现实环境,总是偏理想化的。但是,从趋势上讲,模型的推演还是具备较强的参考价值,SIR系列模型虽然较为简单,但是过去多次真实的传染病案例已经反复的证实了这类模型对于趋势预测的有效性;

  3、在模型中,我们发现,依据疫情数据测算出的β即传染率参数显著高于SARS的经验值,且开始趋于稳定,γ治愈率参数则显著小于SARS的经验值。有充分的理由相信γ治愈率参数随着疫情的不断发展将显著上升,但是β参数趋于稳定则表明,我们之前可能确实明显低估了新型冠状病毒的传染能力;

  4、进一步说,β参数的趋于稳定,前期强有力的隔离政策居功至伟,而即将开始的节后复工潮,将显著提升人口流动性,这对于尚未见到拐点的疫情防控来说,并非一个好消息;

  5、我们尚未对湖北以外的各省市单独进行模型的模拟,随着疫情的发展,也许这项工作也将逐渐必要起来。

  风险提示

  2019-nCoV病毒快速变异;“超级传播者”大量出现

  来源:金融界网站返回搜狐,查看更多

  责任编辑:

上一篇:好消息不断!福建5地又有11名患者治愈出院!
下一篇:张家界:市卫监局工作人员首次上榜“湖南好人”

街舞资讯热门