当前位置: 首页 > 期刊 > 《科普时报》 > 2020.06.12
编号:10452
钟南山院士如何薅准新冠疫情发展走势
http://www.100md.com 2020年6月12日 科普时报 2020.06.12
     (上接第1版)

    钟南山院士指出,一个算法模型里面的运算因子包括变量与定量,比如说某国今天有居家令,明天海滩上万人大聚集,这是变量,那么这是无法预估的;而我国实行了高强度的联防联控机制,一切变成了定量,那么在算法模型里这些参数就不再是一个“浮动区间估值范围”了,而变成了一个“固定死的参数”,那么这个结果就提前用模拟算法拟合到了未来的真实发展环境。

    那么问题来了,这次国际上的一些科学家的算法建模出现了严重的变量估值偏差。钟南山把参数修正之后,这组运算的误差就变得很小了。总之,变量需要变成定量,至少变量取值的波动区间要越窄越好。

    而这里面就存在一个难度,那就是这种运算都是“基于历史的遗传基因排列组合记录”,可能需要庞大的历史数据库作为推算样本;而此次疫情不容许出现“庞大的数据库样本”(需要调集长达一年的堵车数据)只有一两个月的“数据库样本”,这个样本库的稀少,更加大了架构难度和运算难度。这类AI算法的步骤一般是数据库采集、算法定义、算法程序编写、变量与定量的参数设计与取值配型,最后得出运算的结果(估值)。
, 百拇医药
    “传统模型”与“被改良建模”的差距,看似是一个细节,最终的效力和精确度可能是天壤之别。钟南山表示,传统SEIR模型在国外曾被用于社区流行病的预测及防控。但是,将它照搬到中国的此次疫情,肯定是不会准确,因为这个仪器的功能仅限于自然数据采集。由于新冠肺炎疫情具有未知性、突发性、高风险和快蔓延等特点,同时叠加春运高峰期间学生放假、企业员工回家过年等人员跨地域频繁流动等因素,给疫情防控提出了严重挑战。

    为了克服预测难题,钟南山技术团队为它加入了人为的“参数配型”:首先,我国从中央到地方对疫情的强力干预,全民动员上下同心,有力的物资调配,有效的民众居家隔离等因素;其次,团队加上无症状传播期的特性,并结合中国特色的春运大迁移等因素。

    考虑到以上因素,为科学预测疫情发展走势,钟南山技术团队先后对疫情的流行趋势做出了两版预测。

    第一版预测以1月11日到2月12日的数据作为输入数据,根据改进的SEIR模型进行预测。结论显示,新冠肺炎疫情全国在2月下旬达到高峰,4月底趋于平缓。如管控措施推迟5天实施,中国大陆的疫情规模预估将扩大至3倍。
, 百拇医药
    3月初,阐述以上预测内容的论文《基于SEIR优化模型和AI对公共卫生干预下的中国COVID-19暴发趋势预测》在《Journal of Thoracic Disease》(《胸部疾病杂志》)上正式发表。

    该文章提出了基于大数据的改进SEIR预测模型,并提出了数据受限条件下的人工智能LSTM预测方法。这是钟南山领衔的广州医科大学第一附属医院和广州呼吸健康研究院全体科技工作者,为中国抗击新冠肺炎疫情的战略作出了不可替代的贡献。

    一向实事求是、尊重科学的钟南山,并没有凭经验说大话,而是依据事实、凭证据公开说出了他们的预测:“根据我们团队在传统模型基础上加上两个影响因素,即国家强力干预和春节后回程高峰消除后,预测高峰应该在2月中旬接近2月底。到了2月15日,数字果然下来了。我们有信心,4月底基本控制”。

    2月27日,广州市人民政府新闻办公室举办了新冠肺炎疫情防控专场新闻通气会,钟南山引用了以上结论。
, http://www.100md.com
    “疫情开始时,国外就有流行病学家用权威的试验模型,预测2月初中国感染新冠肺炎人数将达16万人。这是没有考虑到中国政府的强力干预,也没有考虑到春节后的延迟复工。”钟南山说,“然而我们做的预测模型显示,2月中旬或下旬将达到疫情高峰,确诊病例约六七万人。研究论文投到国外权威期刊,他们感觉和国外的预测水平差太多,被退了回来。但实际上,我们的预测更接近事实。”

    第二版预测以1月11日到2月17日的数据作为输入数据,通过机器学习构建人工智能模型。

    为了更精准地判断疫情发展的各个关键节点,钟南山技术团队迅速着手实施了第二版预测。该版预测通过机器学习构建了人工智能模型,同时改变了此前的鉴别方法。

    2月9日前,使用“新增确诊人数”作为训练数据进行预测;2月13日后,采用“累计确诊+新增疑似-死亡人数-治愈人数”作为训练数据进行预测。结论显示,全国将会在2月20日左右达到拐点,最终全国确诊病例8万例左右。

    纵观疫情实际走势,从2月20日左右,湖北省以及全国范围内,确诊病例、疑似病例显著减少,疫情出现明显拐点。截至3月26日10时,全国累计报告确诊病例81960例,均与钟南山技术团队做出的预测十分接近,说明了其疫情预测模型的准确性。

    虽然两版预测采用的监测方法不同,但是采用的预测方法是相同的,都是在原始的SEIR模型上引入迁入和迁出人数。

    事实证明,两版预测与疫情实际走势十分吻合,为新冠肺炎疫情防控策略提供了参考,为政府作出全局性的决策提供了科学依据。, http://www.100md.com