武汉在封城之前新冠肺炎感染人数的估计

基本原理和结果
原理:我们研究的假设为:由武汉输入到其他城市的人口的感染率(输入人口感染率)和武汉在封城之前的本地感染率是一致的。基于其他城市的武汉输入人口感染率来估算武汉在封城之前的感染者人数… … Read More >武汉在封城之前新冠肺炎感染人数的估计

基本原理和结果

原理:我们研究的假设为:由武汉输入到其他城市的人口的感染率(输入人口感染率)和武汉在封城之前的本地感染率是一致的。基于其他城市的武汉输入人口感染率来估算武汉在封城之前的感染者人数。

数据:我们收集了武汉之外多个城市的输入性病例的数量。输入性病例指的是在各地卫健委报告的确诊病人数量中,明确来自于近期从武汉流入的病例数量。武汉输入到其它城市的总人口数采用武汉市长在新闻发布会中提到的“近500多万人离开了武汉”,留向各城市的比例从百度地图智慧交通平台获得。

结果:基于湖北之外城市的输入人口感染率估计(截止到1月30日的数据),武汉新冠肺炎感染人数约11990人,(下界6707~ 上界17274)。

局限:1)受各地卫健委所发布的数据的限制,在某些城市,我们不能区分输入病人来源为武汉还是湖北,这会对结果带来一些高估的可能。2)我们将武汉迁出的500万人口按照比例分配给了迁出目的地排名前50的城市,这又会导致预测结果偏低。3) 目前,各地仍然有新增的输入性病例,因此基于1月30日的数据的估计会导致结果偏低。4)本研究基于公布数据做的逻辑推断,仅作学术交流之用。

数据基本情况

我们从各地卫健委发布的数据中,区分了湖北(武汉,在能进一步了解是来自于武汉的情况下)输入性病例和非湖北输入性病例。除了具体城市(这里以北京和杭州为例),我们还对湖北以外的城市的数据做了加总,这两种病人类型的数据见图1。从中我们还可以每天新增病人和累计病人中看到两种病人类型的比例。可以看到,非输入病例的新增人数和比例基本上呈增长趋势,截止1月31日,忽略未分类的数据(假设未分类数据平均来看和已分类的比例接近),该比例已经接近30%。

图1 湖北省外城市平均逐日累计和新增非输入病人比例以及北京杭州两个城市的情况。

结果

在上面的数据的基础上,我们发现,湖北省内和省外的城市(排除武汉),输入病人数量和输入人口总数有很好的线性拟合关系。例如,截止1月25日,如图1,湖北省内城市(排除武汉)输入人口感染率为0.137‰,湖北省外城市输入人口感染率为0.777‰。截止1月30日,湖北省内城市(排除武汉)输入人口感染率增加至0.874‰,湖北省外的城市输入人口感染率增加至1.33‰。

按照这个感染率,我们估计了武汉在封城之前的新冠肺炎感染人数,结果见图3。如果未来其他城市继续出现输入病例,估计值将会相应地增加。

图2 1月25日输入病人数量和输入人口总数散点拟合图。

图3 武汉封城之前感染人数估计。(a)湖北省内城市(排除武汉)及省外城市输入病人感染率(b)根据湖北省内外城市逐日感染率得到武汉感染人数。其中,蓝色和绿色线所示结果分别基于湖北省外城市的线性拟合感染率和平均感染率(总输入病人数量除以总输入人口)得出,黄色和红色线所示结果分别基于湖北省内城市的线性拟合感染率和平均感染率得出。紫色线所示结果为武汉逐日实际报告的确诊病人数量。

总结

1.在所做假设条件下,在所收集的数据的限制下,我们估算出武汉在封城之前已经有11990(上界17274 — 下界6707)人感染。

2.湖北省外城市平均来看,非输入病例的累积比例和新增比例近似呈线性增加趋势。截止1月31日,非输入病人的累积比例大约为28%,非输入病例的新增比例约为31%。

注意,尽管我们用了时间序列数据,但是,我们估算的是武汉在封城之前的病例数量,不是当前的以及过去这些天的武汉病例数量的时间序列。当前武汉被感染人数的估计是另一个问题。我们希望这个武汉封城之前的被感染人数的研究,以及相关的输入和非输入病例的基础数据,能够对于进一步回答这个问题有所帮助。

讨论

目前,我们正在运用这个已有的估计结果,进一步估算武汉封城之后的各城市的本地传染有效再生数、输入病例传染的有效再生数,进而考虑春运对这次传染病的影响。更准确的估计武汉封城之前的情况是大量后续分析的基础。

同时,精确的病例活动轨迹对于构建更加准确的传染病模型非常重要,这对于当地政府应对疫情,开展应急响应具有重要的指导意义。我们也借助这个帖子呼吁各级各地卫健委能够在公布数据的时候,尽可能公布病例的活动轨迹。我们也已经看到陕西、海南、天津、杭州、温州等地陆续公布了详细数据。这将大大提高数据丰富性和可用性,促进科学界关于传染病和传染病控制的研究,从而反过来进一步帮助传染病的控制。

数据清洗和分享

如果你希望用我们的数据做进一步研究,或者希望补充我们的数据整理工作,请跟我们联系。我们会分享目前的粗糙的数据给你。将来整理出来更完整的数据也会正式分享给研究者。

研究团队成员

北京师范大学吴金闪、北京师范大学刘凯、中国科学院文献情报中心沈哲思、北京师范大学汪明、北京市科学技术情报研究所李梦辉、北京师范大学李开文、朱家彤、王倩之、张建新、乔宁宁、张钰霆、贺倩