|
宿主-病毒关联数据库作为解析不同尺度病毒跨种溢出(spillover)的工具大型宿主-病毒关联数据库正日益被用于探索疾病生态学中的宏观问题,尤其是宿主范围、病原体多样性及跨种溢出潜力。尽管此类数据库已在宿主-病原体生物地理学与人畜共患风险的宏观综合研究中发挥关键作用,但其在解析病原体流行率、维持机制及传播动力学等精细尺度问题上的潜在价值仍待挖掘。本研究基于既往工作,评估不同类型数据(包括数据库条目及其溯源的原始研究)如何支撑人畜共患溢出的靶向研究。研究人员选取两种在撒哈拉以南非洲呈反复溢出与暴发特征的人畜共患病——埃博拉病毒病(由正埃博拉病毒属Orthoebolavirus引起)与拉沙热(由拉沙哺乳动物病毒Mammarenavirus lassaense引起)作为案例,检索VIRION数据库中对应病毒分类单元的条目并进行案例分析,评估数据库对空间与时间分辨率、阴性结果、病毒载量等关键情境元数据的捕获程度。基于跨种溢出驱动因素的概念框架,研究表明宿主-病毒关联数据库适用于解析高层级模式,但跨种溢出的精细尺度研究仍需依赖具备详细流行病学数据的特异性研究。本研究为数据库使用者与管理方提供了实用建议,并强调此类工具可作为跨种溢出研究的起点。 宿主-病毒关联数据库是疾病生态学研究的重要基础设施,当前全球对人畜共患传染病暴发的关注度持续提升,气候变化与人类活动进一步增加了溢出风险,但现有数据库多服务于大尺度模式识别,对溢出机制所需的精细动态数据支撑不足,且不同数据库的元数据标准、覆盖范围存在差异,限制了其在机制研究中的应用。为明确此类工具的适用边界,研究人员以正埃博拉病毒属(Orthoebolavirus)与拉沙哺乳动物病毒(Mammarenavirus lassaense)为对象,结合Plowright等人提出的跨种溢出层级屏障框架,系统评估宿主-病毒关联数据库在跨尺度溢出研究中的潜力。该研究发表于《PLOS Pathogens》,为数据库优化与溢出研究设计提供了实证依据。 研究采用的关键技术方法包括:以VIRION数据库为核心数据源,分别于2025年2月21日筛选经NCBI分类校验的正埃博拉病毒属(1764条检测记录)与拉沙哺乳动物病毒(876条检测记录)条目;对数据库引用的原始研究进行人工回溯,重点提取19项正埃博拉病毒属监测研究的采样时间、地点、样本量、检测方法、阴阳结果等元数据;基于“哪些宿主参与溢出—病原体时空流行率如何—病原体如何在宿主体内维持与脱落”三个递进尺度的科学问题,分层评估数据库的支撑能力;结合ZOVER、PHAROS等其他宿主-病毒数据库及GenBank序列数据,对比不同资源在元数据完整性上的差异。 研究结果如下: 数据集描述:VIRION中正埃博拉病毒属与拉沙哺乳动物病毒的条目均包含宿主-病毒关联、检测方法、来源数据库信息,但分别有140条与185条记录缺失采集日期,且所有条目均未收录阴性结果、检测地理位置与样本类型。仅GenBank来源的记录含时间信息,7.7%的正埃博拉病毒属条目与20.4%的拉沙哺乳动物病毒条目可追溯至原始研究。对19项正埃博拉病毒属监测研究的回溯显示,原始研究的元数据报告一致性不足,凸显补充数据库记录的必要性与局限性。 问题1(大尺度):哪些宿主参与溢出?:VIRION可标准化展示病毒已知宿主范围,正埃博拉病毒属关联31种宿主,分属12科5目(偶蹄目、翼手目、真盲缺目、啮齿目、灵长目),并能识别共感染模式,19项研究中有6项同时检测多种病毒,可指导靶向监测。拉沙哺乳动物病毒的宿主记录中包含实验室模型与血清交叉反应物种,而ZOVER数据库因纳入系统综述元数据,可更精准地界定12种啮齿动物宿主,体现专用数据库在小尺度宿主界定中的优势。 问题2(中尺度):病原体时空流行率如何?:量化流行率需阳性与阴性结果、高精度时空元数据,而VIRION等仅收录阳性记录的数据库无法直接计算阳性率。研究人员手动提取19项监测研究的样本量与检测结果,发现阴性结果的缺失是核心限制。GenBank是正埃博拉病毒属最主要的序列来源(占VIRION条目的92%),可提供国家层面地理信息与采集日期,但缺乏血清学数据;拉沙哺乳动物病毒的相关研究已通过系统综述构建了含阴性结果与精细时空信息的数据集,可支撑中尺度流行率分析。 问题3(小尺度):病原体如何在宿主体内维持与脱落?:该问题需病毒载量、组织嗜性等精细数据,而VIRION及多数原始监测研究均未收录此类信息。病毒载量需通过qRT-PCR的Ct值或空斑试验、TCID50等直接测量,但19项正埃博拉病毒属研究中极少提供定量数据。样本类型是推断脱落途径的关键,回溯原始研究可获得10219份检测的样本来源,但数据库层面未收录该类元数据,仅流感等少数病毒拥有含此类信息的专用流行病学数据库。 讨论部分指出,数据库使用者需首先明确研究问题的尺度:大尺度问题可直接依托数据库识别宿主关联模式,生成候选宿主假设;中小尺度问题则需结合原始研究与专用数据集,且需警惕三类偏差——宿主分类偏差(如正埃博拉病毒属研究中的“蝙蝠偏好”,果蝠采样量是食虫蝠的5倍,远超其生物多样性占比)、采样与方法学偏差(血液样本占比最高,组织样本与病毒分离数据稀缺,血清学检测存在交叉反应与试剂局限性)、地理偏差(14项正埃博拉病毒属研究中有8项位于暴发区,高估流行率)。针对数据库管理者、研究者与资助方,研究提出四项建议:系统报告原始研究与数据库的阴性结果;扩大时空与物种采样覆盖度;详细记录样本来源;主动调查共感染情况。数据库需明确变量定义,匹配资源定位,避免误用。 研究结论明确:宿主-病毒关联数据库是跨种溢出研究的高效起点,可支撑大尺度宿主范围与模式识别,但不应作为精细机制研究的唯一数据源。未来需通过增加监测投入、推动符合FAIR原则的数据共享(尤其是阴性结果与元数据)、优化数据库元数据收录范围,逐步填补数据缺口,提升对高风险人畜共患病的溢出预测能力。 |

