期刊名称:Cell Proliferation
影响因子:5.9
期刊分区:JCR 2区/中科院1区
发表时间:2024年2月
作者单位:浙江大学医学院附属第二医院
相关疾病:COVID-19
样本类型:血浆
相关产品:感染性疾病研究一站式解决方案(点击左侧查看详情)
样本数量:814
其他信息:预后预测、临床建模、外部队列验证
01
前言
今天和大家分享一篇通过分析血浆蛋白质组开发新型血浆蛋白分类器来预测COVID-19感染患者死亡率的文章,于2024年2月发表在Cell Proliferation(IF=5.9)杂志上,标题为“Proteome analysis develops novel plasma proteins classifier in predicting the mortality of COVID-19”。
02
研究背景
在过去三年中,新型冠状病毒(COVID-19)感染一直是全球性的公共卫生问题,给世界医疗系统带来了沉重的负担。根据大量流行病学调查,部分COVID-19患者出现了并发急性呼吸窘迫综合征的情况;患有严重合并症的老年人更容易发展为重症/危重症,致使死亡率增加。近年来,蛋白质组学应用于临床医学的各个方面。了解疾病发展过程中蛋白质组的动态变化,有助于深入理解疾病机制,目前关于COVID-19感染病程中血浆蛋白的变化情况尚不清楚。
该研究通过观察不同结局COVID-19患者血浆蛋白在病程中的变化,开发了可用于预测患者临床结局的血浆蛋白分类器。该分类器能够用于识别潜在的高危患者并指导进一步管理,在临床实践中具有卓越实用性。
03
研究样本
该研究共纳入了374名COVID-19患者(核酸检测或抗原检测阳性),包括发现队列(n=277)和验证队列(n=97)。其中从发现队列获得710例血浆样本,验证队列获得104例血浆样本(包括生物学重复)。
04
实验设计
图1 研究流程
研究收集了2022年12月至2023年1月期间在浙江大学医学院附属第二医院和复旦大学附属中山医院招募的COVID-19患者的血浆样本。来自第二附属医院的277名COVID-19患者组成发现队列,采集他们病程中不同时间点(第1天、第3天、第7天、第14天和第21天)的血浆样本,共采集到710例。来自复旦医院的97名COVID-19患者组成验证队列,采集他们入院第一天(24小时内)的血浆样本,共采集到104例。作者将患者入院后28天内的死亡率设定为临床结局,数据显示:发现队列中共204名患者生存,73名患者死亡;验证队列中共86名患者生存,11名患者死亡。将两组队列根据结局情况分为生存组和死亡组,用于进行后续分析。
05
实验结果
//(1)COVID-19患者血浆蛋白质组分析
研究基于SWATH的检测方法获得蛋白质组学数据。作者展示了发现队列中生存组和死亡组之间定量肽和蛋白质的分布情况,使用protein intensity来计算每对生物学重复和技术重复之间的Pearson相关系数以表明结果的可靠性。本研究总共定量到了530种肽和蛋白质,随后进行了主成分分析(PCA)和分层聚类分析,结果表明许多蛋白质在不同血浆样本组(生存和死亡、男性和女性、疾病轻/中/重度和危重以及年龄)中差异表达,这表明可以从蛋白质组学数据中获取区分不同患者的蛋白生物标志物。
图2 发现队列COVID-19患者血浆样本的蛋白质组分析
//(2)生存组和死亡组之间血浆蛋白的变化
作者分析了生存组和死亡组之间前三周的差异表达蛋白(DEPs)。结果显示,在第1周,C反应蛋白(CRP)、网状自噬调节因子2和胱抑素-C是死亡组中上调最显著的蛋白。在第2周,胰岛素样生长因子(IGF)结合蛋白复合物酸不稳定亚基和载脂蛋白L1在死亡组中下调最显著,免疫球蛋白kappa可变3D-15、CRP和血清淀粉样蛋白A-1蛋白上调最显著。第三周,免疫球蛋白重变量3-64D、flotillin-2和细胞分裂周期5样蛋白上调最显著。根据分析结果,两组间差异在第1周最为显著。接着,作者探讨了3周内DEPs之间的重叠,发现在第一周和第二周有8个共同的DEPs,第二周和第三周之间没有共同的DEPs,第一周和第三周之间只有一种。因此,使用发现队列3周内收集的血浆样本总共确定了56个DEPs。
基于Metascape平台对DEPs进行通路富集分析,发现IGF结合蛋白对IGF转运和摄取的调节获得了最高的富集评分。此外,补体系统、血浆脂蛋白的组装、重塑和清除以及清道夫受体对配体的结合和摄取相关通路也高度富集。这一结果表明COVID-19的严重程度与巨噬细胞和脂质代谢的急性炎症和失调有关。最后,该研究基于String Web的平台构建了DEPs及其相关功能网络,发现补体系统、脂质代谢以及IGF和IGFBP之间的相互作用在感染过程中起着至关重要的作用,值得进一步探索。
图3 发现队列的28天生存组和28天死亡组之间蛋白质组改变
//(3)新冠肺炎患者死亡率的血浆蛋白预测模型
作者将发现队列中的88个样本,随机分为训练数据集(n=58)和内部测试数据集(n=30),用于生成机器学习模型,在上述筛选的56个DEPs的基础上,排除6个免疫球蛋白后进行五折交叉验证,选择重要性排名前五的蛋白质,即CRP、细胞外基质蛋白1(ECM1)、IGF结合蛋白复合物酸不稳定亚基(ALS)、E3泛素-蛋白连接酶HECW1和磷脂酰胆碱-甾醇酰基转移酶(LCAT)来构成最终分类器,随后对分类器进行优化。ROC曲线结果表明该分类器在独立验证队列中具有良好的预测性能。
图4 蛋白质分类器区分28天生存组和死亡组
// (4)预测28天新冠肺炎患者死亡率的现有因素和评分的预测效率
为了比较五蛋白分类器与其他生物标志物预测COVID-19患者早期死亡率的预测效率,作者收集了发现队列和验证队列患者CRP、年龄、淋巴细胞和中性粒细胞绝对值、NLR、4C死亡率和E-CURB65评分数据,分别计算了这些因素预测死亡率的AUC。结果表明五蛋白分类器模型可实现对COVID-19患者28天死亡率的早期预测,发现队列AUC为0.88,验证队列AUC为0.80,优于其他评分因素,尤其是4C死亡率和E-CURB65这两个常见评分系统。
表1 COVID-19患者指标及严重程度评分诊断绩效分析
06
结论
作者通过蛋白质组学技术和机器学习方法,证明了急性炎症在重症/危重COVID-19中的重大危害,并开发了包含CRP、ECM1、HECW1、ALS和LCAT五个蛋白的分类器。该蛋白分类器在早期预测COVID-19患者入院28天内的死亡率方面显示出比其他现有生物标志物和评分系统更大的优势。此外,作者还通过一个独立验证队列验证了该模型的预测效果,结果具有良好的重现性。同时整个检测只需要1mL来自COVID-19患者的早期血浆,创伤更小,更方便快速。因此,本研究开发的分类器在预测确诊COVID-19患者的严重程度和预后方面具有巨大的潜力,有助于指导临床治疗,降低高危患者的不良结局发生率。
07
总结
本文是一篇应用蛋白质组学技术构建COVID-19患者早期预测相关蛋白分类器的文章,主要目标是构建预测模型,用于指导临床治疗,有巨大的临床价值。
本文的独特之处是选取患者入院后第1天至第21天的不同时间点采集的血浆样本进行蛋白质组学检测分析,并使用从另一家医疗中心采集的血浆样本对结果进行验证。更值得一提的是,该研究确定了一个由五种蛋白质组成的蛋白分类器,该分类器可以使用患者入院后24小时内收集的痕量血浆样本有效预测COVID-19患者的临床结局。并针对不同因素(CRP、年龄、淋巴细胞和中性粒细胞绝对值、NLR、4C死亡率和E-CURB65评分数据)对预测效果进行了对比分析,提供了更多的研究线索。
但本文也存在一些局限性:首先,受COVID-19相关管理规定和医院住院负荷的影响,大部分入组患者接受了院前治疗(包括抗生素和抗病毒治疗),这可能会影响血浆蛋白的表达并导致偏倚。第二,尽管作者匹配了两组患者的年龄、性别、合并症和疾病严重程度等方面,但验证队列的性别、年龄比和死亡率并没有严格控制到与发现队列一致。这种不匹配可能导致混杂偏倚并影响验证结果。总的来说,这项工作揭示了一种潜在的蛋白质分类器,可以帮助预测COVID-19患者的预后并提供了新的诊断策略,具有一定的临床价值。
以上就是今天分享的内容,如果您也想探索感染性疾病的奥秘,那么,我们专门研发的感染产品(点击阅读《产品上新 | 感染性疾病研究一站式解决方案》)将是您的不二选择——我们的产品通过尖端机器学习技术,精准挖掘关键的蛋白生物标志物,全面揭示疾病的诊断、预后及疗效。我们会根据客户的科研想法提供专业的选题支持,并细化为可行的研究方案。客户只需要准备临床样本,之后我们将交付完整的检测数据、丰富的数据分析图表以及可直接用于论文发表的结果拼图和中英文方法学文案。同时我们在客户成文的过程中提供数据分析支持,为客户论文产出和科研成果转化的全流程保驾护航!
文献原文:
Zeng Y, Li Y, Zhang W, et al. Proteome analysis develops novel plasma proteins classifier in predicting the mortality of COVID-19. Cell Prolif. 2024;57(7):e13617. doi:10.1111/cpr.13617.