Crispr/Cas9介导的遗传学筛选 (Genetic Screens)已成为肿瘤表型与鉴定癌症进展驱动基因的核心工具。标准流程是将慢病毒 sgRNA 文库导入细胞或动物模型,经功能性压力(增殖、转移、药物处理)富集或耗竭特定 sgRNA,再通过高通量测序量化丰度变化,即可在无偏好前提下找出与表型相关的必需基因或耐药基因。

在Crispr screen技术进步同时,如何分析和发掘Crispr screen得到的数据也是一个巨大的挑战。与传统转录组、蛋白组数据相比,CRISPR 筛选产生的计数矩阵维度更低、噪声来源更多(如慢病毒滴度、编辑效率、细胞倍增速率等),且需同时估计 sgRNA 水平与基因水平的竞争适应度,这对统计模型提出迥异的要求。一般至少并行 2–3 种互补策略对Crispr screen数据进行分析,通过一致性评分或投票机制降低假阳性。

Cancer CRISPR Screening Data Analysis Platform (OncoCRISPRDB)可用于肿瘤Crispr数据再挖掘和分析肿瘤的各种表型下基因功能及通路情况。OncoCRISPRDB整合了多种肿瘤模型及实验条件下Crispr Screen数据,可以实现多种算法下功能基因筛选、通路分析、通路下基因相互作用分析和跨表型基因和通路的研究,同时支持客制化的分析参数以及可视化方式。

OncoCRISPRDB有三个核心步骤:数据收集,数据分析和可视化工具。该数据库整合161个数据集,涵盖1082个样本,精心筛选并适配 7 种针对CRISPR Screen数据的算法,实现对数据的基因,通路,表型层面的探索。

OncoCRISPRDB平台的数据源自GEO数据库,涵盖从2016年2月至2024年9月期间收集的肿瘤基因在CRISPR Screen中的数据。数据经过严格的筛选,以确保其质量和相关性。再经过临床信息分组,基因名的转化及数据清洗,我们得到了涉及

,用户可以自由选择3种算法。每种算法均有至少80个数据集可供探索,并提供气泡图,火山图,Rank图。
,DCE (Differential Causal Effects)算法用于通过比较正常细胞和癌细胞的基因表达数据来检测信号通路中的异常调控。该方法基于因果推断的统计框架,能够识别在癌症细胞中异常调控的特定基因相互作用(即通路中的边),同时考虑混杂因素的影响跨表型基因。该模块支持KEGG数据库中220条KEGG通路下的基因相互作用分析 (注:部分数据部分通路缺失不支持)

使用GSEA算法模拟各类表型之间的相似度。将各表型下基因得分进行排序,在汇总所有表型的基因集后,使用GSEA算法对每种表型计算富集得分ES (Enrichment Score)。高ES得分表明该基因集与该表型之间的关联性较强。该模块的分析结果以GSEA图,Ridge图以及Bar图的形式呈现。

跨表型基因分析模块实现深入探索不同表型或类似表型下不同实验组中功能基因的表现。其对任意两个数据集进行Z-score标准化处理,确保数据处于同一尺度,从而消除不同数据集之间的量纲和量级差异。

通过CRISPR Screen数据分析,挖掘关键基因和通路,为肿瘤研究提供新的策略。
【2025.11.22】黄景瑜跟金晨?问问黄日莹?王俊凯和王源、易烊千玺?艺人们关注超线
约基奇44+13+7国王爆冷灭掘金终结8连败 威少21+6+11超传奇
快船大胜黄蜂:哈登55+7+10三分单节27分创纪录 保罗神迹历史首人
俞敏洪深夜发全员信道歉,回应被叫“老登”,称“用员工血汗钱旅游”说法不妥