首页 > 新闻 > 医学前沿 > 13+!一个识别circRNA-RBP相互作用的工具--circRIP!

13+!一个识别circRNA-RBP相互作用的工具--circRIP!

时间: 2022-08-02 11:01  来源: 求医网   编辑: 硕硕

环状核糖核酸(circRNA) 由下游剪接供体和上游剪接受体共价连接而成。 circRNA 最重要的功能之一主要是通过结合 RNA 结合蛋白 (RBP) ...

摘要:
环状核糖核酸 (circRNA) 由下游剪接供体和上游剪接受体共价连接而成。 circRNA 最重要的功能之一主要是通过结合 RNA 结合蛋白 (RBP) 发挥作用。 
背景介绍
近年来,circRNA的研究已经越来越被重视了,然而目前还没有有效的算法来识别全基因组的 circRNA-RBP 相互作用。今天小编为大家带来的这篇文章,作者开发了一种独特的算法 circRIP,用于从 RNA 免疫沉淀测序 (RIP-Seq) 数据中识别 circRNA-RBP 相互作用。文章发表在《Briefings in Bioinformatics》上,影响因子为:13.994,文章题目为:circRIP: an accurate tool for identifying circRNA–RBP interactions。
数据介绍
本研究所用数据是从 GEO 数据库 (GSE138711) 获得 WM278 细胞系中 IGF2BP3 RIP-Seq 的三个重复样本,以及从 ENCODE 数据库中获得的 K562 和 HepG2 细胞系的 119 和 103 个 eCLIP 数据集。    
结果解析 01  
circRNA概述   虽然 RIP-Seq 是检测 RBP 和 RNA 相互作用的有效技术,但目前基于 RIP-Seq 的流程和算法是专门为线性 RNA 设计的,不适用于 circRNA。为了克服这一限制,本研究开发了一种独特的方法来检测 RBP 和 circRNA 的结合,流程如图1所示。首先,根据先前的算法识别 RIP-Seq 的 IP 和输入样本中的 circRNA,并提取 circRNA 的计数。每百万计数 (CPM) 用于标准化 circRNA 的计数。接下来,IP 和输入的所有reads都被映射到基因组,以计算宿主基因的正向剪接点 (FSJ)。然后计算 IP 和输入中 circRNA 表达 (CPM) 的倍数变化。为了评估抗体对 circRNA 的显著富集,使用条件方法测试两个泊松率的比率来比较 IP 和输入样本中检测到 circRNA 的概率并生成 P 值。最后,通过结合 circRNA 表达的倍数变化和 P 值来估计 IP 中 circRNA 的富集。倍数变化≥ 2 且 P 值 < 0.05 的 circRNA 被认为是 IP 富集(RBP 结合)的 circRNA。否则,它被认为是非富集的 circRNA。
02   circRIP敏感性和特异性的验证  
本研究建立了一个管道来生成模拟的 RIP-Seq 数据,并测试了 circRIP 的敏感性和特异性。如图2A所示,首先,从 GENCODE和 circBase中获得人类基因组中所有线性转录本和 circRNA 全长序列的序列。通过连接 circRNA 序列的头部和尾部来创建反向剪接事件。然后,随机选择9000个线性转录本和1000个具有潜在表达的circRNA来构建模拟输入样本。最后,随机添加 IP/输入和背景噪声的倍数变化来模拟 IP 样本。首先将倍数变化随机设置为 2-10,结果表明,> 88% 的富集 circRNA 被召回 [AUC = 0.96] (图 2B)。然后,本研究通过分别设置从 2 到 10 的倍数变化来生成九个模拟数据集。通过应用 circRIP,在所有九个数据集中观察到可靠的性能:九个数据集中的平均 AUC 为 0.92(图 2C),最低 AUC为0.9,变化为 2 倍,表明circRIP的性能稳健。此外,本研究在模拟数据集中对 circRIP 和之前的工具 Clirc 进行了比较。结果表明,与 Clirc(AUC = 0.76)相比,circRIP 具有显著优势(AUC = 0.94)(图 2D)。
03   基于RIP-Seq数据识别IGF2BP3结合circRNA  
IGF2BP3 是调节 mRNA 稳定性和翻译的 m6A readers之一。为了研究 IGF2BP3 和 circRNA 之间的相互作用,本研究使用 circRIP 分析了 WM278 细胞系中的公共 IGF2BP3 RIP-Seq 数据集。总共鉴定了 1285 个 circRNA,其中 95 个 circRNA在IP样本中显著富集(图 3A ),表明与IGF2BP3可能存在相互作用。另外,本研究预测 CDR1as 是与 IGF2BP3 结合的最丰富的富集 circRNA(图 3A 和 B),这已经得到了 RIP-PCR 结果的验证,表明circRIP 的可靠性。本研究还比较了 IP 样本中 IGF2BP3 富集和非富集 circRNA 的read计数,发现在 IP 样本中也检测到了一些非富集 circRNA 的读取(图 3C),这表明在识别 RBP 结合 circRNA时,消除这些 circRNA是必要的,本研究的工具也采用了这一方法。富含 IGF2BP3 的 circRNA 的基因组分布主要来自外显子,而不是内含子和基因间区域(图 3D)。此外,本研究对富含 IGF2BP3 的 circRNA 进行了通路分析,结果显示了 DNA 代谢、细胞周期、蛋白质定位和造血的富集,表明这些 circRNA-RBP 相互作用的潜在功能类别(图 3E)。
04   基于eCLIP数据识别数千种circRNA-RBP相互作用  
为了测试 circRIP 在 eCLIP 数据中的性能,本研究从ENCODE中收集了 K562 细胞系中 119 个 RBP 和 HepG2细胞系中103个RBP的eCLIP数据集。在鉴定的全部 10361 和 5433 个 circRNA 中,2823 和 1333 个 circRNA 分别被 K562 和 HepG2 细胞中的 RBP 显著富集,表明 circRNA 和 RBP 存在广泛的相互作用(图 4A )。本研究还比较了circRNA 和线性 RNA 上 RBP 的结合motif。密度分布显示大多数motif在 circRNA 和线性 RNA 中显著相似(图 4B)。六个随机选择的 RBP 的结果显示出来自 circRNA 和线性 RNA 的motif高度相似,表明 RBP 在 circRNA 上的结合motif与线性 RNA 相似(图 4C)。接下来,本研究进一步研究了这些 RBP 结合 circRNA 的基因组分布。在 K562 细胞中,RBP AQR 与最多的 circRNA 结合,这些 circRNA 大部分(66.21%)来自内含子区域,而不是外显子和基因间区域,表明 AQR 可能在内含子circRNA的生成中发挥重要作用。另一种 RBP SF3B4 与更多的内含子 circRNA (>50%) 结合,而其他RBP与更多的外显子circRNA 结合,而不是内含子circRNA 或基因间circRNA 结合(图 4D)。 为了揭示这些 circRNA 的潜在功能,本研究进行了通路分析,这些 RBP 结合 circRNA 在多个生物过程中富集。例如,结合 AQR 的 circRNA 在有丝分裂细胞周期、蛋白质分解代谢、DNA 损伤等富集。DROSHA 结合 circRNA 参与蛋白质分解代谢、细胞内转运和 mRNA 代谢过程(图 4E)。这些结果表明circRNA-RBP相互作用在细胞系中普遍存在,并且可能在病理或生理过程中发挥重要作用。    
小编总结
本研究基于RIP-Seq和eCLIP数据,开发了一种准确的方法,可以系统地识别RBP和circRNA的相互作用;验证了circRIP工具在仿真和真实数据集中的性能;探索circRNA 与IGF2BP3和其他>100 rbp的相互作用。CircRIP是为下一代测序数据而设计的,具有准确和广泛使用的量化方法。
相关标签
分享赢大奖:
新浪微博(企业版) QQ微博

在线提问

最少可输入50个汉字

常见病 儿童 老人 女性 男性

求医通安卓客户端

关于我们|招贤纳士|联系我们|用户协议|帮助中心|网站地图|内容合作|友情链接|新浪微博|下载安卓客户端

免责声明:求医网所有建议仅供用户参考。但不可代替专业医师诊断、不可代替医师处方,请谨慎参阅,本站不承担由此引起的相关责任。 Copyright © 2016 QIUYI.CN 京ICP证111012号 公安备案号11011202000697 京ICP备11039101号 互联网药品信息服务资格证书