当前位置:    新闻动态   2023   魏彦杰团队提出环形RNA全长序列组装方法

 

魏彦杰团队提出环形RNA全长序列组装方法


2023年9月22日

2023年9月22日,魏彦杰团队在Briefings in Bioinformatics杂志上发表了题为“JCcirc: circRNA full-length sequence assembly through integrated junction contigs”的文章,构建了一个新的环形RNA全长序列组装工具。

随着测序技术的发展,环形RNA在动植物代谢及人类疾病中的作用逐渐被发现,它能够通过多种方式完成其功能,包括与miRNA互作,与RBP互作,翻译蛋白。这些功能与其序列息息相关。由于环形RNA序列和线性RNA相似度极高,且序列内部存在可变剪接的情况,如何准确构建circRNA序列是环形RNA功能研究的基础。针对该问题,魏彦杰团队提出了JCcirc,该方法除了利用典型的环形RNA组装特征back splice junction(BSJ)外,还引入了新的特征junction contig(JC),结合BSJ和JC的优势,提出了 JCcirc(https://github.com/cbbzhang/JCcirc)。它能够使用剪接图和片段覆盖率有效重建所有类型的环形RNA 全长序列及RNA可变剪接。JCcirc主要包括四个步骤,1.从测序数据中提取BSJ并组装JC;2. 将BSJ和JC比对比对到参考环形RNA序列上,获得与环形RNA全长序列相关的候选片段;3. 基于注释信息及片段覆盖度过滤低置信度片段;4. 生成环形RNA全长序列及选择性剪接环形RNA。JC加入显著提升了JCcirc的性能,且有利于较长环形RNA序列的组装,在多组人类模拟数据集中,发现组装序列中位长度增加了4bp至18bp。研究结果证明了 JCcirc 在人体模拟数据集上相对于现有方法的优越性,其平均 F1 值比CircAST高0.40,比CIRI-full和circRNAfull 高0.13。 对于400 bp以下、400-800 bp、800 bp-1200 bp和1200 bp以上的circRNA,正确组装率分别比现有最优方法高13%、9%、4%和3%。此外,JCcirc 在其他五个模型物种数据集和真实测序数据集上也优于现有的组装工具,能够准确组装环形RNA全长序列。



高性能中心相关链接:

中国科学院深圳先进技术研究院 粤ICP备09184136号-3             地址: 深圳市南山区西丽深圳大学城学苑大道1068号             邮编: 518055              联系电子邮箱: cx.zeng@siat.ac.cn