您当前所在的位置: 首页>焦点图片

省烟草农科院寸玉鹏博士在基因组结构分析领域取得重大突破

发布时间:2018-06-13 来源:云南省烟草农科院 浏览次数:

  现代基因组测序技术快速发展为癌症等疾病研究提供了新工具,同时测序产出的大量数据也对计算和模型提出了挑战。如何快速、准确找出癌症基因组中的遗传变异就成了计算生物学中的重要挑战。寸玉鹏博士通过多年对癌症二代基因组数据的分析,开发了一系列独立的模型用于发现癌症基因组中的基因拷贝数变异、结构变异等遗传变异、组织样本纯度估计、突变聚类,并将成果于2018年5月25日发表在《Nature protocols》(自然实验手册)上,该刊物为Nature出版集团的子刊,主要发表科学研究领域的成功方法,2017年影响因子为10.03。

  该模型用一种全新的方法来鉴定基于体细胞的单核苷酸位点变异细胞癌细胞种类,进而构建癌细胞在体内的扩散过程。其它模型均采用贝斯狄利克雷混合模型来推断细胞种类。由于贝斯狄利克雷混合模型需要用大量采样模拟来找到最优参数,其在高性能服务器上的计算时间通常需要3个星期左右,而该模型用普通电脑只需3~8秒就可计算结果。该模型为基因组大数据分析计算设备和速度上提供了双重改进策略,并在计算速度和精度上优于美国Broad研究所和英国Sanger研究所的同类方法,处于国际领先地位。

  寸玉鹏博士是云南省烟草农科院2016年底从德国科隆大学引进的生物信息学方向的高端人才,从事把生物统计、统计学习和计算机技术的应用到生物学数据处理和建模中。累计以第一作者和通讯作者在Nature Protocols, Bioinformatics, BMC Bioinformatics,PLoS ONE 等杂志发表生物信息算法的文章5篇,其中SCI文章4篇(累计总影响分子达到22.58),并作为第四作者在Nature和作为主要的数据分析人员贡献了 Nature Genetics, Nature Communications等顶级学术刊物的数据的分析,论文的总引用次数达455次。

  文章链接: https://www.nature.com/articles/nprot.2018.033  

  

方法流程图