中国生物工程学会会刊     创刊于2005年

位置:主页 > 刊物一览 > 2017年 > 1月 >

基于文献计量的基因组编辑技术发展态势分析

时间:2018-05-29来源:未知 作者:王慧媛 袁天蔚 阮亮亮 熊燕 点击:

自2013 年首次报道CRISPRCas9 系统成功在哺乳动物基因组 编辑中应用以来,以CRISPR 为 代表的基因组编辑技术受到广泛 关注。基因编辑技术是对目标基 因序列进行插入、删除或者改变 的操作方法。从锌指核糖核酸酶 (ZFN)技术、转录激活因子样 效应物核酸酶(TALEN)技术到 现在的RNA 介导的成簇规律间 隔短回文重复序列系统(CRISPR) 技术,基因组编辑技术成为生命 科学研究的一项重要技术。尤其 是CRISPR 技术,自2012 年问世 以来,在短短几年内迅速席卷全 球各实验室,并展现出广阔的应 用前景,被认为是遗传研究领域 的革命性技术,已应用于作物育 种、疾病模型构建、靶向药物研 发等各个领域。采用文献统计、 共被引分析和关键词共现分析 等文献计量方法,对基因组编辑 技术近十年的相关文献进行分 析,总结技术发展路径和研究现 状,并对未来的研究热点趋势进 行展望。

1 基因组编辑技术发展迅速

基因组编辑依赖于位点特 异的核酸内切酶在剪切位点通过 DNA 修复系统触发序列修改。目 前,在该领域主要有三种技术,即 ZFN 技术、TALEN 技术和CRISPR 技术。

TALEN 技术与ZFN 技术组 成了一大类强有力的基因组编 辑工具,由一个可编码的序列特 异性DNA 结合模块与一个非特 异性的DNA切割结构域所组成, 通过诱导DNA 双链断裂来刺激 容易出错的非同源末端连接或 在特定基因所在的位置进行的 同源定向修复,完成一系列基因 编辑操作。CRISPR 技术是最新 出现的一种基因组编辑工具,与 其他基因组编辑工具相比,更易 于操作,有更强的可扩展性。

利用Web of Science 数据库, 检索2006 ~ 2016 年的基因组编 辑技术相关文献(检索时间为 2016 年11 月8 日,数据更新时间 为2016 年11 月4 日)。2006 年 以来,共获得基因组编辑技术研 究相关文献8176 篇。2015 年发文 量为1964 篇,是2006 年发文量(62 篇) 的31.68 倍。2016 年( 数据 截至2016 年11 月8 日)为2145篇,已经比2015 年增长了9.22%。 2006 ~ 2015 年,基因组编辑技 术研究发文量的平均年增长率为 47.94%,发文量呈快速增长的趋 势(图1)。

2 美国引领基因组编辑技术 研究

2006 ~ 2016 年全球发表的 基因组编辑技术论文中,美国 以4090 篇的发文量位居世界第 一,占全球该领域发文总量的 50.02%。中国以992 篇的发文量 排名第二,占全球该领域发文总 量的12.13%,发文量排名前五的 国家还有德国、英国、日本(图2)。

2006 ~ 2015 年,基因组编 辑技术论文发文量排名前五的国 家中,美国的发文量增长速度最 快, 从2006 年的36 篇增长到 2015 年的993 篇(2016 年数据不 全,此处只做趋势观察,不做年 度统计),发文量增长了近26.58 倍,平均年增长率达44.90%。中 国从2007 年才开始有基因组编 辑技术的相关文献报道,发文量 以缓慢的速度平稳增长。2012 年 开始,中国的发文量快速增长, 2014 年达到189 篇,超越德国, 位居全球第二(图3)。

2006 ~ 2016 年,在基因组 编辑技术领域,美国发表的论文 的篇均被引频次达到26.93 次,h 指数高达135,拥有较多的高质 量论文。中国尽管在发文量上排 在全球第二,但其论文的总被引 频次只有15 416 次,篇均被引频 次仅为15.54 次,在发文量排名 前十位的国家中排名靠后,而法 国、加拿大、荷兰、意大利、西班牙的篇均被引频次都达到20 次 以上(表1)。

2006 ~ 2016 年,全球基因 组编辑技术相关论文8176 篇, 总被引频次为155 810 次,篇均 被引频次为19.06 次。将某一时 间段各国论文的篇均被引频次与 该时间段全球篇均被引频次相 比,得到各国篇均被引频次的相 对数值,将这一指标称为标准引 文影响指数(normalized citation impact,NCI),国际篇均被引频 次作为基线1,NCI 可以从一个 角度反映一个国家在该领域的研 究水平。

发文量排名前十位的国家 中,美国、法国、加拿大、荷兰 和西班牙在基因组编辑领域的研 究高于全球平均水平,德国和意 大利与全球平均水平相当,英国 略低于全球平均水平,而中国和 日本的NCI 分别为0.82 和0.66, 低于全球平均水平(图4)。

3 中国研究机构在基因编辑 技术研究领域论文发文量表 现突出

2006 ~ 2016 年全球基因组 编辑技术论文发文量排名前十位 的研究机构如图5 所示。哈佛大 学以390 篇的发文量排名首位; 中国科学院排名第二(260 篇), 是唯一进入全球前十的中国研究 机构。

2006 ~ 2016 年,基因组编 辑技术论文发文量排名前十的机 构中,美国麻省理工大学的篇均 被引频次最高,达到94.38 次, 其次是哈佛大学,篇均被引频次 为69.80 次。中国科学院尽管发文量排名第二位,但篇均被引频 次仅为17.41 次,与其他机构相 比,整体发文质量仍有一定差距。 从h 指数来看,哈佛大学的h 指 数较高(74),拥有较多的高质 量论文(表2)。

2006 ~ 2016 年,基因组编 辑技术论文发文量排名前十的中 国机构中,中国科学院以260 篇 的发文量排名第一,占中国基 因组编辑技术研究论文总量的 26.21%。从h 指数来看,中国科 学院的h 指数为31,遥遥领先于 其他国内机构。清华大学的篇均 被引频次最高,达到64.10 次, 其次是北京大学,篇均被引频次 为38.01 次。这两所高校在基因 组编辑技术领域的论文总体质量 较高(表3)。

4 基因组编辑技术领域的革 命性技术——CRISPR 技术

为了研究基因组编辑的技术 发展路径,运用信息可视化软件 CiteSpace 绘制知识图谱并计量 分析数据,对2006 ~ 2016 年基 因组编辑相关文献的共被引和关 键词共现情况进行分析(图6), 梳理基因组编辑的技术路径, 可以看出,CRISPR 技术无疑是 基因组编辑技术领域的革命性突 破。CiteSpace 是应用于Java 环 境下的可视化软件,基于对特定 领域文献集合的计量,通过知识 图谱的绘制,能够对CRISPR 技 术的知识结构、研究演进以及热 点和前沿主题进行定量与定性 分析。

CRISPR 是一类广泛分布于 细菌和古菌基因组中的重复结构。研究表明,CRISPR 与一系列相关 蛋白、前导序列一起,能为原核 生物提供对抗噬菌体等外源基因 的获得性免疫能力。这种结构 的作用机理可能与真核生物的 RNA 干扰过程类似,最早于1987 年在大肠杆菌(Escherichia coli) K12的凋亡蛋白抑制因子(inhibitor of apoptosis protein)基因侧翼序列 中被发现 。2005 年左右,CRISPR 位点附近高度保守的Cas 基因 (CRISPR-associated genes) 引起 了研究者关注。Cas 基因是一类 基因家族,编码具有核酸酶和解 旋酶结构域的蛋白质。2005 年, Daniel 等[2] 在原核生物中发现了基 因序列中包含45 个CRISPR-Cas 系统的蛋白家族和多个CRISPRCas 亚型的集合,这些集合显示了 高度的灵敏性和特异性。2007 年 3 月,Barrangou 等[3]在《Science》 上发表文章称,CRISPR 与Cas 构 成的CRISPR-Cas 系统能够使细 菌抵抗噬菌体,从而免受病毒和 质粒侵害,在此基础上,研究人 员逐步探明了CRISPR-Cas 系统 详细的免疫机制,为CRISPR-Cas 系统发展成为通用的RNA 介导的 可编程DNA 核酸内切酶辅平了 道路,这篇文章成为了CRISPRCas 系统作为基因组编辑工具的 奠基性研究。随后,科学家们陆续对CRISPR-Cas 的作用机制进行 了深入研究,例如2008 年荷兰瓦 赫宁根大学的Brouns 等[4] 发表在 《Science》上的文章,报道了原 核生物中小CRISPR RNA(small CRISPR RNAs)介导的抗病毒防 御, 阐述了包含在CRISPR-Cas 中的病毒衍生序列如何使用来自 宿主的CRISPR 相关蛋白Cas 介 导抵抗感染的抗病毒反应。直到 2012 年8 月,加州大学伯克利分 校的Jinek 等[5] 发表在《Science》 杂志上的文章,正式提出利用 RNA 介导CRISPR-Cas 系统可 实现基因组编辑,证明CRISPRCas 系统可作为基因组编辑工具, CRISPR-Cas 基因组编辑技术瞬间 吸引了全球研究者的目光。该文 章被引用1290 次,成为近几年来 CRISPR 技术大热的起点。

5 有效性验证和应用研究是 基因组编辑技术研究的热点

利用作者从论文中抽取用于 表征论文的主题特征的关键词,可 以分析出一定研究领域的热点和 前沿主题。在CiteSpace 软件中, 选择网络节点类型为“keywords” ( 关键词), 参数阈值设置为 “top 50”(每年出现频次最高的 前50 位关键词),绘制关键词共 现知识图谱(图7)。分析2006 ~ 2016 年基因组编辑技术相关的 8176 篇文献,共出现14 142 个关 键词。综合来看,2006 ~ 2013 年, 频次和中介中心性较高的关键词分别 是zinc fi nger nuclease(锌指核酸酶)、DNA express system(DNA 表达系统)、Escherichia coli( 大 肠杆菌)、DNA binding specifi city (DNA 结合特异性)、homologous recombination(同源重组)、双 链断裂fragment-length-polymorphism ( 片段多态性)、endonuclease (核酸内切酶)等。这期间的研究 热点在于对上一代基因组编辑技术 ZFNs、TALANs 等的深入研究和对 CRISPR 技术的分子机制研究。

2013 年以后的高频词和高中介中心 性关键词为prokaryote(原核细胞)、 mice( 小鼠)、mammalian cell ( 哺乳细胞)、CRISPR/Cas9、 pluripotent stem cell (多能干细胞) 等,研究热点集中在以CRISPR 技术为代表的基因组编辑技术在 不同系统中的有效性验证及应用。 2013 年以来,基因组编辑技 术领域不断取得突破性进展,大 部分都是围绕CRISPR 技术展开。 科学家们纷纷在细菌、斑马鱼、小 鼠、小麦、水稻、哺乳动物甚至人 类等不同生物系统上验证CRISPR 的 有效性,例如,Hsu 等[6] 利用产脓 链球菌(Streptococcus pyogenes) 中的Cas 酶(SpCas)和RNA,在 小鼠和人类细胞的DNA 中进行 了插入、修改、敲除基因片段, 首次证明了Cas9 核酸酶能用于哺 乳动物细胞基因组的编辑;Cong 等[7] 将多个引导序列编码到单个 CRISPR 阵列中,使得能够同时编 辑小鼠基因组内的多个位点,展 示CRISPR 技术在小鼠体内进行 多位点编辑的有效性;Jiang 等[8]利 用CRISPR-Cas 系统进行RNA 指 导的细菌基因组编辑,利用Cas9 核酸内切酶结合双股RNA 在肺炎 链球菌和大肠埃希氏菌基因组中实现精确的基因突变;Hwang 等[9] 发现细菌II 型CRISPR-Cas 能够 在斑马鱼胚胎中诱导产生靶向遗 传修饰,其效果与ZFN 和TALEN 的效果相类似;Ding 等[10]利用 CRISPR 技术进行人多能干细胞 基因组编辑,并指出CRISPR 较 ZFN 和TALEN 具有极大的优 势,CRISPR 更易于操作,也具 有更强的扩展性;Shan 等[11] 利 用CRISPR-Cas 系统定点突变了 水稻和小麦两个作物的OsPDS 和TaMLO 等5 个基因, 首次证 实CRISPR-Cas 系统能够用于植 物的基因组编辑;Niu 等[12]利用 CRISPR技术实现猴的基因编辑, 提示该技术进行人基因组编辑的 可能性。

同时,以CRISPR 为代表的 基因组编辑技术在疾病治疗、动 植物品种改造等应用方面的研究 也取得较大进展。研究人员已经 利用CRISPR 技术在疾病治疗领 域取得诸多突破,包括构建衰老 模型[13]、改造艾滋病毒[14]等,尤 其是成功编辑T 细胞[15],为与自 身免疫相关的1 型糖尿病、艾滋 病、癌症等多发性疾病提供了新 的治疗途径。在癌症治疗领域, 研究人员利用CRISPR 技术鉴别 和筛选癌症相关基因[16]、精准控 制基因表达[17]、构建癌症类器官[18] 等。此外,CRISPR 也可用于设 计干细胞,开发疾病研究和药物 测试模型[19],并有望应用到诱导 多能干细胞中[20],实现个性化的 干细胞治疗,造福多种遗传学疾 病的患者。在动植物分子育种方 面,在利用CRISPR-Cas 系统定 点突变了水稻和小麦基因的基础 上,Ji 等[21] 利用CRISPR-Cas 特 异识别病毒和外源DNA的特性, 将CRISPR 切割系统引入植物, 在植物中建立了DNA 病毒防御 体系;CRISPR 技术也被广泛用 于山羊、猪、狗等动物品种的改良上。除了应用于疾病治疗和物种 改良,CRISPR 在其他应用领域也 发挥着重要的作用,如销除“转 基因”生物中特定序列[22]、光控 CRISPR-Cas9 系统[23]、制备新型 gRNA 文库[24]等。

在多种系统中成功应用CRISPR 技术之后, 科学家们更加关注 CRISPR 技术应用于人类基因组 编辑。2015 年,我国中山大学生 命科学学院黄军就在《Protein & Cell》杂志发表文章称,其团队成 功修改了人类胚胎的DNA,为治 疗地中海贫血症提供了可能[25]。 这是CRISPR 技术首次应用于人 类胚胎编辑,尽管引发了基因组 编辑技术伦理和监管问题的巨大 争议,但仍是该基因组编辑技术 应用研究的重要突破,黄军就也 因此入选了《Nature》2015 年度 十大人物。

6 总结与展望

随着基因组编辑技术飞速发 展,尤其是CRISPR 技术的不断 应用与探索,相关研究发文量逐 年迅速增长。美国引领了基因组 编辑技术的研究,其发文量占全 球发文量的近一半,且发文质量 整体水平较高。中国后来居上, 在基因组编辑领域的研究实力强 劲,尤其是中国科学院,在发文 量上仅次于哈佛大学,其发文整 体实力与高质量论文量在国内也 处于领先地位。基因组编辑技术 发展过程中,CRISPR 技术无疑是 该领域的革命性技术。

近年来,基因组编辑的研究 热点都围绕着CRISPR 技术展开, 从作用机制到不同系统的有效性验证,再到技术应用,基因组编 辑的应用潜力不断被挖掘,在药 物开发、疾病治疗、动植物改造 等领域发挥着越来越重要的作 用。利用基因组编辑技术寻找、 确定和制备药物筛选靶(分子药 靶)已成为新药研发的新思路; 基因组编辑技术越来越普遍地 用于作物育种。此外,研究人员 也在不断探索如何减少基因组 编辑技术的脱靶效应,提高系统 效率和特异性,寻找更高效的编 辑系统或工具等,对脱靶效应的 研究使得该技术更为精准,“精 准基因组编辑”正逐步实现。而 具有多重功能或更大识别序列 的新系统也在不断被发现。此 外,随着基因组编辑技术成功 应用于人类胚胎,该技术的快 速发展所带来的伦理和监管问 题也得到广泛关注和探讨。