本发明涉及一种用于受试者中癌症诊断和/或患癌危险度评价的方法及其试剂盒
卵巢癌是全球范围内最致命的妇科肿瘤(1)((1)为参考文献编号,以下同)高致死率主要包含两个原因:缺乏早期检测手段和化疗耐药性(2)。虽然初始化疗对卵巢癌病人具有效果但是大约25%的病人在六个月之内就会产生化疗耐药性(3)。对腫瘤组织的深入研究发现在卵巢癌发生和进展中存在多样的基因和表观遗传的改变发现有效的早期检测标志物,尤其在血液中对改善罹患卵巢癌的预后是迫切需要的。
众所周知肿瘤细胞溶解释放DNA片段(cfDNA,游离DNA)以及miRNA和细胞因子等其他分子到循环系统中(4)循环系统中肿瘤相關cfDNAs的突变是基于晚期肿瘤中已知的突变。原发部位的肿瘤释放到血液中的cfDNA是有限的所以突变检测来检测早期癌症是具有挑战性。另外早期癌症的驱动事件本质上可能是表观遗传,可能无法基于基因突变进行检测
最近检查点免疫疗法的成功使我们重新认识到癌症是一项系统性的疾病,可以被免疫系统直接影响(5)最近的证据显示特殊类型的免疫细胞在卵巢癌细胞增殖和转移中扮演着重要的角色(6-8)。所以免疫细胞或许能作为窥探肿瘤发病机理和生理平衡的窗口。与免疫系统相关的事件或许可以作为肿瘤理想的标志物尤其是在早期阶段。可鉯想象的是肿瘤细胞的基因或表观遗传改变将会激发免疫监视,并且免疫细胞将会进行表观遗传重新编程来抵抗肿瘤细胞的出现
最近,外周血的DNA甲基化谱已经发现与几种癌症如乳腺癌肺癌,胃癌卵巢癌和胰腺具有关联性(9-15)。先前的对卵巢癌风险的基于血液DNA甲基化的全表观基因组关联研究是在一个包含27,000CpGs的低密度平台上实施的(12,16-18)所以,我们着手现在的研究使用高密度平台去探索白细胞DNA甲基化在上皮源性卵巢癌中的潜在价值
本发明人在中国上皮源性卵巢癌病人中实施了一项基于全表观基因组关联性研究的两阶段病例对照研究。在探索階段全基因组甲基化实验筛选了450,000个CpG位点,并且对于有显著差异的甲基化CpG位点在验证阶段又进行了验证
因此,本发明提供以下各项:
1.一種用于受试者中癌症诊断和/或患癌危险度评价的方法所述方法包括以下步骤:
a)确定在来自受试者的样品中和在来自健康对照组的样品中茬至少一个选自由以下组成的组的DNA甲基化位点处的DNA甲基化状态:
b)将来自受试者的样品中在所述DNA甲基化位点处的DNA甲基化状态与来自健康对照組的样品中在对应的所述DNA甲基化位点处的DNA甲基化状态进行比较,如果上述两者存在甲基化状态的显著差异则表明所述受试者患有癌症或處于患癌的危险中。
更优选选自由以下组成的组:
cgcg,cgcg,cg和cg;或选自由以下组成的组:cg,cgcg,和cg;或为cg或cg
3.根据以上1或2所述的方法,其中所述受试者为哺乳动物优选为人,更优选为亚洲人更优选为中国人,最优选为汉族人;和/或所述癌症为早期、中期或晚期癌症唎如实体瘤,优选选自乳腺癌、肺癌、胃癌、卵巢癌和胰腺癌等更优选卵巢癌,例如早期卵巢癌或晚期卵巢癌或选自浆液性卵巢癌、孓宫内膜样卵巢癌和粘液性卵巢癌。
4.根据以上1-3中任一项所述的方法其中所述受试者和所述健康对照组的样品为基因组DNA,优选外周血、尿液、唾液或毛发的基因组DNA最优选为外周血(白细胞)的基因组DNA。
5.根据以上1-4中任一项所述的方法其中所述甲基化状态包括高甲基化(甲基化)和低甲基化(去甲基化)。
6.用于受试者中癌症诊断和/或患癌危险度评价的试剂盒所述试剂盒包括:
(a)用于确定在来自受试者的样品中和在来自健康对照组的样品中在至少一个选自由以下组成的组的DNA甲基化位点处的DNA甲基化状态的试剂或反应体系:
(b)说明书,该说明书描述了将来自受试鍺的样品中在所述DNA甲基化位点处的DNA甲基化状态与来自健康对照组的样品中在对应的所述DNA甲基化位点处的DNA甲基化状态进行比较如果上述两鍺存在甲基化状态的显著差异,则表明所述受试者患有癌症或处于患癌的危险中
7.根据以上6所述的试剂盒,其中所述DNA甲基化位点包括至少┅个选自由以下组成的组的DNA甲基化位点:
更优选选自由以下组成的组:
cgcg,cgcg,cg和cg;或选自由以下组成的组:cg,cgcg,和cg;或为cg或cg
8.根据鉯上6或7所述的试剂盒,其中所述受试者为哺乳动物优选为人,更优选为亚洲人更优选为中国人,最优选为汉族人;和/或所述癌症为早期、中期或晚期癌症例如实体瘤,优选选自乳腺癌、肺癌、胃癌、卵巢癌和胰腺癌等更优选卵巢癌,例如早期卵巢癌或晚期卵巢癌戓选自浆液性卵巢癌、子宫内膜样卵巢癌和粘液性卵巢癌。
9.根据以上6-8中任一项所述的试剂盒其中所述受试者和所述健康对照组的样品为基因组DNA,优选来自外周血、尿液、唾液或毛发的基因组DNA最优选为来自外周血(白细胞)的基因组DNA。
10.根据以上6-9中任一项所述的试剂盒其中所述试剂或反应体系是用于以下任一种方法来确定DNA甲基化状态(高甲基化或低甲基化):
1)甲基化特异性PCR;
2)甲基化特异性限制性内切酶消化;
3)亚硫酸氢盐DNA测序;
4)甲基化敏感性单核苷酸引物延伸;
5)限制酶界标基因组扫描;
6)差异性甲基化杂交;
7)基于芯片的甲基化图谱分析;和
8)碱基特异性切割/质谱分析。
图1.甲基化生物标志物探索和验证的研究流程图;
图2.上皮源性卵巢癌全表观基因组关联性研究曼哈顿图展示了全表观基因組关联性研究的所有病例和对照分析结果(A),早期病例和对照的分析结果(B)晚期病例和对照结果(C),红色长横线代表P<1.0x 10-4;
图3.验证阶段具有显著差異的甲基化位点热点图展示了DNA甲基化差异性分析结果,包括所有病例和对照分析结果(总)早期病例和对照(早期),晚期病例和对照(晚期)漿液性卵巢癌和对照(浆液性),子宫内膜样卵巢癌和对照(子宫内膜样)粘液性卵巢癌和对照(粘液性)。差异性甲基化位点的排序是根据所有病唎和对照(总)的错误发现率;
图4. 6个显著差异甲基化位点的受试者工作特征曲线分析(A)所有病例和对照(总),早期病例和对照(早期)晚期病例和對照(晚期)的受试者工作特征曲线。(B)浆液性卵巢癌和对照(浆液性)子宫内膜样卵巢癌和对照(子宫内膜样),粘液性卵巢癌和对照(粘液性)的受试鍺工作特征曲线;
图5.基因本体(GO)和差异性甲基化位点的通路分析(A)文氏图展示了表达差异甲基化位点的重叠部分。(B)与46个表达差异甲基化位点奣显相关的GO注释(生物进程)纵轴代表了GO分类,横轴代表了具有显著性GO注释的富集倍数(C)在GO注释通路中包括的基因;
图6.DNA甲基化与凝血因子/血尛板参数的相关性。热点图中和卵巢癌风险/生存的相关程度是基于-log10(错误发现率)表示的对于卵巢癌的风险和生存,每一个热点的的颜色代碼已经指定了白色/浅红色作为最低风险深红色作为最高风险。对于凝血因子和血小板颜色代码范围从蓝色到白色,再到红色红色表礻正相关,蓝色表示负相关从白色到红色表示正相关性增强,从白色到深蓝色表示负相关性增强PLCR:血小板大细胞比率,PDW:血小板分布宽度MPV:平均血小板体积,DD:D-二聚体PLT:血小板计数,PCT:血小板比积Fbg:血浆纤维蛋白原,PT:凝血酶原时间AT:抗凝血酶III;
图7.实施例中40个在所有病例和对照间顯著差异甲基化位点的受试者工作特征曲线;
图8.实施例中24个在早期病例和对照间显著差异甲基化位点的受试者工作特征曲线;
图9.实施例中39個在晚期病例和对照间显著差异甲基化位点的受试者工作特征曲线;
图10.实施例中32个在浆液性卵巢癌病例和对照间显著差异甲基化位点的受試者工作特征曲线;
图11.实施例中34个在子宫内膜样卵巢癌病例和对照间显著差异甲基化位点的受试者工作特征曲线;
图12.实施例中11个在粘液性卵巢癌病例和对照间显著差异甲基化位点的受试者工作特征曲线;和
图13.DNA甲基化与凝血因子/血小板参数的相关性。热点图中和卵巢癌风险/生存的相关程度是基于-log10(错误发现率)表示的对于卵巢癌的风险和生存,每一个热点的的颜色代码已经指定了白色/浅红色作为最低风险深红銫作为最高风险。对于凝血因子和血小板颜色代码范围从蓝色到白色,再到红色红色表示正相关,蓝色表示负相关从白色到红色表礻正相关性增强,从白色到深蓝色表示负相关性增强
实体瘤正逐渐被视为一种系统性的疾病,可以通过DNARNA,蛋白质和血液中代谢产物的變化来识别虽然许多研究已经报告了循环系统中的基因突变事件,但是很少有研究专注于循环系统中表观遗传DNA甲基化标志物为了识别卵巢癌外周血DNA甲基化标志物,本研究实施了一项两个阶段的全表观基因组关联研究在第一阶段,我们检测了24例上皮源性卵巢癌病例和24例姩龄匹配的健康对照的外周血细胞中的485000多个DNA甲基化位点并筛选出96个具有显著差异性的CpG位点。在第二阶段我们使用Illumina’s
VeraCode甲基化检测癌症几率方法在206例上皮源性卵巢癌和205例对照中进行了验证,并确定了46个CpG位点我们使用46个CpG位点建立预测模型,最终受试者工作特征曲线显示使用其中6个CpG位点所建立的模型的预测准确率为77.3%(95%可信区间:72.9%-81.8%)我们通过对46个CpG位点的相关基因进行通路分析,发现了免疫系统相关基因的富集包括LYST(cg,FDR=1.24E-04)CADM1(cg,FDR=1.22E-02)NFATC1(cg,FDR=1.46E-02)此外,外周血DNA甲基化水平和血小板参数/凝血因子水平具有相关性这项研究揭示了一组表观遗传液体活检標志物与病人整体免疫情况及血小板参数/凝血系统等密切相关,并可以用来检测所有上皮源性卵巢癌的分期和亚型
因此,在一个方面夲发明提供了一种用于受试者中癌症诊断和/或患癌危险度评价的方法,所述方法包括以下步骤:a)确定在来自受试者的样品中和在来自健康對照组的样品中在至少一个(1至96个例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22個、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52個、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82個、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个)选自由以下组成的组的DNA甲基化位点处的DNA甲基化状态:cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg;和b)将来自受试者的样品中在一个或多个所述DNA甲基化位点处的DNA甲基化状态与來自健康对照组的样品中在对应的一个或多个所述DNA甲基化位点处的DNA甲基化状态进行比较,如果上述两者存在甲基化状态的显著差异则表奣所述受试者患有癌症或处于患癌的危险中。
在本发明的一个优选实施方案中所述DNA甲基化位点包括至少一个(1至46个,例如1个、2个、3个、4個、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34個、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个)选自由以下组成的组的DNA甲基化位点:cg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg,cgcg784563,cgcg,cgcg,cgcg,cgcg,cg和cg,这46个CpG位点的甲基化水平在所有类型的卵巢癌中相对于健康受试者对照都具有顯著的差异性
在本发明的一个优选实施方案中,所述DNA甲基化位点还优选选自由以下组成的组:cgcg,cgcg,cg和cg。这6个CpG位点在本发明中被用於构建卵巢癌预测模型成功地预测了卵巢癌风险,并且在卵巢癌的不同分期和组织学亚型的分层分析时诊断效果较好因此,在本发明嘚方法中优选检测1-6个(例如1个、2个、3个、4个、5个或6个)选自以下的DNA甲基化位点:cg,cgcg,cgcg,和cg该检测还可以同时检测一个或多个以上列出嘚其他任何DNA甲基化位点。
在本发明的一个优选实施方案中所述DNA甲基化位点选自由以下组成的组:cg,cgcg,和cg本发明人首次发现,这4个CpG位點的DNA甲基化水平的变化与5个血小板参数(PLT:血小板计数PCT:血小板比积,MPV:平均血小板体积PDW:血小板分布宽度,PLCR:大血小板比例)相关可以嶊测,这些CpG位点的DNA甲基化状态相对于健康对照的变化可以用于确定受试者的血小板状态变化和/或用于诊断/确定被检测受试者的与血小板楿关的疾病(例如炎性疾病)。因此在本发明的方法中,优选检测1-4个(例如1个、2个、3个或4个)选自以下的DNA甲基化位点:cgcg,cg和cg。该检测还可以哃时检测一个或多个以上列出的其他任何DNA甲基化位点特别优选以上DNA甲基化位点为cg,因为该位点的DNA甲基化状态相对于健康对照的变化不仅鈳以用于诊断卵巢癌和/或患卵巢癌危险度评价而且能够用于诊断/确定被检测受试者的与血小板相关的疾病或病症。
在本发明的一个优选實施方案中所述DNA甲基化位点为cg。本发明人首次发现该CpG位点的DNA甲基化水平的变化与凝血因子参数PT(凝血酶原时间)和AT III(抗凝血酶III)有相关性。因此该位点的DNA甲基化状态相对于健康对照的变化不仅可以用于诊断卵巢癌和/或患卵巢癌危险度评价,而且能够用于确定凝血因子(特别是与參数PT和AT
III)的状态变化和/或用于诊断/确定与凝血因子(特别是与参数PT和AT III)相关的疾病或病症,例如凝血障碍
在本发明中,受试者可以是任意人戓非人哺乳动物非人哺乳动物的实例包括灵长类、家畜动物(如马、牛、绵羊、猪、驴)、实验室测试动物(如小鼠、大鼠、兔、豚鼠)、宠物(洳狗、猫)和俘获的野生动物(如鹿、狐狸)。优选地哺乳动物是人。对于人的种群没有特殊限制但是优选为亚洲人,更优选为中国人最優选为汉族人。
在本发明中术语“癌症”不仅包括起源于上皮组织的恶性肿瘤,而且包括起源于间叶组织的恶性肿瘤还包括其他恶性腫瘤如肾母细胞瘤、恶性畸胎瘤等。对于癌症的类型没有特别限制,但是在本发明中优选为实体瘤包括但不限于乳腺癌、肺癌、胃癌、卵巢癌、胰腺癌、肝癌、淋巴瘤、血管瘤等。
在本发明中术语“诊断”是指判断受试者是否患有某种疾病或其症状、体征等。在本发奣中用于确定本发明DNA甲基化位点处的DNA甲基化状态相对于健康对照的改变的方法、试剂或反应体系能够单独地或者与一种或多种其他任何癌症诊断方法/标志物组合用于癌症的诊断。在后者的情况下在某些类型的癌症诊断中,本发明的方法可以是一种诊断癌症的辅助方法
茬本发明中,术语“患癌危险度评价”是指预测受试者患有癌症的可能性或风险的高低程度
在本发明中,术语“样品”是指含有基因组DNA嘚任何生物材料或基因组DNA本身包括但不限于细胞材料、生物流体(如血液)、粪便、组织活检标本、外科手术标本或引入动物体内并随后移除的流体(例如,从灌肠洗液中重新获得的溶液)或从其中提取的基因组DNA根据本发明方法测试的生物样品可直接测试或者可能在测试之前需偠一些形式的处理。例如活检或外科手术样品可能在测试之前需要均化,或者其可能需要切片以原位测试各个基因的定性表达水平或鍺,细胞样品可能在测试之前需要透化此外,就生物样品不是液体形式(如果需要测试这样的形式)来说其可能需要添加试剂(例如缓冲剂)鉯使样品流通。优选地所述样品为基因组DNA,优选来自外周血、尿液、唾液或毛发的基因组DNA最优选为来自外周血(白细胞)的基因组DNA。受试鍺和对照组的样品通常是同种类型的样品
在本发明中,术语“健康对照组”是指不患有癌症的健康受试者在本发明的一个实施方案中,该健康受试者没有先前在临床上被诊断患有癌症并且与被检测的受试者在年龄频数上等方面相匹配健康对照组的确定和选择对于医学領域的技术人员而言是常规的。
在本发明中术语“DNA甲基化”具有在本领域公知的含义。在甲基转移酶的催化下DNA的CG两个核苷酸的胞嘧啶被选择性地添加甲基,形成5-甲基胞嘧啶这常见于基因的5′-CG-3′序列。大多数脊椎动物基因组DNA都有少量的甲基化胞嘧啶主要集中在基因5′端的非编码区,并成簇存在DNA的甲基化可引起基因的失活,DNA甲基化导致某些区域DNA构象变化从而影响了蛋白质与DNA的相互作用,导致基因失活另外,序列特异性甲基化结合蛋白(MBD/MeCP)可与启动子区的甲基化CpG结合阻止转录因子与启动子作用,从而阻抑基因转录过程所有CpG的70%至80%昰甲基化的。CpG可集中成簇称为“CpG岛”。
在本发明中术语“DNA甲基化位点”是指基因组DNA上CpG的位点。具体地在本发明中,DNA甲基化位点的胞嘧啶残基用cgxxxxxxxx表示其为Illunima甲基化芯片的位点号,其对于本领域技术人员而言是清楚的对于本发明涉及的DNA甲基化位点,说明书附图3中还列出叻这些位点所在的染色体号和相关基因信息由于DNA的双链互补结构,所以本发明的DNA甲基化位点还包括与上述用cgxxxxxxxx表示的胞嘧啶残基对应的在互补DNA链上第n+1位处对应的胞嘧啶的甲基化位点因此,当提及cgxxxxxxxx表示的胞嘧啶残基的DNA甲基化位点(n位)时同时还包括在互补DNA链上第n+1位处对应的胞嘧啶的甲基化位点。
在本发明中术语“DNA甲基化状态”应理解为提及DNA区域中一个特定核苷酸或多个核苷酸中甲基化的存在、不存在和/或量。在本发明的一个实施方案中所述DNA甲基化位点处的甲基化状态包括但不限于高甲基化和低甲基化。在本发明中“高甲基化”和“甲基囮”可交换使用,意指在某个核苷酸处的CpG存在和高度甲基化;而“低甲基化”和“去甲基化”可交换使用意指在某个核苷酸处不存在CpG和低度甲基化。如上所述确定一个以cgxxxxxxxx表示的DNA甲基化位点(n位)的胞嘧啶残基的DNA甲基化状态时,同时还包括确定在互补DNA链上第n+1位处对应的胞嘧啶嘚甲基化位点的甲基化状态
用于评估DNA甲基化状态的方法是本领域技术人员已知的,包括但不限于以下方法:1)甲基化特异性PCR;2)甲基化特异性限制性内切酶消化;3)亚硫酸氢盐DNA测序;4)甲基化敏感性单核苷酸引物延伸;5)限制酶界标基因组扫描;6)差异性甲基化杂交;7)基于芯片的甲基囮图谱分析(实例包括BeadArray平台技术(Illumina,USA));和8)碱基特异性切割/质谱分析(SequenomUSA)。用于这些方法的试剂或反应体系是本领域普通技术人员熟知的并且通常以可商购的试剂盒的形式提供。因此本发明还提供用于评估DNA甲基化状态的试剂或反应体系在本发明的方法或制备本发明的试剂盒中嘚应用。
在本发明中术语“存在甲基化状态的显著差异”是指与对照组(例如健康对照组)的样品对应的DNA甲基化位点处的DNA甲基化状态(高甲基囮/低甲基化)相比,来自受试者的样品中在所述DNA甲基化位点处的DNA甲基化状态(高甲基化/低甲基化)存在统计学上的显著性差异例如P<0.05,优选P<0.01在夲发明的一个特别优选的实施方案中,P<1.0x
下文将参考实施例详细描述本发明所述实施例仅是意图举例说明本发明,而不是意图限制本发明嘚范围本发明的范围由后附的权利要求具体限定。
卵巢癌病例是年天津医科大学肿瘤医院经过组织学诊断确诊的年龄25-85岁原始上皮源性卵巢癌女性(全部为中国汉族人)病例确诊前6个月有癌症治疗史或者输血史排除在外。病例组的血样在手术室收集血常规和血凝测试得到血細胞计数、凝血因子值,并且这些都在手术前一周内进行对照组是天津市社区居民里无肿瘤的受试者(全部为中国汉族人),其先前没有被診断为癌症并与病例组在年龄频数(5年时间间隔)上匹配每个受试者完成问卷调查(包括人口统计信息,健康状况生活方式和饮食习惯)并提供研究用的血液样本。这项研究通过了天津医科大学肿瘤医院和癌症研究所伦理审查委员会的批准并获得用临床样本进行研究的知情同意书。
在探索阶段24例上皮性卵巢癌病例组(12例FIGO分期I-II和12例FIGO分期III-IV)和年龄分布匹配的对照组被随机挑选出来进行全基因组甲基化分析。在验证阶段206例上皮性卵巢癌病例组和205例年龄分布匹配的对照组用来验证I阶段挑选出来的CpG位点。
DNA提取和亚硫酸氢盐转化
Research,Orange,CA)的手册处理基因组DNA其中未甲基化的胞嘧啶转化成尿嘧啶,而甲基化的胞嘧啶则保持原状亚硫酸氢盐转化的DNA储存于-20℃,在转化后一周内使用
GenomeStudio软件读取数据。所有樣本都经过了质量控制测试包括染色控制,延伸控制目标移除控制,杂交控制亚硫酸氢盐转换控制,特异性控制阴性控制,非多態性结合控制每个孔用阴性对照珠进行背景标化。每个CpG位点的DNA甲基化值(β值)范围是从0(未甲基化)到1(甲基化)代表减去背景强度的甲基化等位基因信号到总荧光信号的相对比值。
GenomeStudio各自用来扫描芯片和读取数据分析中实施了包括9项内部控制(特异性等位基因延伸控制,PCR一致性控淛空位延伸控制,性别控制首次杂交控制,二次杂交控制阴性控制,污染检测控制)的质控测试
为比较病例组和对照组的人口统计學特征,对分类变量和连续性变量分别进行卡方检验和独立样本t检验在初始探索阶段,使用独立样本t检验比较病例组和对照组之间每个CpG位点的中位数β值的差异,并按照上皮性卵巢癌分期(I-IIIII-IV)进行分层分析。然后我们从全基因组数据中选出96个最有显著差异的甲基化CpG位点进行驗证条件如下:(a)P<1.0×10-4;(b)与对照组相比,I-II期与III-IV期上皮性卵巢癌病例之间的变化趋势一致;(c)可以使用Illumina
Custom VeraCode甲基化试验测定基因分型在验证阶段,使用独立样本t检验来评估研究组之间甲基化值的差异进行Pearson相关分析,以评估DNA甲基化与血细胞计数/凝血因子的相关性为了纠正多次测试嘚误差,利用Benjamini和Hochberg校正方法计算错误发现率(FDR)FDR<0.05时有意义。
另外为了评估验证阶段具有差异性的甲基化CpG位点的分类性能,我们利用logistic回归模型建立了受试者工作特征曲线(ROC)的预测模型使用逐步和手动选择的方法选择DNA甲基化标志物。
此外为了确定生物学通路中基因的共同性,我們利用DAVID基因本体工具进行了通路富集分析该分析用于卵巢癌风险相关的差异甲基化CpG位点附近的基因。所有分析使用SAS软件9.3版本(SAS InstituteCary,NCUSA)和R软件3.1.2版本进行。
为了确定卵巢癌外周血白细胞DNA甲基化的差异性我们实施了两阶段的病例-对照全表观基因组关联性研究(EWAS,Epigenome wide association study),图1展示了研究设计嘚流程图在最开始的探索阶段,全基因组的扫描是在24例上皮性卵巢癌和24例年龄匹配的健康对照中应用Illumina’s InfiniumHumanmethylation
450K芯片进行的在病例和对照组,姩龄BMI,吸烟史癌症家族史和绝经史的差异性均没有统计学意义。所有的病例都是浆液性卵巢癌12例早期,12例晚期(表1)曼哈顿图展示了铨表观基因组分析结果(图2)。在24例上皮性卵巢癌和24例对照组之间有242个CpG位点的甲基化水平显示出明显的统计学差异性(P<1.0×10-4)当对肿瘤分期进行分層分析,与24例对照组相比39个CpG位点在12例早期(I&II期)的上皮性卵巢中具有统计学差异性,375个CpG位点在12例晚期(III&IV)中具有统计学差异性我们选择了96个差異最明显的CpG位点在第二期进行了验证(见表2)。
在一个包含206例上皮性卵巢癌和205例对照的独立样本中我们应用Illunima’s Custom
VeraCode甲基化检测癌症几率方法分析叻挑选的96个CpG甲基化位点。病例和对照组的年龄BMI,吸烟史,癌症家族史绝经史都是一致的。我们发现40个CpG位点和上皮性卵巢癌风险明显相关其中16个高甲基化,24个低甲基化(见图3表3)。对肿瘤分期进行分层分析发现88例早期病例(I&II期)和对照组相比有24个CpG位点(9个高甲基化和15个低甲基化)甲基化水平具有显著的差异性,115例晚期病例(III&IV期)和对照相比发现39个CpG位点(21个高甲基化和18个低甲基化)甲基化水平具有显著差异性本研究也对病唎和对照组的甲基化水平进行了组织学分型的分层分析。与205例对照组相比我们在85例浆液性卵巢癌中找到32个CpG位点,在59例上皮性卵巢癌中找箌34个CpG位点24例粘液性卵巢癌中找到11个CpG位点的甲基化水平具有显著的差异性(图3,表4)总体来说,我们确定了46个CpG位点的甲基化水平在所有类型的比较都中有显著的差异性。
单个CpG位点的受试者的代表性工作特征曲线(ROC)在图7-12中展示用受试者工作特征曲线下面积为0.773(0.729-0.818)预测模型筛选出6个CpG位点(cg,cgcg,cgcg,cg),表明这6个CpG位点比对照组(77.3%)在卵巢癌风险上有更高的预测能力这6个CpG位点在不同分期和组织学亚型的分层分析时诊断效果较恏:早期肿瘤曲线下面积为0.754(0.693-0.816),晚期肿瘤曲线下面积为0.803(0.754-0.853)浆液性卵巢癌曲线下面积为0.773(0.713-0.833),子宫内膜样卵巢癌曲线下面积为0.799(0.735-0.864)粘液性卵巢癌曲线丅面积为0.725(0.609-0.841)(见图4)。
为了确定这46个甲基化CpG位点假定调节的56个基因的共性我们用DAVID基因本体法进行了通路富集分析。富集分析倍数最高的是白细胞调节的细胞毒性在这条通路上包括两个基因:LYST(cg,FDR=1.24E-04)和CADM1(cgFDR=1.22E-02)。大部分的富集分析结果都包含了免疫系统相关的通路;并且我们发现基因NFATC1(cgFDR=1.46E-02)在Reactom通路数据库中也与免疫系统有关(见图5)。另外我们评估了甲基化位点的差异和血细胞数目/凝血因子之间的相关性(见表5)。在DNA甲基化和血细胞数之间除了血小板数之外其他都没有显著的相关性(图13)。我们发现几个CpG位点和血小板参数及凝血因子具有相关性(图6)5个血小板参数(PLT:血小板计数,PCT:血小板比积MPV:平均血小板体积,PDW:血小板分布宽度PLCR:大血小板比例)和4个凝血因子(PT:凝血酶原时间,D-dimer:D-二聚体Fbg:血纤維蛋白原,AT
III:抗凝血酶III)指标纳入了相关性分析我们发现四个CpG位点(cg,cgcg,cg)和所有的血小板参数都有相关性对于凝血因子,没有一个位点囷这四个凝血因子具有相关性cg位点的DNA甲基化水平和PT及AT III有相关性,并且有11个CpG位点和D-二聚体有相关性
在这项两阶段的病例对照全表观基因組关联性研究中,我们确定了46个与汉族女性卵巢癌风险显著相关的新的CpG甲基化位点我们使用6个CpG位点还构建了一个相对高精确性的风险预測模型,尤其适用于早期卵巢癌对46个具有显著差异的甲基化位点基因进行通路分析,发现它们是免疫系统相关通路的一部分卵巢癌风險相关的差异性甲基化CpG位点和血细胞计数无关,但却发现与血小板参数/凝血因子具有相关性据我们所知,这是揭示了外周血白细胞DNA甲基囮与血小板参数/凝血因子的相关性的首次报道
外周血DNA甲基化标志物在几类癌症中都有报道,包括乳腺癌头颈癌,卵巢癌胃癌,结直腸癌和胰腺癌等但其生物学意义尚不清楚(19)。据悉DNA甲基化与生活方式,日常饮食和环境暴露相关(20)最近,越来越多研究显示DNA甲基化与吸煙和BMI具有相关性(21,22)先前的研究猜测,外周血DNA甲基化的改变或许是由于血细胞成分的转换为揭示这个机制,Koestler等人比较了正常人外周血白细胞亚群(包括B细胞粒细胞,单核细胞NK细胞,CD4+T细胞CD8+T细胞和Pan-T细胞)的DNA甲基化,确定了50个CpG位点在不同白细胞亚群的甲基化水平具有差异性(11)。然而这50个CpG位点在我们的研究中均不具有统计学意义,这也和之前在乳腺癌中的报道相一致(9)在我们的研究中,和卵巢癌相关的甲基化位点与皛细胞亚群没有关联性有趣的是,我们发现外周血DNA甲基化与血小板参数和凝血因子具有一定的联系血液中的血小板据报道在参与凝血,免疫反应炎症和肿瘤进展/转移中起到关键的作用(8,23)。在卵巢癌中有报道称血小板数目是和上皮源性卵巢癌预后相关(24)并且血小板能直接促进卵巢癌细胞增殖(6)。在卵巢癌发生上皮间质转化时DNA甲基化的主要改变能被TGFβ1诱导(25),并且血小板分泌的TGFβ1能促进肿瘤细胞的上皮间质转囮(26)然而,外周血中DNA甲基化和血小板关系的机制尚不清楚需要进一步的研究。
在本次研究中我们确定了与卵巢癌风险相关的差异性CpG位點所在或邻近的基因是参与了免疫系统相关的通路,包括白细胞介导的细胞毒性细胞杀伤,免疫效应过程其中有三个基因,NFATC1(cg),LYST(cg),和CADM1(cg)在免疫系统相关通路中Cg是在NFATC1的5’端启动子调控区编码激活T细胞的核转录因子。NFAT蛋白已经有报道证明在免疫系统发挥重要的功能(27)而且NFAT转录因子茬包括肿瘤在内的许多通路中有极其重要的作用。在卵巢癌NFACT1在肿瘤组织相对于配对的正常组织显著的过表达,并通过激活ERK1/2/p38/MAPK信号通路上调c-myc促进体外肿瘤细胞增殖(29)Cg是在11号染色体CADM1上游15kb处,CADM1是一个细胞黏附分子并认为是一个肿瘤抑制基因(30,31)CADM1低表达可能是因为启动子区甲基化并因此促进了肿瘤细胞增殖/侵袭(30,31)。在卵巢癌CADM1下调可以作为预后不好的标志物(32)。CADM1通过使肿瘤细胞对免疫监控机制更敏感发挥抑制肿瘤转移的新功能并且CADM1丢失是肿瘤免疫编辑的关键一步(33)。Cg位于1q42.3编码溶酶体转运调节蛋白LYST上游的35kb处LYST突变与谢迪亚克—东综合征相关(34)。目前未有LYST与卵巢癌或其他癌症相关的报道需要进一步的研究去探索这个基因与卵巢癌相关的功能。
先前卵巢癌全表观基因组关联研究已经确定了几个外周血差异性甲基化CpG位点(12,16,17)然而,没有一个达到我们验证时的选择标准(P<1.0×10-4)以前研究的探索阶段是基于Illumina’s 27K甲基化芯片,而我们所用的450K芯片的覆盖范围要比以前大的多我们研究中挑选出验证的96个CpG位点只有一个是包含在27K芯片中。
总得来说我们已经确定了一组血源性的DNA甲基化标誌物与上皮源性卵巢癌风险相关。因此外周血DNA甲基化表达谱可以成为卵巢癌风险评估和早期检测的新工具。大型前瞻性队列研究和深入嘚生物学机制研究需要来验证这些新的生物标志物并且为精准医学提供卵巢癌表观基因组治疗策略。
表1.全表观基因组检测和验证的研究對象基本情况和临床特征