背景
1.癌症的基因突变理论指出“司机”(driver)突变使肿瘤细胞获得增殖优势,随之发生的“乘客”(passenger)也与肿瘤发生相关。这些突变主要来自于内源性或外源性诱变剂暴露、异常 DNA 编辑、 复制错误和DNA修复缺陷
2.DNA测序技术可系统的分析肿瘤基因的各类突变,包括单碱基替换、小的插入/缺失、重排及拷贝数变异
3.目前大多乳腺癌基因组研究集中在蛋白编码的外显子区域,对非翻译区、内含子和基因间区研究有限,对揭示乳腺癌分子致病机制具有局限性
研究方法—样本收集
560例乳腺癌患者外周血淋巴细胞样品DNA
560例病灶相邻正常乳腺组织或皮肤样品DNA
268乳腺癌患者totalRNA
研究方法—测序及比对
测序平台:Illumina GAIIx, Hiseq 2000 或 Hiseq 2500
肿瘤样品平均测序深度40.4X,正常对照样品平均测序深度30.2X
研究方法
基因组数据处理
鉴定新的乳腺癌基因
非编码区域常见变异分析
变异特征分析
Kataegis突变分析
重排突变分析
分类:聚簇类重排,非聚簇类重排
亚分类:缺失、倒位、串联重复, 1-10kb、10kb-100kb、100kb-1Mb、1Mb-10Mb、>10Mb(染色体间易位)
研究结果——肿瘤基因及driver突变
560例乳腺癌患者亚型分类
1.共检测到3,479,652个体细胞单碱基变异、371,993 个小的插入/缺失变异、77,695个重排突变
2.结合其他研究,共分析了1,332个乳腺癌患者的测序数据,完成了包含727个肿瘤基因的清单(包括MED23、FOXP1、MLLT4、XBP1和ZFP36L1共5个之前罕有研究或不明确的基因)
上图为93个Driver基因突变在ER阳性或阴性患者体内分布
1.检测出1,278个特有的、39个罕见的基因阅读框内融合。对260例患者转录组测序分析,未发现这些融合基因的表达。影响CDKN2A、RB1、MAP3K1、PTEN、MAP2K4、ARID1B、FBXW7、MLLT4 和TP53基因印记的常见重排突变远高于重排率背景。检出显性效应基因ETV6和ESR1部分区域频繁发生重排突变,但转录组水平无变化,突变意义未知。
2.检测出93个基因的1,628个疑似driver突变,95%的患者至少检测到1个driver突变,Top10突变基因为TP53、PIK3CA、MYC、CCND1、PTEN、ERBB2、chr8:ZNF703/FGFR1 位置、GATA3、RB1 和MAP3K1。Top10基因突变占疑似driver突变的62%。
driver突变各种类型占比
研究结果——非编码区域的常见体细胞变异
上图为5个频繁发生突变的调控区域的单碱基替换或Indel变异分布,右图为分别包含这5个区域突变的样品及560个样品总的12类变异特征分布比例
检测到5个频繁发生突变的调控区域,PLEKHS1基因启动子区域CAGCAAGC TGAACA GCTTGCTG回文重复序列之间的G和C位置、TBC1D12启动子 Kozak区域CCCCAGATGGTGGG的C和G位置、WDR74基因启动子区域、长链非编码RNA MALAT1和NEAT1
研究结果——变异特征
1.检测到12类单碱基特征变异,特征5, 6, 17, 18 和20之前在其他癌种类型中检测到,特征26和30为新检测到的类型
2.结合患者的生物学特性,特征1和5与诊断年龄相关、特征2和13和APOBEC相关、特征 6, 20和26与MMR缺陷相关、特征3和8和HR缺陷相关、 特征18,17 和 30 为病因不明类型
上图显示在每个样品中每类特征变异的数量
下图显示在每个样品中每类特征变异的比例
含有12类特征变异的样品比例及样品中每类特征变异的数量分布
检测到6类特征变异,特征1突变(占重排突变的9%)和特征3突变(占重排突变的18%)主要特点是具有串联重复,特征1突变大多>100kb,特征3突变<10kb。>95%的特征3串联重复突变在15%的癌种中检测到,91%的BRCA1突变或启动子区域甲基化均属于特征3突变。>35%的特征1串联重复突变仅在8.5%的乳腺癌患者中检测到,具有该类突变的患者通常有TP53突变,但无BRCA1/2突变或BRCA1启动子区域甲基化。
1.特征5突变(占重排突变的14%)的特点是具有<100kb的缺失,常与BRCA1突变或启动子区域甲基化、BRCA2突变及特征1的大片段串联重复突变同时发生。
2.特征2突变(占重排突变的22%)的特点是具有非聚簇类>100kb的缺失、倒位和染色体间易位,该类突变在ER阳性患者中较常见。
3.特征4突变(占重排突变的18%)的特点是染色体内聚簇类染色体易位。
4.特征6突变(占重排突变的19%)的特点是聚簇类倒位和缺失。
miRNA聚簇分析结果,0=红色, 1=紫色, 2=蓝色, 3=浅蓝色, 4=绿色, 5=橙色
BRCA状态,BRCA1突变显示为紫色,BRCA2显示为橙色
AIMS亚型,(basal=红色, luminal B=浅蓝色, luminal A=深蓝色)
GISTIC聚簇分析结果,MYC、ZNF217、ZNF703、CCND1及ERBB2扩增情况,同源重组缺陷评分(HRD),Kataegis突变分布,GATA3、PIK3CA、PTEN、RB1及TP53基因突变分布,HER2、PR及ER状态,黑色显示为阳性
结合重排对每类变异特征贡献率、组织学、基因表达将6类重排特征变异划分为7个亚类
上图显示为7个亚型变异样本的6类重排特征变异分布比例
下图显示为7个亚型变异样本中12类单碱基变异特征分布
携带7个亚型特征变异样本的OS情况
携带7个亚型特征变异样本的确诊年龄、肿瘤分级和绝经状态
携带7个亚型特征变异样本的ER状态、免疫响应及淋巴细胞浸润评分
局部突变簇( kataegis )在49%的乳腺癌患者中检出,通常和具有聚簇类重排的特征4和6突变同时发生,而具有串联重复或缺失的特征1、3和5突变通常无kataegis突变
总结
1.整个染色体拷贝数变异及非目标区域的常见突变可能包含其他肿瘤相关基因
2.非编码区域的driver突变鉴定需要更多测序研究
3.病毒或其他微生物在肿瘤发生过程中的作用有待进一步研究
4.完全理解肿瘤的体细胞突变基础需要更多的全基因组测序研究
转自吉因加科技微信订阅号