DNA甲基化测序数据分析服务
背景和实验介绍
DNA甲基化是细胞调控基因表达非常重要的手段之一,一般的原理是启动子或者第一外显子区域的第一个CpG岛甲基化从而抑制基因表达。DNA甲基化是表观遗传学的一个重要方面,其对基因组印迹、生物发育、肿瘤以及癌症发生起着重要作用。现有的几种通用的DNA甲基化测序方法如下图所示:
Fig.1 DNA甲基化测序的三种技术对比图。
数据分析项目:
一.测序质量分析
我们会对测序所得结果进行初步分析,包括序列reads数目、序列长度分布、可以定位到基因组的序列百分比、覆盖度、数据质量优劣等等重要信息。
Table.1 甲基化位置在基因组上的分布图。在没有设置限定条件和设定限定条件下(mapped reads>=5 & length>50bp),RL细胞系和CD19+B细胞系DNA甲基化测序所得结果分不同类别在基因组上的定位结果。
二.甲基化的分布情况分析
统计特异甲基化位点在各个染色体中的分布情况,甲基化的百分比等。甲基化序列信息与已知的信息做对比。
Fig.2 RL细胞系和CD19+B细胞系DNA甲基化情况。A)在各个染色体中的分配;B)类簇个数和甲基化强度的关系;C)染色体长度和甲基化位点多少的相关性。
三.甲基化区域的GC含量分析
对于不同样本的甲基化区域做比较,统计不同样本DNA甲基化区域的GC含量差异。
Fig.3 碱基频率图。三个位点(At1g26400,At5g35935和At2g13360)在不同突变体甲基化的GC content百分比。
四.甲基化位点分析
统计DNA甲基化区域在不同基因注释中(如启动子区域、内含子区域、外显子区域、非基因区间以及各种重复片断区域等)的分布情况。
Fig.4 MRIs和甲基化的CpG岛的基因注释情况图。A)MRIs在基因注释中包括内含子、外显子等中的分布情况;B)与CGIs相关的MRIs在基因注释中的分布情况;C)MRIs在基因重复片段中的分布情况。
五.多样本甲基化水平不同区域的功能分析
统计得到有显著差异的甲基化水平区域以及其相关基因,进行功能分析,包括GO Analysis, Pathway Analysis等等,从而推断在不同实验条件或者不同环境下基因表观遗传差异以及可能参与的生物功能。
Fig.5 甲基化基因的功能分析图。甲基化的基因和没有甲基化的基因在各个基因功能中的分布,显示甲基化基因和非甲基化基因具有不同的生物功能。
参考文献
J Penterman, et al. (2007) DNA demethylation in the Arabidopsis genome. PNAS. 104:6752-6757.
Choi J-H, et al. (2010) Genome-Wide DNA Methylation Maps in Follicular Lymphoma Cells Determined by Methylation-Enriched Bisulfite Sequencing. PLoS ONE 5(9): e13020. doi:10.1371/journal.pone.0013020
R Lister, et al. (2009) Finding the fifth base: Genome wide sequencing of cytosine methylaiton. Genome Res. 19:959-966.
D Zilberman, et al. (2007) Genome-wide analysis of Arabidopsis thaliana DNA methylation uncovers an interdependence between methylation and transcription. Nature Genetics. 39:61-69.
PW Laird. (2010) Principles and challenges of genomewide DNA methylation analysis. Nat Rev Genet. 11(3):191-203.
L Lopez-Serra, et al. (2006) A Profile of Methyl-CpG Binding Domain Protein Occupancy of Hypermethylated Promoter CpG Islands of Tumor Suppressor Genes in Human Cancer. Cancer Res. 66:8342-8346.