概述
全基因组Survey 分析是指对于没有基因组参考序列的物种,正式启动基因组项目前,基于小片段文库的低深度测序数据,通过K-mer分析,可有效评估基因组大小、GC含量、杂合度高低及重复序列含量等信息。
应用
1.是进行全基因组测序的基础和前提,为后续全基因组de novo测序及组装策略的制定提供依据;
2.通过基因组Survey分析,可对基因组进行初步组装,然后进行SSR标记开发及同源注释等高级分析。
技术流程
样本要求
样本类型:无降解,无RNA污染的DNA样品
样本总量:≥2 μg DNA
样本浓度:≥30 ng/μl
样本纯度:OD260/280=1.8~2.0
策略
测序平台:HiSeqPE150
文库:小片段文库
测序深度
50X
常见问题
Q 做全基因组survey有什么意义?
通过 Survey 可以知道基因组大小、GC 含量及重复序列等情况,为后续测序、组装研究提供指导。Survey 一般建 500bp 小片段文库,测 50X,这些数据是不会浪费的,可以用于后期组装。
Q 全基因组survey结果展示中对全基因组大小预估是怎样的?
mer深度分布服从泊松分布,根据曲线获得K-mer深度期望值,用于估计基因组大小。一般来说我们会选择K-mer分布最多的峰为主峰,主峰所对应的深度值为K-mer深度期望值。基因组大小=K-mer总数/K-mer期望深度值。如下表示例: