最近在做一个细菌的转录组的课题,其中一个任务是寻找CRP依赖的基因和operon的promoter序列。网上搜了一些资料。Virtual Footprint可以实现一些功能。但是Virtual Footprint是利用大肠杆菌中motif的matrix来分析你的序列,而不能从一堆序列中,通过统计学规律寻找潜在的motif。最后同学推荐MEME,这个软件的确很不错,也强大。
因为我已经找到了一些潜在依赖CRP与cAMP复合物转录的基因和operon,于是提取operon前200bp的DNA序列,然后放到meme中,他能自动寻找所有潜在的motif。当然效果也不错,预测的motif和其他论文中报道的别的细菌CRP promoter序列基本一致。
下面是MEME的suit所有的programs:
我所用到的是MEME这个program,其他的大家可以自己根据自己研究情况来探索。同时MEME suit有在线分析版本和本地版本,目前我是用的是在线分析版本,如果序列比较大(超过了60kb,只能减少序列或者使用单机版本)。有新的发现欢迎也来分享一下你的经验哦。