人物简介
刘小乐 (Xiaole Shirley Liu) 青年时代就读于天津南开中学, 1992 年考入北京大学生物系。 1994 年转学到美国史密斯女子学院 (Smith College) 双修生物化学和计算机科学, 三年后以最高拉丁荣誉毕业 (Summa Cum Laude, 授予全校积分最高的 1% 的毕业生)。2002 年于斯坦福大学取得生物医学信息学博士和计算机科学辅修博士学位后, 被直接聘为哈佛大学终身制助理教授。她目前担任哈佛大学公共卫生学院生物统计与计算生物学系的终身正教授、Dana-Farber 肿瘤研究所功能性癌症表观遗传组学中心主任, 和同济大学生物信息学系教授并长江学者讲座教授[1]。
研究领域
刘小乐的工作侧重于基因调控机制的生物信息和计算生物学研究。她的科研组通过整合全基因组 ChIP-chip/Seq, 核小体定位, 组蛋白修饰, 基因表达谱, 基因组序列等数据, 构建转录与表观遗传调控的计算和统计模型。她的主要科学成就可以归纳成为四个方面:
首先,她开发了一些被广泛应用和引用的算法寻找转录因子基序 (transcription factor motif discovery)。这些算法, 比如BioProspector, MDscan, Motif Regressor, CompareProspector, AdaBoost (引用加全超过 1,400 次), 成为以后出版 motif discovery 的算法发现改善的标杆。
其次,她是ChIP-chip/seq数据分析的先驱。她和同事们发表了ChIP-chip领域内的第三篇文献 (Lieb et al, Nat Genet 2001, 引用441次), 和历史上第一个人类全基因组增强子的功能 (Carroll et al, Nat Genet 2006, 引用374次)。她开发出十分受欢迎的ChIP-chip (MAT 和 MA2C, 有 22 篇发表在 Nature/ Science/ Cell 系列上的论文使用了刘小乐组开发的 MAT 算法来分析 ChIP-chip 数据)与ChIP-seq分析算法(MACS, 超过 1,600 个注册用户), 以及下游的分析流水线(CEAS, 引用40次)。她组里正在研发一套 ChIP-chip/seq 系统研究的计算平台。
她第三方面的成就在于表观遗传调控。她与同事们发表了第一个高通量人类核小体分布图谱 (Oszolak et al, Nat Biotech 2007, 引用126次), 比较核小体本质性定位与活体定位的不同(Zhang et al, Nat Struct Mol Biol 2009, 引用32次), 发现H3K36me3在基因组的定位特性(Kolasinska-Zwierz et al, Nat Genet 2009, 引用47次)。 最近, 他们又发现斑马鱼胚胎干细胞中组蛋白修饰起始特性 (Vastenhouw et al, Nat 2010), 并运用组蛋白修饰动态变化揭示基因转录调控机理 (He et al, Nat Genet 2010)。
最后,她在对癌症以及代谢疾病的核受体调控的认识中做出了重要贡献。通过全基因组ChIP-chip / seq 数据分析,她和同事们发现了乳腺癌中的雌激素受体(ER, Carroll et al, Cell 2005; Carroll et al, Nat Genet 2006, 共同通讯作者),前列腺癌中的雄激素受体(AR, Wang et al, Cell 2009, 共同通讯作者),乳腺癌与前列腺癌中ER和AR的协同作用转录因子与染色质异构子 (FoxA1, Lupien et al, Cell 2008),糖尿病中氧化物酶体增殖物激活受体 (PPAR,Lefterova et al, Genes Dev 2008) 等的重要的转录与表观调控机制。
首先,她开发了一些被广泛应用和引用的算法寻找转录因子基序 (transcription factor motif discovery)。这些算法, 比如BioProspector, MDscan, Motif Regressor, CompareProspector, AdaBoost (引用加全超过 1,400 次), 成为以后出版 motif discovery 的算法发现改善的标杆。
其次,她是ChIP-chip/seq数据分析的先驱。她和同事们发表了ChIP-chip领域内的第三篇文献 (Lieb et al, Nat Genet 2001, 引用441次), 和历史上第一个人类全基因组增强子的功能 (Carroll et al, Nat Genet 2006, 引用374次)。她开发出十分受欢迎的ChIP-chip (MAT 和 MA2C, 有 22 篇发表在 Nature/ Science/ Cell 系列上的论文使用了刘小乐组开发的 MAT 算法来分析 ChIP-chip 数据)与ChIP-seq分析算法(MACS, 超过 1,600 个注册用户), 以及下游的分析流水线(CEAS, 引用40次)。她组里正在研发一套 ChIP-chip/seq 系统研究的计算平台。
她第三方面的成就在于表观遗传调控。她与同事们发表了第一个高通量人类核小体分布图谱 (Oszolak et al, Nat Biotech 2007, 引用126次), 比较核小体本质性定位与活体定位的不同(Zhang et al, Nat Struct Mol Biol 2009, 引用32次), 发现H3K36me3在基因组的定位特性(Kolasinska-Zwierz et al, Nat Genet 2009, 引用47次)。 最近, 他们又发现斑马鱼胚胎干细胞中组蛋白修饰起始特性 (Vastenhouw et al, Nat 2010), 并运用组蛋白修饰动态变化揭示基因转录调控机理 (He et al, Nat Genet 2010)。
最后,她在对癌症以及代谢疾病的核受体调控的认识中做出了重要贡献。通过全基因组ChIP-chip / seq 数据分析,她和同事们发现了乳腺癌中的雌激素受体(ER, Carroll et al, Cell 2005; Carroll et al, Nat Genet 2006, 共同通讯作者),前列腺癌中的雄激素受体(AR, Wang et al, Cell 2009, 共同通讯作者),乳腺癌与前列腺癌中ER和AR的协同作用转录因子与染色质异构子 (FoxA1, Lupien et al, Cell 2008),糖尿病中氧化物酶体增殖物激活受体 (PPAR,Lefterova et al, Genes Dev 2008) 等的重要的转录与表观调控机制。
主要成就
刘小乐发表了 70 篇文献 (26 篇是(共同)第一或通讯作者), 包括 19 篇在 Nature/Cell 系列中 (其中 7 篇是(共同)第一或通讯作者)。根据 Google Scholar 统计她的 H-index 为 28,就是说她有 28 篇论文被引用超过 28 次。 她做过 26 场国际会议特邀学术报告, 在世界各地的大学与研究机构举行过 50 次讲座和研讨会。她担任 19 家期刊 (包括 Nature, Nature Genetics, Nature Review Genetics, 和Nature Biotechnology) 和 3 个国际会议的审稿人, 并且先后担任 Genomics, Annals of Applied Statistics, Biostatistics, 和 BMC Bioinformatics 的编委。她还参与了 9 个美国国内或国际科学会议的组织和程序委员会。
刘小乐非常关心教书育人。在最近 5 年里, 她在不同的学术机构教授了 8 门不同的课程和讲习班, 包括在哈佛大学的 3 门课程以及 2007 年国家自然科学基金的龙星计划课程。她在哈佛的研究小组的学生、程序员、分析师、博士后、研究员来自不同背景(4 名物理,2 名生物物理,以及化学工程、电气工程、生物、生物信息、计算机和经济学各一名) ,并且她在同济大学现有三名研究生。她不仅仅是实验室成员科学研究方面的导师,还关注他们的事业发展前途。她组里的博士毕业生和博士后大都在优秀高校终身制任教 (加州大学旧金山分校, 贝勒医学院, 亚利桑那大学, 杨百翰大学, 同济大学)。
刘小乐非常关心教书育人。在最近 5 年里, 她在不同的学术机构教授了 8 门不同的课程和讲习班, 包括在哈佛大学的 3 门课程以及 2007 年国家自然科学基金的龙星计划课程。她在哈佛的研究小组的学生、程序员、分析师、博士后、研究员来自不同背景(4 名物理,2 名生物物理,以及化学工程、电气工程、生物、生物信息、计算机和经济学各一名) ,并且她在同济大学现有三名研究生。她不仅仅是实验室成员科学研究方面的导师,还关注他们的事业发展前途。她组里的博士毕业生和博士后大都在优秀高校终身制任教 (加州大学旧金山分校, 贝勒医学院, 亚利桑那大学, 杨百翰大学, 同济大学)。
刘小乐 2002 年成为高等教育年鉴 (The Chronicle of Higher Education) 的封面人物, 获得了Bioinformatics Whiz 和 rising star 的美誉。她 2005 年获得 Claudia Adams Barr 创新基础癌症研究奖, 2006 年获得国防部前列腺癌研究计划新人奖, 2008 年获得 Sloan 基金会研究奖金。她目前担任三项美国卫生部 (NIH) 资金和一项国防部资金的 PI (Principle Investigator), 以及六项 NIH 资金的骨干 (Co-Investigator)。她还担任美国卫生部, 自然科学基金, 和国防部医学研究计划的评审团委员。
未来展望
生物医学研究的未来不仅依赖于可以设计出优秀实验并产生高质量数据的实验生物学家,还要依赖于会对产生的数据进行有效分析挖掘的计算生物学家。公共域的基因组数据比任何一个实验室能产生的数据都多,而且有更多的知识含量。配备了广泛的生物学知识、充足的数据挖掘及算法开发技能,计算生物学家能够有效地利用公共数据,从更多的相关数据中更快地找到规律, 设计出更好的生物学实验,为生物医学的新发现做出重要贡献。 随着高通量测序技术的不断提高, 数据生成将会象超市购物一样容易和充足,而且基础科学 (用模式生物和细胞株) 研究、转化医学 (用正常和得病人的组织器官) 研究、和临床 (直接接触病人) 研究之间的距离将会缩短。在 5 年之内, 用不到 $100 在一小时内测序一个人体基因组将会成为现实。生物医学研究者的方向、模式和所提出的问题将会和现在完全不同。 每个生物医学研究工作者都应该问自己:我怎样为这一天做好准备?刘小乐期待着与有志向、有天分的同学们一起探索生物医学的奥妙。[1]
代表文章
(#共同第一作者, *共同通讯作者[1]) :
1. Liu XS, Brutlag DL, Liu JS (2002). An algorithm for finding protein-DNA binding sites with applications to chromatin immunoprecipitation microarray experiments. Nat Biotechnol. 20(8):835-9.
2. Johnson WE#, Li W#, Meyer CA#, et al, Liu XS (2006). MAT: Model-based Analysis of Tiling-arrays for ChIP-chip. Proc Natl Acad Sci U S A. 103(33): 12457-62.
3. Carroll JS, et al, Liu XS*, Brown M* (2006). Genome wide analysis of estrogen receptor binding sites. Nat Genet. 38(11):1289-97.
4. Ozsolak F#, Song JS#, Liu XS*, Fisher DE* (2007). Global chromatin structure mapping of human promoters. Nat Biotechnol. 25(2):244-8.
5. Johnson DS#, Li W#, et al., Struhl K*, Myers RM*, Lieb JD*, Liu XS* (2008). Systematic evaluation of variability in ChIP-chip experiments using predefined DNA targets. Genome Res. 18(3):393-403.
6. Zhang Y#, Liu T#, et al, Li W*, Liu XS* (2008). Model-based analysis of ChIP-Seq (MACS). Genome Biol. 9(9):R137.
7. Wang Q#, Li W#, et al, Liu XS*, Brown M* (2009). Androgen receptor regulates a distinct transcription program in androgen-independent prostate cancer. Cell. 138(2):245-56.
8. Vastenhouw N#, Zhang Y#, et al, Liu XS*, Rinn J*, Schier A* (2010). Chromatin signature of embryonic pluripotency is established during zygotic genome activation in zebrafish. Nature. 464(7290):922-6.
9. He HH#, Meyer CA#, et al, Brown M*, Liu XS* (2010). Nucleosome dynamics defines transcriptional enhancers. Nat Genet, 42(4):343-7.
10. Ji H* & Liu XS*. Analyzing ‘omics data using hierarchical models (2010). Nat Biotech. 28(4):337-40
1. Liu XS, Brutlag DL, Liu JS (2002). An algorithm for finding protein-DNA binding sites with applications to chromatin immunoprecipitation microarray experiments. Nat Biotechnol. 20(8):835-9.
2. Johnson WE#, Li W#, Meyer CA#, et al, Liu XS (2006). MAT: Model-based Analysis of Tiling-arrays for ChIP-chip. Proc Natl Acad Sci U S A. 103(33): 12457-62.
3. Carroll JS, et al, Liu XS*, Brown M* (2006). Genome wide analysis of estrogen receptor binding sites. Nat Genet. 38(11):1289-97.
4. Ozsolak F#, Song JS#, Liu XS*, Fisher DE* (2007). Global chromatin structure mapping of human promoters. Nat Biotechnol. 25(2):244-8.
5. Johnson DS#, Li W#, et al., Struhl K*, Myers RM*, Lieb JD*, Liu XS* (2008). Systematic evaluation of variability in ChIP-chip experiments using predefined DNA targets. Genome Res. 18(3):393-403.
6. Zhang Y#, Liu T#, et al, Li W*, Liu XS* (2008). Model-based analysis of ChIP-Seq (MACS). Genome Biol. 9(9):R137.
7. Wang Q#, Li W#, et al, Liu XS*, Brown M* (2009). Androgen receptor regulates a distinct transcription program in androgen-independent prostate cancer. Cell. 138(2):245-56.
8. Vastenhouw N#, Zhang Y#, et al, Liu XS*, Rinn J*, Schier A* (2010). Chromatin signature of embryonic pluripotency is established during zygotic genome activation in zebrafish. Nature. 464(7290):922-6.
9. He HH#, Meyer CA#, et al, Brown M*, Liu XS* (2010). Nucleosome dynamics defines transcriptional enhancers. Nat Genet, 42(4):343-7.
10. Ji H* & Liu XS*. Analyzing ‘omics data using hierarchical models (2010). Nat Biotech. 28(4):337-40
- 参考资料
- 1.刘小乐.同济大学生命科学与技术学院[引用日期2013-03-20]
词条标签: