内容简介
本书阅读对象为本科、研究生和从事生物学及其相关专业领域(如医学、农
学等)科研与开发人员等,可以作为生物信息学专业学生的入门教材和非生物信
息学专业学生和科研工作者的基础教材。本书共分为四部分:生物信息学基础
(一篇)、高通量测序数据分析(第二篇)、生物信息学外延与交叉(第三篇)和生
物信息学资源与实践(第四篇)。各篇内容:(1)作为生物信息学的基础篇,一
篇包括8章内容,涵盖序列数据产生、分子数据库、序列联配算法、基因预测、系统
发生树构建和蛋白质结构预测等。同时也涵盖了生物信息学计算机基础部分,
包括操作系统、主要编程语言等。该篇主要目的是使初学者掌握生物信息学的
基本概念和主要方法。(2)第二篇为高通量序列数据分析,主要针对目前第二代
和第三代测序技术产生的核苷酸序列数据,涵盖基于高通量测序数据的基因组
拼接、基因组变异、转录组、非编码RNA、甲基化和宏基因组等生物信息学分析原
理和技术。(3)第三篇为生物信息学外延与交叉,介绍了与生物信息学紧密相关
的四个生物学领域:系统生物学、群体遗传学、数量遗传学和合成生物学。(4)
后一篇为生物信息学资源与实践篇,主要罗列了生物信息学主要相关术语、专业
词汇、数据库和公开软件等资源,并提供了8个生物信息学实验课程内容。上述
一篇和第四篇内容建议作为本科教学的基本内容,第二篇和第三篇可以作为
研究生和生物信息学专业学生教学内容。
作者简介
樊龙江 浙江大学生物信息学研究所和作物科学研究所教授,生物信息学和作物遗传育种专业博士生导师。教育部“新世纪优秀人才支持计划”获得者,浙江省生物信息学学会副理事长,德国DAAD访问学者。自2000年起,直接参与浙江大学生物信息学学科筹建,为浙江大学第一批生物信息学专业导师。
目录
绪论
第一节 生物信息与生物信息学
一、迅速增长的生物信息
二、生物信息学的概念
第二节 生物信息学简史与展望
一、生物信息学发展简史
二、生物信息学技术的应用
三、生物信息学学科展望
第三节 本书的组织与使用
*第一篇 生物信息学基础
第1-1章 生物信息类型及其产生途径
第一节 生物信息的类型
第二节 DNA测序技术
一、第一代测序技术
二、第二代测序技术
三、第三代测序技术
第三节 高通量测序技术的应用
一、DNA/RNA相关测序
二、蛋白质一DNA/RNA互作测序
三、甲基化/宏基因组测序
第四节 蛋白质序列及其结构测定
一、蛋白质序列与蛋白质互作测定
二、蛋白质结构测定
第1-2章 分子数据库
第一节 分子数据库概述
一、分子数据库概念
二、数据库记录格式
三、数据库冗余、序列递交和检索
第二节 核苷酸及其相关数据库
一、DNA/RNA序列数据库
二、基因组数据库
三、非编码RNA数据库
第三节 蛋白质及其相关数据库
第四节 代谢途径等专业数据库
一、代谢途径数据库
二、代谢组学数据库和表型数据库
第1-3章 两条序列联配算法及序列搜索
第一节 序列联配基本概念
第二节计分矩阵
一、计分矩阵的一般原理
二、氨基酸替换矩阵
三、位置特异性计分矩阵(PSSM)
第三节 两条序列联配算法
一、Needleman-Wunsch算法
二、Smith-WaterTnan算法
第四节 BLAST算法及数据库搜索
一、BLAST算法
二、利用BLAST 进行数据库序列搜索
三、序列相似性的统计推断
第1-4章 多条序列联配算法及功能域分析
第一节 多序列联配概念及其算法
一、多序列联配概念
二、多序列全局联配算法
三、多序列局部联配算法
第二节 蛋白质序列功能域分析与模型
一、功能域概念
二、功能域模型
第三节 熵与信息量
一、不确定性与信息量
二、信息熵的应用
第1-5章 基因预测与功能注释
第一节 基因组序列构成与基因预测
一、基因组序列的基本构成
二、基因预测及其基本方法
……
第1-6章 系统发生树构建
第1-7章 蛋白质结构预测与药物设计
第1-8章 生物信息学计算机基础
*第二篇 高通量测序数据分析
第2-1章 基因组拼接与分析
第2-2章 基因组变异与分析
第2-3章 转录组分析
第2-4章 非编码RNA分析
第2-5章 甲基化与组蛋白修饰分析
第2-6章 宏基因组分析
第2-7章 蛋白质组分析
*第三篇 生物信息学外延与交叉
第3一1章 系统生物学
第3-2章 群体遗传学
第3-3章 数量遗传学
第3-4章 合成生物学
*第四篇 生物信息学资源与实践
第4-1章 生物信息学常用代码和关键词
第4-2章 生物信息学数据库和在线分析工具
第4-3章 生物信息学实验
第4-4章 生物信息学常用英文术语及释义
参考文献
精彩书摘
《生物信息学》:
自开始接触生物信息学以来,一晃已近二十年了。我是在攻读博士学位期间开始注意并学习生物信息学的。我的博士生导师胡秉民为应用数学专业教授,主要从事生态系统模型模拟研究。虽然已具备一定数量统计和数量遗传学基础,但当时对于生物信息学,我还是非常陌生的,通过自学才开始一点点了解这门新兴学科。2001—2003 年间,中国科学院理论物理研究所郝柏林院士在浙江大学首次开设“生物信息学”研究生课程,我作为他的助教,系统地学习了生物信息学;同时,在他的带领下从事水稻基因组分析。自那时起,浙江大学生物信息学学科和相应研究机构也逐步建立起来,如,2001 年浙江大学成立生物信息学研究所,朱军和杨焕明任所长;2003 年浙江大学建立IBM 生物计算联合实验室等。2004 年郝院士离开杭州加入复旦大学,生物信息学研究生课程就由朱军教授和我承担下来。现在该课程作为浙江大学全校研究生公共课程,已成为一门重点建设课程,每年选课人数都在150 人左右。
20 世纪末,我国生物信息学还处于起步阶段,学习资料很少。学生时常索要学习材料,于是我整理了备课笔记,取名《生物信息学札记》,于2001 年6 月上传到实验室主页上供学生参考。随着生物信息学的发展,分别于2005 年3 月和2010 年1 月更新札记两次。由于网络传播的作用,许多生物信息学初学者都读过该札记,在国内产生了一定的影响。本书是在该札记框架基础上,补充大量新材料编写而成的。
生物信息学学科内容涵盖广且发展很快。基于国内外生物信息学相关教材,以及自身对生物信息学的粗浅理解,我把生物信息学大致分为四部分(篇) 内容:第一部分即基础篇,为生物信息学的基础知识。这部分内容总体变化不大(与10~15 年前比较),它是生物信息学的核心知识,生物信息学教学最重要的部分,应为必讲内容。第二部分高通量测序数据分析篇,是最近十年才出现的生物信息学新内容。2005 年高通量测序技术突破后,针对该技术产生的序列数据,出现大量生物信息学新算法和新工具。第三部分生物信息学外延与交叉,重点介绍与生物信息学密切相关的其他生物学学科。生物信息学引入了这些学科的部分核心技术(或反过来被引入),如数量遗传学、群体遗传学和新兴学科合成生物学。第四部分为生物信息学资源与实践篇。生物信息学数据库和软件工具对生物学学科至关重要,所以这部分也是生物信息学重要组成部分。同时,该篇中以实践为目的的生物信息学教学资源是课堂教学的一个很好补充。
……
前言/序言
复旦大学理论生命科学研究中心郝柏林特为该书作序
1959 年9 月,我国自行研制的104 真空管电子计算机通过国家鉴定。它每秒钟可以执行1 万条浮点运算指令。2016 年6 月,在世界超级计算机500 强名单中位居首位的是我国无锡超算中心的神威太湖之光计算机,其峰值运算速度达到每秒9 亿亿次(93104.6 Tflops)。57 年间,运算速度提高了9 万亿倍。信息技术的如此发展速度是人类在所有其他科学技术领域不能比拟的,它注定要改变社会生产和生活的方方面面,生物学和医学的研究也不例外。
1953 年,DNA 双螺旋结构的发现,把生物学推进到了分子水平。生命活动的核心过程由核酸和蛋白质两大类高分子,以及它们与其他分子的相互作用决定。DNA 和蛋白质序列的测定,特别是永无止境的基因组测序,导致生物大数据的迅
猛增长。生物信息学应运而生。
1999 年,我提出建立国家级生物医学信息中心的建议。虽然建立“中心”的计划由于科学管理体制问题而长期搁浅,但我国生物信息学的研究和教学在广大同行推动下仍然不断进步。2001 年初,我和张淑誉在杭州参加华大基因的籼稻基因组测序任务。相当一部分测序工作在西湖边上曲苑风荷附近的杭州华大基因完成。西湖“西进”之后,现在那里只剩下金庸茶馆的一座亭子。那时华大基因杨焕明教授等学者与浙江大学相关院系商议,着手建立生物信息学研究生点。我自始至终参与了筹划过程,并且承诺为2001—2003 年的三届研究生讲授“生物信息学引论”大课。浙江大学请当时已经是副教授的农学院樊龙江博士做我的“助教”。这是一位极其称职的“助教”。他每课必在,认真地批改学生作业,同时还参加了水稻基因组的研究。
2004 年以后,朱军教授和樊龙江等继续生物信息学的讲授和研究。我高兴地看到,十几年来浙江大学的生物信息学无论在学生培养,还是在科学研究方面都取得了明显成绩。现在樊龙江聚团队之力,主编了《生物信息学》一书,更是值得祝贺的好事。不过我自己只有同一两位合作者共同写书的经历,对于现在比较时兴的团队著述没有经验,也不大放心。好在樊龙江告诉我,他在统一全书文字和体例方面,下了很大功夫。我想,读者们是会对此有所评价的。
生物信息学 下载 mobi epub pdf txt 电子书 格式