內容簡介
     《遺傳統計學:基於連鎖和關聯分析的基因定位(翻譯版)》將遺傳學的基礎理論、數理統計學的基本方法和遺傳學前沿研究結閤起來,結構編排科學,主要包括:遺傳學基礎理論;數理統計學基礎理論;基因連鎖分析的基礎理論、常用分析方法及其統計模型基礎、常用分析程序;基因關聯分析的基礎理論、數理分析方法及其統計模型基礎、常用分析程序。     
作者簡介
     Benjamin M Neale,於2006年畢業於弗吉尼亞聯邦大學(Virginia Commonwealth Universitv),獲得精神疾病遺傳學學士學位。在本科學習期間,他與Patrick Sullivan博士、Cynthia Bulik博士、Kenneth Kendler博士等一起從事結構方程建模和精神疾病的連鎖分析研究工作。2004年,他搬到精神疾病研究所(IOP)與PakSham博士共同開發關聯分析的方法。在精神疾病研究所,他開始與Philip Asherson博士進行多動癥的遺傳學研究,主要是關聯分析研究。目前,他與Mark Daly博士正在麻省總醫院(Massachusetts General:Hospital)的人類遺傳研究中心和麻省理工學院-哈佛大學Broad研究所做訪問研究,主要是開發全基因組關聯研究的分析方法。  
  Manuel AR Ferreira,於2000年畢業於葡萄牙裏斯本大學(University of Lisbon,Portugal)的生物科學專業。在本科學習期問,特彆是作為一名訪問學生在英國牛津大學學習期間,他主要從事行為生態學方麵的研究。2001年,他移居到澳大利亞的昆士蘭大學(University of Oueensland)的昆士蘭醫學研究所和醫學院跟隨NickMartin教授和David Dufry博士攻讀博士學位。他的論文是通過連鎖分析鑒定哮喘的遺傳風險因素。他曾獲得多項學術奬勵,包括2004年度的歐洲人類遺傳學學會Lodewijk-Sandkuijl奬。2006年,他獲得瞭澳大利亞國傢健康和醫學研究理事會Sidney Sax奬學金,加入哈佛大學醫學院人類遺傳研究中心Shaun Purcell博士領導的研究組。目前,他在那裏參與全基因組關聯研究分析方法的開發。   
  Sarah E Medland,於2000年畢業於澳大利亞昆士蘭大學(University of Queensland),獲得神經心理學學士學位(榮譽)。她本科期間主要針對大腦語言中樞的偏側性進行研究。她在昆士蘭醫學研究所的遺傳流行病部攻讀博士學位時,指導老師為David Duffy博士、Margie Wright博士和Gina Geffen教授。在博士學習期間,她與Nick'Martin教授開展閤作。她的博士課題主要針對行為的偏側性進行遺傳流行病學研究。她還開展瞭多個其他領域的研究,包括方法學的開發、藥物濫用、政治和社會態度、嬰兒生長發育和肥胖。2006年,她獲得瞭澳大利亞國傢健康和醫學研究理事會Sidney Sax奬學金,加入弗吉尼亞州精神病學和行為遺傳學研究所Mike Neale博士領導的研究組。     
內頁插圖
          目錄
   第一篇 基礎知識
第1章 引言
第2章 DNA和基因分型的基礎
2.1 DNA結構
2.2 DNA重組和遺傳距離
2.3 基因型分析
2.4 基因分型技術
2.5 小結
第3章 群體遺傳學簡介
3.1 曆史背景
3.2 孟德爾遺傳定律
3.3 隨機婚配
3.4 多基因遺傳
3.5 親緣關係和遺傳共享
3.6 單基因位點的Fisher模型
3.7 多位點和環境效應的Fisher模型
3.8 小結
第4章 統計學基礎
4.1 簡介
4.2 描述性統計量
4.3 統計推斷
4.4 綫性迴歸
4.5 似然
4.6 混閤分布
4.7 小結
第5章 統計把握度
5.1 正確(不正確)決策的概率
5.2 最大似然估計
5.3 小結
5.4 示例
5.5 最小二乘估計
5.6 充分統計量
5.7 小結與局限性
第6章 群體遺傳學及其在基因定位中的作用
6.1 簡介
6.2 哈迪-溫伯格平衡
6.3 遺傳漂變和近親交配
6.4 連鎖不平衡
6.5 小結
第二篇 連鎖分析
第7章 連鎖分析原則
7.1 基因定位
7.2 模型依賴的連鎖分析
7.3 非模型依賴的連鎖分析
7.4 經驗估計全基因組連鎖顯著性
7.5 小結
第8章 IBD估計算法
8.1 簡介
8.2 計算問題:處理未知相型
8.3 傢係數據分析
8.4 舉例
第9章 用於連鎖分析的迴歸法
9.1 簡介
9.2 Haseman-Elston算法
9.3 Haseman-Elston算法拓展
9.4 基於迴歸的全譜係連鎖
9.5 模擬研究
9.6 使用MERLIN迴歸的幾個實例
9.7 小結
第10章 數量性狀的方差成分連鎖分析
10.1 簡介
10.2 方差成分連鎖模型
10.3 用MERLIN進行方差成分連鎖分析
10.4 結構方程建模軟件包中的方差成分連鎖分析
10.5 小結
第11章 單變量連鎖分析的擴展
11.1 親源效應
11.2 基因型-環境相互作用
11.3 X染色體連鎖
11.4 單因素連鎖分析擴展的實施
第12章 同胞對中多元數據的數量性狀位點檢測
12.1 簡介
12.2 多變量分析在人類遺傳學/雙胞胎研究的簡史
12.3 特徵選擇
12.4 多元方差成分連鎖分析
12.5 多元QTL分析:實踐問題
12.6 小結
第13章 連鎖分析中影響第一類錯誤和統計把握度的因素
13.1 選擇性抽樣
13.2 樣本量大小
13.3 性狀分布偏差
13.4 異常值
13.5 傢係誤差
13.6 基因分型錯誤
13.7 標記位點的信息性、密度和遺傳圖譜
13.8 質量控製準則
第三篇 關聯研究
第14章 關聯研究概述
14.1 簡介
14.2 關聯研究中的方法
14.3 關聯研究中的概念
14.4 國際人類基因組單倍型圖計劃
14.5 關聯研究的把握度
14.6 關聯分析的應用
14.7 小結
第15章 單基因座位關聯模式
15.1 簡介
15.2 基於隨機樣本的關聯分析
15.3 病例-對照研究
15.4 以傢係為基礎的關聯研究
15.5 小結
第16章 全基因組關聯研究數據分析:PLINK使用手冊
16.1 簡介
16.2 GWAS
16.3 GWAS SNP基因分型及數據處理
16.4 分析前的GWAS數據準備
16.5 GWAS數據分析概論
16.6 質量控製
16.7 拷貝數變異
16.8 肌萎縮側索硬化癥病例-對照GWAS數據的描述性分析
16.9 GWAS數據的關聯分析
16.10 PLINK的附加功能
16.11 未來發展方嚮
16.12 小結
第17章 單倍型分析
17.1 簡介
17.2 人群基礎的單倍型重建
17.3 基於傢係的單倍型構建
17.4 利用單倍型定位疾病基因
17.5 小結
第18章 區域性多位點關聯模型
18.1 簡介及基本方法
18.2 已定相與未定相
18.3 多位點檢驗的使用
18.4 WHAP分析
18.5 小結
第19章 連鎖不平衡與遺傳標記
19.1 連鎖不平衡相關統計量
19.2 基因組的區塊樣特性
19.3 遺傳標記
19.4 群體變異
19.5 復等位基因標記
19.6 小結
第20章 Haploview連鎖不平衡分析和標簽的應用指南
20.1 簡介
20.2 數據檢查
20.3 連鎖不平衡分析
20.4 標簽分析
20.5 在Haploview中查看PLINK結果
20.6 其他的考慮和程序
20.7 小結
第21章 影響關聯分析把握度和第一類錯誤的因素
21.1 簡介
21.2 檢測關聯性把握度的影響因素
21.3 人群分層
21.4 基因分型錯誤
21.5 全基因組關聯分析
21.6 發現關聯性的計算把握度
21.7 小結
第22章 統計推斷的重抽樣方法
22.1 簡介
22.2 自助法估計
22.3 置換檢驗
附錄 文件格式
A1.1 概述
A1.2 MERLIN/MERLIN-Regress/Pedstats/Minx/QTDT/GRR
A1.3 WHAP
A1.4 Haploview
A1.5 PLINK
A1.6 DOS與Unix/Linux下運行程序的比較
網絡資源
索引      
前言/序言
     2014年,我在美國參加學術會議期間第一次見到Statistical Genetics:Gene Mapping through Linkage and Association,就被書中的內容深深吸引,猛然間萌生齣翻譯此著作的念頭。
  迴國後,我嘗試著與該著作的主編BenjaminNeale博士取得聯係,詢問齣版中文譯著的可能。齣乎我的意料,Neale博士及時迴應並給予瞭極大支持,細緻地指導我如何獲取版權。Neale博士的肯定和鼓勵,更加堅定瞭我翻譯此著作的想法。在人民衛生齣版社的支持下,譯著齣版計劃於2015年11月正式獲得立項。
  該書以基因定位研究為主綫,內容覆蓋瞭遺傳學、統計學和數學的基礎知識,並分彆從連鎖分析和關聯分析的角度,介紹瞭基因定位研究的常用方法、應用範疇及其數理基礎;書中引入瞭大量研究實例,語言通俗易懂,內容新穎生動,適閤於有誌於或正在從事遺傳學研究的研究生及科技工作者閱讀。
  此譯著的26位青年譯者全部工作在遺傳統計學研究的一綫,在各自的領域都有著突齣的成績;長期參與遺傳統計學研究的實踐,使得他們對遺傳統計學有著客觀而專業的認識。其中部分人我雖素未謀麵,但在譯著翻譯齣版過程中,他們專業的素養、專注的態度和執著的精神都給我留下瞭深刻的印象。
  感謝上海交通大學賀林院士、安徽醫科大學張學軍教授的鼓勵和指導。譯著翻譯齣版過程中,得到瞭安徽醫科大學葉鼕青教授、上海交通大學師詠勇教授、中山大學貝錦新教授、中南大學夏昆教授、軍事醫學科學院周鋼橋教授、南京醫科大學鬍誌斌教授和香港大學楊萬嶺教授等的幫助和指導,在此一並謝過。
  感謝人民衛生齣版社給予的幫助和支持。感謝我的愛人一直默默地支持我的工作。
  由於譯者水平有限,書中某些翻譯難免存在不盡如人意之處,真誠地希望讀者提齣寶貴意見和建議。    
				
 
				
				
					遺傳統計學:基於連鎖和關聯分析的基因定位(翻譯版)  內容簡介  本書深入剖析瞭現代遺傳統計學領域的核心——基因定位,通過對連鎖分析和關聯分析這兩種關鍵方法的詳盡闡釋,為讀者構建瞭一個全麵而深入的理解框架。本書的價值不僅在於其理論的嚴謹性,更在於其將復雜概念轉化為可操作方法的實用性,旨在引導研究者掌握在海量遺傳數據中精確鎖定緻病基因的科學藝術。  第一部分:理論基石——遺傳學與統計學的融閤  在踏入基因定位的迷人世界之前,本書首先為讀者奠定瞭堅實的理論基礎。這部分內容強調瞭遺傳學原理與統計學方法的有機結閤,是理解後續所有分析技術的基石。     遺傳學的基石: 我們將從孟德爾遺傳定律齣發,迴顧基因的傳遞、連鎖與重組的基本概念。理解染色體結構、基因在染色體上的排列方式,以及同源染色體在減數分裂過程中發生的交叉互換,是理解連鎖分析的關鍵。本書將詳細介紹等位基因、基因型、錶型之間的關係,並探討群體遺傳學中的基本概念,如等位基因頻率、基因型頻率以及Hardy-Weinberg平衡定律,這些都為後續的群體基因定位研究提供瞭理論依據。    統計學的力量: 統計學在遺傳統計學中扮演著至關重要的角色,它為我們提供瞭從不確定數據中提取有效信息的工具。本書將介紹描述性統計和推斷性統計的基本原理,包括均值、方差、標準差、概率分布(如二項分布、正態分布)等。重點將放在假設檢驗、迴歸分析、方差分析等統計方法上,這些工具將貫穿於整個基因定位的分析過程,幫助我們評估數據中的信號是否具有統計學意義,並量化基因與性狀之間的關聯強度。    遺傳統計學的交匯: 本書將清晰地闡述遺傳學問題如何轉化為統計學問題,以及統計學方法如何解決這些遺傳學難題。例如,如何用統計模型來描述基因在群體中的傳遞,如何用假設檢驗來判斷某個基因座與特定性狀之間是否存在關聯。這種跨學科的視角,將幫助讀者理解為何需要遺傳統計學,以及它在現代生物學研究中的不可替代性。  第二部分:連鎖分析——傢族譜係中的基因追蹤  連鎖分析是基因定位的經典方法,它依賴於基因在染色體上的物理位置以及在世代傳遞過程中錶現齣的連鎖現象。本部分將深入探討連鎖分析的原理、方法和應用。     連鎖與重組的原理: 本書將詳細解釋連鎖(linkage)的概念——即位於同一條染色體上的基因傾嚮於一同遺傳。同時,我們將深入探討重組(recombination)的發生機製,即在減數分裂過程中,同源染色體之間發生的片段交換,這會導緻連鎖基因的分離。重組頻率(recombination frequency)是衡量兩個基因之間物理距離的關鍵指標,也是構建遺傳連鎖圖譜的基礎。    連鎖分析的基本概念:        連鎖圖譜(Linkage Map): 讀者將學習如何利用重組頻率構建基因的連鎖圖譜,它以圖的形式展示基因在染色體上的相對位置和順序。本書將介紹不同類型的連鎖圖譜,以及如何通過多點連鎖分析來提高圖譜的精度。        連鎖分析統計量(Lod Score): 這是連鎖分析的核心統計工具。本書將詳盡解釋Lod score的計算原理,它衡量的是在某個特定重組率下,觀察到的連鎖模式比隨機分配的概率。讀者將學會如何解讀Lod score,特彆是Lod score大於3的閾值,它通常被認為是存在連鎖的有力證據。        傢族研究的設計與數據收集: 連鎖分析通常依賴於具有明確遺傳關係的傢族譜係數據。本書將討論如何設計有效的傢族研究,包括選擇閤適的傢族成員、收集詳細的錶型和遺傳型信息,以及處理缺失數據和不完整譜係等問題。    連鎖分析的算法與軟件: 本書將介紹實現連鎖分析的常用算法,例如最大似然估計法(Maximum Likelihood Estimation, MLE),以及基於貝葉斯方法的算法。同時,將推薦和介紹一些在實際研究中廣泛使用的連鎖分析軟件,並展示如何利用這些軟件進行數據分析和結果解讀。    連鎖分析的應用: 學習連鎖分析如何應用於定位單基因遺傳病(如囊性縴維化、亨廷頓病)的緻病基因,以及如何用於研究多基因遺傳病的遺傳因子。  第三部分:關聯分析——群體中的基因與性狀關聯探索  隨著高通量基因分型技術的發展,關聯分析已成為研究復雜遺傳病和數量性狀基因定位的主流方法。本部分將係統介紹關聯分析的原理、策略和挑戰。     關聯分析的原理: 關聯分析的基本思想是,如果在群體中,某個遺傳標記(如SNP)的特定等位基因與某個性狀(疾病狀態、生理指標等)的齣現頻率之間存在顯著的統計學關聯,那麼這個遺傳標記可能位於緻病基因附近,或者它本身就是緻病基因的一部分。    不同類型的關聯分析:        全基因組關聯研究(Genome-Wide Association Study, GWAS): 本書將重點介紹GWAS,它通過在大量的獨立個體中,對遍布全基因組的數百萬個遺傳標記進行係統性檢測,來尋找與特定性狀顯著關聯的基因位點。本書將詳細闡述GWAS的研究設計、樣本選擇、數據質量控製、SNP篩選、統計檢驗方法(如logistic迴歸、綫性迴歸)以及多重檢驗校正(如Bonferroni校正、FDR校正)。        候選基因關聯研究(Candidate Gene Association Study): 盡管GWAS更為強大,候選基因關聯研究在特定情況下仍有其價值。本書將解釋如何基於先前的生物學知識,選擇特定的候選基因進行關聯分析,以及這種方法的優勢與局限性。    關聯分析中的挑戰與對策:        連鎖不平衡(Linkage Disequilibrium, LD): LD是指在群體中,某些等位基因傾嚮於一同遺傳的現象。本書將深入分析LD的産生原因、程度度量(如r²和D'值),以及它對關聯分析結果的影響。理解LD是解讀GWAS結果和進行精細定位的關鍵。        群體分化(Population Stratification): 不同亞群之間可能存在遺傳背景的差異,這可能導緻虛假關聯。本書將介紹檢測和糾正群體分化的常用方法,如主成分分析(Principal Component Analysis, PCA)和混閤模型(Mixed Model)。        錶型與遺傳型的異質性: 真實世界的錶型可能受到環境因素、基因-基因互作和基因-環境互作的影響。本書將探討如何處理這些異質性,以及如何設計研究來捕捉更復雜的遺傳模式。    關聯分析的精細定位與功能驗證: 找到顯著關聯的SNP後,下一步是精細定位真正的緻病基因。本書將介紹基於LD塊、eQTLs(expression Quantitative Trait Loci)等方法進行精細定位的策略。此外,還將簡要提及功能驗證的重要性,即通過實驗手段(如基因敲除、基因編輯)來確認找到的基因在緻病機製中的作用。  第四部分:高級主題與未來展望  除瞭核心的連鎖和關聯分析,本書還將觸及一些更高級的主題,並展望遺傳統計學領域的未來發展。     多基因風險評分(Polygenic Risk Score, PRS): 隨著GWAS識彆齣越來越多的風險位點,PRS成為整閤多個微弱遺傳效應以預測個體疾病風險的重要工具。本書將介紹PRS的構建方法、應用場景及其局限性。    基因-基因互作(Gene-Gene Interaction, GGI)與基因-環境互作(Gene-Environment Interaction, GEI): 復雜性狀往往由多個基因共同作用,或與環境因素協同影響。本書將介紹如何利用統計模型來探索GGI和GEI,盡管這仍然是遺傳統計學中的一個重大挑戰。    錶觀遺傳學與基因定位: 除瞭DNA序列變異,錶觀遺傳修飾(如DNA甲基化、組蛋白修飾)也可能影響基因功能和性狀。本書將簡要介紹錶觀遺傳學在基因定位研究中的潛在作用。    大數據與機器學習在遺傳統計學中的應用: 隨著數據量的爆炸式增長,機器學習和人工智能技術正在被引入遺傳統計學領域,用於更高效的數據分析、模式識彆和預測。本書將對這些新興趨勢進行探討。    倫理、法律和社會影響(ELSI): 基因定位研究的成果不僅有科學價值,還涉及到重要的倫理、法律和社會議題,如隱私保護、基因歧視、知情同意等。本書將對這些問題進行必要的討論。  本書特色     理論與實踐並重: 本書既有嚴謹的理論推導,又不乏實際操作的指導,讓讀者能夠將理論知識轉化為解決實際研究問題的能力。    清晰的邏輯結構: 內容組織條理清晰,從基礎理論到核心方法,再到高級主題,層層遞進,幫助讀者建立係統性的知識體係。    豐富的案例分析: (此處為虛構,但如果原書有,會是其特色)本書將穿插大量的真實研究案例,展示連鎖分析和關聯分析在實際研究中的應用過程和結果解讀。    麵嚮讀者廣泛: 無論您是生物學、醫學、統計學、計算機科學等相關領域的學生、研究人員,還是對人類遺傳學和疾病機製感興趣的專業人士,本書都將是您寶貴的學習資源。  通過研讀《遺傳統計學:基於連鎖和關聯分析的基因定位》,您將掌握探索基因世界奧秘的有力武器,為揭示生命的遺傳密碼、理解疾病發生機製、開發個性化醫療提供堅實的理論和技術支持。