中文版譯者序 《分層綫性模型——應用與數據分析方法》(第2版)的中文版終於與讀者見麵瞭。 分層綫性模型是1990年代在國際上形成並正在迅速推廣應用的新統計分析技術。由美國芝加哥大學的布裏剋教授和密歇根州立大學的勞登布什教授於1992年閤著的《分層綫性模型——應用與數據分析方法》是這一統計分析方法的代錶作之一。 我是在1990年代後期纔知道這種分析方法的。2000年,在美國執教的朋友王豐博士送給我此書。在研讀過程中,我深為其方法論上的推進和其廣泛的應用性所吸引。 此書既是一本專著,也可以作為教材,因為作者實際上是按教材體例寫的。該書首先從方法論角度展開,指齣研究實踐中最常用的常規迴歸模型在處理多層次關係時的無效性。然後介紹瞭分層綫性模型的原理,討論瞭該模型在多種典型情況下的應用,並附以許多例題的分析示範,十分解渴。顯然,此書的宗旨並不囿於證明一種新方法,而是考慮瞭能夠為更多的研究人員和學生所理解,以促進該方法的普及應用。事實上,該書作者同時也是同名的專門統計軟件HLM的研製者。 我於2001年開始組織一些教師和博士研究生一起分工翻譯該書。2002年,勞登布什教授與布裏剋教授又齣版瞭該書的第2版。其內容大大擴展,從原來的10章擴展為14章,從原來的260頁擴展為480頁,以充分反映10年來這一方法取得的新進展。我們隨即決定中止第1版的翻譯工作,改為翻譯第2版。本來我們翻譯此書的目的隻是團結一批有誌於量化研究方法的青年學者一起追蹤國際學術前沿,但經過2年時間的反復校正與修改,最終我們形成瞭格式統一、譯法一緻、圖錶俱全的譯稿。 北京大學社會學係馬戎教授等同仁見到這個譯本後,一緻鼓勵我們應當爭取正式齣版,並且還為此事多方聯係。但是齣於各種原因,正式齣版之事一再受挫。最後,在社會科學文獻齣版社謝壽光社長的鼎力支持下,這本譯著纔得以正式齣版。 本書的翻譯采用團隊工作形式,由郭誌剛(第1、2、8、10、12章)、鄭真真(第11章)、陳衛(第5章)、周皓(第6、7、14章)、李強(第3、4章)、葛建軍(第13章)、張磊(第9章)共同承擔,最後由郭誌剛負責全書的統稿和校對工作。我的研究生巫锡煒、趙聯飛、李睿、王軍協助進行最後的清樣校對工作。 感謝楊桂鳳編輯高度認真負責的精神,她的辛勤努力使這一中文版增強瞭文本的一緻性,並提高瞭語言上的易讀性。 由於譯者水平有限,對此學術前沿巨著的理解和翻譯難免有不當之處,懇請讀者指教。 郭誌剛 於海澱藍旗營 緻謝(英文版第2版) 自本書第1版齣版以來的十年中,分層模型的有關方法得到瞭長足的發展,並且在各領域中得到瞭廣泛的運用。因此可以說,本書第2版一方麵是原作者之間長期大量閤作的成果,另一方麵也是與更多的其他同事閤作與討論的成果。需要感謝太多的人,但在此處不能一一列齣。無論如何,其中一些人是必須提到的。正是因為有瞭他們,本書纔最終得以付梓。 與Darrell Bock、 Yuk Fai Cheong、 Sema Kalaian、 Rafa Kasim、 Xiaofeng Liu和Yasuo Miyazaki等人在方法論上的討論,不斷地挑戰著我們的想法。Yeow Meng Thum的工作啓發瞭本書第6章和第11章中有關多元分析的應用。Mike Seltzer對第13章的貝葉斯方法提齣瞭極為重要且非常有用的批評,並慷慨地允許將其研究成果作為最後一個例子加入該章。Meng-Li Yang和Matheos Yosef在發展“分層一般化綫性模型”(第10章)中所用的最大似然估計方法方麵做瞭基礎工作。Young-Yun Shin仔細閱讀瞭本書的初稿,並提齣瞭許多建設性意見。Guang-lei Hong對初稿提齣的批評意見促使第12章交互分類模型的形成。作為應用程序員和長期的朋友,Richard Congdon的工作體現在本書的每一章中。Stuart Leppescu也為第2版的數據處理和新的分析工作提供瞭協助。 芝加哥社區人類發展項目(the Project on Human Development in Chicago Neighborhoods, PHDCN)中的同事,包括Felton Earls、 Rob Sampson和Christopher Johnson,都對本書第2版有著重要影響,這體現在第10章和第11章中關於社區效應的例子上。的確,我們還要感謝麥剋阿瑟基金會(the MacArthur Foundation)、國傢司法研究所(the National Institute of Justice)和國傢精神衛生研究所(the National Institute of Mental Health)對芝加哥社區人類發展項目的資助,該項目也支持瞭本版新章節中關鍵性方法論方麵的工作。 我們特彆感謝Pamela Gardner,她幫助檢查、編輯並錄入瞭本書的全稿。她的高效率和幽默感是保證整個工作順利進行的基礎。 匿名評論者對這一版的新章節提齣瞭許多有益的建議。作為Sage齣版社的方法論編輯,C.Deborah Laughton對本書的齣版給予瞭令人欽佩的耐心和精神上的支持;我們還要再次感謝係列叢書的主編Jan de Leeuw的鼓勵。 叢書主編對分層綫性模型的介紹 在社會科學中,數據結構經常在以下意義上是分層的:我們有描述個體的變量,但是個體又組成較大的群體,每一群體由一定數量的個體組成。對於較大群體還有一係列變量來描述。 首推的例子也許是教育。學生組成班級,既有變量描述學生,又有變量描述班級。班級變量也許是學生變量的匯總指標,諸如學生數量或社會經濟狀況的平均值。但是班級變量也可以是教師(如果本班隻有一個教師),或者是本班的教室(如果本班總是聚會於同一教室)。此外,在這個例子中,層次結構還會相當自然地延伸。班級還會進一步組成學校,學校構成校區,等等。我們也可以有描述學校的變量和描述校區的變量(如教學方式、學校建築、鄰裏狀況等)。 一旦我們發現這個分層數據結構的例子,我們就會看到更多的例子。它們自然地發生於地理和(區域)經濟中。在某種意義上,社會學的基本問題就是將個人屬性與所寓於其中的群體和結構的屬性聯係起來。以同一種方式,經濟學的問題是將微觀層次與宏觀層次聯係起來。此外,許多重復測量也是分層的。如果我們不斷追蹤調查一些個體,那麼對任一個體的觀察構成一組測量,按照同一種方式,一個學校或班級也構成一組測量。當每個調查員調查一組對象時,調查員便處於較高層次。隻要對這些分層結構多加思索便會不可避免地導緻一個結論,即使不能說大多數,至少也能說很多社會科學數據都有這種嵌套的或分層的結構。 在意識到分層數據的重要意義之後,下一步是考慮如何在統計技術上體現對分層結構的分析。有兩種做法已經遭到否定。第一種做法是將所有高層變量分解(disaggregate)到個體水平。比如將教師、班級和學校的特徵全都賦予學生個人,然後在個體層次進行分析。這一方法的問題是,要是我們知道一些學生是同一班級的,那麼我們也就知道他們在班級變量上取相同的值,於是,我們便不能采用經典統計技術的基本假定,即各觀測之間相互獨立。另一種做法是先將個體水平的變量匯總到較高層次,然後在較高層次進行分析。比如我們將學生特徵匯總到班級,然後再對班級進行分析,分析時也許還需要按規模對班級加權。這種做法的主要問題是,我們拋棄瞭所有的組內信息,它也許占到最初分析時信息總量的80%或90%。其結果是,匯總變量之間的關係總是顯得較為密切,然而這常常與直接分析未曾匯總的變量所反映的情況大相徑庭。於是,我們不但浪費瞭信息,而且要是我們企圖在個體層次解釋匯總分析結果,還將導緻對結果的麯解。所以,匯總方法和分解方法都不能令人滿意。 如果僅限於用常規綫性模型進行分析,我們知道其基本假定有綫性、正態性、方差齊性、獨立性。我們希望保留前兩項,但需要對後兩項(尤其是關於獨立性的假定)加以修改。修改的主要原因在於:由於同組的個體之間比異組的個體之間更為接近或相似,所以一個學生與其他班級的學生可能是相獨立的,而與同一班級的學生在許多變量上相同。那麼,這些變量並不需要觀察,這意味著它們從綫性模型中消失,進入誤差部分,並導緻殘差之間齣現相關。這一思路可以用方差成分