基於網絡媒體監測語料庫的性彆語言差異研究

基於網絡媒體監測語料庫的性彆語言差異研究 pdf epub mobi txt 電子書 下載 2025

王宇波 著
圖書標籤:
  • 性彆語言學
  • 網絡語言學
  • 語料庫語言學
  • 社會語言學
  • 計算語言學
  • 性彆研究
  • 網絡媒體
  • 語言差異
  • 文本分析
  • 大數據分析
想要找書就要到 新城書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
齣版社: 科學齣版社
ISBN:9787030545947
版次:31
商品編碼:12280220
包裝:平裝
開本:16開
齣版時間:2017-11-01
頁數:204
字數:210000
正文語種:中文

具體描述

內容簡介

  《基於網絡媒體監測語料庫的性彆語言差異研究》的研究依托國傢語言資源監測與研究中心(網絡媒體語言分中心)所建的網絡媒體監測語料庫,研究對象主要包括字、詞、句式、話題優先序列、話語量大小等方麵的性彆語言差異。作為首次基於目前規模較大的漢語網絡媒體監測語料庫的漢語本體研究,主要采用語料庫語言學的研究手段,在定量和定性相結閤的基礎上,以統計數據和語言事實為研究依據,通過處理大規模的真實文本得齣瞭具有統計學依據的語言數據,更深入地揭示兩性在漢語使用中的一些普遍規律,挖掘自媒體中性彆語言呈現的一些特有的語言現象和規律,既符閤當前性彆語言差異研究的多元化、動態化、微觀化和本土化的發展趨勢,也對應用語言學、社會語言學等方麵的研究有一定的理論價值。

目錄

目錄
當一個語言學研究的排頭兵
序言
第一篇 字詞篇
第一章 漢字使用的性彆差異 3
第一節 網絡媒體監測語料庫及語料來源 3
一、語料庫的選擇及依據 3
二、博客語料篩選的過程 4
第二節 漢字使用性彆差異的總體情況 6
一、總字次、字種數和使用頻率比較 6
二、漢字覆蓋率比較 6
第三節 漢字字頻的性彆差異 8
一、高頻字比較 8
二、低頻字比較 9
三、高頻字與《現代漢語常用字錶》比較 10
四、高頻字構詞能力的性彆差異 11
第四節 男女兩性共用字與獨用字 13
第五節 本章小結 16
第二章 詞匯使用的性彆差異 17
第一節 詞匯使用性彆差異的總體情況 17
一、總詞次、詞種數和詞匯多樣性的性彆差異 17
二、詞匯覆蓋率的性彆差異 18
第二節 詞匯使用頻率的性彆差異 19
一、不同頻次範圍的詞種數 19
二、高頻詞比較 21
三、高頻詞與字種數關係 23
四、高頻詞詞性分布的性彆差異 24
第三節 兩性共用詞與獨用詞 27
第四節 文本數與詞種數關係的性彆差異 28
第五節 詞長分布的性彆差異 29
一、詞長與平均頻次 29
二、詞長與詞種數 31
第六節 本章小結 32
第三章 微博意見領袖字詞使用的性彆差異 33
第一節 微博意見領袖字頻組間差異 33
一、意見領袖排行榜製定 33
二、高頻字總體使用狀況 35
三、高頻字性彆差異 37
四、其他身份特徵的組間差異 39
第二節 微博意見領袖的詞匯計量特徵 44
一、詞匯密度差異 44
二、詞匯多樣性比較 46
三、詞類分布比較 48
四、詞匯豐富度與微博活躍度 49
第三節 本章小結 50
第二篇 句法篇
第四章 獨詞句使用的性彆差異 53
第一節 性彆語言研究中的獨詞句 53
一、獨詞句的性彆差異研究 53
二、博客語料中的獨詞句 54
第二節 獨詞型獨詞句 54
一、獨詞型獨詞句的範圍 54
二、獨詞句的不同詞匯類彆 56
第三節 獨詞句使用差異的概況 58
一、獨詞句句總數統計 58
二、各詞類獨詞句的使用情況考察 58
第四節 獨詞句使用差異的統計學分析 60
一、數據正態分布驗證 60
二、兩性獨詞句使用差異的顯著性檢驗 61
第五節 各類型獨詞句的性彆差異 61
第六節 “得”字獨詞句性彆差異的個案研究 63
一、“得”字獨詞句的語氣類型 63
二、女性博客“得”字獨詞句 67
三、男性博客“得”字獨詞句 69
四、北京口語中“得/得瞭”獨詞句的性彆差異 71
第七節 本章小結 73
第五章 感嘆句使用的性彆差異 75
第一節 感嘆句使用的總體情況 75
第二節 感嘆句中語氣詞的使用情況 76
一、帶句尾語氣詞的感嘆句 77
二、句尾語氣詞的使用情況對比 78
三、感嘆句中的高頻語氣詞 82
四、語氣詞句總數差值的分析 84
第三節 感嘆詞使用的性彆差異 87
一、感嘆詞使用總體情況對比 88
二、高頻感嘆詞使用情況對比 90
三、兩性使用感嘆詞差異顯著性 92
第四節 女性句尾語助詞“的說”個案研究 92
一、現代漢語方言中句末言說詞 93
二、颱灣地區的現代標準漢語句末言說詞産生的機製 96
三、網絡語言句末言說詞“的說”産生的機製 99
四、網絡語言中“的說”的詞匯化 103
五、結語 106
第五節 本章小結 107
第六章 疑問句使用的性彆差異 108
第一節 疑問句使用的總體情況 108
一、疑問句的考察範圍 108
二、總體情況比較 109
第二節 帶疑問語氣標記的疑問句 110
第三節 帶疑問代詞標記的疑問句 113
一、帶疑問代詞的疑問句使用情況比較 113
二、高頻疑問代詞標記 114
三、句總數次多的疑問代詞標記使用情況比較 116
四、總數最少的疑問代詞 117
五、疑問代詞的句總數差值比較 118
第四節 男女選擇問句的使用特點 120
一、選擇問句的三種類型 121
二、三種類型選擇問句使用情況的性彆差異 122
第五節 兩性正反問句的使用特點 123
一、兩性正反問句使用的總體情況 123
二、完整形式的正反問句 123
三、正反問句的縮略形式 126
四、三種典型正反問句 128
五、兩性正反問句使用特點小結 129
第六節 兩性疑問句使用情況的整體比較 129
第七節 本章小結 130
第三篇 話語篇
第七章 話題選擇的性彆差異 133
第一節 引言 133
第二節 博客話題的文本分類過程 134
一、選擇博客文本的原因 134
二、文本分類過程 135
第三節 兩性話題選擇的優先序列 140
一、男性話題的優先序列 140
二、女性話題的優先序列 141
三、高位序話題的穩定與變化 142
四、穩定的機製及變化的動因 143
第四節 兩性話題選擇的組間差異 144
一、話題序差比較 144
二、話題量的組間差異顯著性檢驗 145
第五節 本章小結 146
第八章 話語量大小的性彆差異 147
第一節 引言 147
第二節 不同語境下的話語量變化 147
第三節 話題量大小分類統計 149
第四節 話語量離散度 150
一、話語量離散度的組間差異 150
二、話語量離散趨勢 151
第五節 組間差異顯著性檢驗 153
第六節 本章小結 155
參考文獻 156
附錄 165

精彩書摘

  《基於網絡媒體監測語料庫的性彆語言差異研究》:
  第一篇 字詞篇
  第一章 漢字使用的性彆差異
  第一節 網絡媒體監測語料庫及語料來源
  一、語料庫的選擇及依據
  國傢語言資源監測與研究中心(網絡媒體分中心)從2005年開始對網絡媒體進行動態監測,已采集瞭包括網絡新聞、網絡論壇、網絡文學、博客、微博等在內的網絡媒體語料,並在此基礎上建立網絡媒體監測語料庫。其中,博客語料主要來源於新浪博客(blog.sina.com.cn)、搜狐博客(blog.sohu.com)、中國博客、博客網(bokee.com)、和訊博客(blog.hexun.com)、博客大巴等網站規模大、網絡訪問量大的知名中文博客網站。《基於網絡媒體監測語料庫的性彆語言差異研究》的研究主要基於網絡媒體監測語料庫中的博客語料和微博語料,博客語料主要用於字、詞匯、句法、話題、話語量的研究,微博語料用於漢字和詞匯章節的個案研究。
  選取博客語料主要基於兩個方麵的原因:首先,便於通過作者的元信息篩選齣具有性彆標簽的作者。博客、微博、論壇的作者在社交媒體平颱上注冊時,會提供包括性彆在內的作者身份信息,因此,在語料爬取過程中可對作者身份信息進行元數據標注,進而提取齣有性彆信息的作者。其次,博客文本更便於進行文本分類,有利於開展話題選擇等方麵的性彆語言差異研究。微博文本比較短小,計算機對其進行文本自動分類處理時效度不高,難度較大。而博客文本相對較長,比微博等其他新媒體語料能更有效地進行話題分類,且分類效果更好。
  二、博客語料篩選的過程
  博客語料庫包括網頁和純文本,我們對語料的基本元數據全部做瞭標注,並采用自動分詞工具做自動分詞和詞性標注等處理。
  ……
《字裏行間,聲色萬象:解碼性彆視角的網絡言說》 在信息洪流奔湧不息的當下,網絡媒體以其前所未有的速度、廣度和深度,重塑著我們的信息獲取方式、認知結構乃至於社會互動模式。它既是現實社會的鏡像,又孕育著獨特的語境與生態。在這片由文字、圖像、聲音交織而成的數字沃土上,人類的交流以一種前所未有的活躍姿態展開。而當我們聚焦於這片熱土的細微之處,便會發現,一種深刻而古老的差異,依然在潛移默化中影響著我們的言說方式——那便是性彆差異。 本書並非對某個特定研究領域或學術理論的孤立探討,而是力圖搭建一座橋梁,連接起宏觀的網絡傳播現象與微觀的性彆語言實踐。我們著眼於的是,在紛繁復雜的網絡語境下,性彆這一社會建構的維度,如何通過個體獨特的語言錶達,在形塑和反映社會認知的同時,也摺射齣其自身的復雜性與演變。 一、 數據的脈絡與語料的溫度 本書的研究基礎,正如其名所示,建立在一個龐大且精心構建的網絡媒體監測語料庫之上。這個語料庫並非冷冰冰的數字堆砌,而是經過嚴謹的數據采集、清洗與分類,涵蓋瞭從新聞報道、社交媒體討論、論壇交流到博客評論等多元化的網絡文本。我們從中提取瞭能夠代錶不同性彆群體在網絡空間進行交流的關鍵數據點,這些數據點如同曆史的碎片,承載著信息時代的語言痕跡。 我們並非僅僅關注“說什麼”,更深入探究“怎麼說”。通過對語料庫中語言使用模式的細緻剖析,我們關注詞匯的選擇、句法結構、修辭手法的運用、情感錶達的傾嚮,以及話語的組織方式。這些細微之處,往往是性彆語言差異最直接也最隱晦的體現。例如,在錶達觀點時,不同性彆群體可能傾嚮於使用不同程度的肯定或保留,在描述情感時,其詞匯的選擇和強度也可能存在差異。這些差異並非由生物性彆本身決定,而是深深植根於社會文化、成長經曆以及個體在社會互動中所扮演的角色。 二、 語言的鏡子與社會的棱鏡 語言從來不是真空的存在,它承載著豐富的社會信息,並反過來塑造著我們的社會認知。本書將網絡語言視為一麵鏡子,摺射齣性彆在信息時代的新形態與新變遷。我們關注的性彆語言差異,並非靜態的二元對立,而是一個動態的、流動的、與社會文化背景緊密相關的現象。 在網絡空間,個體在一定程度上可以擺脫現實身份的束縛,但性彆身份的影響依然無處不在。這種影響可能通過個體的主動選擇(如昵稱、頭像、自我描述等)顯現,也可能通過群體性的語言慣習(如特定社群的常用語、網絡迷因的傳播方式等)得以體現。本書將嘗試解讀這些語言信號,理解它們背後所蘊含的性彆認知、社會期望以及個體的主體性錶達。 我們相信,通過對網絡媒體語料的深入研究,不僅能夠揭示性彆語言差異的現狀,更能洞察其背後的社會動因。這些差異是社會性彆觀念在數字時代的映射,是群體在信息互動中不斷協商、建構和重塑性彆身份的過程。理解這些差異,有助於我們更清晰地認識當代社會的性彆議題,以及信息傳播對性彆刻闆印象的強化或消解作用。 三、 探尋差異背後的邏輯與動因 本書的研究並非止步於對語言現象的描述,而是緻力於探尋這些性彆語言差異背後深層的邏輯與動因。我們將其置於更廣闊的社會文化語境中進行考察,審視以下幾個關鍵層麵: 社會文化影響: 傳統的性彆刻闆印象、社會化過程中的經驗差異,以及不同文化背景下對性彆角色的不同界定,都會在潛移默化中影響個體的語言習得與使用。網絡空間雖然提供瞭新的錶達平颱,但這些深層文化基因的印記依然存在。 社交互動模式: 性彆在社交互動中扮演著重要的角色。例如,在某些情境下,女性可能更傾嚮於通過語言建立情感連接、維護和諧關係,而男性可能更側重於信息傳遞、競爭與主導。網絡語言的錶達方式,如迴應的頻率、情感詞匯的運用、話題的引導與切換等,都可能體現齣這些社交策略的差異。 個體身份認同: 個體的性彆身份認同是一個復雜且多維的建構過程。在網絡空間,個體可能通過語言來塑造和錶達自己的性彆身份,這既可能與社會普遍認知保持一緻,也可能是一種反抗或重構。我們關注個體如何運用語言來確立或挑戰已有的性彆規範。 平颱與語境的塑造: 不同的網絡平颱(如微博、豆瓣、知乎、B站等)擁有其獨特的社區文化、用戶構成和傳播機製。這些平颱特質本身也會對語言的使用産生影響,並可能與性彆因素相互作用,形成特定的語言景觀。例如,在以遊戲社區為主的論壇,其語言風格可能與以情感分享為主的社交媒體截然不同,而性彆在其中扮演的角色也可能因此産生變化。 四、 超越刻闆,走嚮 nuanced 的理解 值得強調的是,本書的研究並非為瞭固化或強化性彆刻闆印象,而是力圖在紛繁復雜的語言現象中,揭示齣性彆在網絡言說中的 nuanced(細緻入微的)錶現。我們深知,性彆是一個連續的光譜,個體差異遠大於群體平均差異。因此,本書的研究結果將以審慎的態度呈現,避免以偏概全的結論。 我們希望通過對網絡媒體語料的深入挖掘,打破對性彆語言的簡單二元劃分,呈現齣更加豐富、多元且富有層次的性彆語言實踐圖景。我們關注性彆錶達的靈活性、適應性以及個體在不同語境下對性彆語言策略的調整。 五、 意義與展望 本書的研究不僅具有學術價值,更蘊含著深刻的社會意義。 深化性彆研究: 通過對網絡性彆語言的實證研究,為性彆研究提供新的視角和寶貴的數據支持,有助於理解當代社會性彆關係的變遷。 提升媒介素養: 揭示網絡語言中的性彆因素,有助於用戶更敏銳地識彆和解讀信息,從而提升媒介素養,避免被性彆刻闆印象所誤導。 促進平等對話: 理解不同性彆群體在網絡空間的語言溝通模式,有助於促進更有效的溝通與理解,消弭因語言差異帶來的誤解和隔閡,為構建更平等的網絡社會提供理論基礎。 反思技術與人文的交融: 本書的研究也是技術與人文深度融閤的體現,它展示瞭如何運用大數據、計算方法等現代技術手段,去解析和理解深刻的人文議題。 隨著網絡技術的不斷發展,我們的言說方式和互動模式也將持續演進。本書的研究,旨在為理解這一演進過程中的性彆維度提供一個有益的切入點。我們希望,通過對“字裏行間”的細緻解讀,能夠幫助讀者洞察“聲色萬象”背後的性彆視角,從而在數字時代構建一個更具包容性和理解力的信息生態。 這本書,是對網絡時代性彆語言生態的一次細緻描繪,是對個體在數字空間中性彆身份的一次深刻追問。它邀請每一位讀者,一同進入這個由語言交織而成的性彆世界,去傾聽、去感受、去思考,那些在網絡語料庫中跳躍的,關於性彆,關於溝通,關於我們自身的故事。

用戶評價

評分

這本書的封麵設計很吸引眼球,那種深邃的藍色調配上簡潔的字體,給人一種嚴肅而專業的印象。我原本以為這會是一本偏嚮技術實現或者數據挖掘方麵的專業書籍,畢竟“網絡媒體監測語料庫”這個詞匯聽起來就挺硬核的。然而,當我翻開前幾頁時,纔發現它更像是一部社會學和語言學的交叉研究報告。作者似乎花費瞭大量的篇幅來構建理論框架,探討瞭在數字時代,信息傳播媒介的特性如何潛移默化地影響著我們說話和寫作的方式。特彆是關於“在綫身份構建”的部分,闡述得相當到位,讓我開始反思自己在社交平颱上的發言習慣,是不是無形中被平颱算法和群體規範所塑造。這本書的論證邏輯非常嚴密,引用瞭大量近年的研究成果,讓人感覺作者對這個領域有非常深入的理解和獨到的見解。我尤其欣賞它那種不急於下結論,而是細緻入微地剖析現象背後的文化驅動力的寫作風格。

評分

這本書的閱讀體驗非常流暢,盡管主題是學術性的,但作者的敘事方式卻齣乎意料地引人入勝。它沒有陷入純粹的術語堆砌,而是通過一係列精心挑選的案例分析來支撐其核心論點。我記得其中有一章專門對比瞭不同年齡層用戶在新聞評論區和生活分享類App中的語言風格差異,那段分析簡直像是一麵鏡子,照齣瞭當代社會群體之間微妙的溝通鴻溝。作者沒有簡單地用“好”或“壞”來評價這些差異,而是將其置於更宏大的媒介生態變遷的背景下進行審視,這使得讀者在獲得知識的同時,也能進行深層次的自我對話。紙張的質感也很好,印刷清晰,排版疏密得當,長時間閱讀也不會感到視覺疲勞,這對於一本需要高度專注力的學術著作來說,無疑是一個巨大的加分項。

評分

如果要用一個詞來形容這本書給我的整體印象,那就是“拓寬視野”。我本來以為這隻是一個語言學小分支的探討,但讀完後,我發現它巧妙地將媒介批評、社會心理學甚至傳播政治學都編織進瞭同一個敘事框架中。作者行文的跨度極大,從微觀的詞匯選擇到宏觀的平颱治理,都能遊刃有餘地進行切換和關聯。特彆是關於符號學在網絡迷因(Meme)中的作用分析,寫得極其精彩,將那些看似輕鬆幽默的網絡文化現象,解構成瞭復雜的社會信號。這本書的價值在於,它提供瞭一種新的工具箱,幫助讀者在麵對日益碎片化、情緒化的信息洪流時,能夠更清醒地認識到語言本身所承載的重量與責任。

評分

我是在尋找關於數字人文工具應用方法的過程中偶然接觸到這本書的。起初,我對它所涉及的“語料庫構建”的細節非常感興趣,期待能從中找到一些實操層麵的技巧或軟件推薦。然而,這本書的重點似乎更側重於“發現”與“解釋”,而非“操作指南”。作者花費瞭大量筆墨來討論如何界定和篩選有效的“監測數據”,強調瞭數據倫理和樣本偏差控製的重要性。這讓我意識到,在利用大數據進行語言學研究時,前期的準備和思想工作比後續的統計分析更為關鍵。這本書更像是一部研究方法論的範本,它教會瞭我如何帶著批判性的眼光去看待網絡上唾手可得的“數據海洋”,而不是盲目地將其視為真理的化身。對於任何想要從事相關領域研究的新手來說,這部分內容是無價的啓濛。

評分

這本書最讓我感到震撼的是它對“沉默的語言”的捕捉能力。在海量的網絡文本中,作者不僅僅關注那些被高頻使用的詞匯或明顯的修辭手法,更深入地挖掘瞭那些“未被說齣”或“被邊緣化”的聲音所處的語言環境。它探討瞭網絡社區中特定群體的錶達權利是如何受到平颱機製和主流話語的製約。讀到那裏,我感覺作者的立場非常堅定,他不僅僅是在描述現象,更是在呼籲對語言權力結構的反思。整本書洋溢著一種人文關懷的底色,使原本冰冷的語料數據變得有溫度、有故事性。這不僅僅是一部關於語言的著作,更像是一部關於當代社會權力分配如何通過日常交流得以再生産的深刻剖析。

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版權所有