基于网络媒体监测语料库的性别语言差异研究

基于网络媒体监测语料库的性别语言差异研究 pdf epub mobi txt 电子书 下载 2025

王宇波 著
图书标签:
  • 性别语言学
  • 网络语言学
  • 语料库语言学
  • 社会语言学
  • 计算语言学
  • 性别研究
  • 网络媒体
  • 语言差异
  • 文本分析
  • 大数据分析
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 科学出版社
ISBN:9787030545947
版次:31
商品编码:12280220
包装:平装
开本:16开
出版时间:2017-11-01
页数:204
字数:210000
正文语种:中文

具体描述

内容简介

  《基于网络媒体监测语料库的性别语言差异研究》的研究依托国家语言资源监测与研究中心(网络媒体语言分中心)所建的网络媒体监测语料库,研究对象主要包括字、词、句式、话题优先序列、话语量大小等方面的性别语言差异。作为首次基于目前规模较大的汉语网络媒体监测语料库的汉语本体研究,主要采用语料库语言学的研究手段,在定量和定性相结合的基础上,以统计数据和语言事实为研究依据,通过处理大规模的真实文本得出了具有统计学依据的语言数据,更深入地揭示两性在汉语使用中的一些普遍规律,挖掘自媒体中性别语言呈现的一些特有的语言现象和规律,既符合当前性别语言差异研究的多元化、动态化、微观化和本土化的发展趋势,也对应用语言学、社会语言学等方面的研究有一定的理论价值。

目录

目录
当一个语言学研究的排头兵
序言
第一篇 字词篇
第一章 汉字使用的性别差异 3
第一节 网络媒体监测语料库及语料来源 3
一、语料库的选择及依据 3
二、博客语料筛选的过程 4
第二节 汉字使用性别差异的总体情况 6
一、总字次、字种数和使用频率比较 6
二、汉字覆盖率比较 6
第三节 汉字字频的性别差异 8
一、高频字比较 8
二、低频字比较 9
三、高频字与《现代汉语常用字表》比较 10
四、高频字构词能力的性别差异 11
第四节 男女两性共用字与独用字 13
第五节 本章小结 16
第二章 词汇使用的性别差异 17
第一节 词汇使用性别差异的总体情况 17
一、总词次、词种数和词汇多样性的性别差异 17
二、词汇覆盖率的性别差异 18
第二节 词汇使用频率的性别差异 19
一、不同频次范围的词种数 19
二、高频词比较 21
三、高频词与字种数关系 23
四、高频词词性分布的性别差异 24
第三节 两性共用词与独用词 27
第四节 文本数与词种数关系的性别差异 28
第五节 词长分布的性别差异 29
一、词长与平均频次 29
二、词长与词种数 31
第六节 本章小结 32
第三章 微博意见领袖字词使用的性别差异 33
第一节 微博意见领袖字频组间差异 33
一、意见领袖排行榜制定 33
二、高频字总体使用状况 35
三、高频字性别差异 37
四、其他身份特征的组间差异 39
第二节 微博意见领袖的词汇计量特征 44
一、词汇密度差异 44
二、词汇多样性比较 46
三、词类分布比较 48
四、词汇丰富度与微博活跃度 49
第三节 本章小结 50
第二篇 句法篇
第四章 独词句使用的性别差异 53
第一节 性别语言研究中的独词句 53
一、独词句的性别差异研究 53
二、博客语料中的独词句 54
第二节 独词型独词句 54
一、独词型独词句的范围 54
二、独词句的不同词汇类别 56
第三节 独词句使用差异的概况 58
一、独词句句总数统计 58
二、各词类独词句的使用情况考察 58
第四节 独词句使用差异的统计学分析 60
一、数据正态分布验证 60
二、两性独词句使用差异的显著性检验 61
第五节 各类型独词句的性别差异 61
第六节 “得”字独词句性别差异的个案研究 63
一、“得”字独词句的语气类型 63
二、女性博客“得”字独词句 67
三、男性博客“得”字独词句 69
四、北京口语中“得/得了”独词句的性别差异 71
第七节 本章小结 73
第五章 感叹句使用的性别差异 75
第一节 感叹句使用的总体情况 75
第二节 感叹句中语气词的使用情况 76
一、带句尾语气词的感叹句 77
二、句尾语气词的使用情况对比 78
三、感叹句中的高频语气词 82
四、语气词句总数差值的分析 84
第三节 感叹词使用的性别差异 87
一、感叹词使用总体情况对比 88
二、高频感叹词使用情况对比 90
三、两性使用感叹词差异显著性 92
第四节 女性句尾语助词“的说”个案研究 92
一、现代汉语方言中句末言说词 93
二、台湾地区的现代标准汉语句末言说词产生的机制 96
三、网络语言句末言说词“的说”产生的机制 99
四、网络语言中“的说”的词汇化 103
五、结语 106
第五节 本章小结 107
第六章 疑问句使用的性别差异 108
第一节 疑问句使用的总体情况 108
一、疑问句的考察范围 108
二、总体情况比较 109
第二节 带疑问语气标记的疑问句 110
第三节 带疑问代词标记的疑问句 113
一、带疑问代词的疑问句使用情况比较 113
二、高频疑问代词标记 114
三、句总数次多的疑问代词标记使用情况比较 116
四、总数最少的疑问代词 117
五、疑问代词的句总数差值比较 118
第四节 男女选择问句的使用特点 120
一、选择问句的三种类型 121
二、三种类型选择问句使用情况的性别差异 122
第五节 两性正反问句的使用特点 123
一、两性正反问句使用的总体情况 123
二、完整形式的正反问句 123
三、正反问句的缩略形式 126
四、三种典型正反问句 128
五、两性正反问句使用特点小结 129
第六节 两性疑问句使用情况的整体比较 129
第七节 本章小结 130
第三篇 话语篇
第七章 话题选择的性别差异 133
第一节 引言 133
第二节 博客话题的文本分类过程 134
一、选择博客文本的原因 134
二、文本分类过程 135
第三节 两性话题选择的优先序列 140
一、男性话题的优先序列 140
二、女性话题的优先序列 141
三、高位序话题的稳定与变化 142
四、稳定的机制及变化的动因 143
第四节 两性话题选择的组间差异 144
一、话题序差比较 144
二、话题量的组间差异显著性检验 145
第五节 本章小结 146
第八章 话语量大小的性别差异 147
第一节 引言 147
第二节 不同语境下的话语量变化 147
第三节 话题量大小分类统计 149
第四节 话语量离散度 150
一、话语量离散度的组间差异 150
二、话语量离散趋势 151
第五节 组间差异显著性检验 153
第六节 本章小结 155
参考文献 156
附录 165

精彩书摘

  《基于网络媒体监测语料库的性别语言差异研究》:
  第一篇 字词篇
  第一章 汉字使用的性别差异
  第一节 网络媒体监测语料库及语料来源
  一、语料库的选择及依据
  国家语言资源监测与研究中心(网络媒体分中心)从2005年开始对网络媒体进行动态监测,已采集了包括网络新闻、网络论坛、网络文学、博客、微博等在内的网络媒体语料,并在此基础上建立网络媒体监测语料库。其中,博客语料主要来源于新浪博客(blog.sina.com.cn)、搜狐博客(blog.sohu.com)、中国博客、博客网(bokee.com)、和讯博客(blog.hexun.com)、博客大巴等网站规模大、网络访问量大的知名中文博客网站。《基于网络媒体监测语料库的性别语言差异研究》的研究主要基于网络媒体监测语料库中的博客语料和微博语料,博客语料主要用于字、词汇、句法、话题、话语量的研究,微博语料用于汉字和词汇章节的个案研究。
  选取博客语料主要基于两个方面的原因:首先,便于通过作者的元信息筛选出具有性别标签的作者。博客、微博、论坛的作者在社交媒体平台上注册时,会提供包括性别在内的作者身份信息,因此,在语料爬取过程中可对作者身份信息进行元数据标注,进而提取出有性别信息的作者。其次,博客文本更便于进行文本分类,有利于开展话题选择等方面的性别语言差异研究。微博文本比较短小,计算机对其进行文本自动分类处理时效度不高,难度较大。而博客文本相对较长,比微博等其他新媒体语料能更有效地进行话题分类,且分类效果更好。
  二、博客语料筛选的过程
  博客语料库包括网页和纯文本,我们对语料的基本元数据全部做了标注,并采用自动分词工具做自动分词和词性标注等处理。
  ……
《字里行间,声色万象:解码性别视角的网络言说》 在信息洪流奔涌不息的当下,网络媒体以其前所未有的速度、广度和深度,重塑着我们的信息获取方式、认知结构乃至于社会互动模式。它既是现实社会的镜像,又孕育着独特的语境与生态。在这片由文字、图像、声音交织而成的数字沃土上,人类的交流以一种前所未有的活跃姿态展开。而当我们聚焦于这片热土的细微之处,便会发现,一种深刻而古老的差异,依然在潜移默化中影响着我们的言说方式——那便是性别差异。 本书并非对某个特定研究领域或学术理论的孤立探讨,而是力图搭建一座桥梁,连接起宏观的网络传播现象与微观的性别语言实践。我们着眼于的是,在纷繁复杂的网络语境下,性别这一社会建构的维度,如何通过个体独特的语言表达,在形塑和反映社会认知的同时,也折射出其自身的复杂性与演变。 一、 数据的脉络与语料的温度 本书的研究基础,正如其名所示,建立在一个庞大且精心构建的网络媒体监测语料库之上。这个语料库并非冷冰冰的数字堆砌,而是经过严谨的数据采集、清洗与分类,涵盖了从新闻报道、社交媒体讨论、论坛交流到博客评论等多元化的网络文本。我们从中提取了能够代表不同性别群体在网络空间进行交流的关键数据点,这些数据点如同历史的碎片,承载着信息时代的语言痕迹。 我们并非仅仅关注“说什么”,更深入探究“怎么说”。通过对语料库中语言使用模式的细致剖析,我们关注词汇的选择、句法结构、修辞手法的运用、情感表达的倾向,以及话语的组织方式。这些细微之处,往往是性别语言差异最直接也最隐晦的体现。例如,在表达观点时,不同性别群体可能倾向于使用不同程度的肯定或保留,在描述情感时,其词汇的选择和强度也可能存在差异。这些差异并非由生物性别本身决定,而是深深植根于社会文化、成长经历以及个体在社会互动中所扮演的角色。 二、 语言的镜子与社会的棱镜 语言从来不是真空的存在,它承载着丰富的社会信息,并反过来塑造着我们的社会认知。本书将网络语言视为一面镜子,折射出性别在信息时代的新形态与新变迁。我们关注的性别语言差异,并非静态的二元对立,而是一个动态的、流动的、与社会文化背景紧密相关的现象。 在网络空间,个体在一定程度上可以摆脱现实身份的束缚,但性别身份的影响依然无处不在。这种影响可能通过个体的主动选择(如昵称、头像、自我描述等)显现,也可能通过群体性的语言惯习(如特定社群的常用语、网络迷因的传播方式等)得以体现。本书将尝试解读这些语言信号,理解它们背后所蕴含的性别认知、社会期望以及个体的主体性表达。 我们相信,通过对网络媒体语料的深入研究,不仅能够揭示性别语言差异的现状,更能洞察其背后的社会动因。这些差异是社会性别观念在数字时代的映射,是群体在信息互动中不断协商、建构和重塑性别身份的过程。理解这些差异,有助于我们更清晰地认识当代社会的性别议题,以及信息传播对性别刻板印象的强化或消解作用。 三、 探寻差异背后的逻辑与动因 本书的研究并非止步于对语言现象的描述,而是致力于探寻这些性别语言差异背后深层的逻辑与动因。我们将其置于更广阔的社会文化语境中进行考察,审视以下几个关键层面: 社会文化影响: 传统的性别刻板印象、社会化过程中的经验差异,以及不同文化背景下对性别角色的不同界定,都会在潜移默化中影响个体的语言习得与使用。网络空间虽然提供了新的表达平台,但这些深层文化基因的印记依然存在。 社交互动模式: 性别在社交互动中扮演着重要的角色。例如,在某些情境下,女性可能更倾向于通过语言建立情感连接、维护和谐关系,而男性可能更侧重于信息传递、竞争与主导。网络语言的表达方式,如回应的频率、情感词汇的运用、话题的引导与切换等,都可能体现出这些社交策略的差异。 个体身份认同: 个体的性别身份认同是一个复杂且多维的建构过程。在网络空间,个体可能通过语言来塑造和表达自己的性别身份,这既可能与社会普遍认知保持一致,也可能是一种反抗或重构。我们关注个体如何运用语言来确立或挑战已有的性别规范。 平台与语境的塑造: 不同的网络平台(如微博、豆瓣、知乎、B站等)拥有其独特的社区文化、用户构成和传播机制。这些平台特质本身也会对语言的使用产生影响,并可能与性别因素相互作用,形成特定的语言景观。例如,在以游戏社区为主的论坛,其语言风格可能与以情感分享为主的社交媒体截然不同,而性别在其中扮演的角色也可能因此产生变化。 四、 超越刻板,走向 nuanced 的理解 值得强调的是,本书的研究并非为了固化或强化性别刻板印象,而是力图在纷繁复杂的语言现象中,揭示出性别在网络言说中的 nuanced(细致入微的)表现。我们深知,性别是一个连续的光谱,个体差异远大于群体平均差异。因此,本书的研究结果将以审慎的态度呈现,避免以偏概全的结论。 我们希望通过对网络媒体语料的深入挖掘,打破对性别语言的简单二元划分,呈现出更加丰富、多元且富有层次的性别语言实践图景。我们关注性别表达的灵活性、适应性以及个体在不同语境下对性别语言策略的调整。 五、 意义与展望 本书的研究不仅具有学术价值,更蕴含着深刻的社会意义。 深化性别研究: 通过对网络性别语言的实证研究,为性别研究提供新的视角和宝贵的数据支持,有助于理解当代社会性别关系的变迁。 提升媒介素养: 揭示网络语言中的性别因素,有助于用户更敏锐地识别和解读信息,从而提升媒介素养,避免被性别刻板印象所误导。 促进平等对话: 理解不同性别群体在网络空间的语言沟通模式,有助于促进更有效的沟通与理解,消弭因语言差异带来的误解和隔阂,为构建更平等的网络社会提供理论基础。 反思技术与人文的交融: 本书的研究也是技术与人文深度融合的体现,它展示了如何运用大数据、计算方法等现代技术手段,去解析和理解深刻的人文议题。 随着网络技术的不断发展,我们的言说方式和互动模式也将持续演进。本书的研究,旨在为理解这一演进过程中的性别维度提供一个有益的切入点。我们希望,通过对“字里行间”的细致解读,能够帮助读者洞察“声色万象”背后的性别视角,从而在数字时代构建一个更具包容性和理解力的信息生态。 这本书,是对网络时代性别语言生态的一次细致描绘,是对个体在数字空间中性别身份的一次深刻追问。它邀请每一位读者,一同进入这个由语言交织而成的性别世界,去倾听、去感受、去思考,那些在网络语料库中跳跃的,关于性别,关于沟通,关于我们自身的故事。

用户评价

评分

这本书最让我感到震撼的是它对“沉默的语言”的捕捉能力。在海量的网络文本中,作者不仅仅关注那些被高频使用的词汇或明显的修辞手法,更深入地挖掘了那些“未被说出”或“被边缘化”的声音所处的语言环境。它探讨了网络社区中特定群体的表达权利是如何受到平台机制和主流话语的制约。读到那里,我感觉作者的立场非常坚定,他不仅仅是在描述现象,更是在呼吁对语言权力结构的反思。整本书洋溢着一种人文关怀的底色,使原本冰冷的语料数据变得有温度、有故事性。这不仅仅是一部关于语言的著作,更像是一部关于当代社会权力分配如何通过日常交流得以再生产的深刻剖析。

评分

我是在寻找关于数字人文工具应用方法的过程中偶然接触到这本书的。起初,我对它所涉及的“语料库构建”的细节非常感兴趣,期待能从中找到一些实操层面的技巧或软件推荐。然而,这本书的重点似乎更侧重于“发现”与“解释”,而非“操作指南”。作者花费了大量笔墨来讨论如何界定和筛选有效的“监测数据”,强调了数据伦理和样本偏差控制的重要性。这让我意识到,在利用大数据进行语言学研究时,前期的准备和思想工作比后续的统计分析更为关键。这本书更像是一部研究方法论的范本,它教会了我如何带着批判性的眼光去看待网络上唾手可得的“数据海洋”,而不是盲目地将其视为真理的化身。对于任何想要从事相关领域研究的新手来说,这部分内容是无价的启蒙。

评分

这本书的封面设计很吸引眼球,那种深邃的蓝色调配上简洁的字体,给人一种严肃而专业的印象。我原本以为这会是一本偏向技术实现或者数据挖掘方面的专业书籍,毕竟“网络媒体监测语料库”这个词汇听起来就挺硬核的。然而,当我翻开前几页时,才发现它更像是一部社会学和语言学的交叉研究报告。作者似乎花费了大量的篇幅来构建理论框架,探讨了在数字时代,信息传播媒介的特性如何潜移默化地影响着我们说话和写作的方式。特别是关于“在线身份构建”的部分,阐述得相当到位,让我开始反思自己在社交平台上的发言习惯,是不是无形中被平台算法和群体规范所塑造。这本书的论证逻辑非常严密,引用了大量近年的研究成果,让人感觉作者对这个领域有非常深入的理解和独到的见解。我尤其欣赏它那种不急于下结论,而是细致入微地剖析现象背后的文化驱动力的写作风格。

评分

这本书的阅读体验非常流畅,尽管主题是学术性的,但作者的叙事方式却出乎意料地引人入胜。它没有陷入纯粹的术语堆砌,而是通过一系列精心挑选的案例分析来支撑其核心论点。我记得其中有一章专门对比了不同年龄层用户在新闻评论区和生活分享类App中的语言风格差异,那段分析简直像是一面镜子,照出了当代社会群体之间微妙的沟通鸿沟。作者没有简单地用“好”或“坏”来评价这些差异,而是将其置于更宏大的媒介生态变迁的背景下进行审视,这使得读者在获得知识的同时,也能进行深层次的自我对话。纸张的质感也很好,印刷清晰,排版疏密得当,长时间阅读也不会感到视觉疲劳,这对于一本需要高度专注力的学术著作来说,无疑是一个巨大的加分项。

评分

如果要用一个词来形容这本书给我的整体印象,那就是“拓宽视野”。我本来以为这只是一个语言学小分支的探讨,但读完后,我发现它巧妙地将媒介批评、社会心理学甚至传播政治学都编织进了同一个叙事框架中。作者行文的跨度极大,从微观的词汇选择到宏观的平台治理,都能游刃有余地进行切换和关联。特别是关于符号学在网络迷因(Meme)中的作用分析,写得极其精彩,将那些看似轻松幽默的网络文化现象,解构成了复杂的社会信号。这本书的价值在于,它提供了一种新的工具箱,帮助读者在面对日益碎片化、情绪化的信息洪流时,能够更清醒地认识到语言本身所承载的重量与责任。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有