高端图像与视频新技术丛书:视频编码与传输新技术

高端图像与视频新技术丛书:视频编码与传输新技术 pdf epub mobi txt 电子书 下载 2025

朱秀昌,刘峰,胡栋 著
图书标签:
  • 视频编码
  • 视频传输
  • 图像处理
  • 视频技术
  • 编码技术
  • 传输技术
  • 多媒体
  • 通信
  • 数字视频
  • 网络视频
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 电子工业出版社
ISBN:9787121245329
版次:1
商品编码:11580310
包装:平装
丛书名: 高端图像与视频新技术丛书
开本:16开
出版时间:2014-12-01
用纸:胶版纸
页数:328
字数:544000
正文语种:中文

具体描述

内容简介

  《高端图像与视频新技术丛书:视频编码与传输新技术》主要介绍近年来在数字视频编码和传输领域出现的若干新技术,分析了它们的基本原理、主要技术、研究进展和应用前景。《高端图像与视频新技术丛书:视频编码与传输新技术》共10章,第1章简要介绍视频编码与传输的基本理论和技术,第2~10章分别介绍率失真优化和码率控制、分布式视频编码、可分级与多描述视频编码、多视点视频编码、视频信号的压缩感知、解码视频的差错掩盖、无线视频传输的质量保证、监控视频的智能分析和超分辨率图像重建。
  《高端图像与视频新技术丛书:视频编码与传输新技术》可作为从事信号处理、通信工程、计算机应用、广播电视、计算机视觉及自动控制等领域的工程技术人员,以及大专院校相关专业的教师、高年级学生或研究生的参考用书。

作者简介

1982年至今,在南京邮电大学从事科研与教学工作。“中国通信学会”高级会员;“中国通信学会IP应用与增值电信技术委员会”委员;“中国电子学会”高级会员;“中国电子学会广播电视技术分会”理事;中国图象图形学会高级会员。《中国多媒体通信》杂志编委;电子工业出版社:“21世纪高等学校通信类规划教材”编审委员会委员。

内页插图

目录

第1章 视频编码与传输基础
1.1 概述
1.1.1 视频的数字化
1.1.2 数字视频的压缩编码
1.1.3 压缩视频的传输
1.2 视频编码的基本方法
1.2.1 预测编码方法
1.2.2 变换编码方法
1.2.3 运动估计和运动补偿
1.2.4 量化和熵编码
1.2.5 H.2 61混合编码模式
1.3 数字视频压缩标准
1.3.1 H.2 6x标准
1.3.2 MPEG-x标准
1.3.3 AVS标准
1.3.4 VC-1标准
1.3.5 HEVC标准
1.4 数字视频的网络传输
1.4.1 通信网络基础
1.4.2 主要传输网络
1.4.3 网络接入技术
1.4.4 线IP网络的视频传输
参考文献

第2章 率失真优化和码率控制
2.1 概述
2.1.1 视频编码的三项指标
2.1.2 率失真优化
2.1.3 码率控制
2.2 率失真理论基础
2.2.1 图像的信源熵
2.2.2 率失真理论
2.2.3 主要率失真模型
2.3 率失真优化编码
2.3.1 率失真优化方法
2.3.2 率失真优化的量化器
2.3.3 率失真优化的模式判决
2.3.4 率失真优化的运动估计
2.4 视频编码的码率控制
2.4.1 码率控制基础
2.4.2 分层码率控制方法
2.4.3 H.2 64的码率控制
2.5 新近的码率控制
2.5.1 半模糊的码率控制器
2.5.2 基于HVS的码率控制
2.5.3 平滑视频质量的码率控制
2.5.4 基于SSIM的码率控制
2.6 编码复杂度
2.6.1 计算复杂度和视频质量
2.6.2 对可变复杂度算法的需求
2.6.3 可变复杂度算法
参考文献

第3章 分布式视频编码
3.1 概述
3.1.1 相关信源的编码
3.1.2 Slepian-Wolf损编码
3.1.3 Wyner-Ziv有损编码
3.2 分布式视频编码的主要方法
3.2.1 空域Wyner-Ziv方法
3.2.2 频域Wyner-Ziv方法
3.2.3 DISCUS编码方法
3.3 Wyner-Ziv编码中的边信息估计
3.3.1 Wyner-Ziv解码框架
3.3.2 边信息的估计
3.3.3 加权运动估计的边信息预测
3.3.4 MAP运动估计的边信息预测
3.4 分布式视频编码的性能
3.5 几种特殊的分布式视频编码方法
3.5.1 H.2 64视频的分布式编码
3.5.2 可分级DVC
3.5.3 多视点DVC
参考文献

第4章 可分级与多描述视频编码
4.1 概述
4.2 可分级视频编码
4.2.1 空域可分级编码
4.2.2 质量可分级编码
4.2.3 时域可分级编码
4.2.4 细粒度可分级编码
4.2.5 频域可分级编码
4.3 多描述视频编码
4.3.1 多描述编码
4.3.2 多描述编码的理论基础
4.3.3 基于量化的多描述编码
4.3.4 基于变换的多描述编码
4.4 H.2 64可分级编码
4.4.1 空域SVC技术
4.4.2 时域SVC技术
4.4.3 信噪比SVC技术
4.4.4 混合SVC技术
参考文献

第5章 多视点视频编码
5.1 概述
5.1.1 立体视觉
5.1.2 多视点视频
5.1.3 多视点视频的压缩编码
5.2 立体视频的采集和显示
5.2.1 立体成像的几何模型
5.2.2 立体视频的采集
5.2.3 立体视频的显示
5.3 多视点视频编码技术
5.3.1 MVC的系统框架
5.3.2 MVC的预测结构
5.3.3 宏块级编码技术
5.4 虚拟视点合成技术
5.4.1 基于模型的绘制方法
5.4.2 基于图像的绘制方法
5.5 多视点视频编码标准
5.5.1 MVC的技术要求和应用
5.5.2 预测结构和码流结构
5.5.3 MVC的档次与级别
5.5.4 MVC的高层语法
5.6 二维视频转三维技术
5.6.1 深度图
5.6.2 深度图的获取
5.6.3 深度图的编码
参考文献

第6章 视频信号的压缩感知
6.1 概述
6.1.1 信号的稀疏表示
6.1.2 信号的随机测量
6.1.3 信号的优化重建
6.2 从测量值重建原信号
6.2.1 信号重建的基本概念
6.2.2 典型的重建算法
6.3 基于CS的视频编码
6.3.1 全感知和压缩感知
6.3.2 CS视频编码系统
6.3.3 分块CS视频编码
6.3.4 CS编码中的关键技术
6.4 基于CS的分布式视频编码
6.4.1 DCVS的基本原理和系统结构
6.4.2 DCVS的性能特点和关键技术
6.5 基于CS的多描述视频编码
6.5.1 分块压缩感知
6.5.2 BCS-MDC编码
6.5.3 测量值分组
6.5.4 BCS-MDC解码
参考文献

第7章 解码视频的差错掩盖
7.1 概述
7.1.1 视频通信中的差错控制
7.1.2 解码端的差错掩盖
7.2 自适应插值的帧内差错掩盖
7.2.1 插值算法的约束条件
7.2.2 基于边缘判决的多方向插值
7.2.3 基于块内容的自适应掩盖
7.3 采用模糊推理的帧间差错掩盖
7.3.1 掩盖块的匹配准则
7.3.2 使用模糊推理的掩盖算法
7.3.3 隶属度函数的自适应定义
7.4 基于运动信息的H.2 64帧间差错掩盖
7.4.1 H.2 64中的运动矢量恢复算法
7.4.2 基于均值漂移的运动矢量恢复
7.4.3 基于核回归的运动矢量恢复
参考文献

第8章 线视频传输的质量保证
8.1 概述
8.1.1 面向网络的视频压缩
8.1.2 视频传输的QoS要求
8.1.3 图像质量评价
8.2 基本的QoS保证
8.2.1 以网络为主的QoS保证
8.2.2 以终端为主的QoS保证
8.3 采用跨层设计的QoS保证
8.3.1 跨层设计的必要性
8.3.2 WMN中跨层设计的要求
8.3.3 跨层设计方法及优化
8.4 线Mesh网络简介
8.4.1 线Mesh网络的类型
8.4.2 线Mesh网络的特点
8.4.3 线Mesh网络的标准
8.4.4 线Mesh网络的QoS
8.5 WMN中的QoS模型
8.5.1 QoS保证的框架模型
8.5.2 WMN多跳链路的干扰模型
8.5.3 丢包模型
参考文献

第9章 监控视频的智能分析
9.1 概述
9.1.1 视频监控
9.1.2 智能视频分析
9.1.3 视频分析的关键技术
9.1.4 主要应用领域
9.2 运动目标检测技术
9.2.1 背景减除方法
9.2.2 帧间差方法
9.2.3 混合高斯模型(GMM)方法
9.2.4 光流场方法
9.3 运动目标跟踪技术
9.3.1 卡尔曼滤波方法
9.3.2 均值漂移方法
9.4 目标行为分析技术
9.4.1 行为特征的选择与表示
9.4.2 人体行为识别
9.4.3 人体行为描述
9.4.4 行为分析的应用
9.5 多摄像机协同技术
9.5.1 应用需求和技术难点
9.5.2 目标特征的提取
9.5.3 目标轨迹的提取和交接
参考文献

第10章 超分辨率图像重建
10.1 概述
10.1.1 图像的空间分辨率
10.1.2 超分辨率重建基础
10.1.3 图像的降质模型
10.1.4 超分辨率重建的应用
10.1.5 反问题的正则化求解
10.1.6 超分辨率重建的主要方法
10.2 基于插值的超分辨率方法
10.2.1 最近邻插值
10.2.2 双线性插值
10.2.3 双立方插值
10.2.4 核回归插值
10.3 基于重建的超分辨率方法
10.3.1 凸集投影(POCS)方法
10.3.2 最大后验概率(MAP)方法
10.3.3 迭代反向投影(IBP)方法
10.4 基于学习的超分辨率方法
10.4.1 邻域嵌入的方法
10.4.2 非局部滤波的方法
10.4.3 基于样例的方法
10.4.4 基于稀疏表示的方法
10.5 视频序列的超分辨率
10.5.1 视频图像的降质模型
10.5.2 视频序列的超分辨率重建
10.5.3 运动信息的获得
10.5.4 窄量化集约束的投影超分辨率重建
参考文献

前言/序言


视频编码与传输新纪元:压缩、加速与沉浸的深度探索 在信息爆炸的时代,视频已然成为信息传播、文化交流和娱乐消费的核心载体。从高清电影到实时直播,从虚拟现实到增强现实,对视频内容的需求与日俱增,同时也对视频的处理、压缩、传输和呈现提出了前所未有的挑战。本书《高端图像与视频新技术丛书:视频编码与传输新技术》正是为应对这些挑战,深入剖析当前视频领域最前沿、最核心的技术革新而精心编撰。它不仅仅是对现有技术的梳理,更是对未来发展趋势的洞察与预测,旨在为视频技术的研究者、开发者、工程师以及相关从业者提供一套全面、深入且极具实践指导意义的技术指南。 本书着力于“新”,聚焦于当前学术界和工业界最活跃、最具突破性的视频编码与传输技术。我们不再停留在对H.264/AVC、H.265/HEVC等经典标准的浅层介绍,而是将目光投向了更先进、更高效、更适应未来多样化应用场景的新一代编码标准,例如AV1 (AOMedia Video 1)。AV1作为开放、免版税的下一代视频编码格式,其强大的压缩性能和广泛的应用前景,使其成为业界关注的焦点。本书将对AV1的编码工具集、核心算法原理进行详尽的解析,包括其引入的全新编码工具,如用于提高压缩效率的引线预测 (Prediction Filters)、用于减少伪影的块划分策略 (Block Partitioning Strategies) 以及更为精细化的环路滤波 (In-loop Filtering) 等。同时,还会深入探讨AV1在实际编码过程中的性能优化策略,分析不同场景下的编码参数选择,以及在实际部署中可能遇到的挑战与解决方案。 除了AV1,我们还将目光聚焦于更具前瞻性的编码技术和研究方向。例如,基于深度学习的视频编码 (Deep Learning-based Video Coding)。这一新兴领域正在颠覆传统的基于信号处理的编码范式,通过神经网络自动学习并优化编码过程中的各个环节,从像素的预测、残差的表示到熵编码的建模,均展现出超越传统编码器的巨大潜力。本书将详细介绍深度学习在视频编码中的应用框架,包括卷积神经网络 (CNNs)、循环神经网络 (RNNs)、Transformer等在视频编码中的具体实现,并探讨如何利用生成对抗网络 (GANs) 或变分自编码器 (VAEs) 来实现更高效的视频压缩。我们将分析基于深度学习的编码器在性能、复杂度以及通用性方面的优势与劣势,并探讨其未来的发展趋势,例如端到端的学习式编码 (End-to-End Learned Coding) 以及如何结合传统编码器优势以实现混合模型。 在传输层面,随着视频内容分辨率的不断提升(如8K、全景视频)以及用户对低延迟、高可靠性实时传输的需求日益增长,传统的传输协议和技术已显不足。本书将深入探讨下一代视频传输技术,重点关注基于HTTP的流媒体传输协议 (HTTP-based Streaming Protocols) 的最新发展。我们将详细解析DASH (Dynamic Adaptive Streaming over HTTP) 和HLS (HTTP Live Streaming) 的工作原理,并深入探讨如何优化这些协议以适应更高分辨率、更高帧率的视频流,以及如何通过更智能的比特流切换、缓冲区管理和丢包补偿策略来提升用户体验。 此外,对于低延迟实时传输这一关键应用场景,本书将详细剖析QUIC (Quick UDP Internet Connections) 协议及其在视频传输中的应用。QUIC作为一种基于UDP的传输层网络协议,旨在解决TCP在拥塞控制、连接建立和丢包恢复方面的固有缺点,从而显著降低视频流的延迟,提升实时互动体验。本书将深入解析QUIC的拥塞控制算法、多路复用机制、连接迁移能力,并结合实际案例分析如何利用QUIC实现低延迟的直播、在线游戏和视频会议等应用。 面向新兴的视频应用,如XR (Extended Reality),本书将提供深入的技术解析。XR内容,无论是VR (Virtual Reality) 还是AR (Augmented Reality),其对视频编码和传输的要求都远超传统视频。高分辨率、高帧率、宽视场角以及对头部运动的实时响应,都意味着需要更高效的压缩技术和更低延迟的传输。本书将探讨全景视频编码 (Panoramic Video Coding) 的技术挑战,例如视点自适应编码 (View-dependent Coding)、多视点视频编码 (Multiview Video Coding) 以及如何在保持视觉质量的同时大幅度降低码率。同时,还将分析XR内容中空间音频编码 (Spatial Audio Coding) 的集成,以及如何将空间音频与视频流同步传输,以提供更具沉浸感的感官体验。 本书还将关注视频质量评估 (Video Quality Assessment) 和感知编码 (Perceptual Coding) 的最新进展。在信息爆炸的时代,码率的降低与用户感知的视频质量之间的平衡是至关重要的。我们将介绍基于客观评价和主观评价的最新质量评估模型,并深入探讨如何利用这些模型来指导编码器的优化,实现感知优化编码 (Perceptually Optimized Coding)。例如,如何根据人眼视觉系统的特性,将更多的码率分配给感知上更重要的图像区域,从而在视觉上达到更高的质量,即使客观测量指标可能略有下降。 此外,本书还特别关注视频编码与传输的安全性和隐私保护。随着视频内容的日益普及,恶意篡改、非法分发和用户隐私泄露等问题也愈发突出。本书将探讨视频水印 (Video Watermarking)、视频加密 (Video Encryption) 以及防盗链技术 (Anti-Hotlinking Technologies) 在保护视频内容版权和隐私方面的应用。我们将分析不同水印技术的优劣,包括其鲁棒性、隐匿性和容量,并探讨如何通过加密技术来保障视频数据的安全性。 本书的内容组织清晰,逻辑严谨,每个章节都聚焦于一个核心技术点,并进行深度剖析。理论讲解与实际应用相结合,既有对核心算法原理的数学推导和概念阐述,也有对实际编码器实现、参数调优以及性能评估的详细指导。为了帮助读者更好地理解和掌握技术,本书还包含大量的图表、流程图以及代码示例(非直接代码,但会描述其实现思路和关键算法),力求将复杂的技术概念以直观易懂的方式呈现。 本书的目标读者群体广泛,包括但不限于: 在校研究生和博士生:希望深入了解视频编码与传输领域前沿技术的研究人员。 视频编解码算法工程师:致力于开发和优化新型视频编码器的技术专家。 流媒体技术开发者:需要掌握最新的流媒体传输协议和优化技术的工程师。 XR/VR/AR内容开发者:对沉浸式体验的视频内容制作与分发有迫切需求的技术人员。 视频内容平台运营者:需要了解视频技术以优化内容分发、提升用户体验的管理人员。 对视频技术感兴趣的爱好者:希望系统性学习视频编码与传输领域最新进展的读者。 总而言之,《高端图像与视频新技术丛书:视频编码与传输新技术》是一部集学术性、前瞻性和实践性于一体的著作。它将带领读者穿越视频技术的最新浪潮,深入理解那些驱动着我们今日数字世界视听体验不断进步的底层力量。无论您是想在视频技术领域深耕,还是希望为未来的视频应用奠定坚实的技术基础,本书都将是您不可或缺的智囊。它不仅是知识的汇聚,更是技术创新的起点,激励着每一位读者共同探索视频技术的无限可能。

用户评价

评分

作为一名在媒体行业摸爬滚打了近十年的技术爱好者,我最近有幸接触到一本让我眼前一亮的书,虽然它最终未能完全满足我对于“高端”二字的期待,但我依然认为它有着不小的价值。首先,这本书的选题角度非常前沿,尤其是在我们这个行业,技术的迭代速度快得令人发指,尤其是视频编码和传输方面。我一直希望找到一本能够系统梳理当前最新技术动态的书,能够让我快速了解那些正在崭露头角、或者已经深刻影响行业发展的技术。这本书在这一点上确实给了我一些启发,它涉及了一些我之前仅仅略有耳闻的编码标准和传输协议,让我有了一个初步的了解。然而,我期待的是更深入的技术剖析,例如在具体的编码算法层面,能够有更详细的数学模型推导,或者对不同编码器在特定场景下的性能表现有更细致的对比分析。此外,对于新型传输网络(如5G切片、边缘计算在视频传输中的应用)的探讨,虽然提及,但深度略显不足,感觉更像是浅尝辄止,未能触及核心的挑战与解决方案。总体来说,这本书更像是一个目录,一个引子,引导读者去思考未来的方向,但如果想在此基础上立刻着手研究某个具体技术,可能还需要寻找更多更专门的资料。

评分

坦白说,这本书的装帧设计和排版布局确实很吸引人,第一眼看上去就充满了专业性和学术性。封面设计简洁大气,书籍的纸质也相当不错,翻阅起来手感很好,这对于喜欢阅读纸质书籍的我来说,是一个加分项。在内容上,它确实触及了一些我认为是当下视频技术发展中的热点和前沿领域,比如一些关于AI在视频编码中的应用,以及对更高分辨率、更高帧率视频的传输挑战的探讨。然而,在我花了相当一部分时间仔细研读后,我发现这本书的“干货”含量,与我最初的期待之间存在一定的差距。我一直在寻找能够帮助我解决实际工作中所遇到的技术瓶颈的书籍,比如在处理高动态范围(HDR)视频的编码效率问题,或者是在优化低延迟视频流传输的稳定性方面。这本书虽然提到了这些话题,但提供的信息更多的是一种概览式的介绍,对于具体的技术实现细节、算法优化策略,以及在复杂网络环境下可能遇到的实际问题和解决思路,却鲜有深入的探讨。我希望能够看到更多能够启发我思考、并直接应用于实践的深入分析,而不是停留在概念的层面。

评分

这本书的编排设计让我印象深刻,尤其是在章节的逻辑递进方面,我认为它在理论讲解和实际应用之间的衔接上做了一些有益的尝试。例如,它在介绍某个编码技术之前,会先铺垫相关的理论基础,这对于初学者来说无疑是友好的。然后,在解释完技术原理后,又会立刻引出相关的实际应用案例,这有助于我们理解这些高深莫测的技术是如何落地生根,服务于我们的日常生活的。但是,作为一名有着一定技术背景的读者,我在阅读过程中,总感觉有些地方的逻辑跳跃性比较强,或者说,对于某些关键性的技术细节的处理,作者的处理方式有些过于“点到即止”。我期望的是能够看到更多关于“为什么”的解释,例如,为什么某个编码算法能够取得更好的压缩率?其背后隐藏的数学原理是什么?又或者,在传输过程中,为什么某个协议能够有效降低延迟?这些更深层次的“解剖”并没有完全体现在书中。尽管书中提供了不少图表和示意图,但有时这些图表本身也需要进一步的解释,否则可能会让读者感到困惑。我个人认为,这本书在“面”的介绍上做得不错,但“点”的深入挖掘还有很大的提升空间,尤其是在技术原理的严谨性方面,还需要加强。

评分

作为一名对图像和视频技术抱有浓厚兴趣的学习者,我一直在寻找能够为我提供系统性知识体系的书籍。这本书的出现,让我对“高端”技术有了新的认识,也让我对未来的学习方向有了更清晰的把握。书中涵盖的一些内容,比如在图像处理与视频编码的结合方面,确实展现了一些令人耳目一新的思路。我尤其关注那些能够提升视觉效果和传输效率的技术。然而,我在阅读的过程中,发现这本书在理论深度和实践指导性之间,似乎没有找到一个完美的平衡点。很多章节的阐述都显得有些过于概括,例如,在介绍某个新的编码工具时,只是简单地列举了它的优势,但对于其核心的数学模型、算法的推导过程,以及在不同硬件平台上的性能表现,却缺乏详细的描述。同样,在传输技术方面,书中对一些先进的协议和架构的介绍,也显得不够深入,更多的是一种概念性的普及,而未能触及到实际应用中可能遇到的挑战、权衡和优化方法。我期待的是能够看到更多能够帮助我理解技术原理、掌握实现方法、并具备解决实际问题的能力的内容,而这本书在这方面,还有很大的提升空间。

评分

我一直关注着视频编码和传输领域的发展,因为这直接关系到我们日常使用的流媒体服务、视频会议以及各种在线教育平台的体验。这本书的出版,让我对这个领域的最新进展充满了好奇。我尤其关注那些能够提升视频质量、降低带宽消耗的技术。这本书确实涵盖了一些我感兴趣的方向,例如,它提到了下一代编码标准的一些特性,以及一些新型的传输技术。然而,在实际阅读过程中,我发现书中的内容虽然覆盖面较广,但很多部分的阐述都显得比较笼统,缺乏具体的技术细节和深入的案例分析。比如,在介绍某个压缩算法时,书中可能只是简单地说明其优点,却没有提供具体的实现方法、性能评估的详细数据,也没有对比它与其他算法在不同场景下的优劣。同样,在传输技术方面,对于一些新兴的协议,书中只是泛泛地提及,并没有深入讲解其工作机制、优缺点,以及在实际部署中可能遇到的问题和解决方案。我希望能够看到更多具有实践指导意义的内容,能够帮助我理解如何将这些新技术应用到实际项目中,或者如何评估和选择最适合的技术方案。

评分

图书是正版的,无破损等现象。快递十分给力,快递员服务态度良好。

评分

还可以

评分

太高深了,得好好研究。

评分

学习充电

评分

帮忙做善事,买书捐赠!希望这些书能帮到人!

评分

还可以吧 就是好多算法看不太明白 不建议初学者看

评分

书的质量不错,到货速度很快

评分

质量好,内容多,价格给力,下次还会买的!

评分

诅咒你们,还想发财

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有