图书基本信息 | |||
图书名称 | 凸优化理论 | 作者 | (美)博克斯,赵千川,王梦迪 |
定价 | 49.0元 | 出版社 | 清华大学出版社 |
ISBN | 9787302399568 | 出版日期 | 2015-11-01 |
字数 | 285000 | 页码 | |
版次 | 1 | 装帧 | 平装 |
开本 | 16开 | 商品重量 | 0.4Kg |
内容简介 | |
《凸优化理论》力图以简洁的篇幅,介绍凸优化 的一个完整理论分析框架。凸优化理论的基石在于对 偶。作者选取了*小公共点/*大相交点的几何框架 (简称为MC/MC框架)作为凸优化问题的对偶性分析 的基础框架。相比于基于函数共轭性的代数框架,MC /MC框架*适用于直观地分析和理解各种重要的优化 问题,也*适合初学者学习和理解凸优化理论。本书 可以作为高年级本科生、研究生“运筹学优化类”课 程的教材或相关研究人员的参考书。 原作者美国工程院院士博塞克斯教授有极高的 学术造诣和学术声誉,在学术专*和教材的写在方面 取得了公认的成就。 |
作者简介 | |
目录 | |
编辑推荐 | |
本书力图以简洁的篇幅,介绍凸优化的一个完整理论分析框架。凸优化理论的基石在于对偶。作者选取了小公共点/大相交点的几何框架(简称MC/MC框架)作为凸优化问题的对偶性分析的基础框架。相比于基于函数共轭性的代数框架,MC/MC框架更适用于直观地分析和理解各种重要的优化问题,也更适合初学者学习和理解凸优化理论。本书可以作为高年级本科生、研究生运筹学优化类课程的教材或相关研究人员的参考书。 原著作者美国工程院院士Dimitri P.Bertsekas教授有极高的学术造诣和学术声誉,在学术专著和教材的写作方面取得了公认的成就。 |
文摘 | |
第 1章凸分析的基本概念 凸集和凸函数在优化模型中非常有用,是一种便于分析和算法设计的内涵丰富的结构 .这个结构的主体可以归结为几条基本性质 .例如,每个闭的凸集合都可以被支撑该集合的超平面所描述;凸集边界上的每个点都可以通过该集合的相对内点集来逼近,以及包含于闭凸集的每条半直线当被平移到该集合中的任意一个点发出的时候仍然包含于该集合.不过,尽管有这些好的性质,凸集及其分析并非完全没有理论和应用上难以处理的异常和例外情况 .例如,不同于仿射的紧集,像线性变换和向量和这样的某些基本运算并不保持闭凸集的闭性不变 .这会使得某些优化问题的处理,包括优解的存在性和对偶性,变得复杂起来 .因此,有必要认真对待凸集的理论和应用的学习 .第 1章的目标是建立凸集学习的基础,特别是要强调与优化有关的问题 . 1.1凸集与凸函数本章将介绍凸集合与凸函数相关的基本概念,这些内容将贯穿本书所有的后续章节 .附录 A列举了本书将用到的线性代数和实分析的定义、符号和性质.首先我们给出凸集合的定义如下 (见图 1.1.1).定义 1.1.1 .n的子集 C被称为凸集,如果其满足 αx (1 . α)y ∈ C, . x, y ∈ C, . α ∈ 依惯例我们认为空集是凸的 .通常根据问题的背景,我们可容易地判定某特定凸集是否为非空 .然而多数情况下,我们会尽量说明集合是否为非空,从而降低模糊性 .命题 1.1.1给出了一些保持集合凸性不变的集合变换.命题 1.1.1 (a)任意多个凸集 {Ci | i ∈ I}的交集 ∩i∈I Ci是凸集. 图 1.1.1凸集的定义 .凸集中任意两点的连线线段都包含在集合内部,因此左图中的集合是凸集,而右图中的不是 . (b)任意两个凸集 C1与 C2的向量和 C1 C2是凸集. (c)对任意凸集 C和标量 λ,集合 λC是凸集 .另外,如 λ1, λ2为正标量,则以下集合是凸的, (λ1 λ2)C = λ1C λ2C. (d)凸集的闭包 (closure)与内点集 (interior)是凸集. (e)凸集在仿射函数下的象和原象是凸集. 证明证明的思路是直接利用凸集的定义 .在 (a)中,我们在交集 ∩i∈I Ci中任取两点 x,y.由于每个 Ci都是凸集,x和 y间的线段被每个 Ci所包含,因而也属于它们的交集.类似地在 (b)中,任取 C1 C2中的两点,可以用 x1 x2和 y1 y2表示,其中 x1,y1 ∈ C1且 x2,y2 ∈ C2.对任意 α ∈ 有如下关系 α(x1 x2) (1 . α)(y1 y2)= (αx1 (1 . α)y1) (αx2 (1 . α)y2).由于 C1和 C2分别是凸集,上式右侧中两个小括号代表的向量分别属于 C1和 C2,而它们的向量和属于 C1 C2.因此根据定义 C1 C2是凸集.对 (c)的证明留给读者作为练习.对 (e)可用类似 (b)的方法来证明.为证明 (d),考虑某凸集合 C,以及 C的闭包中任取的两点 x与 y.根据闭包的性质可得,在 C中存在序列 {xk}. C和 {yk}. C分别收敛到 x与 y,即 xk → x且 yk → y.对任意 α ∈ ,我们构造一收敛到 αx (1 . α)y的序列 {αxk (1 . α)ykd,由于 C是凸集,则该序列被包含在 C内.我们可得到 αx (1 . α)y属于 C的闭包,因此凸集 C的闭包也是凸集 .类似地,在 C的内点集中任取两点 x与 y并构造分别以 x,y为中心且半径 r足够小的开球,使得它们都被包含在 C内.对任意 α ∈ ,构造以 αx (1 . α)y为中心 r为半径的开球 .则该球内的任意点都可表示为 C中向量 x z和 y z的凸组合 α(x z) (1 . α)(y z),其中 IzI (ii)函数 f为下半连续的. (iii)集合 epi(f)为闭. 证明如果 f(x)= ∞对所有 x成立,那么结果是平凡的,显然成立 .n我们假定 f(x) < ∞对至少一个 x ∈ 成立 .这样 epi(f)就是非空的,且 f至少有一个非空的水平集.先来证明 (i)蕴含 (ii).假定水平集 Vγ对于每个标量 γ都是闭的.反设 f(x) > lim inf f(xk)k→∞ 对某个 x和收敛到 x的点列 {xk}成立,并且令 γ为满足 f(x) >γ> lim inf f(xk)k→∞ 的标量 .那么必存在子列 {xk}K使得 f(xk)《 γ对所有 k ∈K成立 .于是 {xk}K . Vγ成立 .由于 Vγ是闭的, x必然也属于 Vγ,于是 f(x)《 γ,从而导出矛盾.n下面证明 (ii)蕴含 (iii).假定 f在 上为下半连续,并令 (x, w)为点列 {(xk,wk)d . epi(f)的极限 .于是我们有 f(xk)《 wk,进而令 k →∞,由 f在 x处的下半连续性,我们得到 f(x)《 lim inf f(xk)《 wk→∞ 于是,(x, w) ∈ epi(f),故 epi(f)为闭.后证明 (iii)蕴含 (i).假定 epi(f)为闭,且令 {xk}为点列,它收敛到某个 x且属于对应于某个标量 γ的水平集 Vγ .于是 (xk,γ) ∈ epi(f)对于所有的 k成立,并且 (xk,γ) → (x, γ),因而由于 epi(f)为闭,我们有 (x, γ) ∈ epi(f).故 x属于 Vγ .这意味着这个集合是闭的.口在大部分推导中,我们倾向于采用闭性的概念,而较少用到下半连续性.其中的一个原因是,不同于闭性,下半连续性是一个与定义域有关的性质.例如,由 / 0,x ∈ (0, 1);f(x)= ∞, x/∈ (0, 1).定义的函数 f : → (.∞, ∞]既不是闭的也不是下半连续的;但如果把它的定义域限制到 (0, 1)上,就变成为下半连续 .另一方面,如果函数 f : X → 具有闭的有效定义域 dom(f)且在每个 x ∈ dom(f)处均为下半连续,那么 f必然是闭的 .我们把这个结论叙述为一个命题.其证明可以据命题 1.1.2证明 (ii)蕴含 (iii)的过程给出. 命题 1.1.3令 f : X → 为一函数 .如果它的有效定义域 dom(f)是闭的,且 f在每个 x ∈ dom(f)处均是下半连续的,那么函数 f是闭的.举例来说,集合 X的示性函数为闭当且仅当 X是闭的 (“当”的部分可以根据上述命题得出,而“仅当”的部分可以用上图的定义导出 ).更一般地,如果 fX是形如 / f(x),x ∈ X fX (x)= ∞,其他的函数,其中 f : n →为连续函数,那么可以证明 fX是闭的当且仅当 X是闭的.后需要指出非真的闭凸函数非常特殊:它不能在任何点上取有限值,因此它具有如下形式 / .∞,x ∈ dom(f),f(x)= ∞, x/∈ dom(f).n为明白其中的原因,让我们来考虑非真的闭凸函数 f : → ,并假定存在着某个 x使得 f(x)为有限 .令 x满足 f(x)= .∞ (这样的点必然存在,因为 f是非真的并且 f不恒等于 ∞).因为 f是凸的,可知每个点 k . 11 xk = x x, . k =1, 2, ···kk 都满足 f(xk)= .∞,同时有 xk → x.因为 f是闭的,这意味着 f(x)= .∞,从而导出矛盾.总之,非真的闭凸函数在任何点都不能取有限值 . 1.1.3凸函数的运算我们可以通过几种途径来验证函数的凸性 .像仿射函数 (a.ine func-tions)和范数 (模,norms)这样的一些常见函数是凸的 .多面体函数 (poly-hedral function)是一类重要的凸函数,根据定义是真凸函数,且其上图是多面体 (polyhedral set).从已知的凸函数出发,可以通过保持凸性的运算来生成其他凸函数.保持凸性的主要运算如下: (a)与线性变换做复合运算. (b)与非负标量相加或相乘. |
序言 | |
本书的目标是给出以下两个主题的易懂、简洁和直观的展示 . (a)凸分析,特别是与优化的联系 . (b)优化与小大问题的对偶理论,特别是在凸性框架中的情形 .它们是在广泛的实际应用中相关的两个主题.优化的重点在于推导出约束问题存在原始和对偶优解的条件 .约束问题的例子是 minimize f(x) subject to x ∈ X, gj(x) . 0,j =1, ··· , r. 其他类型的优化问题,包括从 Fenchel对偶性产生的问题,也属于我们考虑的范围.小大问题的重点是推导保证等式 inf sup φ(x, z) = sup inf φ(x, z)x∈Xz∈Zz∈Zx∈X 成立,以及下确界 “inf”和上确界 “sup”可取到的条件.凸性的理论内容介绍得比较详细 .囊括了这个领域几乎所有重要的方面,对于凸优化中核心的分析问题的展开是足够了 .数学预备知识是线性代数和实分析的入门知识 .附录中包含了用到的有关知识的总结 .除了这些少量背景外,本书的内容是自足的,严格的证明会贯穿全书 .线性和非线性优化理论的先修知识不是必需的,尽管作为背景知识无疑它们是有帮助的 .我们的目标是尽量发挥凸性理论在以一种统一的方式建立强的对偶性方面的作用 .为此,我们的分析常会偏离 Rockafellar 1970年的经典著作的思路,而是遵从 Fenchel/Rockafellar的框架 .例如,我们采用不同的方式来处理闭集相交理论和线性变换下闭包的保持 (1.4.2和 1.4.3节);我们用约束优化情形下的对偶性来发展次微分运算 (5.4.2节);此外,我们没有凸优化理论使用下确界卷积 (in.mal convolution)、函数图像 (image)、极性集合和函数 (polar sets and functions)、双函数 (bifunctions)和共轭鞍点函数 (conjugate saddle functions)等概念 .类似于 Fenchel/Rockafellar,我们的理论体系是基于 Legendre/Fenchel共轭的思想,不过相比之下,在几何和可视化方面要来得直观得多.我们的对偶框架是基于两个简单的几何问题:小公共点问题 (min mon point problem)和大相交点问题 (max crossing point problem).小公共点 /大相交点 (MC/MC)框架的突出优点在于其几何上的直观性.借助这个框架,对偶性理论的核心问题都变得显然,并且可以采用统一的方法处理 .我们的方法是先在 MC/MC框架里得到许多广泛可用的定理,然后把它们用于解决特定问题 (约束优化、 Fenchel对偶性、小大问题等)上.我们处理所有对偶性问题 (对偶间隙的存在性、对偶优解的存在性、对偶优解集合的结构 )和其他问题 (次微分理论、择一定理、对偶间隙估计)都按照这样的思路.从根本上说, MC/MC框架与共轭性框架存在着密切的联系 .也正因为如此, MC/MC框架在理论上很有用也有一般性 .不过,这两个框架在分析对偶性和提供几何解释上扮演者互补的角色:共轭性强调函数 /代数描述,而 MC/MC强调集合 /上图描述 . MC/MC框架更简单,而且看起来更适合可视化和研究强对偶性和对偶优解的存在性问题 .共轭性框架,由于强调函数的描述,更适合凸函数的数学运算比较复杂,而且共轭函数的计算可以用于分析和计算.本书源自作者早期的著作 (与 A. Nedi′c和 A. Ozdaglar合著 ),但具有不同的特点 . 2003年的书内容很多,从结构上更像是学术专著,目标是利用非光滑分析的概念建立凸的和非凸的优化问题之间的联系 .本书的组织与此不同,本书集中于介绍凸优化问题 .尽管有这些区别,两本书在写作风格、数学基础和某些内容上还是有共同之处 .本书各章的内容如下:第 1章:本章给出后续各章描述对偶性理论所需要的全部凸分析工具 .会介绍基本的代数概念,如凸锥、超平面、拓扑概念,如相对内点、闭包、线性变换下闭性的保持,超平面分离 .另外,本章还会给出与对偶和优化相关的特定概念,如回收锥和共轭函数 .第 2章:本章介绍多面体凸性概念:顶点、 Farkas和 Minkowski-Weyl定理及其在线性规划中的应用 .在后续章节中不会用到,首次阅读时可以跳过 . 前言 XI第 3章:本章集中在优化的基本概念上:极小值的类型、解的存在性和对偶理论专题,如部分小化和小大理论 .第 4章:本章介绍 MC/MC对偶框架 .我们会讨论它和共轭理论之间的联系,及在约束优化和小大问题上的应用 .本章后给出与强对偶性和对偶优解存在性有关的应用广泛的定理.第 5章:本章把第 4章的对偶定理应用到线性规划、凸规划和小大理论等专题上 .我们还应用这些定理作为进一步发展凸分析工具的辅助 .这些工具包括强有力的 Farkas引理的非线性版本、次微分理论、择一定理 .后一节主要侧重于可分问题,给出非凸问题和对偶间隙的估计 .为了简洁起见,我们略去了教师们可能会感兴趣的一些话题 .例如把理论应用到特定结构的问题 ; Boyd和 Vanderbergue的著作 ,以及我和 John Tsitsiklis合著的关于并行与分布式计算的著作 包含了这方面的许多材料 (这两本书都可在线访问).另外一个忽略的重要部分是计算方法 .不过,我补充了一个很长的第 6章 (超过 100页),其中有常见的凸优化算法 (和一些新算法),并且可以从本书的网站下载 (.athenasc./convexduality.html).本章和更全面的凸分析、优化、对偶性以及算法等内容一起,将成为作者正在编著的教材的一部分 .到那时,本章将在对偶性之外,为教师们提供凸优化算法内容 (如作者在麻省理工学院所做的 ).本章是一个定期更新的 “活”的章节 .它的当前内容是 :算法方面的第 6章: 6.1.问题结构与计算方法; 6.2.算法中的递减性 ; 6.3.次梯度法 ; 6.4.多面体近似方法 ; 6.5.邻近性和 Bundle方法 ; 6.6.对偶邻近点算法 ; 6.7.内点法 ; 6.8.近似次梯度法 ; 6.9.优算法和复杂性.虽然作者没有在书中提供习题,但是在本书的网站上提供了大量的习题 (并附有详细的解答 ).读者 /教师也可以使用 中给出的章节后习题 (共 175道).这些习题的风格和符号与本书类似 .习题解答在本书的网站可以下载,也可以在线获取 (.athenasc./convexity.html).本书可以作为凸优化理论课程的教材,作者在过去十年在麻省理工学院和其他场所教授过类似课程 .本书也可以作为非线性规划课程的补充材料,或者作为凸优化模型 (而不是理论)方面课程的理论基础.本书的组织使得读者 /教师可以选择性地使用其中的内容 .例如,第 2章多面体凸性的材料完全可以略去,因为第 3~5章完全不涉及这部分内容.类似地,小大理论 (3.4,4.2.5和 5.5节)可以被略去;并且如果是XII凸优化理论这样,那么 3.3和 5.3.4节这些使用部分小化工具的内容也可以略去 .另外,5.4~5.7节处在 “末端 ”,都可以略去而不会影响其他章节 .如作者在麻省理工学院的“非线性规划”课程 (加上网站上补充的关于算法的第 6章)上所做的,一种 “小的”选项包含以下内容: .第 1章,除去 1.3.3和 1.4.1节. .第 3.1节. .第 4章,除去 4.2.5节. .第 5章,除去 5.2,5.3.4和 5.5~5.7节.这种组合侧重于非线性凸优化,而完全不涉及多面体凸性和小大理论.作者感谢同事们对本书的贡献 .作者与 Angelia Nedi′c和 Asuman Ozdaglar在他们的 2003年的著作上的合作为本书打下了基础 . Huizhen (Janey) Yu仔细阅读了本书部分内容的早期书稿,并给出了一些很有启发的建议 . Paul Tseng通过与作者在集合相交理论方面的合作研究,对本书做出了实质性的贡献 .部分体现在 1.4.2节 (这项研究受到与 Angelia Nedi′c的早期合作的启发 ).非常感谢 Dimitris Bisias,Vivek Borkar,John Tsitsiklis,Mengdi Wang和 Yunjian Xu等学生和同事提供的反馈信息 .后,作者希望感谢课堂上的许多学生所不断提供的动力和灵感 . |
评分
评分
评分
评分
评分
评分
评分
评分
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有