2022-01-13 21:39:18
先声明一下,这篇帖子对数学基础不好或者抽象能力不强的人不友好,建议不要浪费时间。不过希望工程师们看看,也许有启发,因为泛函分析现在是高水平工程师混饭吃的标配,傅立叶变换,小波分析,最优控制,数学规划,资源最优配置,偏微分方程数值求解,有限元分析,弹性力学数值计算等等等等,基础都是泛函分析。
这是介绍数学思维方式的最后一部分。主要介绍抽象思维的强大。
由于泛函分析是古典数学和现代数学的桥梁,是古典数学分析,代数和几何以现代观念交叉在一起发展起来的学科,是数学承先启后的门槛,又有广泛的应用,既是所有优化资源配置技术的基础,又是所有控制技术的基础,更是化繁为简的利器。
我在实际工作中体会是几门数学学科在实际应用上的地位是:微积分就像是钢丝钳,粗活细活都能干,凡是能够定义连续因果关系的问题,用微积分试一下没错;线性代数就像是螺丝刀,凡是离散问题,定义线性关系,就能试图找一下构造基(特征根),把问题分解投影到基上,就能分而治之;数理统计就象是扳手,碰到没有明显因果关系的糊涂乱麻问题,先寻找一下趋势外推或线性拟合,找一下统计相关性;实在碰到无法下嘴的问题,只能是数值逼近或数值模拟了。不过泛函分析是很特殊的工具,类似电钻,可以把困难问题彻底击穿,找到本质。当然数理方程是工程师的电锯,有招没招锯一下,大卸八块找原理。作为一个现代工程师,如果工具箱里没钢丝钳,螺丝刀,扳手,榔头,电钻,电锯,可能心中没底,觉得自己全身赤裸,裸奔的工程师,没法见人。其实现在工程师会不会计算并不重要,因为现在都有现成的计算软件包,关键是在一堆现象中发现问题,定义问题关键因素,并对解决问题知道用什么工具。
泛函分析是把代数(泛函分析有人就称为无穷维空间线性代数),分析(泛函就是把函数当成自变量的广义函数),几何(泛函分析的主要对象之一就是函数组成的赋范空间)整合在一体的学科,是现代数学的门槛,学过泛函分析,基本就算看到现代数学大门了。
泛函分析不管是研究对象,概念,还是得到的结论,都远远超出了人类直觉、经验和常识的能力,充分展示了人类抽象能力的强大。
先说说什么是泛函,泛函就是以函数为自变量的函数。举例来讲,老鹰在空中追兔子,它锁定兔子的最佳攻击路径是一条基于与兔子位置相关和时间相关的二维曲线,也即一个函数,但是兔子还会不断变化自己逃跑路径,所以这条攻击曲线或攻击函数在不断变化,这样老鹰追兔子行为的数学模型就是一个以函数为变量的函数。
这个帖子的主要参考教材有(从易到难):《实变函数论与泛函分析》下册,夏道行 吴卓人 严绍宗 舒五昌 ,人民教育出版社;《泛函分析讲义》,张恭庆, 林源渠, 郭懋正,北京大学出版社;《泛函分析》,拉克斯(PeterD.Lax),人民邮电出版社。
这篇帖子重点介绍泛函分析(Functional Analysis)来源和发展。
泛函概念是阿达马19世纪末基于变分法中出现的函数的函数概念给出的。
早在1696年约翰·伯努利(Johann Bernoulli)提出最速曲线问题时,人类就涉及了泛函概念。但是当时并未能够抽象到泛函概念(以函数为自变量的函数),而是用传统函数思维方式处理,也就是变分法。
欧拉在1733年《变分原理》解决了最速曲线问题。1786拉格朗日提出了变分法一般解决方式,得到了著名的欧拉—拉格朗日方程(后面我们会介绍基于现代泛函分析角度的变分法概要:按照泛函观点,变分法的本质是研究形如J[y]=∫_a^bF(x,y,y’)积分方程的极值,函数 y=y(x)是在某个集合Y上变动,例如Y可以是[α,b]上具有连续导函数(或再附加一定的约束条件,如y(α)=0,y(b)=1等)的函数的全体。所以J[y]是一个以函数y为变量的函数的函数,也即一个泛函。在介绍微积分的帖子中,我们说过,微积分是求解以数 x为自变量的函数f(x)的极值,变分法是研究以函数y为自变量的函数J[y]极值。在变分法中,函数y 本质上被视为点,因为类似于微分思想,在求解泛函J[y]的极值时,需要考虑函数y_0相邻近的一切函数。泛函分析把变分思想进行升级: 当把函数当成点后,与函数点之间的本质区别其实就是某种衡量远近的几何度量的不同,当把某些函数构成的集合定义为具有某种度量的的空间后,微积分的许多思想就能借用了)。
真正奠定现代泛函分析思想和框架的是希尔伯特和巴拿赫,而推动泛函分析发展的是冯·诺伊曼。
1、泛函分析起源于纯数学研究
泛函分析奠基性工作主要来源于:Fredholm和Hilbert关于积分方程的工作,Volterra 和Hadamard 关于动量问题的研究,Hahn 和Banach关于对偶概念的研究, Lebesgue, Frechet ,Banach和 Riesz 在抽象空间上的研究。
限于篇幅,我们下面只介绍关键的希尔伯特和巴拿赫的工作。
(1)、希尔伯特关于积分方程的工作
最早的积分方程来源于傅立叶研究热问题。1822年,傅立叶讨论了如果去逆向解如下积分方程:
f(x)=∫e^itx*g(t)dt
也就是已知f,怎么求出g。
现代的语言中,这其实就是求傅立叶变换的逆变换。傅立叶证明了g(x)=1/2πi(∫e^-itx*f(t)dt), 也即反傅立叶公式。
Abel提出一个类似的问题:假设我们知道一个曲线y=f(x)满足f(a)=0,我们想要找出g满足:
f(x)=∫_a^xg(y)/√(x-y)dy
Abel证明了g(x)=1/π(∫_a^xf’(y)/√(x-y)dy)
Liouville在研究二阶常微分方程的时候发现上述问题等价于一类积分方程。比如方程:f”+f=g如果满足边界条件f(a)=1,f’(a)=0,利用这个方程的基本解可以证明方程的解满足:
f(x)=cos(x-a)+∫_a^xsin(x-y)*g(y)dy
也即二阶的常微分方程也可以等价于某一类积分方程。
基于上述工作,Fredholm和Hilbert总结为:
积分方程都可以归类为下面的两种形式(后世称之为第一类和第二类积分方程):
∫_a^bK(x,y)f(y)dy=g(x)和λf(x)-∫_a^bK(x,y)f(y)dy=g(x)
其中a,b,g给定,目标是求解出f。函数K(x,y)被称为这个方程的核,一般假设这是一个容易求解的函数。
瑞典数学家Ivar Fredholm在1903年第一个给出了这两类方程严格的处理方法:他的思想就是著名的Fredholm二择一原理:如果K(x,y)是某类正则对称核(K(x,y)=K(y,x)),第二类方程
λf(x)-∫_a^bK(x,y)f(y)dy=g(x) 和其次方程λf(x)-∫_a^bK(x,y)f(y)dy=0
满足: 对于任何复数λ,第一个方程对于某个g∈L^2(a,b)有解当且仅当第二个方程的所有解v满足∫_a^bgvdx=0。
也即以下两个情况只能二选一
★第一个方程对于任意g∈L^2(a,b)有解。
★第二个方程有非零的解。
所以要证明第一种情况只需要证明第二个不可能成立即可。
Hilbert看完Fredholm的工作后,建立了积分方程的根本理论:Hilbert的基本思想是考虑了如何用双线性形式(双线性的定义是设X,Y都是向量空间,f 是直积,X×Y={(x,y)|x∈X,y∈Y},是一个映射。如果 f 满足f(a_1x_1+a_2x_2,y)=a_1f(x_1,y)+ a_2f(x_2,y),f(x ,b_1y_1+b_2y_2)=b_1f(x,y_1)+ b_2f(x,y_2),
则称 f 是双线性型)来处理Fredholm提出的问题,为此他定义了内积(一种向量乘积,用矩阵表达。这是希尔伯特把函数看成函数构成的向量空间的一个向量的原始思想来源,为后来希尔伯特空间概念提出奠定基础,这也是泛函分析最主要的思想源泉),把源问题写成:f-λkf=g , 后乘上一个函数u变成了
(u,f)- λ(u,kf)=(u,g),任给u∈L^2(a,b)
希尔伯特把满足方程φ_n(x)=λ_n* ∫_a^bK(x,y)φ_n(y)dy的的函数φ_n(x)称为特征函数,而λ_n为特征向量。 他证明了:如果λ_n不同,则对应的特征向量是正交的: ∫_a^bφ_n(x) φ_m(x)dx=0(类似正定对称矩阵不同特征值对应的特征向量也是正交的)。
他证明了如果K(x,y)是对称而且连续的,任何两个连续函数的乘积满足
∫_a^b∫_a^b K(s,t)x(s)y(t)dsdt=∑_n=1^m1/λ_n(∫_a^bφ_n(s)x(s)ds)(∫_a^bφ_n(s)y(s)ds)
这里的m可能是有限或者无限。在无限的情况下,这个积分对于任何属于L^2(a,b)上的函数都成立。用内积的记号,可以写成
(Kx,y)= ∑_n=1^m 1/λ_n(φ_n,x)( φ_n,y),
他证明了:
如果存在g使得f(x)= ∫_a^bK(x,y)g(y)dy成立,那么f=∑_n=1^m c_n*φ_n,
其中c_n=∫_a^bφ_n(x)f(x)dx, 希尔伯特定义这个展开方式叫广义傅立叶级数,而c_n叫广义傅立叶系数。
希尔伯特上述工作本质是:利用正交展开将积分方程求解问题化成无限阶的线性方程组求解问题,并在此基础上实际引入无限维(实)欧几里得空间l^2,即满足∑_n=1^∞|a_n|^2<∞的实数列a=(a_1,a_2,…,a_n,…)全体。他提出了l^2上有界双线性形式、有界线性形式(即所谓连续线性泛函)以及两种收敛(即所谓的强、弱收敛)等概念,给出了l^2上的选择原理(即所谓的闭单位球的弱紧性),还发现连续谱的存在等等。
上述工作为积分方程建立了基础,为系统化的理解积分方程展开了方向:对数学分析的系统化;对任意函数的级数展开建立逻辑基础;这就是泛函分析后来的展开方向,也为微分方程数值逼近,变分法和位势理论(potential theory)发展提供了原始思想。
显然,希尔伯特工作还未完全建立泛函概念,因为在20世纪初,函数的概念还仅仅是解析表达式,并未有今天:函数就是一个集合到另外一个集合的映射这种理解。所以希尔伯特在积分方程中定义内积概念时,碰到如何定义函数的函数概念的困难((u,f)就是一个以函数为变量的函数)。
真正理解现代函数概念,并完整提出现代泛函概念的是其他数学家,现代数学定义函数是通过映射,也即函数是一个集合映射到另外一个集合的映射,所以理解函数的函数概念易如反掌。具体内容在微积分介绍函数时已经介绍,不重复。
(2)、希尔伯特以后的后续工作
弗雷歇(Frechet)提出了以具体函数类为背景的抽象度量空间概念,并完善推广了度量空间中的紧性、完备性、可分性等基本概念。
希尔伯特的学生施密特(Schmidt)系统的发展了l^2的空间理论。他在希尔伯特工作基础上,把所有∑_n=1^∞|a_n|^2<∞的实数列集合在一起构成l^2,并在这个集合上定义了内积:
<x,y>=∑_n=1^∞x_ny_n^-
内积本质是比较l^2上任意两个元素,特别的范数是:
‖x‖=√(x,x)=√(∑_n=1^∞|x_n|^2),以下的三角不等式成立:
‖x+y‖≤‖x‖+‖y‖
同时Schmidt和Frechet定义了L^2:这个空间由所有满足
∫_a^b|f|^2dx<∞的Lebesuge可测函数构成,在这个空间也能定义内积:(f,g)=∫_a^bf g^-dx
g^-是 g(t)的共轭(复数域),从而也可以定义范数:
‖f‖=√(f,f)=√(∫_a^b|f|^2ds)
Riesz在上述基础上证明了下面的结果:
如果一个(φ_n)是一列n充分大的单位正交列(即φ_i, φ_i)=1,(φ_i, φ_j)=0,当i≠j,)而a_n =∫_a^bφ_n(x)f(x)dx,(也即a_n是f(x)傅立叶系数),那么∑_n=1^∞a_n^2<∞成立的充分条件是存在f∈L^2使得
∫_a^bf(s) φ_n (x) dx=f(x)成立,也即 f(x)的傅里叶级数收敛于f(x)(同时也证明了:{a_n}为L^2[a,b]中某个函数的傅里叶系数的必要条件是∑_n=1^∞a_n^2<∞)。
这个定理说明l^2和L^2的元素是一一对应的(这个定理的特例就是傅立叶展开)。
这是泛函分析的基础定理。
根据上述定理,可以证明希尔伯特空间的共轭空间(共轭空间就是赋范空间X上的全体线性连续泛函所组成的线性空间X^*),它与自身(保持范数不变地)同构(也叫共轭线性同构),这个结果在希尔伯特空间算子理论中具有很重要的作用。
在上述基础上,Schmidt在1908年给出了正交、闭集、向量子空间的定义,并证明在闭向量子空间上投影的存在性。这是几何概念正式进入了泛函分析。
1902年勒贝格积分出现,为希尔伯特工作的进一步发展提供更好的工具,在此基础上,里斯引入平方可积函数空间L^2[α,b],证明了它的完备性、可分性,将弗雷德霍姆理论推广到K(x,y)是矩形[α,b]×[α,b]上平方可积函数的情形。
然后是泛函分析对偶理论(用连续性条件来刻画一定函数类上的连续线性映射T:E→F)的发展。1903年阿达马在E是C[α,b]([α,b]上连续函数的全体),F是实数域,当{f_n}一致收敛于ƒ 时,T f_n→Tf的情况下,将T 表示成一列积分的极限的形式。但这种表示不惟一。
后来弗雷歇和里斯在实l^2空间上,独立地在T 是强连续假设下给出简单而惟一的表示,即希尔伯特空间l^2上的连续线性泛函表示定理。里斯又给出C[α,b]、L^p[α,b]、l^p(p>1)上的表示定理。在这些表示定理实质上就是证明了线性子空间(又称向量子空间)上连续线性泛函必可延拓到全空间的定理。
黑利1921年用赋范数列空间代替具体的C[α,b]、Lp[α,b]、l^p等而考虑抽象形态的延拓问题。
至此,现代泛函分析的框架就基本完成了。
(3)、弗雷歇(Frechet)对数学分析的抽象公理化
泛函分析发展的另外一个重大突破是把数学分析现代化了,建立了公理化体系。
弗雷歇认为,希尔伯特用一串无限的数列(广义的傅立叶系数)来替换函数,然后他去处理那些数列而不是函数本身。这本质上就是在无穷维空间建立一种坐标概念(在正交基上的投影是傅立叶变换的典型手段,也是处理复杂问题的主要手段,而正交基本质上就是一种坐标系),这是一个最本质的突破,也是超出人类直觉的发现。
但是Frechet认为,数学分析不能依靠坐标去定义微分(古典微积分定义微分是需要坐标概念的,这一点限制了对泛函求导,因为泛函没有坐标,或者说是无限维的)。否则分析的方法无法抽象到一般无穷维空间,他认为广义分析或者说泛函分析只需要基于集合论和集合(空间)中极限(本质上就是点集拓扑)这种基础就能完全建立起来,坐标是多于概念。
基于上述思想,他定义了度量空间:也就是一个函数的集合,其中任何两个函数之间都可以定义距离(比现在抽象的度量狭隘一点),并且在集合上附加一个结构,使得这个集合中元素之间可以相互比较差异。这个想法是革命性的。这就是数学分析公理化的思想。根据上述思想,弗雷歇写出第一本泛函分析的教程,奠定了现代数学分析基础。这本教程影响了一大批人,包括大名鼎鼎的Hausdorff。
(4)、巴拿赫的工作
巴拿赫的最大贡献在于推广了弗雷歇的思想,认为泛函的本质概念就是空间之间的映射(也即函数的函数),并提出了赋范线性空间这个概念,并且研究了上面的一些非常重要的算子性质。
巴拿赫定义的赋范线性空间就是线性空间X如果带有一个范数。他定义的一般的的范数是:‖.‖:X→[0,∞)本身是一个X上的函数,满足下面几条性质即可:存在零元素;对于任何a∈R,f∈X, ‖af‖=|a|‖f‖;‖x+y‖≤‖x‖+‖y‖;如果lim_m,n→∞‖x_n-x_m‖=0成立,那么存在x∈X使得lim_ n→∞‖x_n-x‖=0(完备性)。
也即巴拿赫空间就是完备的赋范线性空间。
巴拿赫定义最大的突破是:可以不再依赖坐标定义极限,连续,可微,可积等等数学分析中基本概念了,因为他定义的范数和完备性,是不依赖坐标的抽象定义。在巴拿赫空间中,定义函数连续:一个映射F:X→X如果满足对于任意lim_ n→∞‖x_n-x‖=0的数列x_n, lim_ n→∞‖F(x_n)-F(x)‖=0成立, 那么称这个函数是连续的。用L(X)表示所有从X映到自身的线性连续函数构成的集合。
当不需要坐标去定义导数,就能够定义一个函数的函数的导数:函数一个函数F:X→X在某一点x可导当且仅当存在一函数A∈L(X)使得
‖F(x+δ)-F(x)-Aδ‖=0(δ)。A就是F的导数,记为F’(x)。这样无限维微积分就建立了。
(5)、巴拿赫空间后续发展
后来,在许多具体的无限维空间以及它们上面相应的收敛性陆续被证明后,E.哈恩、巴拿赫和N.维纳在1923年提出了抽象形态的线性空间(向量空间)定义和按范数收敛的概念,哈恩提出了共鸣定理,1927年H.施坦因豪斯和巴拿赫用完备度量空间的第二纲性(baire纲定理)证明了共鸣定理(设X是巴拿赫空间,Y是赋范线性空间,
则从X到Y的一族有界线性算子的范数集是有界的。所以共鸣定理也叫一致有界性原理或巴拿赫-施坦豪斯定理),根据这个定理,巴拿赫证明了著名的压缩映射的不动点定理(大名鼎鼎的不动点定理构建了整个微观经济学的基础)、开映射定理。
1927年巴拿赫--哈恩证明了巴拿赫空间上泛函延拓定理,这个定理为局部凸拓扑线性空间理论奠定了基础,这是资源最优配置算法的理论基础。
1931年巴拿赫在《线性算子理论》一书中证明了巴拿赫空间上连续线性算子值域不是第一纲集便是全空间,并给出闭图像定理。至此,巴拿赫空间理论已基本形成,以它为基础,建立了整个泛函分析大厦,而且是泛函分析应用中的最强有力工具。
(6)、算子谱论
希尔伯特的工作还引导出泛函分析另外一个主要发展方向:算子谱理论。
算子就是对任何函数进行某一项操作都是一个算子,例如包括但不限于加减乘除,求幂次,开方,微分,积分,取概率(概率是集合{X<x}(实数集的子集)对[0,1]区间的一个映射),等等。严格讲,算子就是集合之间映射,就是集合之间关系,就是某空间上定义的集合的变换。
在泛函分析中,常见的算子有微分算子,梯度算子,散度算子,拉普拉斯算子,哈密顿算子等。
算子的定义并不限于有限函数空间,是定义在一般空间的,例如度量空间,向量空间,赋范向量空间,内积空间, Banach空间,Hilbert空间等等。算子还可分为有界的与无界的,线性的与非线性的等等类别。
算子的谱就是算子的特征值(对于有限维空间上的算子,谱论讨论的就是研究对应矩阵的特征值、特征空间以及若尔当分解等性质)。例如对于一个输入和输出函数类型相同的算子T,满足T(f)=kf的k称为算子T的特征值,相应的f称作T关于k的特征函数。这是线性代数特征值概念的直接推广。
对于有限维空间X上的线性算子A,A的谱点就是特征值。可以证明空间X按这些特征值可以分解成若干个关于这个算子的不变子空间,相应的正交化的特征向量是X中的 一组标准正交基,空间中的任意一个元素x可以用这组正交基表示出来,也即x可以分解为正交基上的投影,(A作用的形式是放大、缩小特征值的倍数)。
所以特征值刻画了有限维空间上线性算子的基本性质,在无穷维空间,根据线性算子谱(特征值)也能类似的刻画线性算子的性质。当然泛函分析讨论的线性算子谱理论比限维空间的情况复杂得多,线性算子的谱理论不仅仅包含特征值,还可以有连续谱、剩余谱等。
抽象谱论是里斯开始的,他的思想直接源头是弗雷德霍姆理论,他的这个理论与有限阶线性方程组求解理论极其相似。1918年,里斯在l^p和C[α,b]上,用算子代替希尔伯特的双线性形式,在巴拿赫空间上引入全连续算子概念,得到l^2上有界自共轭算子A的谱分解:f(A)=∫_a^bf(λ)dE_λ,其中f是[α,b]上的连续函数,{E_λ}是l^2上一族投影算子。这个定理对希尔伯特发现的连续谱做出了很好的解释。也即非特征值的连续谱所相应的是广义特征向量。
谱理论真正的应用在量子力学中。因为物理上可观察量的性质与希尔伯特空间上自共轭算子的性质一致,这个里斯谱分解定理提供了一个算子所作用的向量空间的标准分解,也称称为谱分解,特征值分解,或者特征分解。
这方面作出最大贡献的是冯·诺伊曼。1926年冯·诺伊曼发现物理学家所必须运用的狄拉克δ函数有逻辑矛盾,为此引入抽象的希尔伯特空间概念(希尔伯特空间定义就是冯·诺伊曼提出来的),并把物理学上的可观察量以及奇异积分方程、微分方程中出现的无界算子给出了无界自共轭算子的谱分解,并发现对称算子和自共轭算子的区别,建立了对称算子亏指数理论,又给出了酉算子和正常算子谱分解,证明了量子力学中交换关系的表示在酉等价意义下是惟一的(即量子力学体系的数学描述本质上只有一种,这是很伟大的发现,也是超出直觉的发现,使薛定谔的波动方程和海森堡矩阵力学不再扯皮)等等,为非正常算子谱论和巴拿赫空间算子谱论提供一个基础。
巴拿赫的《线性算子理论》一书问世以及冯·诺伊曼的《量子力学的数学基础》一书问世,标志着泛函分析已作为独立的数学分支学科诞生。
以上内容可以参考布尔巴基学派奠基人之一迪多涅的名著《泛函分析历史》。
2、量子力学推动了泛函分析发展
泛函分析作为学科的形成,以致它的整个发展,至今主要是围绕着对偶理论和算子谱论展开的,而这是冯·诺伊曼从研究量子力学数学化引入的概念,被巴拿赫完善的。
这一部分主要介绍冯·诺伊曼的工作。具体内容可以参看其经典名著《量子力学的数学基础》。
量子力学的公理化和数学基础是冯·诺伊曼建立的。核心是引入了算子代数。
1926年,冯·诺伊曼来到哥廷根大学,跟随希尔伯特研究数学,但是被哥廷根大学的量子力学工作吸引,当时冯·诺伊曼发现量子力学数学基础很混乱,例如海森堡、玻恩和泡利从微观粒子的粒子性出发建立的矩阵力学,薛定谔从波动性出发建立的波动力学互相之间无法兼容统一,尽管后来薛定谔用狄拉克和约当发展的线性变换理论证明了两者的等价性,但是量子力学仍然是一团乱麻,以至于当时认为世界上只有3个半人懂,冯·诺伊曼认为可以通过建立形式化的数学体系和一体化框架,可以统一这两种量子力学体系。
在介绍冯·诺伊曼工作之前,我们得回顾一下量子力学的基本假设。
首先是学过大学普通物理都知道的玻尔的基本假设。玻尔为了解决原子结构和原子光谱提出了三条基本假设:
★定态假设: 电子在原子中, 可以在一些特定的圆轨道上运动, 而不辐射电磁波, 这时原子处于稳定状态(定态) 并具有一定的能量。
★量子化条件: 电子以速度v在半径为r的圆周上绕核运动时, 只有电子角动量 l 等于h / 2π的整数倍的那些轨道才是稳定的,也即
l=mrv=nh/2π,其中n=1, 2, 3, . . . 称为主量子数。
★跃迁假设: 当原子从从高能量E i 的轨道跃迁到低能量E f
的轨道上时, 要发射能量为 hv= E i- E f 的光子。
基于上述假设(当然还有其他人的假设,例如普朗克假设等等,但是不是很本质,就不重复了),薛定谔和海森堡分别得到量子力学的五条基本假设(参照狄拉克的《 Principle of Quantum Mechanics》,有中译本。这是目前绝大多数量子力学五大公设之说的由来)。
量子力学五条基本假设:
★波函数假设:微观物理系统的状态由一个波函数完全描述。
一个微观系统包含着若干个粒子,当这些粒子按照量子力学的规律运动,称此系统处于某种量子状态,简称量子态。波函数是粒子位置和时间的复函数,当一个微观系统的波函数得确定时,该系统的全部性质都可以由此得出,即波函数表征了系统的量子态。
为了保证波函数具有物理意义,它必须满足连续性、有限性和单值性条件。
量子力学表征状态的这种方式与经典力学是完全不同的。在经典力学中,我们一般通过质点的位置和动量来确定质点的状态,如能量、角动量等都是该两个量的函数。由于微观粒子的波粒二象性,我们并不能同时确定粒子的位置和动量(实际上它们有许多可能值),因此在量子力学中,需要利用波函数来说明体系的量子态,并由它来对量子系统做出统计描述。当然波函数并不能直接通过物理实验来测得,能够测出的是概率密度 。而确定波函数需要量子力学的下一条假设。
★量子态演化假设:量子系统的状态随时间的演化满足薛定谔方程。
如果量子态中都满足该方程,那么它们的线性叠加也同样也满足该方程。量子态都是同一个量子系统的可能量子态,则它们的线性叠加也是这个量子系统的可能量子态,这就是量子态的叠加,简称叠加态。
量子态是描述物理系统的基础,可以用Hilbert空间中的态矢量表示,也即态矢量可以构成对粒子的(完备)描述,而力学量用厄米算符表示。
解释一下:经典力学中物理量的测量值对应是各阶数值张量,而量子力学中物理量的测量值对应是各阶线性算符张量,也即在任何一个时刻(在测量前)对一个量子系统的物理量不可能预言单一的数值,除非一个算符的特征值只有一个。量子力学假设确定了任何一个时刻物理量的算符形式是确定的,所以能准确预言任意时刻物理量的算符形式而不是物理量的数值。因此从经典力学过渡到量子力学的方法就是保留物理量原有的形式并把复数改成线性算符即可,除非出现了没有经典对应的物理量,比如自旋。
★测量假设:量子力学中的可观测量由厄米算符来表示(厄米算符从代数角度来讲,表达自伴算子的矩阵是埃尔米特矩阵,即厄米算符表达了一个厄米矩阵(Hermitian Matrix),从几何角度来讲,厄米算符就是在有限维的内积空间上,一个自伴算子(self-adjoint operator)等于自己的伴随算子。在线性代数中,我们知道埃尔米特矩阵就是等于自己的共轭转置的矩阵。厄米算符具有一些重要的性质:在任何状态下,厄米算符的特征值必为实数;在任何状态下平均值为实数的算符必为厄米算符;厄米算符的属于不同特征值的特征函数彼此正交;厄米算符的特征函数具有完备性,根据有限维的谱定理,必定存在着一个正交归一基,可以表达自伴算子为一个实值的对角矩阵)。
可观测量是指可通过物理实验得到测量结果的量,它对应于经典理论中的力学量。算符是指作用到一个函数上得到另一个函数的运算符号。由于量子系统中粒子的力学量(如坐标、动量、能量等)并不像经典力学中那样能同时具有确定的值,因此引入了算符来表示这些力学量(因为所有力学量的数值都是实数,所以表示力学量的算符也是实数。在泛函分析中,厄米算符具有这样的性质,因而在量子力学中,用厄米算符来表示力学量)。
解释一下上述意思:经典力学描述物理系统以该系统的空间位形(位置和形状)为基础,位形的变化及如何变化反映系统的运动及动力学性质;而量子力学描述物理系统则以该系统的状态为基础,由此引入了一个经典力学中完全没有的量子态的概念,态蕴含了该系统的所有物理信息。经典力学认为物理量(物理量是指一切现象、实体、物质等的可以被观测量化的物理性质)的数学模型是数值量;而量子力学则认为物理量的数学模型是线性算符量,前者认为物理量直接能被观测量化,后者认为同观测相联系的仅仅只是物理量的特征值或期望值。
量子力学中的态空间由多个特征态(Eigen state)构成,特征态是一个基本的量子态,简称基本态(Basic stat)或基矢(Basic vector)。态空间是一个线性的复向量空间,即希尔伯特空间。希尔伯特空间可以表示量子系统的各种可能的量子态,算符描述对应于力学量,当系统处于的某个特征态时,力学量有确定值=该特征态中的特征值。若测量的态矢量不是特征矢量, 则测量是一个概率。
上述量子测量假设必然导致了一个量子系统特有性质的出现:量子纠缠。当几个粒子在彼此相互作用后,由于各个粒子所拥有的特性已综合成为整体性质,无法单独描述各个粒子的性质,只能描述整体系统的性质,则称这现象为量子缠结或量子纠缠(quantum entanglement)。例如有两个自旋向上或向下的电子A和B,总共有四种可能的结合态:|↑↑⟩、|↑↓⟩、|↓↑⟩、|↓↓⟩。态矢量|Ψ⟩可以是这四种态的叠加,由于它不能被分离为单个电子的态的乘积,所以这个系统的态被称为纠缠态,当然四种可能的结合态的叠加不一定都是纠缠态。在纠缠态中,A和B的测量是不独立的,将这纠缠的两个电子分开,比如一个留在地球上,另一个则被送往宇宙的另一端。接着我们测量留在地球上的电子的自旋,测量的结果有50%的可能自旋向上,50%的可能自旋向下。但是,一旦我们测得这个电子的自旋,就能即刻确定在宇宙另一端的电子的自旋。
量子纠缠是一种纯粹发生于量子系统的现象,在经典力学里,找不到类似的现象。
当处于量子纠缠态时,各子系统的状态都依赖于对方但各自却处于一种不确定的状态。也就是说当未对子系统做出测量时,系统都分别处于各自的叠加态,而当对子系统中的一个进行测量,使该系统从叠加态塌缩到一个特征态时,必然对另外的子系统产生直接的作用,且测量包含了另外子系统的信息,并在瞬时改变了另外系统的描述。一个多体纠缠态不可能通过任何因式化分解为可分离的形式。从信息传输的角度看,纠缠中包含着量子关联的信息,目前的量子计算实验和量子通信实验都证明量子纠缠的存在,且量子纠缠对子信息隐形传态和稠密编码中有很好的体现,同时量子计算机也利用了量子纠缠特性,才能保证使所需的结果在计算结束后以较大的概率出现。
★粒子全同性假设:在量子系统中,存在内禀属性完全相同的粒子,对任意两个这样的粒子进行交换,不会改变系统的状态。
该假设的意味着,在一个由多个全同粒子(例如全是电子)构成的量子系统中,假如我们能够对它们进行标识的话,那么交换任意两个粒子被标识的粒子,系统的概率分布不变,而概率幅至多会有正负号的改变,其中+号对应于粒子为玻色子的情况,而—对应于费米子的情况。这就表明在量子力学中,交换任意两个全同粒子,不会导致任何可被观测到的现象出现,也即微观粒子是不能被标识的,我们不可能在两个电子之间做出区分,因为它们在理论上是完全等价的。这与经典物理的情况是不同的,因为经典物理中,粒子虽然在技术上无法区分,但可以追踪一个个粒子,给它们一个个编号。
全同粒子是大量粒子的集体行为,显著影响粒子的统计行为,全同粒子的统计分布不再满足经典的麦克斯韦--玻尔兹曼统计,而是换成玻色--爱因斯坦统计或费米--狄拉克统计(分子以上的一般遵循麦克斯韦--玻尔兹曼分布,原子以下的粒子行为基本都是费米--狄拉克分布和玻色--爱因斯坦分布)。所以量子统计和经典统计的区别并不在于粒子具有波粒二象性,而是粒子是不可区分的。全同粒子和波粒二象性都是量子力学的基本假设。全同粒子是量子力学特有的概念,完全没有经典的对应。微观粒子的不可分辨性是因为量子相干:粒子的康普顿波长大于粒子平均间距。
这个假设可以解释许多著名现象,例如绝缘体不导电(电子是费米子,在绝缘体中把所有可能的运动状态挤满了,于是就没办法让特定方向的流动更显著产生宏观电流);元素周期表(电子挤不下了才会一层一层轨道向外排,产生周期律);超导,超流,玻色--爱因斯坦凝聚等等。
在量子力学的框架下全同粒子不可分辨只是作为公理假设。
★泡利不相容原理:在费米子(在一组由全同粒子组成的体系中,如果在体系的一个量子态(即由一套量子数所确定的微观状态)上只容许容纳一个粒子,这种粒子称为费米子。或者说自旋为半奇数(1/2,3/2…)的粒子统称为费米子,服从费米--狄拉克统计)组成的系统中,不能有两个或两个以上的粒子处于完全相同的状态。在原子中完全确定一个电子的状态需要四个量子数:主量子数n、角量子数l、磁量子数ml以及自旋磁量子数ms。因此泡利原理又可表述为原子内不可能有两个或两个以上的电子具有完全相同的4个量子数n、l 、ml 、ms 。所以泡利不相容原理在原子中就表现为:不能有两个或两个以上的电子具有完全相同的四个量子数,或者说在轨道量子数m,l,n,ms确定的一个原子轨道上最多可容纳两个电子,而这两个电子的自旋方向必须相反。这成为电子在核外排布形成周期性从而解释元素周期表的准则之一。核外电子排布遵循泡利不相容原理、能量最低原理和洪特规则。能量最低原理就是在不违背泡利不相容原理的前提下,核外电子总是尽先占有能量最低的轨道,只有当能量最低的轨道占满后,电子才依次进入能量较高的轨道,也就是尽可能使体系能量最低。洪特规则是在等价轨道(相同电子层、电子亚层上的各个轨道)上排布的电子将尽可能分占不同的轨道,且自旋方向相同。量子力学证明,电子这样排布可使能量最低,所以洪特规则可以包括在能量最低原理中,作为能量最低原理的一个补充)。
量子力学的五个假设建构了量子力学的理论框架。从这些假设出发推导出的一些重要结论,解释并预测了许多微观领域的现象。近一个世纪大量的实验事实证明了作为量子为学理论基础的这些假设的正确性。
冯·诺伊曼根据上述五大假设构造了量子理学的公理化框架。
第一步是原子状态的数学描述。冯·诺伊曼的处理是:原子的状态由希尔伯特空间中的单位向量表征(可以数学证明这种描述同海森堡和薛定谔的定义是一致的)。
简单描述冯·诺伊曼的思想就是:一个系统的态,包含了为了确定它未来演化的所有信息集合。在经典力学中,系统的态包括所有的粒子的位置和动量信息,在量子力学中,冯·诺伊曼定义为一个希尔伯特空间的矢量。例如一个只有两种可能的态的系统(例如电子的自旋要么向上,要么向下),可以用矢量的两个分量来表示(10), (01),取一个沿着z-轴自旋的电子,量子系统的态可以同时是两种态的叠加,将态矢量相加得到电子的自旋可以即不向上,也不向下,它是两种可能的态之间的线性叠加(其实叠加态的可能性是量子力学与经典理学不同的本质根源)。
在量子力学中,冯·诺伊曼定义可观察量(就是可以测量的信息)就是矩阵,当将矩阵作用于矢量上时,就能产生其他的矢量。
对于在一个系统上可以做的每一种测量(比如能量、位置、动量、自旋等等),都存在一个不同的矩阵。以电子的自旋为例,沿着x-轴、y-轴、z-轴自旋的电子相对应的矩阵分别是:X=(0110),Y=(0−110),Z=(010−1)。通过矩阵乘法,矩阵作用在态矢量上,一些矢量就会改变方向,而那些经过矩阵乘法之后,方向也仍保持不变的矢量被称为特征矢量,从矩阵代数,我们很容易理解特征值。所以我们能够理解冯·诺伊曼对量子力学中测量的定义:测量就是特征值。或者说一个测量的可能结果是与可观察量相关的矩阵M的特征值m。但是,如果态不是可观察量M的特征矢量,那么对M的测量结果将是概率性的。这样,测量可以给出任何一个特征值mi,且每一个都有一定的概率。我们就可以以M的特征矢量的基来扩展任意态|Ψ⟩:|Ψ⟩=∑iαi|i⟩
其中αi是复常数。给出特征值mi的测量概率为|αi|^²(即概率(mi)=| αi|²)。且所有概率之和必须为100%。以电子为例,测量到电子自旋向上和向下的概率分别为:
|↑⟩:|α|^2,|↓⟩:|β|^2 ,且概率之和满足|α|²+|β|²=1。在进行测量后,态矢量会发生坍缩, 也即如果特征值mi被测量,那么测量后的系统的态是对应的特征矢量|i⟩。如果我们现在重复测量,我们能确定无疑地得到相同的值mi。但是,如果我们对一个不同的可观察量(对应于一个新矩阵N)进行测量,那么结果会再次是概率性的,除非|i⟩也是N的特征矢量。
以电子自旋为例,测量自旋向上或向下的概率分别为|α|²和|β|²。一旦进行了测量,态矢量|Ψ⟩就会坍缩到|↑⟩或|↓⟩,具体坍缩到其中的哪一个态取决于被测量的是哪一个。任何沿着z-轴自旋的后续测量都会得到相同的值。但是,如果我们决定测量一个不同的量,比如沿着x-轴的自旋,那么结果会再次是概率性的。
上述解释可以用薛定谔猫来理解(猫处于一个密封的盒子中,盒子中还有一个充满有毒气体氰化氢的玻璃烧瓶和一些放射性物质。倘若盒子里的放射性原子发生了衰变,装有氰化氢的烧瓶就会被打碎,氰化氢挥发导致猫随即死亡;如果放射性物质没有衰变,则不会触发打碎烧瓶的装置,猫能继续存活。一个在盒子之外的观测者在没有打开盒子前,无法得知猫的命运。因此对于观测者而言,猫同时处于生与死的状态。由于放射性的量子力学本质,猫的生或死的态是由量子比特携带的;当我们打开盒子发现猫是死是活的概率由|α|²和|β|²给出;一旦盒子被打开,猫的态就会坍缩成其中的一种)。
大多数矩阵都有不同的特征矢量,这意味着如果态是一个矩阵的特征矢量,它就不太可能是另一个矩阵的特征矢量。因此如果其中一种测量是确定的,那么另一种测量就变得不确定。
这便是海森堡不确定性原理。它说的是:如果我们对粒子的位置知道的越精确,那么对它的动量就知道的越不精确,反之亦然。
在经典力学中,我们可以同时精确地知道位置和动量,只有知道这些信息才能预测粒子未来的演化。但是,在量子力学中,如果我们知道一个粒子的位置x,那么就完全无法确定它的动量p,这种关系可以用式子表示:
ΔxΔp≥h^2
其中ħ≈10-34J⋅s是普朗克常数。我们之所以在日常生活在没有察觉到这些不确定性,是因为ħ太小了。其他的可观察量也存在着类似的不确定性关系。
第二步是构造了基于量子力学五条假设上的抽象希尔伯特空间,并证明海森堡和薛定谔的原子状态定义满足五条假设。
第三步是构造了量子力学的形式语言:由抽象希尔伯特空间的向量(代表系统状态)、泛函算子(代表系统中的可观察量)及其代数规则构成(冯·诺伊曼将诺特和阿廷的非交换代数理论有关概念扩展到希尔伯特空间上的算子代数中,由此产生了“算子环”的概念,算子环是有限维空间内矩阵代数的自然推广,这就是著名的冯·诺伊曼代数)。
这三步工作建立了量子力学的公理化纲领,完成了量子力学数学化,使冯·诺伊曼推动了希尔伯特空间的算子理论的发展,在1927年左右,冯·诺伊曼首先给出了希尔伯特空间的抽象定义(也是现在泛函分析教材所使用的定义),并把希尔伯特空间上自共轭算子谱理论从有界推广到无界,引入稠定闭算子的概念,给出无界自共轭算子、酉算子以及正规算子的谱分解定理,指出了对称算子和自共轭算子在性质上的差异,还与外尔共同研究了无界算子经过扰动后谱的变化规律。(这些在量子力学上做的工作,奠定了谱理论的形成,加上1933年巴拿赫所著《线性算子理论》(Th orie des operations li naires),标志着泛函分析的诞生)。
第四步是冯·诺伊曼用概率论对量子力学进行分析,引入统计矩阵U(现称为ρ矩阵)来描述各种量子状态的系统之集合,统计矩阵成为量子统计学的主要工具,为现代热力学的发展奠定了基础。
1932年,冯·诺伊曼的名著《量子力学的数学基础》由德国斯普林格公司出版,在这本书中指出,狄拉克等人在处理算子的概念时,对其定义域和拓扑并未予以充分考虑,草率地假设当算子为自共轭时,总可以被对角化,而对于无法对角化的,则引入狄拉克非正常函数(δ函数)的概念,冯·诺伊曼发现了它的自相矛盾,并证明:变换理论能够建立在清晰的数学基础之上,其方法并非去修正狄拉克的理论,而是发展希尔伯特的算子理论。当他成功地将算子谱论由有界推广到无界情形后,便最终完成了量子力学的形式化工作,它包含海森堡和薛定谔等人的体系作为特殊情况。并从统计学角度阐述了量子力学中的因果律和测不准原理:量子系统的不确定性并非由于观察者的状态未知所致,即使在系统中引入假想的隐参量,使观察者处于精确的状态,最终仍会因为观察者的主观意识而导致不确定的观察结果。并给出了遍历假设在量子系统中的表述和证明(这是遍历理论的奠基)。
《量子力学的数学基础》(德文版)先后被译为法文(1947年)、西班牙文(1949年)、英文(1955年)和日文,它至今仍是理论物理领域的经典之作。
其实我认为量子力学创立人应该包括冯·诺伊曼,只是物理学家不想被数学家抢饭碗,一直装聋作哑,事实上现代量子力学的框架还是冯·诺伊曼创立的。物理学家被数学家抢饭碗的事情经常发生,例如诺特(德国女抽象代数学家)证明的伟大定理:一个对称的物理系统必然有一一对应的守恒量(不变量)(简单描述就是:连续对称性和守恒定律的一一对应。诺特定理对于所有基于作用量原理的物理定律都是成立的。诺特定理和量子力学深刻相关,通过诺特定理,仅用经典力学的原理就可以认出和海森堡测不准原理相关的物理量(譬如位置和动量)。诺特定理解释了物理系统对于空间平移的不变性,也即物理定律不随着空间中的位置而变化,给出了线性动量的守恒律;对于转动的不变性给出了角动量的守恒律;对于时间平移的不变性给出了著名的能量守恒定律。在量子场论中,诺特定理产生出更多的守恒定律,例如从电势和向量势的规范不变性得出电荷的守恒)。杨振宁李政道获诺贝尔奖的工作,就是基于这个基础,实际上量子场论也离不开这个定理,现在的凝聚态的物理也离不开。
以上内容可以参考冯·诺伊曼的名著《量子力学的数学基础》。
最后再废话一句,学习量子力学,如果不能用泛函分析和群论作为基础工具,最多能够学到《十万个为什么》水平。现在很多大学的量子力学老师也就是《十万个为什么》水平。
泛函分析主题分为无限维空间的几何(包括度量空间;巴拿赫空间和希尔伯特空间);无穷维空间代数(包括线性算子;线性算子谱);巴拿赫代数和广义函数。
泛函分析的应用主要在偏微分方程解的存在性和唯一性证明,数值解构造;最优控制的极大值计算;小波分析的基构造;傅立叶变换和有限元计算五个方面上。
本来上述主题都可以写一点科普的,但是帖子太长了,以后有机会再慢慢写吧。
最后,把介绍过的数学帖子罗列一下:
https://www.douban.com/group/topic/96711443/
https://www.douban.com/group/topic/83808893/
https://www.douban.com/group/topic/96542437/
https://www.douban.com/group/topic/130968109/
https://www.douban.com/group/topic/95244972/
https://www.douban.com/group/topic/82509566/
https://www.douban.com/group/topic/79539691/
https://www.douban.com/group/topic/84570941/
https://www.douban.com/group/topic/102217272/
https://www.douban.com/group/topic/78333278/
https://www.douban.com/group/topic/79621229/
https://www.douban.com/group/topic/79487681/
https://www.douban.com/group/topic/79835542/
https://www.douban.com/group/topic/79882697/
https://www.douban.com/group/topic/79759824/
https://www.douban.com/group/topic/79922278/
最后再说一句,不了解数学,并不会影响你的生活,但是当陷入问题丛林中时,知道一点数学思想,就像手中有一把大砍刀,显然比赤手空拳走出问题丛林的概率大一些。学点数学,可以建立化繁为简,分而治之,抽象类比,抓住本质的能力,可以一针见血找到问题关键,而不会被云山雾罩蒙蔽。
我认为任何的理论突破和技术创新,它必须超过前人对世界本质的认识或者技术上集大成,或者工艺上根本突破,所以任何理论突破或创新,在思想难度上,技术复杂度上都必须超越以前。
顺便再说一句,我不推荐一般人把数学当成职业,除非有超常的数学天赋或家里有矿,不然还是学点便于谋生的职业,当然可以学点基础的数学,然后转计算机,金融,工程,管理,管理信息系统之类谋生容易的专业,其实这几十年来,,大学数学系毕业生最主要的出路是当中学数学老师,中学老师有两大弊病,一个是上升的上限太低,很容易就到天花板,无路可去,第二个是容易消磨人的斗志,安于现状,不求进取,混日子。人想有点成就,还是需要玩命和冒险精神的,稳定的生活对年轻人是谋杀前途的。