4 傅立叶数学思想
介绍傅立叶理论的书籍比较多,而这些理论书籍也是经过了漫长的发展,直到20世纪30年代才在 Bochner、Wiener、Paley 以及 Titchmarsh 等人手上发展起来的(Dominguez 2016, Sec. The earliest Accounts and books on the FT)。
4.1 函数概念的演变
要理解傅立叶分析的思想,必须从函数概念说起。虽然今天我们对数学函数的概念相当熟悉,但是这个思想也是经过了漫长的发展才成形。
函数概念是数学中最基本的概念之一,但它不像算术产生于远古时代,函数概念的产生非常晚,至今只有三百余年历史。函数概念的演变大体上可分为萌芽阶段、形成阶段、成熟阶段、近代阶段和现代阶段等五个阶段。
在公元十六世纪之前,数学上占统治地位的是常量数学,其特点是用孤立、静止的观点去研究事物。具体的函数在数学中比比皆是,但没有一般的函数概念。十六世纪,随着欧洲过渡到新的资本主义生产方式,迫切需要天文知识和力学原理。当时,自然科学研究的中心转向对运动、对各种变化过程和变化着的量之间依赖关系的研究。数学研究也从常量数学转向了变量数学。数学的这个转折主要是由法国数学家笛卡尔完成的,他在《几何学》一文中首先引入变量思想,称为“未知和未定的量”,同时引入了两个变量之间的相依关系。这便是函数概念的萌芽。十七世纪,在对各种各样运动的研究中,人们愈来愈感到需要有一个能准确表示各种量之间关系的数学概念。经过深思熟虑,人们从笛卡尔的变量思想中得到启示,从而引出了函数概念。据考证,十七世纪中叶,微积分的创始人之一德国数学家莱布尼兹最先使用函数(function)这个名词。不过,他指的是变数x的幂x^2,x^3,…等等。后来才逐步扩展到多项式函数、有理函数、幂函数、指数函数、对数函数、三角函数和反三角函数以及由它们的四则运算、各种复合所形成的初等函数。这些函数都是具体的,都有解析表达式,并且和曲线紧密联系在一起。那时的函数就是表示任何一个随着曲线的点的变动而变化的量。至此,还没有函数的一般定义。
十八世纪初,贝努利最先摆脱具体的初等函数的束缚,给函数一个抽象的不用几何形式的定义:“一个变量的函数是指由这个变量和常量的任何一种方式构成的一个量。”欧拉则更明确地说:“一个变量的函数是该变量和常数以任何一种方式构成的解析表达式。”函数之间的原则区别在于构成函数的变量与常量的组合方式的不同。欧拉最先把函数的概念写进了教科书。在贝努利和欧拉看来,具有解析表达式是函数概念的关键所在。
1734 年,欧拉用记号 y=f(x) 表示变量 x 的函数,其中的“f”取自“function”的第一个字母。
十八世纪中期,由于偏微分方程中的弦振动问题引起了关于函数概念的争论,迫使数学家接受一个更广泛的概念。1755 年欧拉给函数下了一个新的定义:如果某些量这样地依赖于另一些量,当后者改变时它经常变化,那么称前者为后者的函数。
法国数学家傅立叶的工作更广泛地展现了函数究竟是什么的问题,他的工作动摇了十八世纪的信念,原来那种视函数仅为解析式的观点,作为揭示函数关系真谛的巨大障碍,终于被排除了。
十九世纪 20 年代,微积分严格理论的奠基者柯西的函数概念,可以说是现代函数概念的基础,他认识到函数是变量与变量之间的一种关系,但不足之处是仍然没有摆脱“表达式”之说。
1837 年,德国数学家狄利克莱在总结柯西和罗巴切夫斯基工作的基础上,给出至今最常用的函数定义:如果对于给定区间上的每一个 x 的值都有唯一的一个 y 值与它对应,那么 y 就是 x 的一个函数。至于在整个区间上 y 按照一种还是多种规律依赖于 x,或者 y 依赖于 x 是否可用数学运算来表达,那都是无关紧要的。
二十世纪以来,函数概念不断扩充,函数不仅是变数,还可以是其它变化着的事物。还出现了所谓广义函数以及函数的函数等等。但大体上可被布尔巴基的函数概念覆盖。以研究函数为已任的分析学,成为数学的三大基本分支之一,形成几何、代数、分析三足鼎立的局面。在分析学中,函数论占有重要地位,它又划分为实函数论与复函数论两大部分,分工越来越细。而复函数论也是与傅立叶变换密切结合在一起的。
我国最早使用“函数”一词是清朝数学家李善兰(杜石然 1961)。1859 年李善兰在上海与英国人伟烈亚力合作译英国数学著作《代数学》时译道:“凡式含天,为天之函数”,首次将“function”译成“函数”。中国古代以天、地、人、物表示未知数,“函”字即“含有”、“包含”之意。 这种用法我国和日本一直沿续至今。
1 极限一词的英文表述是limit,由清代数学家李善兰翻译而来. 中文翻译与limit一词数学含义的高度匹配,令人惊叹。
从概念上粗略但直观地看,极限就是某个变化状态能够无限接近但未必达到的一个尽头,或者说是一个极致界限。因此,就概念而言,极限二字可以由中文字面含义顾名思义1 。所谓极限思想,就是通过分析可以无限接近某一极限状态的各种变化状态,来理解想要了解的极限状态的思想。所谓极限方法,就是利用极限思想而产生的解决问题的方法。于是,极限思想把需要了解的一种状态,与它附近的各种状态及其变化过程,有机联系在了一起。它是一种用运动变化和联系的观点看待并分析解决问题的思想,因此深化和提升了用孤立和静止的观点看待分析问题的初等数学思想。
而级数是利用极限来理解无限多个数或函数依次相加,从而把求和运算从有限推广到无限的一个重要概念。级数是表示和研究函数以及进行数值计算的一个有力工具,是极限思想把初等数学推向高等数学的一个光辉典范。
4.2 三角级数
在18世纪,甚至到今天,无穷级数一直被认为是微积分的一个不可缺少的部分。实际上,牛顿研究级数是和他的流数法分不开的,因为对于稍为复杂一些的代数函数和超越函数,只有把它们展成无穷级数并进行逐项微分或积分,他才能处理它们。莱布尼茨在他1684年和1686年初期发表的一些文章中,也强调了“一般的或不定的方程”。伯努利家族、欧拉以及他们同时代的人,都大量依靠级数的使用。数学家们只是逐渐地,正如在上一章所指出的那样,学会用有尽的形式(也就是简单的分析表达式)来研究初等函数。虽然如此,级数仍然是某些函数的唯一表达式,而且是计算初等超越函数的最有效的工具。
随着研究领域的逐渐扩展,数学家们运用无穷级数所取得的成功变得越来越多。新概念中存在的困难,起码在一段时间里是没有认识到的。级数只是无穷多项式,并且也就当作多项式来处理。此外,正如欧拉和拉格朗日所相信的,每个函数都能表示为级数,似乎是显然的事。
17世纪后期和18世纪,摆在数学家面前的问题之一是函数表的插值。为了适应航海、天文学和地理学的进展,要求三角函数、对数函数和航海表的插值有较大的精确度。插值(这个词是沃利斯的)的常用方法叫线性插值法,因为它假设了在两个已知值之间的区间中,函数是自变量的线性函数。然而,问题中的函数往往是非线性的,因而数学家感到需要有一种较好的插值方法。
格雷戈里-牛顿内插公式由泰勒发展成一个把函数展成无穷级数的最有力的方法。二项式定理、有理函数的长除法和待定系数法,都是有局限性的方法。泰勒在他研究有限差计算的第一本出版物《增量法及其逆》(Methodus Incrementorum Directa et Inversa,1715)中,推导出他在1712年曾经叙述过的定理,这定理至今仍用他的名字命名。
18世纪的数学家还广泛研究了三角级数,特别是在他们的天文学理论中。这种级数在天文学中之所以有用,显然是由于它们是周期函数,而天文现象大多是周期的。这种研究是一个广泛课题的开始,而这课题的全部深刻意义在18世纪还没有被意识到。开始使用三角级数的问题是插值问题,特别是要确定行星在介于观测到的位置之间的位置。这类级数在偏微分方程的早期工作中也曾用到,但奇怪的是这两条思路却一直分开,甚至对同时研究两类问题的人也是这样。
关于三角级数的全部工作,处处都渗透了这样一个矛盾现象:虽然当时正在进行着把所有类型的函数都表示成三角级数,而欧拉、达朗贝尔、拉格朗日却始终没有放弃过这样的立场,即认为并非任意的函数都可以用这样的级数表示。这个矛盾的部分解释是:在三角级数被认为是成立的那些地方,总有其他的论据,在某些情况下是物理的论据,似乎能够保证它们的成立。因此,人们就可以随意假设级数,并推导出系数公式。是否任意函数都能用三角级数表示的争论,就成了人们注意的中心了。
4.3 傅立叶变换基本思想
用今天的语言来描述,傅立叶的发现实际上是在说:任何一个信号都可以用两种方式来表达,一种就是通常意义上的表达,自变量是时间或者空间的坐标,因变量是信号在该处的强度,另一种则是把一个信号“展开”成不同频率的简单三角函数( 简谐振动)的叠加, 于是这就相当于把它看作是定义在所有频率所组成的空间(称为频域空间)上的另一个函数,自变量是不同的频率,因变量是该频率所对应的简谐振动的幅度。
这两个函数一个定义在时域( 或空域)上,一个定义在频域上,看起来的样子通常截然不同,但是它们是在以完全不同的方式殊途同归地描述着同一个信号。它们就像是两种不同的语言,乍一听完全不相干,但是其实可以精确地互相翻译。在数学上,这种翻译的过程被称为“傅立叶变换”。
傅立叶变换就像是把信号彻底打乱之后以最面目全非的方式复述出来,而一切信息都还原封不动的存在着。
在傅立叶变换的所有这些数学性质中,最不寻常的是这样一种特性:一个在时域或空域上看起来很复杂的信号(譬如一段声音或者一幅图像)通常在频域上的表达会很简单。这里“简单”的意思是说作为频域上的函数,它只集中在很小一块区域内,而很大一部分数值都接近于零。如下图是一张人脸和它对应的傅立叶变换,可以看出,所有的频域信号差不多都分布在中心周围,而大部分周边区域都是黑色的(即零)。
这是一个意味深长的事实,它说明一个在空域中看起来占满全空间的信号,从频域中看起来很可能只不过占用了极小一块区域,而大部分频率是被浪费了的。这就导出了一个极为有用的结论 :
一个看起来信息量很大的信号, 其实可以只用少得多的数据来加以描述。 只要对它先做傅立叶变换, 然后只记录那些不接近零的频域信息就可以了, 这样数据量就可以大大减少。
基本上,这正是今天大多数数据压缩方法的基础思想。在互联网时代,大量的多媒体信息需要在尽量节省带宽和时间的前提下被传输,所以数据压缩从来都是最核心的问题之一。而今天几乎所有流行的数据压缩格式,无论是声音的 mp3 格式还是图像的 jpg 格式,都是利用傅立叶变换才得以发明的。从这个意义上说来,几乎全部现代信息社会都建立在傅立叶的理论基础之上。这当然是傅立叶本人也始料未及的。
本小节内容主要来源于参考资料:木遥《不确定性原理的前世今生》(木遥 2011)。
4.4 傅立叶分析的严密性
大约在 1800 年前后,数学家们开始关心分析的庞大分支在概念和证明中的不严密性。函数概念本身就是不清楚的;使用级数而不考虑它们的收敛和发散已经产生了悖论和不同意见的争论;关于用三角级数来表示函数的论战进一步引起了混乱;当然,导数和积分的基本概念还从来没有恰当地定义过。所有这些困难最终导致人们对分析的逻辑状况的不满。
傅立叶没有拿到科学院审查委员会的完全认可,主要原因就是因为其缺乏严密性的认可。客观上来讲,当年傅立叶的理论,的确是不严谨的,或者说是有缺陷的。随着数学思想的进步,傅里叶的成就在后来赢得了广泛的赞许。但严格地讲并不是任意周期函数的傅里叶级数都收敛。关于收敛条件和收敛证明问题的研究,后继者柯西(Cauchy,1789-1857)和泊松(Poisson,1781-1840)的努力没有结果,代表性的成果是狄利克雷(Dirichlet,1805-1859)和黎曼(Riemann,1826-1866)做出的。
1822 年 5 月西普鲁士青年狄利克雷(Dirichchlet,Peter Gustav Lejeune,1805—1859)来到巴黎学习数学,他选定在法兰西学院和巴黎理学院攻读,1823 年夏,他被选中担任 M.法伊将军的孩子们的家庭教师。法伊是拿破仑时代的英雄,时任国民议会反对派的领 袖。狄利克雷担任此职,不仅收入颇丰,而且受到视如家人的善待,还结识了许多法国知识界的名流,并与傅里叶相识,傅里叶鼓励他完成收敛性的证明。狄利克雷在 1822 年到 1825 年期间在巴黎会见傅里叶之后,对傅里叶级数产生了兴趣。1829 年狄利克雷被聘为柏林大学教授,他在克雷尔杂志发表了他最著名的一篇文章《关于三角级数的收敛性》(Sur la convergence des séries trigonométriques),狄利克雷给出的证明,是对傅里叶在其《热的解析理论》的末尾几节中草拟的证明的改进,成功地给出收敛的充分条件(Kline 2014, vols. 3 P.135):
- f(x)是单值有界的;
- f(x)是分段连续的,即在(闭的)一个周期内只有有限多个间断点;
- f(x)是分段单调的,即在一个周期内只有有限多个最大值和最小值。
狄利克雷(Dirichlet)迈开了傅里叶级数严密化的坚实的第一步,以致黎曼(Riemann)尊称他为傅里叶级数理论的真正奠基者。关于傅里叶级数收敛性的研究持续到今天有很多结果,但Dirichlet条件在今天“信号与系统”教科书中使用最为广泛。
黎曼有一段短时间曾在柏林在狄利克雷的指导下进行研究工作,而且对傅里叶级数产生了兴趣。1854年在格丁根在他为取得大学教授资格而写的论文《试用短文》中以此为题,写了《用三角级数来表示函数》(Über die Darstellbarkeit einer Function durch einer trigonometrische Reihe),文章的目的是要找出函数f(x)必须满足的充要条件使在区间 [-\pi, \pi] 中的一点x处 f(x) 的傅里叶级数收敛到 f(x)(Kline 2014, vols. 3 P.135)。
虽然傅立叶分析的严密性非常重要,科学研究的严密性有的时候反而会是一个制约,但是我们从中可以看到,傅立叶在提出傅立叶级数理论的时候,并没有过于纠结这一点。我们必须重视和发挥直觉在科学研究中的作用。傅里叶从热传导方程解的研究中正是凭直觉发现了傅里叶级数,从而开创了数学物理学一个时代。
4.5 傅立叶与数学物理方法
翻开任何一本数学物理方法的著作梁昆淼 (2010),你都会发现傅里叶级数、傅里叶变换在其中占据了非常重要的地位,本小节就来阐述一下相关的内容。
数学物理方法在物理学、工程技术和其他科学的许多领域都有着十分广泛的应用。主要原因是,在上述研究领域中经常出现很多描述某些物理规律的数学物理方程,通过对这些方程的求解,一方面可以得到极有实用价值的结论,另一方面又可以促进这些领域的发展。
以牛顿为代表的数学物理学家们,完全采用了全新的处理方式来进行科学研究工作,牛顿在其《自然哲学的数学原理》里开创了一这数学物理写作的风格。数学物理学家的工作方式也反应出这一领域的数学特征,他们的工作程序可以归纳为这样几个步骤(桂质亮 1997):
- 选择物理问题,并以数学形式建立该问题的模型;
- 构造数学表达式(通常是一个微分方程),并使它适应于那个物理问题;
- 解方程,或者进行类似的工作;
- 对解作物理意义的解释。
而傅立叶的《热的解析理论》是这一风格的集中体现,完全是19世纪早期数学物理学家的风格,该书第一章主要在于建立不同情况下的物理模型;第二章由这些模型提炼热传导的微分方程。以后约占全书四分之三的内容全是讨论方程的求解以及由此产生的数学问题,包括傅立叶级数和傅立叶积分。他在绪论中指出:“对自然的深入研究是数学发现最丰富的源泉。”这段经常被引用的名言很能表现他的工作方式和目的。这种工作方式和目的实际上在书中到处都能找到。
数学物理方法既可以作为一门纯数学学科来研究 ,也可以作为一门应用数学学科来研究。主要包括偏微分方程和积分方程,而下面三个领域是经典的数学物理方法讨论的内容:
- 波动方程
- 热传导方程
- 稳定问题
而傅立叶恰恰通过热传导方程来对数学物理方法作出了突出贡献。
4.6 为什么傅立叶分析会成为电子类学生的噩梦?
对于通信、机械、自动化控制、光学专业的学生来说,如果要说大学里最令他们难忘的那个男人,估计十之八九会说是约瑟夫·傅立叶。看着那密密麻麻公式恍如天书的《复变函数》与《积分变换》教材,外加中国教材浓浓的苏联风格,正儿八经读懂的同学,能有几个?
不要说电子类学生了,就是历史著名的数学物理学家们,都花了两百年时间才真正消化和完善了傅立叶变换这个思想。
首先,傅立叶变换带来的是哲学上的变化。
人们最初用数学描述世界,是从人类的直觉出发,发明了二维和三维笛卡尔坐标系的空间域,以及定义了以时间为横轴(X轴)、幅度值或其它物理量为纵轴(Y轴)的时间域。这一描述方式,和人类的直觉非常相符,简直一学就会,也能和日常生活的经验对应上。
而傅立叶变换,以及由此带来的傅立叶分析技术,却完全把时间域转换到了频率域,完全从另外一个角度来描述世界,这种描述方式是静态、全局的,并且最重要的是,完全与人类的直觉不相符。这也就是为什么,学生在学习傅立叶变换的时候,完全没有办法通过想象来理解这一技术,起码刚开始是这样。
其次,傅立叶变换涉及到数学细节太复杂、范围太广。
如果真要从数学角度理解好傅立叶变换,起码微积分基础要很扎实,看看大学里多少青年才俊为了高等数学重修了好几年,就知道微积分并没有想象的那么简单。掌握微积分的计算技巧、光把考试弄及格还只是初步,最关键的是还得理解微积分背后的数学概念与思想。
对于电子类专业学生来说,为了方便地用傅立叶来进行信号处理,起码还得对复变函数具备相当的知识,这样才能使得傅立叶分析简洁明了、方便使用。而复数这个东西,可是困扰了数学家几百年的领域,带来的也是一个哲学上的转换,数学引入复数后,才真正形成了一个自洽的体系。复数和之前的数字(自然数、负数、实数)都不太一样,之前的数学也是和现实世界的东西一一对应,而复数则不一样,你完全没有办法和实际生活对应起来,它是完全抽象的产物。虽然负数、无理数这些也给数学家带来了很长时间的困扰,但远不如复数带来的哲学思想冲击大。我们要搞清楚傅立叶变换,虽然对复分析领域的知识要求不算太高,但是基本的概念还是要懂的。
上面说的,还只是初步理解傅立叶变换所需要的数学知识,如果你需要对傅立叶变换的存在性进行研究,那细节就更多了,还好电子类专业学生应该不纠结这一点,反正数学家们已经研究清楚了,拿来用即可。
想想,到大二学傅立叶变换的时候,你的高等数学知识,还记得多少?复变函数估计是大二上学期学的吧,学完后还没理解清楚,就来搞傅立叶变换实战一把,这相当于士兵还没练习好瞄准就上战场,那场面可是相当混乱。
最后,傅立叶变换,很难通过大量的数学计算练习来掌握,最好的方式是编程验证,但编程恰恰是大学新生的薄弱环节。
想想傅立叶这个计算量,试图通过做数学题来练手,基本不可能。快速、高效进行傅立叶实验,写代码是最好的方式。而写代码也是有一定门槛的,那些 Matlab、Python 脚本看起来简单,真要调试起来,问题不少,尤其是在你从理论上还不好判断结果是好是坏的情况下,那经常会让你更加困扰,那些涉及到各种理论名词的英文帮助文档看得云里雾里、阅读效率低下。
综合这三点,傅立叶变换说为什么电子类专业的重修捕手,真不为过。
PS:不过现在已经好了,互联网上已经有大量傅立叶介绍的资料,各种程度的介绍都有,适合不同基础的学生;各种背景知识齐全,适合对科学历史和知识感兴趣的学生广泛阅读。现代的学生真幸福,可以不用光啃书本,还可以找一些更优秀的专业类书籍来学习。
4.7 傅立叶分析与音乐的关系
音乐是傅立叶分析最符合人类直觉的应用领域,通过对音乐乐理的理解,对傅立叶分析的掌握会更加到位。
(Jessop 2017) 这个文献是一个不错的开始,而(Maor 2018b, chap. 5) 和 (王杰 2019, chap. 24) 都是介绍数学与音乐关系的专著,前一本是著名的科普作家 Eli Maor 的作品,他还有《e的故事》(Maor 2018a)、《三角之美》(Eli Maor 2018)这几本优秀的作品。
傅立叶分析用于音乐,可用于识别音乐中自然产生的谐波。从本质上讲,这是所有音乐作品的基础。
傅立叶定理对音乐的重要性怎么强调都不为过:因为每一次周期性振动都会产生一种音乐声(当然,前提是它位于可听频率范围内),它可以分解成它的谐波分量,这种分解是独一无二的;也就是说,每个音调都有一个而且只有一个声谱,它的谐波指纹。
“尽管傅立叶定理本身是一个纯数学概念,但根据傅立叶定理,我们的耳朵能够将复合音分离为其纯音分量,这是一个非常了不起的事实。这被称为欧姆声学定律;它由德国物理学家乔治·西蒙·欧姆(Georg Simon Ohm,1789-1854 年)于 1843 年制定,他以著名的电学定律而闻名。我们将音乐声音分解成其单独的纯音成分的能力——更一般地说,将同时演奏的单独音符的任何组合作为单独的音符来聆听——是大自然赐予我们的最惊人的礼物之一。整个音乐和声理论都建立在它之上,即使它们在 C 大调和弦中一起演奏,我们也能够将 C-E-G 等三和弦作为单独的音符听到。视觉没有这种能力:如前所述,当混合两种颜色时,我们只能看到一种第三种颜色,没有光学和弦之类的东西。”(Maor 2018b, 64)
另外,我想强调一个悲伤的事实:就算对傅立叶变换有着深刻的理解,对你的音乐事业也不会有任何帮助,诸位工科学生,如果想通过傅立叶变换的学习提升你的唱歌水准,趁早放弃这个念头。
4.8 一些在线例子
傅立叶变换,用动图来看是最生动形象的,下面我找了网上两个比较方便的页面,大家可以直观去体验一下傅立叶分析与合成的直观感受。
Fourier Series–Square Wave. MathWorld–A Wolfram Web Resource,并且从这里可以看到更多 Wolfram 有关傅立叶级数的例子。
keysight Frequency vs. Time Domain,这里有一张动图示意。
4.9 小结
对三角级数历史感兴趣的读者,可以参阅(Kline 2014, vols. 2 Chap.20)进行更详细的阅读;对数学分析的严密性更详细的历史叙述,可以参阅(Kline 2014, vols. 3 Chap.40)。