关于微积分的那些符号

微积分,数学分析,与计算机科学

关于微积分的那些符号

近些年,硅谷系极客们普遍认为计算机科学是不需要微积分的,然而,随着近几年尤其是人工智能和概率数据结构领域的发展,微积分变得越来越重要。

我学了好几次微积分,每次学的都没有很多,因为学习微积分对我来说是一种折磨,而这种折磨主要来源于符号由于它们的悠久历史而难以理解。

我会从一个奇怪的视角带你走进它们,学习曲线可能更陡峭,更缺乏成就感,但也更系统。这实际上是数学分析的一个预览。

本文假定你大致了解微积分。如果你是计算机科学魔怔人,那么让我们开始吧。


微积分的符号和我们见过的寻常符号都不同,一般而言,我们寻常会碰到的映射的符号大多是这样的形式:

这种符号十分语义明确、标准化,所以已经成为了现代数学论文中定义映射时的绝对主流,即便 f 可能是花体、希腊字母,亦或是有一些角标。

而微积分的符号则经过了数百年的发展,在 Leibniz 的时代,数学大厦仍然是极其不严谨的,而数学家对数学的认识比今天懵懂得多,而那时候的人们对积分符号的定义也是基于一种“方便”的自然语言的,事实上,这为后世学生理解近代微积分带来了许多麻烦,因为人们在这个旧有的微积分符号定义上不断扩展。例如,我们首先会学到类似这样的积分:

然后,我们又会学到这样的积分:

当你似懂非懂的使用这些符号时,又会学到这样的积分:

其实,绝大多数人的微积分知识学到这里已经基本够用,但如果你学习微积分不仅仅是为了考研,那么你可能会读到一些包含这种积分的材料:

如果你对物理学感兴趣,还有一些奇形怪状的积分写法,例如:

事实上,这些符号根本无法从现代符号的角度来理解,因为它们是在那个数百年前的蛮荒时代依自然语言定义的语法。


如果我们想求出方程 作为曲线围成的面积(由于古今差异,这里需要把 想象成横轴),我们可以这样说:

对方程 沿着 求和

在拉丁语中,这可以写为:Summa y de x

于是,Leibniz 就将它的公式写作:

其中的 实际上是 de (关于 )的意思。

实际上这个积分符号也并非凭空捏造,当时的字母 s 有三种写法,分别是大写 S ,小写 s ,拉长 ſ ,而单词 summa 在当时手写体的小写形式正是 ſumma

而微分算子 中的 则指:Differentia de (关于 的微小变化)

也就是说,这两种 最初实际上是不同的含义。但后来,Leibniz 又指出积分中的 de 也可以指 differentia de 。再后来,人们发现“differentia de ”这种无穷小量实则也根基不稳,Weierstrass 等人便提出了使用极限的语言严谨的描述微积分。在这两件事之后,积分式子再也没有一个准确的理解方法,成为了一个“浮动的能指”(笑)。 而这种“浮动的能指”对于数学来讲是很危险的,不知不觉间为数百年的争执和学生的难以理解埋下祸根。

我们举个错误理解的例子:当你读到了“ 代表无穷小量”,你就会不自觉的联想我们应不应该把 积分式子中的 看成一个多项式,因为莱布尼兹的那句话,你听过的许多课程都会把积分式子中的 说成是无穷小量,这也更加印证了你的错误猜想。


如果要用一个现代风格的严谨符号来代替 Leibniz 的积分符号,我们可以用这样的符号:

其中 是我们要积的函数参数的序号,我们可以规定这样一种简写来表示序号:

这种简写可以让你直观的看到 Leibniz 符号和我们定义的符号的内核完全一致,只是语法不同。Leibniz 符号中的 即我们符号的


由于这篇文章主要面向计算机科学方向而非物理方向,在我们了解最传统的积分之后,我会在讲解上做一个迂回,用公式 去反向讲解公式 。也就是说,我会先讲解一个更底层、更抽象的定义,然后再将公式 作为其的一个特例。我会在后面快速给出公式 ,但这需要我们先熟悉数学符号。

我这样讲解的理由在于,当我们研究计算机科学时,我们基本上是在研究离散空间,比如图或一些概率空间,这时我们需要离散 Laplace 算子、广义 Lebesgue 积分、测度论的工具,而非基于物理学视角的经典工具。


我们用语言讨论的方式来慢慢辨析“什么是积分”,当我们抓住了积分的精神内核,我们才能够定义什么是广义积分。

Leibniz 提出了积分,用以求一个函数围成的面积

函数可以被看作一个集合,其元素是二元组,这个二元组中的第一项是我们可以输入的值,第二项是对应的输出。

面积就像经典积分那样。我们可以用一些矩形来逼近它,这些矩形是函数在某一处的输出值与什么东西的乘积

由于我们想不出来这个“与什么东西的乘积”中的“这个东西”是什么,那么为了进一步理清逻辑,将其记为 ,也就是图示中的问号,假设我们知道它,反过来定义函数。我们可以知道,这个东西的长度一定不为零,否则这个矩形的大小也是零,那就没有意义了,因为我们要不断加入大小不为零的矩形逼近曲线围成的面积。我们可以将图示中的所有矩形的面积之和(也就是函数的积分)记作:

我们想让 这个函数表示“x 是否在矩形的范围里”, 则为 ,否则为 。在此希望读者能仔细思考上述两个式子的相关性。

由于我们并不知道这些矩形的宽度是什么,我们不妨认为这些矩形的宽度是自然存在并分割 ​ 的(就像我们求不出质数的通项公式就认为质数是某种自然存在一样)。

而这种“不完美的逼近”被称作简单函数。而一个更复杂但非负(如果可以取负值,只需将正负部分分开定义)的函数的积分便是:

其中 的意思是前者的每一个取值的结果都小于等于后者。我们用“尽可能大”的 ​ 的积分作为 f 的积分。

至此,我们不严谨的定义了函数和它的积分。至此,我们只剩最后一个问题:哪些矩形的宽度是什么?为什么我们可以判断一个值是否在这个范围内?它们为什么自然存在?

显然,“矩形的范围”指 R 的子集(区间),由于每一个矩形的范围都对应一个矩形的宽度,那么就存在一个映射:

将范围映射到宽度,其中 ,具体是什么则在下面介绍, 的幂集,​ 是扩展实数。我们希望它满足这样的两个性质:

其中 “” 意味着这些集合两两不相交。

也就是说,我们希望一些范围之和的宽度与范围的宽度之和相等,这确保了我们对函数只有唯一的逼近。

至此,我们通过 不严谨的定义了积分,这被称为广义 Lebesgue 积分,其中 被称为一个测度,关于测度的抽象定义会在随后介绍。这里 取 Lebesgue 测度,将区间 都映射到 由一个名为 Carathéodory 构造的技术筛出来,因为你无法为整个 ​ 中的一些非常奇怪的集合找到一个“宽度”,例如一类名为 Vitali 集的集合。

我们用通行的测度论语言重写一下我们懵懂时期写出的式子 为:

以及式子 为:

其中 被称为 的指示函数。

现在,我们逐渐明白了式子 的意思,它实际上可以展开成:

其中 是我们希望的测度,也就是如何定义一个区间的“宽度”。作为练习,你可以想象一下 ​ 不是 Lebesgue 测度而是你定义的某种测度的情况,一个函数的积分会变成什么样子。这个语法实际上也是在自然语言上进行修改,变成了“沿着 ​ 积分”。 被称为 底空间 ,最大为 的定义域 ,可以限制其为更小的 ,也就是 ,这等价于

 

这时我们就可以轻易的用测度论的语言严谨的解释各种物理中的积分了,例如曲线积分 实际上就是:

请读者利用几何直观想象该式。要注意的是, 实际上定义了新的语法,将 置于积分符号的下方了。

同理,对于 ,只需仍使用上式中的测度,并使用任何可导且导数非平凡的 ,则我们可以用 来代指一种退化的 ​。 要注意的是,这同样为积分式创建了一个新的语法,而不是测度论语法。

是环路积分,它实际上只是在曲线为环路的基础上使用了一种特殊的符号。

现在我们正式的定义测度空间:

为集合,如果子集族 满足:

那么这时,我们将 称为一个 -代数。为了简洁和严谨,这个定义使用集合论语言,简要来说,它对集合的差运算有限并运算封闭,第三条式子为了服务下面测度的定义,而第二条式子是为了保证测度在各种自然操作下的良好性质。

测度的概念我们上文中定义过了,但还是把定义抽取出来以免和特化发生混淆。

如果函数 满足:

那么我们将其称为一个测度

此时我们将 ​​ 称为一个测度空间

研究测度与基于测度的数学方法的学科被称为 测度论。如果-代数是集合论意义下离散的, 那么积分退化为对-代数下个元素的测度的加权求和。


是一个很有意思的式子,我们学习这种形式的积分式读作 “将 ” 沿着 积分,这种读法在微积分的哲学上完全没有问题,符合微积分的自然语言读法,但为什么可以“沿着某个方向积分”?我们学到的往往是说把 “看作常量”,但是为什么可以看作常量?事实上,这种积分隐式再次扩展了积分的语法,这个过程实际上如下所示:

注意以上几行在描述同一个映射的全过程,这是一个把函数映射到函数的映射,所以请辨别括号优先级。

也就是说,我们对所有 做积分,这里 的确是常量,因为这个 本身是被 “” 的部分构造好了,变量只有


再讲一点微分吧,我们在上面讲了实际上最初 就是一个不可分割的符号,但 Leibniz 后来发现链式法则,微分符号正好可以真的当分数来用。所以这个符号也逐渐被含糊其意,至少丧失了其本来的意思了。再后来,裸体的 (被称为微分形式)也开始被使用, 变成了一个代数对象。

虽然在微积分的多数应用中 - 语言基本上被隐去了,但数学分析的具体计算(被称为“硬分析”)中,数学家仍然要同时操作多个 - / - ,这被认为是痛苦的,人类难以理解、计算、管理它们,而计算机就更难理解它们了——因为 - / - 语言不加保留的使用了完整的经典逻辑,这意味着我们基本只能已经拿到了一个对象然后问“是不是极限”,亦或是证明“存不存在一个极限”,而无法直接构造出这个极限。有两个领域试图尽量解决这些痛点,一个被称为非标准分析,一个被称为综合微分几何(Synthetic Differential Geometry; SDG)。它们已经有了不少应用。


简单函数及其积分其实还有一种更复杂也更严谨的定义。

如果函数 满足:

称其为一个简单函数。其积分定义为:

这个定义的可扩展性很强,但为什么我们可以对不可数多个元素求和?

实际上这个求和符号的语法应该定义为:

对于形如 的语法,定义为 ,也就是对这样生成出来的集合求和。例如 和图论中 ,高等概率论中你也会遇到它。

然后我们定义对集合求和 的语法:

也就是说,如果 生成出来的集合 只有可数无穷多个元素,我们就可以对生成出来的每个元素标记一个自然数,然后对其进行常规的求和。


其实本来有很多东西想写,但是碍于时间精力不足所以只随性写了这么一点,虽然比较乱,难度高,不够严谨,不过总归是写出来了。

如果真的要认真学数学分析和测度论,入门书籍可能会是 于品的讲义 ,如果对非标准分析感兴趣,可以看 陶哲轩的 Blog

 

评论

此博客中的热门博文

小杂感

黑客精神和7-11便利店