10.2 光滑,偏导数
由于考虑的是不止一个变量的函数,现在我们正进入高维空间,因此有必要就高维空间下的“微积分”交代几句。正如下一章我们将清楚看到的那样,空间——即流形——可以是n维的,这里n是一个正实数。(n维流形经常也简作n流形。)爱因斯坦的广义相对论用四维流形描述时空,许多现代理论甚至要用到更高维的流形。我们将在第12章来讨论一般的n维流形,但在本章,出于简单计,我们只考虑实二维流形(或曲面)S的情形。这样,我们可用局部(实)坐标x和y来标出S的不同的点(S的某个局部区域上的点)。实际上,这里的讨论也可以看作是一般n维情形的代表。
例如,一个二维曲面可以是一个普通的平面或球面。但这种曲面不是“复平面”或“黎曼曲面”,因为我们并不在意它是否像复空间那样被赋予了结构(即具有定义在该曲面上的“全纯函数”概念)。我们关心的只是它是否是光滑流形。几何上看,这意味着我们不必像对§8.2的黎曼曲面所做的那样在意诸如局部共形结构之类的事情,而是需要能够辨别定义在空间上的函数(即函数的定义域为该空间)是否“光滑”。
图10.2 在欧几里得三维空间里画出的球面S上的函数,这里h表示赤道面上方的高度。(a)函数h本身是S上的光滑函数(虚线表示负值)。(b)模|h|(见图6.2(a))沿赤道面不是光滑函数。(c)平方h2在整个S上都是光滑函数。
为了得到何谓“光滑”流形的直观概念,我们来考虑与立方体相对的球面(这里我谈的都是指其表面而非内部)。以球面上的光滑函数为例,我们可将表示赤道面上方高度的函数称为“高度函数”(这里球面就是普通三维欧几里得空间内的图形,赤道面向下的距离计为负)。见图10.2(a)。另一方面,如果所考虑的函数是高度函数的模(见§6.1和图10.2(b)),则赤道面向下的距离也计为正,这样,这个函数沿赤道面就不光滑了。但如果我们考虑的是高度函数的平方,那么这个函数在球面上依然是光滑的(图10.2(c))。在所有这些情形里,函数在北极和南极点都是光滑的,尽管在极点处等高度的周线呈“奇点”状。唯一不光滑的情形出现在图10.2(b)的赤道面处。
图10.3 在一个局部拼块内,各点用光滑(实数)坐标(x,y)来表示。
为了加深对此的理解,我们引入曲面S上的坐标系。这些坐标仅需应用于局部,我们可将S想象为是由一系列局部拼块——坐标拼块——按类似于§8.1对黎曼曲面所做的那样“粘合”而成的。(例如对于球面,我们需要不止一块这种拼块。)在一个拼块内,光滑坐标可标示不同的点,如图10.3。这里坐标皆取实数值,我们不妨称其为x和y(这里没有任何暗示要将它们组合成复数形式)。假定我们有某个定义在S上的光滑函数Φ。在现代数学的词汇里,Φ是指从S到实数空间R的光滑映射(如果Φ是S上的复值函数,则它表示的是S到复数空间C的光滑映射),因为Φ为S的每一个点赋一个实(复)数——即Φ映射S到实(复)数。这种函数有时被称为S上的标量场。在一个特定拼块上,量Φ可表示为一个两坐标的函数:
Φ=f(x,y),
这里量Φ的光滑性可用函数f(x,y)的可微性来表示。
我还没解释什么是多变量函数的“可微性”。虽然直观上很清楚,但要在此给出严格定义还是有点儿过于技术化了。[1]当然作些适当说明还是必要的。
假定f作为一对变量(x,y)的函数是可微的,我们不妨先将f(x,y)看成是关于单个变量x的函数,此时y取定为某个常数值。这样,这个函数作为单变量x的函数(§6.3),一定是光滑的(至少C1)。进而我们将f(x,y)看成是关于单变量y的函数,x取定某个常数值,此时这个单变量y的函数一定也是光滑的(C1)。但这还远远不够充分。有许多关于x和y分别光滑的函数未必对变量对(x,y)也一定是光滑的。***〔10.3〕光滑的充分条件是,该函数分别关于x和y的导数每一个都必须是变量对(x,y)的连续函数。类似要求对变量数超过两个的函数也成立。我们用“偏导数”符号∂来标记关于每个变量的微分。f(x,y)关于x和y的偏导数分别写成
(作为例子,我们来看看f(x,y)=x2+xy2+y3,这时有∂f/∂x=2x+y2和∂f/∂y=2xy+3y2。)如果这些量存在并连续,那么我们说Φ是曲面上的(C1)连续函数。
我们还可以考虑高阶偏导数,f关于x和y的二阶偏导数分别为
(这里显然要求C2连续。)还有一种“混合”的二阶导数∂2f/∂x∂y,它的意义是∂(∂f/∂y)/∂x,即“f关于y的偏导数关于x的偏导数”。我们还可以将这个混合偏导数写成∂2f/∂y∂x。实际上,这两个量相等正是f的(二阶)可微性的结果:**〔10.4〕
(两变量函数的C2连续性要求满足这一点。)***〔10.5〕对更高阶的导数(和更高阶的光滑性),我们有相应的量:
图10.4 为了覆盖整个S,我们必须将不同的坐标拼块“粘合”起来。S上的光滑函数Φ在某个拼块上有坐标表达式Φ=f(x,y),而另一个拼块上有Φ=F(X,Y)(相应的局部坐标分别为(x,y),(X,Y))。在重叠区域,f(x,y)=F(X,Y),这里X和Y是x和y的光滑函数。
我之所以要用不同的字母将f与Φ仔细地区分开来,是因为我们打算根据各种不同坐标系下的表达式来考虑定义在曲面上的量Φ。函数f(x,y)的数学表达式可以随拼块不同而变化,即使Φ在被这些拼块“覆盖”的曲面上任意特定点上的值保持不变。特别是这种情形可以出现在不同坐标拼块之间的重叠区域(图10.4)。如果第二套坐标集记为(X,Y),则对新坐标拼块下的Φ值,我们有新的表达式
Φ=F(X,Y)。
因此在两个坐标拼块之间的重叠区域,我们有
F(X,Y)=f(x,y),
但如上所述,由量X和Y表示的特定的F表达式一般不同于由x和y表示的f的表达式。在重叠区,X和Y可能都是x和y的复杂函数,这些函数可能必须被结合进从f到F的转换中去。*〔10.6〕这些将一个坐标系下的坐标用另一个坐标系下的坐标来表示
X=X(x,y)和Y=Y(x,y)
的函数及其反函数
x=x(X,Y)和y=y(X,Y)
称为转移函数,它们表示不同拼块间坐标的转换。这些转移函数都是光滑的——为简单计,我们姑且设为C∞光滑——它引出这样一个结果:量Φ的“光滑”概念与拼块重叠区的坐标选择无关。