目录

  • 引言

  • 经典力学的伽利略变换

  • 迈克尔逊-莫雷实验

  • 麦克斯韦方程组

  • 利用同时性的概念导出洛伦兹变换

  • 尺缩效应(长度收缩)

  • 钟慢效应(时间膨胀)

  • 双生子佯谬

  • 相对论性多普勒效应

  • 速度合成公式

  • 洛伦兹变换与普通坐标旋转变换的对比

  • 洛伦兹不变量,四维时空间隔,和闵可夫斯基度规

  • 按照洛伦兹变换下各个分量的变换行为对物理量进行分类

1引言

1905年狭义相对论的出现主要是源于爱因斯坦对经典电磁场麦克斯韦方程组对称性结构的深入考虑。传统的伽利略变换虽然是经典力学里牛顿运动定律的对称性,但它却不是麦克斯韦方程组的对称性。为此,我们必须重新审视时间和空间这些基础但却微妙的物理概念,并在此基础上对伽利略变换进行改造升级成洛伦兹变换以使其适配麦克斯韦方程组的对称性。在洛伦兹变换下,时间不再是一个绝对的概念,而是一个相对的概念,且可以与空间发生混合,从而构成一个叫作“四维时空”的统一体。这种全新的时空观和时空对称性除了会带来很多有趣的反直觉的物理现象;更重要的是,它对处于该时空下各种粒子/场的运动规律和演化行为提出了非常强的约束。

本文将从经典牛顿力学所满足的伽利略变换出发,导出光速取决于观察者具体运动状态的结论。而该结论直接与迈克尔逊-莫雷实验和麦克斯韦方程组所指明的“光速不变”的事实相矛盾。为了解决这个矛盾,我们通过重新审视时间和同时性的概念将伽利略变换改造升级成满足“光速不变原理”的洛伦兹变换,它是狭义相对论的核心。在洛伦兹变换以及由它带来的全新的时空观下,我们将会发现诸如尺缩效应/钟慢效应/双生子佯谬/相对论性多普勒效应/非线性的速度合成公式/质能等价关系等一系列反直觉的物理现象和结论。接下来,我们讨论了洛伦兹变换与普通坐标旋转变换的关系,以及如何利用与普通坐标旋转变换的类比导出洛伦兹不变的线元和相应的度规形式。然后为了给之后的内容做铺垫,我们按照洛伦兹变换下张量各个分量的变换行为对物理量进行了分类。

有了上述关于狭义相对论的背景基础,我们下面就正式进入到经典力学系统和经典场论系统动力学行为的研究。我们从控制这些系统动力学行为最为核心的作用量出发,通过要求这些作用量具备各种不变性,如洛伦兹不变性规范不变性等,我们几乎可以唯一地确定出它们的数学形式。然后依据作用量原理,我们可以自动导出满足洛伦兹对称性的各种粒子/场的运动规律和演化行为。为了检验我们从洛伦兹不变的作用量导出的运动方程是否真的具备洛伦兹对称性,同时考虑到读者也许对四维张量的语言还不太熟悉,我们以经典电磁场所满足的麦克斯韦方程组为例,在三维语言下经过了一些冗长的计算验证了其确实满足洛伦兹对称性的要求,并顺便导出了电磁场各个分量在洛伦兹变换下的变换规律。最后为了阐明电磁场洛伦兹变换的物理意义,我们以匀速运动电荷所产生的电磁场为例,说明电场和磁场并不是相互独立的两个毫无关系的物理对象。相反,它们是同一个物理对象“电磁场”的不同表现形式,且它们可以在不同的惯性系间相互转化。

2经典力学的伽利略变换

考虑两个沿x方向存在相对运动的惯性观察者。在t=0时刻两者相互重合,并假设他们之间相对运动的速度为常数v。他们分别对应如图1所示的两个坐标系S和S':

图1 - 沿着x方向相对运动速度是v的两个坐标系S和S'

通过一些朴素的几何关系,根据图1容易看出两个坐标系间的坐标变换关系。其中从S系到S'系的坐标变换关系是:

该线性变换可以用矩阵语言写成如下更为紧凑的形式:

相应地,我们可以从上述坐标变换关系反解出从S'系到S系的坐标变换关系是:

上述两组变换关系叫作“伽利略变换”。可以发现,除了在相对速度v上差了个符号,它们在数学形式上是完全相同的!所以作为惯性系的S系和S'系平权,这也正是伽利略相对性原理的直接体现。同时,经过一些简单的验算我们可以得出伽利略变换的三个重要性质:1)伽利略变换对复合操作运算具有封闭性,即:对时空坐标接连作用两次伽利略变换的结果仍然是一个伽利略变换;2)对于任意一个伽利略变换都存在逆变换,只需要把里头的变换参数从v变成-v即可;3)存在一个平凡的伽利略变换,即变换参数v=0的恒等/单位变换。所以,所有伽利略变换的集合连同其上定义的复合操作在数学上构成了一个群。而且由于该群的变换参数v可以连续变化,所以它对应一个连续群(李群)的数学结构,叫作“伽利略变换群”。容易发现,经典力学的牛顿运动定律:

在伽利略变换群的作用下保持数学形式不变。用现代理论物理的语言来说,这意味着伽利略变换是牛顿运动定律的一个对称性。我们容易得出在伽利略变换框架下的速度叠加关系是如下中小学就已经非常清楚的关系。它意味着“所有速度都是相对的而不存在绝对速度”的朴素认知,并与我们的日常经验和直觉相符:

然而,当我们把这个朴素的速度叠加规则应用到光(电磁波)时,我们会得到:

这样的结论。这意味着在伽利略变换下,光速并不是固定不变的,它取决于观察者具体的运动状态。也就是说,在不同惯性系下会测出不同的光速。这似乎也符合上面我们提到的“所有速度都是相对的而不存在绝对速度”的朴素认知。然而事实并非如此:光速是个很特殊的东西,它是绝对的而不是相对的!我们将在接下来要讲的迈克尔逊-莫雷实验和经典电磁场所满足的麦克斯韦方程组中发现,不管从实验上还是从理论上来说,光速相对于任何惯性观察者都是常数c。而这个存在绝对速度的结论是与传统的伽利略变换相矛盾的。这也促使我们必须重新审视时间和空间以及同时性等基础但却微妙的物理学概念,并提出一套新的时空坐标变换理论(即所谓的“洛伦兹变换”)使得该变换不仅满足“所有惯性系平权”的相对性原理,还必须同时满足“光速在所有惯性坐标系下均为常数c”,即所谓“光速不变原理”的限制。

3迈克尔逊-莫雷实验

人们最开始假设光和声音一样,都需要某种介质来支持它的传播。最初假想光是在一种叫作“以太”(Ether)的媒介中传播的,光在相对于以太以不同状态运动时会有不同的速度。为了验证以太是否存在以及光速是否是常数,1887年迈克尔逊和莫雷设计了如图2所示的光学干涉装置:

图2 - 迈克尔逊-莫雷光学干涉仪的实验装置图

来自图2最左侧相干光源发出的光在经过中央的一个半透射半反射的膜O后,其中一半的光被透射后抵达镜子M1然后被反射回O点,另一半的光被反射后抵达镜子M2然后被反射回O点,并与从M1反射回来的光发生干涉。假设整个装置在以太中以速度u向右运动,那么这等价于装置不动,而以太风以速度u向左吹来。我们可以把“以太风”想象成是一条水流速度为u向左均匀流动的河流,把光想象成是一艘固有速度是c的船。那么容易得出光在水平方向从O到M1再返回O的路径上所花费的时间是:

同理,容易得出光在竖直方向上从O到M2再返回O的路径上所花费的时间是:

容易发现这两个时间是不相等的。为了简化计算,假设装置在以太中的运动速度u远小于光速c,那么我们可以对小量做泰勒展开得出光沿着两条路径上传播的时间差是:

由于光沿着两条路径传播存在着如上所示的时间差,即存在所谓光程差,所以我们自然预期在实验观测中会发现光学干涉条纹的偏移。然而,最终的实验结果发现光学干涉条纹并未发生任何改变,也就是说上述的时间差结果是0!当把光学桌旋转一定角度后发现干涉条纹依然没有发生任何改变!这也就从实验上证明了以太并不存在,光速恒为常数c!

4麦克斯韦方程组

上一节是从实验的角度来看的,这一节里我们将从理论的角度来看“光速不变”。我们从经典电磁场理论所服从的方程,即麦克斯韦方程组,出发。考虑最简单的无源真空情形:

无源真空

此时麦克斯韦方程组可以简化成如下关于电场和磁场更为对称的形式:

可以发现上述麦克斯韦方程组中的第三个和第四个方程的电场和磁场相互耦合。所以为了得到纯的关于电场的方程,我们对第三个方程两边同时取旋度,并利用第四个方程的结果容易得到:

对上述方程最左侧的矢量叉乘运算应用矢量分析中的恒等式可以得到:

然后对上述方程左手边第二项利用第一个麦克斯韦方程的结果可以将上式最终化简成纯的仅关于电场的偏微分方程:

同理,我们可以得到关于磁场的偏微分方程:

容易发现,控制磁场的偏微分方程和控制电场的偏微分方程在数学形式上完全一致。它们都是一类特殊的二阶线性偏微分方程,叫作“波动方程”。所以根据上述两个波动方程的形式可以立刻推断出空间中电磁场/电磁波的传播速度恒为光速c:

它是个仅与真空介电常数和磁导率有关的常数,而与观察者具体的运动状态无关。【注:为了之后计算方便,也为了更好地凸显出理论的对称性,我们把c这个常数定义成1,也就是把光速c定义成一个标准单位。这样处理后时间和空间的量纲也统一起来了】所以对于任何惯性观察者来说,他测出的光速都是c,即:

同时,如果想象骑在光束上跟着电磁波前进,那么我们貌似会观察到一个静止的不向前传播的电磁场构型,但它并不是原本麦克斯韦方程组的解!所以综上所述,我们必须重新审视并修正经典伽利略/牛顿力学里一些关于时间和空间的基本观念,来解释上面这些奇怪的有悖于直觉的现象。

5利用同时性的概念导出洛伦兹变换

我们从一个思想实验出发来思考时间和同时性的问题。假设有一列以速度v从左向右行驶的长度为2L的火车,在t=0时刻,在地面系的人看到该火车的车头和车尾同时被闪电击中。这里站在地面系的人对“同时性”的认知和定义是:假设在t=0时刻地面系站着一个人,且这个人恰好位于距离车头和车尾均为L的正中间的地面位置,那么他毫无疑问会同时接收到从车头和车尾传递过来的光。也就是说对于地面系的观察者来说,车头和车尾被雷击的事件是同时发生的。

但是,对于火车系上的观察者来说,他是否仍然会认为车头和车尾被雷击的事件是同时发生的?他对于“同时性”的定义是什么样的?也就是说,对于一个站在火车正中间的人而言,他是否仍然会同时接收到车头和车尾传递过来的光?答案是否定的!因为站在火车正中间的人在与火车一道向右运动,所以对于这个人来说,从车头传递过来的光其实在与他发生相遇运动,而从车尾传递过来的光在与他发生追及运动。所以很显然他会更早地接收到车头的来光,而更晚地接收到车尾的来光。所以,在火车上的观察者眼里,车头和车尾被雷击的事件就不是同时发生的!

所以可以发现“同时性”的概念变得微妙了起来。在一个参考系下同时发生的事件很有可能在另一个参考系就不再同时发生。也就是说,“同时性”是一个取决于观察者具体运动状态的相对的物理概念,而不是我们传统直觉里自动默认的对每个惯性观察者都一致的概念。图3以时空图的方式更加直观和完整地展现了上面我们所描述的过程:

图3 - 地面系S和火车系S'上接收车头/车尾光信号的时空图

其中图3中的B和A分别对应车头和车尾的雷击事件。由于之前定义了光速是1,所以车头闪电/光的时空轨迹沿着与-x轴呈45度角的BC方向,车尾闪电/光的时空轨迹沿着与+x轴呈45度角的AC方向。M对应距离车头和车尾均为L处于正中间位置的地面系的人,他在时空图里的轨迹是一条竖直向上与t轴平行的直线。因为这条竖直向上的直线与BC和AC交于同一时空点C,所以对于地面系的人来说,车头和车尾被雷击的事件,即A和B,是同时发生的,且通过这两点可以唯一确定一条地面系认为的对应于t=0的同时线(也就是x轴)。

但是对于一个站在火车正中间与火车一道向右运动的人而言,他的时空轨迹对应图中向右倾斜的直线MM'。这条直线MM'与BC的交点是D,而与AC的交点是E。因为D和E是两个不同的时空点,所以这意味着对于火车系的人来说,车头和车尾被雷击的事件,即A和B,并不是同时发生的。

我们现在希望寻找在火车系上的人认为的与A同时发生的事件/时空点在上述时空图中所处的位置。这些位置的集合会构成火车系里对应t'=0的同时线(也就是x'轴)。因为我们现在已经有了A点是t'=0这根同时线上的一点,所以为了定出这根直线,我们只需要找到火车系里一个与A同时的时空点即可。因为AC与MM'交于E,所以我们可以通过E反向作与-x轴呈45度角的直线(即光信号的时空轨迹),这条直线与车头的时空轨迹BB'相交于F。这样一来,从F发出的光自然会和从A发出的光相交于同一时空点E。这就意味着我们成功找到了在火车系观察者看来和A同时发生的其中一个时空点F。所以对于火车系上的观察者而言,此时对应于t'=0的同时线不是AB,而是AF!上面只是定性的推理,为了定量求出这条AF直线的方程,我们只需要求出F的坐标即可。为此,我们必须先求出E的坐标。由于E是直线AC和MM'的交点,所以通过联立直线AC和MM'的方程可以很容易地定出E的坐标:

因为EF是一根与-x轴呈45度角的直线(即光信号的时空轨迹),又因为我们已经定出了E的坐标,所以容易写出直线EF的方程是:

由于F是直线EF和BB'的交点,所以通过联立直线EF和BB'的方程可以很容易地定出F的坐标:

因为A位于坐标原点,所以有了F的坐标,我们可以很容易地定出直线AF的方程是:

它对应火车系上t'=0的同时线,也就是火车系上的x'轴。相应地,火车系上对应于x'=0的线,即火车系上的t'轴,是直线AA'。它的方程是:

这样我们就定出了在火车系上t'轴和x'轴的具体形式。它意味着:当t-vx=0时,t'=0;而当x-vt=0时,x'=0,所以为了满足这两个要求,t'必须存在(t-vx)的因子,而x'必须存在(x-vt)的因子。同时考虑到麦克斯韦方程组是线性的,因此只有线性变换才有可能保持麦克斯韦方程组的线性性。所以出于上面两点的考虑,S系(地面系)到S'系(火车系)的时空坐标变换只能取如下的数学形式:

值得注意的是,此处我们假定比例修正因子f和g只与参考系S和S'间相对速度v的大小有关,而与v的方向无关。所以对于此处v只是沿着x方向的一维情形来说,修正因子f和g均为v的偶函数。我们之后将发现这个假定确实是正确的。接下来,为了满足之前讲的“光速不变原理”的要求,这个线性变换必须保持光速在S和S'系下都是1,这将给我们提供f和g间的关系,即:

所以为了满足“光速不变原理”的要求,f和g必须严格相等(将其记为,这是狭义相对论里比例修正因子的标准记号,且容易知道也是v的偶函数)。所以此时从S系到S’系的时空坐标变换可以简化成如下仅含有一个待定参数的形式:

所以下面的目标就是定出的具体形式。注意到我们现在还有一个限制条件没用到,它就是“(狭义)相对性原理”,即:所有惯性系都是平权的。它意味着物理定律在惯性系下保持数学形式不变,这将要求反过来从S'系到S系的时空坐标变换依然保持上面那个从S系到S'系变换的数学形式,除了把v反号变成-v。所以为了满足“狭义相对性原理”的要求,从S'系到S系的时空坐标变换必须具备如下形式:

【注意到在上述v变到-v的过程里,我们已经隐含地使用了是v的偶函数这个假定。】上面我们是从物理的角度得到的从S'系到S系的坐标变换关系;而另一方面,我们可以直接从数学的角度反解出从S'系到S系间的坐标变换关系是:

上述分别从物理和数学两个不同的角度得到的方程其实描述的是同一个从S'系到S系的坐标变换,所以为了让它们之间自洽,必须满足:

所以通过“狭义相对性原理”的要求,我们最终定出了的具体形式。容易发现我们解出的的确是v的偶函数,这也就验证了我们最开始做的假定是正确的。然而,其中的负根必须舍去,因为如果我们把在v=0时的负根代入到上面从S系到S'系的坐标变换关系,我们会得到S'系里的时间和空间相对于S系发生反射的非物理的荒谬结果:

而在v=0时,S系和S'系根本就是同一个参考系,所以它们之间理应满足最平凡的坐标变换关系,即:

所以我们只能取的正根,即:

从上述关于的表达式容易看出,为了使得变换后的时空坐标仍然是有物理意义的实数,分母中根号里的表达式不能出现负数,所以v的绝对值的上界是1(光速),这意味着光速是所有速度的极限速度。

值得注意的是,在上面的数学处理中我们一直都没考虑沿y和z方向的坐标变换关系,因为我们目前的讨论里只涉及沿着x方向的相对运动,而不牵涉y和z方向。所以这意味着y和z方向的变换关系只是最平凡的y'=y,z'=z的形式。于是代入的具体形式,我们最终得到了从S系到S'系(沿着x方向)的时空坐标变换是:

【注:从上述坐标变换可以发现,与伽利略/牛顿的绝对时空观不同,在狭义相对论里,时间不再是一个绝对的概念,它能够和空间发生混合。所以我们可以将时间和空间统一成一个有机的整体,叫作“四维时空”。】该线性变换可以用矩阵语言写成如下更为紧凑的形式:

这就是大名鼎鼎的“洛伦兹变换”!当然更准确的说法应该是沿着x方向的洛伦兹Boost,因为真正完整的洛伦兹变换除了包含x方向的洛伦兹Boost,还应该包含y方向和z方向的洛伦兹Boost,以及绕着x,y,z三个轴的普通坐标旋转,即:

以及它们之间所有可能的相互复合。但由于Boost操作并不像普通的坐标旋转操作,它是狭义相对论时空变换所独有的特性,又出于简化问题的需要,所以我们这里只讨论沿着x方向的洛伦兹Boost,并粗略地把它称作“洛伦兹变换”。在低速下,它可以退化到本文最开始讨论的伽利略变换。通过反解洛伦兹变换,我们容易得到从S'系到S系的洛伦兹逆变换是:

可以发现,除了在相对速度v上差了个符号,它具有和洛伦兹变换完全相同的数学形式。所以作为惯性系的S系和S'系平权,这也正是狭义相对性原理的直接体现。同时,经过一些简单的验算我们可以得出洛伦兹变换的三个重要性质:1)洛伦兹变换对复合操作运算具有封闭性,即:对时空坐标接连作用两次洛伦兹变换的结果仍然是一个洛伦兹变换,这在之后的“速度合成公式”一节中有详细说明;2)对于任意一个洛伦兹变换都存在逆变换,只需要把里头的变换参数从v变成-v即可;3)存在一个平凡的洛伦兹变换,即变换参数v=0的恒等/单位变换。所以,所有洛伦兹变换的集合连同其上定义的复合操作在数学上构成了一个群。当然严格地说,上面我们只说明了沿着x方向的洛伦兹Boost构成了一个群。但可以在数学上严格证明:所有沿着x,y,z方向的洛伦兹Boost,绕着x,y,z三个轴的普通坐标旋转,以及它们之间所有可能的相互复合,所构成的集合连同其上定义的复合操作在数学上也构成了一个群。而且由于该群的变换参数(相对速度和旋转角度)可以连续变化,所以它对应一个连续群(李群)的数学结构,叫作“洛伦兹群”。当然,还是出于与之前相同的原因,我们现在仍然只考虑洛伦兹群里沿着x方向Boost那一部分,并粗略地把它称作“洛伦兹群”。现在有了洛伦兹群作用下时空坐标变换的具体形式,接下来我们就看看这样一种奇怪的坐标变换方式会带来什么反直觉的物理结论。

6尺缩效应(长度收缩)

第一个由洛伦兹变换产生的反直觉结论是“尺缩效应”。下面我们就来定量地看看这个尺缩效应究竟是怎么产生的。假设有一把静止于地面S系的长度是L的尺子。现在有一个相对于S系以速度v向右运动的惯性系S',那么S'系的观察者会把尺子的长度测成多长?这里问题的关键在于:如何定义尺子的长度?为了说清楚这个问题,我们不妨画一个如图4所示的时空图:

图4 - 尺缩效应的时空图

从图4容易看出,一把静止于S系的尺子会在时空图里划出一条带状的阴影矩形区域。我们说“尺子在地面S系里的长度指的是S系的观察者用他的时间t同时地(比如在t=0时刻)测出尺子两头的位置,然后由此计算出尺子的长度是L,对应到图4就是指OA的长度是L。同理,当我们在S'系里测量尺子长度的时候,我们必须使用S'系的时间t'同时地(比如在t'=0时刻)测出尺子两头的位置,然后由此计算出尺子的长度,对应到图4就是指我们希望求的长度是OB。所以原先文字语言描述里一些含糊不清摸棱两可的概念在时空图里都得以清晰的展现。这也是为什么很多狭义相对论问题最好的处理方式都是画时空图!我们现在的目标是求出OB的长度,所以我们必须先求出点B的坐标。因为B是x'轴和竖直线AB的交点,所以通过联立x'轴和直线AB的方程可以很容易地定出B的坐标:

上面B的坐标是在S系下表示的。然而我们希望得到在S'系下表示的B的坐标,所以利用从S系到S'系的洛伦兹变换,我们有:

这样我们就得到了S'系下t'=0时尺子右端点B的坐标。S'系下t'=0时尺子左端点是坐标原点O。由此可以计算出尺子在S'系下的长度L'是:

可以发现,相较于在静止S系测出的尺子的长度L,S'系下尺子的长度L'变短了。这就是狭义相对论里“尺缩效应”的来源。

7钟慢效应(时间膨胀)

第二个由洛伦兹变换产生的反直觉结论是“钟慢效应”。下面我们就来定量地看看这个钟慢效应究竟是怎么产生的。假设有一个静止于地面S系的钟,这个钟在S系从t=0时刻走到t=T时刻,总共走了间隔是T的时间。现在有一个相对于S系以速度v向右运动的惯性系S',那么S'系的观察者会认为S系的钟走了多长时间?和上一节一样,为了说清楚这个问题,我们画一个如图5所示的时空图:

图5 - 钟慢效应的时空图

从图5容易看出,静止于地面S系的钟会在时空图里划出一条长度是T的直线段OT。我们希望求出S'系的观察者所认为的S系的钟所走的时间。所以我们必须过T作S'系的等时线交t'轴于点T'。于是我们现在的目标就是求出OT'的长度。为此我们必须先求出T'的时空坐标。因为T'是直线TT'和t'轴的交点,所以通过联立直线TT'和t'轴的方程可以很容易地定出T'的坐标:

上面T'的坐标是在S系下表示的。然而我们希望得到在S'系下表示的T'的坐标,所以利用从S系到S'系的洛伦兹变换,我们有:

由此可以计算出S'系观察者所认为的S系的钟走的时间T’是:

可以发现,相较于静止在S系下的钟所走过的间隔为T的时间,在与钟存在相对运动的S'系会认为时间间隔T'变大了。这就是狭义相对论里“钟慢效应”的来源。

我们可以从上述狭义相对论里尺缩钟慢的表达式得出:在狭义相对论所处的时空下,四维时空体积元是个洛伦兹变换下的不变量,即:

这也是为什么我们在后续将要讨论的经典场论系统里要把作用量从拉格朗日量对时间积分的形式等价地改写成如下所示的场的拉格朗日密度对四维时空体积元积分的形式的原因。因为只有这样做才能明显地展现出体系的洛伦兹对称性:

8双生子佯谬

第三个由洛伦兹变换产生的反直觉结论是“双生子佯谬”。下面我们就来定量地看看这个双生子佯谬究竟是怎么产生的。假设地球上有一对双胞胎Alice和Bob,在某一时刻Bob飞离地球做了一趟星际旅行后又返回地球;而Alice静止不动呆在地球上。那么当Bob返回地球时,Alice和Bob谁更年轻?为了说清楚这个问题,我们画一个如图6所示的时空图:

图6 - 双生子佯谬的时空图

从图6容易看出,静止于地面S系的Alice会在时空图里划出一条直线段OA。为简单起见,假设Bob是以相同的速率v飞离地球和返回地球的(其中飞离地球的速度是+v,返回地球的速度是-v)。那么Bob在时空图里划出的轨迹将是由长度是T'的线段OB和BA所构成的折线段OBA。所以我们现在的目标就是比较直线段OA与折线段OBA的长度。容易看出折线段OBA的长度是2T'。所以我们现在要求OA的长度。为此我们必须先写下B在S'系的坐标。然后利用从S'系到S系的洛伦兹变换得到B在S系的坐标:

过B作S系的等时线交t轴于C。所以容易根据B在S系的坐标直接写出C在S系的坐标,进而根据对称性写出A在S系的坐标:

由此可以计算出S系的Alice所经历的时间是:

可以发现,相较于静止在S系下Alice所经历的时间间隔OA,Bob所经历的时间间隔OBA更短。所以经历了星际旅行的Bob在返回地球时会比Alice更年轻。但也许有些人会有疑问:上面我们是站在Alice的角度认为Alice没动,而Bob做了一趟星际旅行,所以最后导致的结果是Bob变得更年轻了;那如果我们是站在Bob的角度不应该认为Bob没动,而Alice做了一趟星际旅行,那么最后导致的结果不应该是Alice变得更年轻了?所以Alice和Bob到底谁更年轻?这也正是狭义相对论里“双生子佯谬”的来源。这里需要说明的是:上述Alice和Bob的坐标系并不等价!其中Alice毫无疑问是处于惯性系的。而Bob由于先飞离地球又返回地球,所以他中间必然经历了加速/减速的过程(图6中的加速/减速点位于B点),所以他是处于非惯性系的!所以Bob一定可以知道是他在做星际旅行而不是Alice。所以上面所说的“站在Bob的角度认为Alice也做了一趟星际旅行”这句推断是完全错误的,因为它默认了Alice和Bob的坐标系是等价的,但其实它们并不等价!

9相对论性多普勒效应

第四个由洛伦兹变换产生的反直觉结论是“相对论性多普勒效应”。下面我们就来定量地看看这个相对论性多普勒效应究竟是怎么产生的。假设有一束光波在地面S系下测得的波长是,频率是f。那么在一个相对于S系以速度v运动的惯性系S'的观察者会测出该光波的波长和频率分别是多少?为了说清楚这个问题,我们画一个如图7所示的时空图:

图7 - 相对论性多普勒效应的时空图

由于光波在地面S系下的波长是,所以这意味着光波相邻波峰间的距离在S系下测是。这在图7中的体现就是t=0时刻O,A,B三点分别对应S系下相邻波峰的位置,且OA和AB的长度均为,是S系下光波的波长。该光波会以光速沿x轴正方向前进,所以它的波峰也会以光速沿着x轴正方向前进。这在图7中的体现就是原先t=0时刻波峰的位置O,A,B会在时空图里划出三条相互平行的与+x轴方向呈45度角的直线OO',AA',BB'。其中,这三条线分别交x'轴于点O,C,D。我们希望找到在S'系下t'=0时刻相邻波峰间的距离,而这在图7中的体现就是线段OC和CD的长度。因为OC和CD的长度相同,所以我们现在的目标就是求出线段OC的长度 ,而这个长度也就是S'系的观察者所测出的光波的波长。为此我们必须先求出点C的坐标。因为C是x'轴和直线AA’的交点,所以通过联立直线AA'和x'轴的方程可以很容易地定出C的坐标:

上面C的坐标是在S系下表示的。然而我们希望得到在S’系下表示的C的坐标,所以利用从S系到S'系的洛伦兹变换,我们有:

由此可以计算出S'系的观察者所测得的光波波长是:

因为光波的频率与波长间呈现反比关系,即:

所以S'系的观察者所测得的光波频率是:

可以发现,相较于在地面S系下测得的光波频率,在S'系下的观察者将会观测到光波的频率发生改变。具体光波的频率会变低(红移)还是变高(蓝移)取决于相对速度v的正负:

这就是狭义相对论里“相对论性多普勒效应”的来源。

10速度合成公式

这一节里我们讨论在狭义相对论里速度是如何相加的。假设我们现在有三个惯性系S,S',S'',且它们之间的相对速度都沿着x方向。其中S'系相对于S系的速度是v,而S''系相对于S'系的速度是u。我们希望知道S''系相对于S系的速度是多少。首先我们可以根据洛伦兹变换写出从S系到S'系,以及从S'系到S''系的坐标变换关系分别是:

为了消去中间S'系的变量,我们将S系到S'系的洛伦兹变换式代入S'系到S''系的洛伦兹变换式:

将上述方程组化简整理后,我们可以得到从S系直接变换到S''系的坐标变换是:

将上述坐标变换式与如下标准形式的洛伦兹变换作比较:

通过对比可以发现,从S系直接变换到S''系的坐标变换也是一个洛伦兹变换,其速度参数w是:

这也就验证了我们之前在论证群结构时提到的封闭性,即沿着x方向的洛伦兹Boost对复合操作运算具有封闭性。这个结果在物理上意味着S''系相对于S系的速度就是如上所示的w的表达式。

当然,我们也可以等价地从另一个角度使用如下计算量更小的方法导出完全相同的物理结果。假设我们现在有两个惯性系S和S',它们之间的相对速度是v(沿着x方向)。假设一个物体在S'系里测出的速度是u(沿着x方向),我们希望知道该物体相对于S系的速度是多少。首先写出从S'系到S系时空坐标微元的洛伦兹变换:

为了得到物体相对于S系x方向的速度,我们将上述方程组的前两个方程相除,并利用“物体在S'系里测出的速度是u”这个条件:

上述得出的w就是物体相对于S系的速度。可以发现,这个速度合成公式与之前导出的w的表达式完全一致!有了速度合成公式,下面我们就代入几个具体的数值来看看这个狭义相对论里的速度合成公式究竟会展现出什么样与传统伽利略变换不同的行为。假设一个物体相对于S'系的速度是0.9倍光速,S'系相对于S系的速度也是0.9倍光速。如果我们按照传统的伽利略变换就会发现该物体相对于S系的速度是1.8倍光速,即:

也就是说,在伽利略变换下S系的观察者会发现物体做超光速运动。然而,如果我们使用正确的狭义相对论下的速度合成公式就会发现,此时S系的观察者测出的物体速度是99.4475%倍光速,非常接近光速但并没有超过光速,即:

下面我们考虑极限情形:当S'系里测出的物体速度刚好就等于光速的话,那么如果按照传统的伽利略变换就会发现该物体相对于S系的速度将不等于光速(超过光速),即:

也就是说,在伽利略变换下S系的观察者会发现光速在不同的惯性系里具有不同的数值。这显然与“光速不变”的事实相矛盾。然而,如果我们使用正确的狭义相对论下的速度合成公式就会发现,此时S系的观察者测出的物体速度将依然等于光速,即:

这也就验证了在狭义相对论下导出的速度合成公式确实是与“光速不变原理”相一致的

11洛伦兹变换与普通坐标旋转变换的对比

在这一节中,我们希望对比一下洛伦兹变换(和之前一样的原因,我们这里还是只讨论狭义相对论所独有的洛伦兹Boost)和普通的坐标旋转变换,看看它们之间存在什么相似的地方和不同的地方。为简单起见,我们只考虑沿着x方向的洛伦兹Boost,和绕着z轴的普通坐标旋转。乍一看,这两者的数学形式好像没有任何的相似之处。出现这种情况是因为洛伦兹变换里所使用的速度参数并不能直接对应到普通坐标旋转变换里所使用的角度参数。也就是说,洛伦兹变换里的速度参数并不是一个最佳的物理选择。所以接下来我们希望选取一个能够等价替换原先速度参数的一个更好的物理参数来表述洛伦兹变换,从而在这个新选取的参数下,我们可以非常明显地看出洛伦兹变换与普通坐标旋转变换间的关系。注意到在上一节中导出的狭义相对论下的速度合成公式:

如果我们做出如下的定义/对应:

那么该速度合成公式刚好与双曲正切函数的和角公式在数学上同构:

其中我们把这个新引进的与速度间存在一一对应的参数叫作“快度”,它在粒子物理学里有着重要的用途。于是此时的洛伦兹修正因子可以利用这个新定义的参数“快度”表达成极其简洁的双曲余弦函数的形式:

相应地可以得到:

将上面这些以快度表示的参数代回到最原始的从S系到S'系的洛伦兹变换,我们有:

将上述得出的以双曲函数表示的沿着x方向的洛伦兹变换与如下以三角函数表示的绕着z轴的普通坐标旋转变换作对比:

可以发现它们俩在数学形式上长得非常相似,主要差别就在于普通坐标旋转变换里用的是三角函数,而洛伦兹变换里用的是双曲函数。但是考虑到双曲函数其实就是三角函数在复平面上的解析延拓,即:

所以不同于普通的坐标旋转变换是对坐标系做了一个实数角的转动;从某种意义上讲,洛伦兹变换可以看成是对时空坐标系做了一个虚数角的转动,其中的虚数角就对应着快度。所以正是因为此时的快度有了类似“转动角度”一样的诠释,所以我们可以从物理直觉上断定出它在相继的洛伦兹变换下会像“转动角度”一样服从线性的叠加关系。为了在数学上检验我们的物理直觉是否正确,我们可以用类似于之前在“速度合成公式”那一节里第一种方法的处理手段,通过复合从S系到S'系,以及从S'系到S''系的洛伦兹变换得出从S系直接到S''系的时空坐标变换形式是:

将上述坐标变换式与如下标准形式的洛伦兹变换作比较:

通过对比可以发现,从S系直接变换到S''系的坐标变换也是一个洛伦兹变换,其相应的快度参数的表达式是:

所以我们就从数学上论证了:尽管速度本身在相继的洛伦兹变换下并不服从简单的线性叠加关系,但是对速度做了非线性的反双曲正切变换以后的“快度” 却在相继的洛伦兹变换下像普通的“转动角度”一样服从线性叠加关系

这也是为什么我们会经常使用“快度”这个物理参数来处理洛伦兹变换问题的其中一个原因。

12洛伦兹不变量,四维时空间隔,和闵可夫斯基度规

在上一节中我们通过引入快度这个物理概念重新改写洛伦兹变换为双曲函数的形式,从而使其与三角函数表示的普通坐标旋转变换间的相似性得到了充分的体现。在这一节里我们将继续探索洛伦兹变换与普通坐标旋转变换间的相似性。对于普通的坐标旋转变换而言,凭借朴素的物理直觉容易知道长度这个概念是不随坐标的旋转而发生变化的。我们可以从数学上验证这个直觉。为简单起见,假设这个坐标变换是绕着z轴的坐标旋转变换。那么在旋转过后的新坐标系里长度微元的表达式应当是:

我们现在希望将该长度微元用老坐标系里的坐标量来表示。所以将上一节中写出的绕着z轴的坐标旋转变换代入上式可以得到:

将上式里的所有平方项展开,然后利用如下的三角函数恒等式:

我们可以将长度微元的表达式化简整理成如下形式:

可以发现,不管在老坐标系还是在新坐标系下,长度这个量都是相同的!用更加现代的理论物理的语言来说,长度这个量就是普通坐标旋转变换下的不变量。我们可以通过引入度规矩阵把上述长度微元的表达式写成如下更为紧凑的形式:

其中微分向量和度规矩阵的定义分别是:

容易发现此时的度规矩阵只是平凡的单位矩阵,且由它定义出的几何空间是我们很早就熟悉的平直欧几里得空间。除此之外,还是个正定矩阵,且所有的特征值均为正数。所以这会导致欧几里得空间里所有的长度都是与我们直觉相符的非负数值。另外在矩阵表示下,我们更容易看出普通坐标旋转变换是一类可以保持欧几里得空间里长度或度规矩阵不变的操作。如果我们抽象地把坐标旋转变换记作,那么可以得出如下的关系:

因为坐标旋转变换对应的矩阵是实数域上的正交矩阵,也就是满足:

所以我们发现坐标旋转变换的确可以保持欧几里得空间里长度不变:

或者说,坐标旋转变换是一类可以保持欧几里得空间里度规不变的操作。它可以用更为简洁的矩阵语言写成:

这说明坐标旋转变换是欧几里得空间里度规的一个对称性!所以它在传统欧几里得几何里的地位极其重要。我们下面将在洛伦兹变换的闵可夫斯基时空背景下平行地导出与它在形式上非常相似的方程。

有了上面普通坐标旋转变换下不变量的背景铺垫,下面我们就来看看沿着x方向的洛伦兹变换下的不变量是什么。类比于普通的坐标旋转变换,假设在老坐标系里有可能洛伦兹不变的四维时空间隔的数学形式是:

那么在洛伦兹变换后的新坐标系里该四维时空间隔的表达式应当是:

我们现在希望将新坐标系里的四维时空间隔用老坐标系里的时空坐标量来表示。所以将上一节中写出的以快度表示的洛伦兹变换关系代入上式可以得到:

将上式里的所有平方项展开,然后利用如下的双曲函数恒等式:

我们可以将四维时空间隔的表达式化简整理成如下形式:

可以发现,不管在老坐标系还是在新坐标系下,四维时空间隔这个量都是相同的!用更加现代的理论物理的语言来说,四维时空间隔这个量就是洛伦兹变换下的不变量。我们可以通过引入度规矩阵把上述四维时空间隔/线元的表达式写成如下更为紧凑的形式:

其中微分向量和度规矩阵的定义分别是:

这就是大名鼎鼎的狭义相对论里平直的闵可夫斯基度规!由它定义出的几何空间是我们还不太熟悉的闵可夫斯基时空。它是一种伪欧空间,所以这意味着:尽管这种时空和欧几里得空间一样是平直的,但是由于此时的度规矩阵并不是正定的,所以这会导致许多与传统欧几里得几何不同的奇怪的现象出现。另外在矩阵表示下,我们更容易看出洛伦兹变换是一类可以保持闵可夫斯基时空里四维时空间隔或闵可夫斯基度规不变的操作。如果我们抽象地把洛伦兹变换记作,那么可以得出如下的关系:

代入之前得出的洛伦兹变换对应的矩阵以及闵可夫斯基度规对应的矩阵,我们有:

所以我们发现洛伦兹变换的确可以保持闵可夫斯基时空里四维时空间隔不变:

或者说,洛伦兹变换是一类可以保持闵可夫斯基时空里度规不变的操作。它可以用更为简洁的矩阵语言写成:

这说明洛伦兹变换是闵可夫斯基时空里度规的一个对称性!所以它在狭义相对论里的地位极其重要。

除此之外,可以发现我们上面度规的选取是这样“多数为负”的号差形式,我们其实也可以选取这样“多数为正”的号差形式。选取不同的号差形式只是习惯问题,最终得出的所有真实可测量的物理结果均与度规的号差形式无关。在本文后续的所有讨论里,我们都将默认使用“多数为负”的号差形式。

13按照洛伦兹变换下各个分量的变换行为对物理量进行分类

为了方便后续经典力学系统和经典场论系统运动规律的讨论,我们必须先依据各种物理量在洛伦兹变换下各个分量的变换行为对它们进行恰当的分类。

(i)首先,如果某个本身只具有1个分量的物理量在洛伦兹变换下不发生改变,即满足:

那么我们就把它叫作“标量”(零阶张量)。在我们后续的讨论中将会碰到的一些典型的标量有:光速,四维时空间隔/线元,固有时(在多数为负的度规号差下,它就是四维时空间隔/线元),标量场(希格斯场),作用量,场的拉格朗日密度,静止质量,电荷,耦合常数,达朗贝尔算符。

(ii)如果某个具有4个分量的物理量在洛伦兹变换下各个分量的变换行为满足与时空坐标一致的变换规则,即满足:

或者将上述分量形式的方程等价地用矩阵的形式表示成:

其中是洛伦兹变换的矩阵表示:

那么我们就把它叫作“4-矢量”(一阶张量)。值得注意的是,并不是一个物理量有4个分量就是4-矢量了,而是说这个物理量的4个分量必须在洛伦兹变换下按照上述指定的规则进行变换,这样它才是4-矢量。在我们后续的讨论中将会碰到的一些典型的4-矢量有:4-电流密度,电磁势,时空坐标,微分时空坐标,时空导数算符,4-速度,4-动量,4-波矢,4-力,4-加速度。

(iii)如果某个具有16个分量的物理量在洛伦兹变换下各个分量的变换行为满足如下的变换规则,即满足:

或者将上述分量形式的方程等价地表示成矩阵的形式:

那么我们就把它叫作“二阶张量”。在我们后续的讨论中将会碰到的一些典型的二阶张量有:闵可夫斯基度规,电磁场场强张量。

值得注意的是,我们可以通过一些特定的流程去构造新的张量。例如:上述列出的各种张量都是以上指标形式呈现出的逆变张量。但是在狭义相对论里,我们可以通过闵可夫斯基度规对这些逆变张量的其中一些指标进行自由的升降从而得到新的协变张量或者混合型张量。同时我们也可以通过恰当地组合上述标量,4-矢量,以及更一般的张量从而构造出新的张量。或者,我们可以通过将张量的某些指标进行缩并从而得到新的张量。为了帮助大家理解,我们下面举一个最简单的例子。假设我们已经知道如下的微分时空坐标:

是个4-矢量,同时也知道粒子的固有时是个标量。那么我们可以通过将两者相除构造出一个新的有物理意义的4-矢量:

它叫作粒子的“4-速度”。现在有了“4-速度”这个4-矢量,再加上我们知道粒子的静止质量是个标量,那么我们可以通过将粒子的4-速度与静止质量相乘构造出一个新的有物理意义的4-矢量:

它叫作粒子的“4-动量”。有了上述狭义相对论的背景基础和知识铺垫,我们下面就可以正式进入对经典力学系统和经典场论系统动力学行为的讨论了。

未完待续……

编辑:牧羊

我们是谁:

MatheMagician,中文“数学魔术师”,原指用数学设计魔术的魔术师和数学家。既取其用数学来变魔术的本义,也取像魔术一样玩数学的意思。文章内容涵盖互联网,计算机,统计,算法,NLP等前沿的数学及应用领域;也包括魔术思想,流程鉴等魔术内容;以及结合二者的数学魔术分享,还有一些思辨性的谈天说地的随笔。希望你能和我一起,既能感性思考又保持理性思维,享受人生乐趣。欢迎扫码关注和在文末或公众号留言与我交流!

扫描二维码

关注更多精彩

对称思维的妙用之从解题到本质(六)——网红鸭子半圆概率问题的多种解法

文字对称中的数学与魔术(八)——魔术《抓牌奇迹》与系列总结

魔术缘何而给你惊喜?

我的数学学习回忆录——一个数学爱好者的反思(二)

江泽民同志出的五角星五点共圆几何题解

2022卡塔尔世界杯小组赛出线形势分析指南——德国队会被西班牙做掉吗?

纠错码与魔术(四)——汉明纠错码魔术进阶

点击阅读原文,往期精彩不错过!

从狭义相对论到经典场论(一):起源和洛伦兹变换的导出相关推荐

  1. 18日精读掌握《费曼物理学讲义-卷一》计划(2019/6/12-2019/6/29)

    本篇目录 18日精读掌握<费曼物理学讲义-卷一>计划概览 作者介绍: 本书内容介绍: 本书目录 书本封面 18日精读掌握<费曼物理学讲义-卷一>计划概览 我将在接下来的18天掌 ...

  2. 一文读懂电磁学发展史[图文版]

    来源:电子万花筒 电磁学或称电动力学或经典电动力学.之所以称为经典,是因为它不包括现代的量子电动力学的内容.电动力学这样一个术语使用并不是非常严格,有时它也用来指电磁学中去除了静电学.静磁学后剩下的部 ...

  3. EXPDP、IMPDP规范及常用技巧总结

    一.巧用并行提升速度 在EXPDP/IMPDP过程中,为了提升速度,而使用并行,有人说不就是加个parallel=n参数嘛,但该如何利用该参数做到真正提升速度呢? 1.单表导出导入数据时使用paral ...

  4. 量子力学的传说——玻尔篇(下)

    写在前面 大约13年前,北大的BBS上一群热血青年对于"量子力学"展开了激烈讨论,有那么几位物理学爱好者分别认领了自己的科学偶像,以人物传记的形式,用不同的角度记录了量子力学的发展 ...

  5. z变换公式表_小白学物理之狭义相对论(1)——洛伦兹变换

    狭义相对论有两条理论基础,第一条是光速不变,第二条是惯性系平权. 光速不变就是说无论在哪个惯性系中观察,光在真空中的传播速度都是一个常数,不随光源和观察者的相对运动而改变.这一表述重点在最后一句,&q ...

  6. 狭义相对论的洛伦兹变换几何推导

    考虑时空中的一条直线,选定一个原点,代表ABAB两点在时空中重叠事件.A,BA,B两点相对以速度uu相对匀速运动.该运动的时空图可以用二维仿射空间表示,对任意质点建立自己在时空中建立仿射坐标系.下面分 ...

  7. 广义相对论-学习记录3-第二章-狭义相对论2

    第二章:狭义相对论 5.流与密度   假定有一个粒子体系,各粒子的带电荷量为ene_nen​,位于位置xn(t)x_n(t)xn​(t)处,则可以定义一个四矢量: Jα≡∑nenδ3(x⃗−x⃗n(t ...

  8. 硬核科普:什么是狭义相对论?它有哪些惊人结论?

    导读:对于我们这些虔诚的物理学家来说,过去.现在和未来的区分,仅仅意味着一种顽固的幻觉. --阿尔伯特·爱因斯坦 作者:迪恩·博南诺(Dean Buonomano) 来源:大数据DT(ID:hzdas ...

  9. 两物体的相对速度公式_《百答相对论》连载(二十一)质疑狭义相对论速度的叠加公式...

    狭义相对论部分:(21)质疑狭义相对论速度的叠加公式 参考<相对论百问>第28页 21相对论的速度叠加公式怎么写?可以用速度叠加达到和超过光速吗? 在经典力学中,物体在力的作用下改变原有的 ...

最新文章

  1. latex大写运算符号
  2. WebBrowser1.Navigate重复载入同一页面时载入的是旧页面
  3. Nginx反向代理之proxy_set_header指令
  4. 【三】版本之间穿梭切换
  5. C++自学26:联合体(union/17)
  6. 21个强大漂亮Ajax/CSS表格设计
  7. 什么是去中心化?交易所为什么要去中心化?
  8. 计算机组成原理期末总结
  9. Spring colud gateway 源码小计
  10. 如何写网站建设策划书
  11. 怎么在微云服务器找一个文件夹,用户怎样了解微云文件在哪里打开
  12. 2021年电赛F题智能送药小车(国二)开源分享
  13. 赖美云的认证照_火箭少女最新路透照出炉:吴宣仪赖美云魅力十足,张紫宁傅菁凭颜值圈粉...
  14. 中国大学moocpython答案查询_python中国大学mooc网课答案
  15. 秒换算 天 时 分 秒
  16. 请问肾阴虚吃什么药?饮食注意什么?还有桂附地黄丸是治肾阴虚还是治肾阳虚的?谢谢
  17. office中为何还要保留Access数据库? 【3500人回复】知乎
  18. 想要4个9?本文告诉你监控告警如何做
  19. Mac快速安装HomeBrew和HomeBrew-Cask方法
  20. 数学建模学习:岭回归和lasso回归

热门文章

  1. 使用H5 canvas画一个坦克
  2. CSP-S2022T1题解
  3. 日元负利率和美元暴跌,是对人民币的夹击
  4. Pandas警告:DeprecationWarning: .ix is deprecated.(ix、loc、iloc的区别)
  5. IPv6 NAT-PT配置【下一代互联网03】
  6. PT站点签到脚本,可挂青龙面板自动签到
  7. 【面试题】一个环,有n个点, 问从0点出发,经过k步回到原点有多少种方法
  8. XCUIApplication API
  9. 《2020 年 SRE 报告》BY CATCHPOINT
  10. QT笔记——Q_PROPERTY了解