Understanding Quaternions 中文翻译《理解四元数》
Tags: math, quaternion
原文地址:http://www.3dgep.com/understanding-quaternions/
正文
在这篇文章中我会尝试用简单的方式去解释四元数的概念,即用可视化的方式解释四元数以及几种对四元数的操作。我将把矩阵、欧拉角和四元数放在一起比较,并解释什么时候该用四元数、什么时候该用欧拉角或矩阵。
内容结构
- 介绍
- 复数
- 复数的加减
- 复数的系数缩放
- 复数的积
- 复数的平方
- 共轭复数
- 复数的绝对值
- 两复数的商
- i的幂
- 复数平面
- 旋转数(Rotors)
- 四元数
- 作为有序数的四元数
- 四元数的加减
- 四元数的积
- 实四元数
- 四元数的系数缩放
- 纯四元数
- 四元数的加法形式
- 单位四元数
- 四元数的二元形式
- 共轭四元数
- 四元数范数
- 四元数规范化
- 四元数的逆
- 四元数的点积
- 旋转
- 四元数插值
- SLERP
- 四元数的差
- 四元数的幂运算
- 2个四元数的分数差
- 注意事项
- SQUARD
- SLERP
- 总结
- 下载Demo
在计算机图形学中,我们使用转换矩阵来表示空间中的一个位置以及朝向。一个转换矩阵还可以表示对一个目标的缩放(scale)或错切(shear)等。 我们可以把转换矩阵想象成一个空间,当你用这个矩阵乘以向量、点(甚至矩阵)后, 你就把向量、点、矩阵转换进这个空间了。
在这篇文章中,我不会讨论转换矩阵的细节。你可以查看我前面的文章,文章中描述了转换矩阵的细节。
在这篇文章中,我想要讨论一个可替代的方案,即用四元数来描述空间里的物体的朝向。
四元数的概念是由爱尔兰数学家Sir William Rowan Hamilton发明的(1843年,都柏林)。Hamilton当时正和他的妻子前往爱尔兰皇家研究院,当他从Brougham桥通过皇家运河时,他领悟到了一个激动人心的东西,并立刻把它刻在桥的一个石头上:
i2=j2=k2=ijk=−1i2=j2=k2=ijk=−1
William Rowan Hamilton Plaque on Broome Bridge on the Royal Canal commemorating his discovery of the fundamental formula for quaternion multiplication.
在我们能够完全理解四元数之前,我们必须先知道四元数是怎么来的。四元数的根源其实是复数。
除了知名的数集(自然数、整数、实数、分数)之外,复数系统引入了一个新的数集——虚数。虚数的发明是为了解决一些特定的无解的方程,例如:x2+1=0x2+1=0要解决这个等式,必须让x2=−1x2=−1,这当然是不行的,因为任意实数的平方都是非负数。
一般而言,数学家是不能忍受一个等式是无解的。于是,一个新的术语被发明了,它就是虚数,一个可以解决上面这个等式的数。
虚数有这样的形式:
i2=−1i2=−1
不要为这个术语较真,因为逻辑上这个数是不存在的。只要知道i是一个平方等于-1的东西即可。
虚数的集合可以用II来表示。
复数的集合CC是一个实数和一个虚数的和,形式如下:
z=a+bi a,b∈R, i2=−1z=a+bi a,b∈R, i2=−1
可以认为所有实数都是b=0的复数、所有虚数都是a=0的复数。
加法:
(a1+b1i)+(a2+b2i)=(a1+a2)+(b1+b2)i(a1+b1i)+(a2+b2i)=(a1+a2)+(b1+b2)i
减法:
(a1+b1i)−(a2+b2i)=(a1−a2)+(b1−b2)i(a1+b1i)−(a2+b2i)=(a1−a2)+(b1−b2)i
λ(a1+b1i)=λa1+λb1iλ(a1+b1i)=λa1+λb1i
z1=(a1+b1i)z1=(a1+b1i)z2=(a2+b2i)z2=(a2+b2i)z1z2=(a1+b1i)(a2+b2i)=a1a2+a1b2i+b1a2i+b1b2i2z1z2=(a1+b1i)(a2+b2i)=a1a2+a1b2i+b1a2i+b1b2i2z1z2=(a1a2−b1b2)+(a1b2+b1a2)iz1z2=(a1a2−b1b2)+(a1b2+b1a2)i
z=(a+bi)z=(a+bi)z2=(a+bi)(a+bi)z2=(a+bi)(a+bi)z2=(a2−b2)+2abiz2=(a2−b2)+2abi
复数的共轭就是指把复数的虚数部分变成负的。共轭复数的符号是¯zz¯或z∗z∗。
z=(a+bi)z=(a+bi)
z∗=(a−bi)z∗=(a−bi)
复数和它的共轭复数的乘积是:
zz∗=(a+bi)(a−bi)=a2−abi+abi+b2=a2+b2zz∗=(a+bi)(a−bi)=a2−abi+abi+b2=a2+b2
我们使用共轭复数来计算复数的绝对值:
z=(a+bi)z=(a+bi)
|z|=√zz∗=√(a+bi)(a−bi)=√a2+b2|z|=zz∗=(a+bi)(a−bi)=a2+b2
z1=(a1+b1i)z1=(a1+b1i)z2=(a2+b2i)z2=(a2+b2i)z1z2=a1+b1ia2+b2i=(a1+b1i)(a2−b2i)(a2+b2i)(a2−b2i)z1z2=a1+b1ia2+b2i=(a1+b1i)(a2−b2i)(a2+b2i)(a2−b2i)=a1a2−a1b2i+b1a2i−b1b2i2a22+b22=a1a2−a1b2i+b1a2i−b1b2i2a22+b22
=a1a2+b1b2a22+b22+b1a2−a1b2a22+b22i=a1a2+b1b2a22+b22+b1a2−a1b2a22+b22i
如果ii的平方等于-1,那么ii的n次幂也应该存在:
i0=1i0=1i1=ii1=ii2=−1i2=−1i3=ii2=−ii3=ii2=−ii4=i2i2=1i4=i2i2=1i5=ii4=ii5=ii4=ii6=ii5=i2=−1i6=ii5=i2=−1
如果按照这个顺序写下去,会出现这样一个模式: (1,\mathbf i,-1,-\mathbf i,1,...)
一个类似的模式也出现在递增的负数幂:
i0=1i0=1i−1=−ii−1=−ii−2=−1i−2=−1i−3=ii−3=ii−4=1i−4=1i−5=−ii−5=−ii−6=−1i−6=−1
你可能已经在数学里头见过类似的模式,但是是以(x,y,-x,-y,x,...)的形式,这是在2D笛卡尔平面对一个点逆时针旋转90度时生成的;(x,-y,-x,y,x,...)则是在2D笛卡尔平面对一个点顺时针旋转90度时生成的。
我们也能够把复数映射到一个2D网格平面——复数平面,只需要把实数映射到横轴、虚数映射到纵轴。
如前面的序列所示,我们可以认为,对一个复数乘以i,这个复数就在复数平面上旋转了90度。
让我们看看这是不是真的。我们随机地在复数平面上取一个点:
p=2+ip=2+i
p乘以i后得到q:q=pi=(2+i)i=2i+i2=−1+2iq=pi=(2+i)i=2i+i2=−1+2i
q乘以i后得到r:r=qi=(−1+2i)i=−i+2i2=−2−ir=qi=(−1+2i)i=−i+2i2=−2−i
r乘以i后得到s:s=ri=(−2−i)i=−2i−i2=1−2is=ri=(−2−i)i=−2i−i2=1−2i
s乘以i后得到t:t=si=(1−2i)i=i−2i2=2+it=si=(1−2i)i=i−2i2=2+i
t刚好是开始的p。如果我们把这些复数放到复数平面上,就得到下面的图:
我们也可以按顺时针方向旋转,只需要把上面的乘数i改成-i。
我们也可以在复数平面上进行任意角度的旋转,只需要定义下面这个复数:q=cosθ+isinθq=cosθ+isinθ
任意的复数乘以q:
p=a+bip=a+biq=cosθ+isinθq=cosθ+isinθpq=(a+bi)(cosθ+isinθ)pq=(a+bi)(cosθ+isinθ)a′+b′i=acosθ−bsinθ+(asinθ+bcosθ)ia′+b′i=acosθ−bsinθ+(asinθ+bcosθ)i
也可以写成矩阵的形式:
[a′−b′b′a′]=[cosθ−sinθsinθcosθ][a−bba][a′−b′b′a′]=[cosθ−sinθsinθcosθ][a−bba]
这也是一个在复数平面绕原点逆时针旋转任意点的方法。(译注:这句话应该是在说旋转矩阵)
了解了复数系统和复数平面后,我们可以额外增加2个虚数到我们的复数系统,从而把这些概念拓展到3维空间。
四元数的一般形式:
q=s+xi+yj+zk s,x,y,z∈Rq=s+xi+yj+zk s,x,y,z∈R
上面的公式是根据Hamilton的著名的表达式得到的:
i2=j2=k2=ijk=−1i2=j2=k2=ijk=−1
以及:
ij=k jk=i ki=jij=k jk=i ki=jji=−k kj=−i ik=−jji=−k kj=−i ik=−j
你可能已经注意到了,i、j、k之间的关系非常像笛卡尔坐标系下单位向量的叉积规则:
x×y=z y×z=x z×x=yx×y=z y×z=x z×x=yy×x=−z z×y=−x x×z=−yy×x=−z z×y=−x x×z=−y
Hamilton自己也发现i、j、k虚数可以被用来表达3个笛卡尔坐标系单位向量i、j、k,并且仍然保持有虚数的性质,也即i2=j2=k2=−1i2=j2=k2=−1。
(\mathbf i \mathbf j, \mathbf j \mathbf k, \mathbf k \mathbf i这几个性质的可视化)
上图展示了如何用i、j、k作为笛卡尔坐标系的单位向量。
我们可以用有序对的形式,来表示四元数:[s,v] s∈R,v∈R3[s,v] s∈R,v∈R3
其中的v,也可以用它各自独立的3个分量表示:
q=[s,xi+yj+zk] s,x,y,z∈Rq=[s,xi+yj+zk] s,x,y,z∈R
使用这种表示法,我们可以更容易地展示四元数和复数之间的相似性。
和复数类似,四元数也可以被加减:
qa=[sa,a]qa=[sa,a]qb=[sb,b]qb=[sb,b]qa+qb=[sa+sb,a+b]qa+qb=[sa+sb,a+b]qa−qb=[sa−sb,a−b]qa−qb=[sa−sb,a−b]
我们也可以表示四元数的乘积:
qaqb=[sa,a][sb,b]qaqb=[sa,a][sb,b]=(sa+xai+yaj+zak)(sb+xbi+ybj+zbk)=(sa+xai+yaj+zak)(sb+xbi+ybj+zbk)=(sasb−xaxb−yayb−zazb)=(sasb−xaxb−yayb−zazb)+(saxb+sbxa+yazb−ybza)i+(saxb+sbxa+yazb−ybza)i+(sayb+sbya+zaxb−zbxa)j+(sayb+sbya+zaxb−zbxa)j+(sazb+sbza+xayb−xbya)k+(sazb+sbza+xayb−xbya)k
可以看到,四元数的乘积依然还是一个四元数。如果我们把虚数i、j、ki、j、k替换成有序对:
i=[0,i] j=[0,j] k=[0,k]i=[0,i] j=[0,j] k=[0,k]
以及还有[1,0] = 1,将它们代入前面的表达式,就得到了:
qaqb=(sasb−xaxb−yayb−zazb)[1,0]qaqb=(sasb−xaxb−yayb−zazb)[1,0]+(saxb+sbxa+yazb−ybza)[0,i]+(saxb+sbxa+yazb−ybza)[0,i]+(sayb+sbya+zaxb−zbxa)[0,j]+(sayb+sbya+zaxb−zbxa)[0,j]+(sazb+sbza+xayb−xbya)[0,k]+(sazb+sbza+xayb−xbya)[0,k]
再把这个表达式扩展成多个有序对的和:
qaqb=[(sasb−xaxb−yayb−zazb),0]qaqb=[(sasb−xaxb−yayb−zazb),0]+[0,(saxb+sbxa+yazb−ybza)i]+[0,(saxb+sbxa+yazb−ybza)i]+[0,(sayb+sbya+zaxb−zbxa)j]+[0,(sayb+sbya+zaxb−zbxa)j]+[0,(sazb+sbza+xayb−xbya)k]+[0,(sazb+sbza+xayb−xbya)k]
如果把后3个四元数相加,并提取公共部分,就可以把等式改写成:
qaqb=[(sasb−xaxb−yayb−zazb),0]qaqb=[(sasb−xaxb−yayb−zazb),0]+[0,sa(xbi+ybj+zbk)+sb(xai+yaj+zak)+[0,sa(xbi+ybj+zbk)+sb(xai+yaj+zak)+(yazb−ybza)i+(zaxb−zbxa)j+(xayb−xbya)k]+(yazb−ybza)i+(zaxb−zbxa)j+(xayb−xbya)k]
这个等式是2个有序对的和。第1个有序对是一个实四元数,第2个是一个纯四元数。这两个四元数也可以合并成一个:
qaqb=[(sasb−xaxb−yayb−zazb),qaqb=[(sasb−xaxb−yayb−zazb),sa(xbi+ybj+zbk)+sb(xai+yaj+zak)sa(xbi+ybj+zbk)+sb(xai+yaj+zak)+(yazb−ybza)i+(zaxb−zbxa)j+(xayb−xbya)k]+(yazb−ybza)i+(zaxb−zbxa)j+(xayb−xbya)k]
如果把下面的表达式代入上面的等式:
a=xai+yaj+zaka=xai+yaj+zakb=xbi+ybj+zbkb=xbi+ybj+zbka⋅b=xaxb+yayb+zazba⋅b=xaxb+yayb+zazba×b=(yazb−ybza)i+(zaxb−zbxa)j+(xayb−xbya)ka×b=(yazb−ybza)i+(zaxb−zbxa)j+(xayb−xbya)k
(译注:注意,第三条和第四条并不是四元数的点积和叉积,而是向量的点积和叉积)
我们就得到了:
qaqb=[sasb−a⋅b,sab+sba+a×b]qaqb=[sasb−a⋅b,sab+sba+a×b]
这就是四元数乘积的一般式。
一个实四元数是一个虚部向量为零向量的四元数:
q=[s,0]q=[s,0]
两个实四元数的乘积是另一个实四元数:
qa=[sa,0]qa=[sa,0]qb=[sb,0]qb=[sb,0]qaqb=[sa,0][sb,0]=[sasb,0]qaqb=[sa,0][sb,0]=[sasb,0]
这和2个虚部为0的复数的乘积几乎一样:
z1=a1+0iz1=a1+0iz2=a2+0iz2=a2+0iz1z2=(a1+0i)(a2+0i)=a1a2z1z2=(a1+0i)(a2+0i)=a1a2
我们也可以用一个系数(实数)去乘四元数:
q=[s,v]q=[s,v]λq=λ[s,v]=[λs,λv]λq=λ[s,v]=[λs,λv]
我们可以用实四元数与普通四元数的乘积,来确认这个等式是否正确:
q=[s,v]q=[s,v]λ=[λ,0]λ=[λ,0]λq=[λ,0][s,v]=[λs,λv]λq=[λ,0][s,v]=[λs,λv]
和实四元数相似,Hamilton也定义了纯四元数。纯四元数是s=0的四元数:
q=[0,v]q=[0,v]
也可以写成下面的形式:
q=xi+yk+zkq=xi+yk+zk
然后是2个纯四元数的乘积:
qa=[0,a]qa=[0,a]qb=[0,b]qb=[0,b]qaqb=[0,a][0,b]=[−a⋅b,a×b]qaqb=[0,a][0,b]=[−a⋅b,a×b]
我们可以把四元数写成实四元数和纯四元数的和:
q=[s,v]q=[s,v]=[s,0]+[0,v]=[s,0]+[0,v]
给定任意的向量v,我们可以把这个向量写成一个系数和一个单位方向向量的乘积:
v=v^v v=|v|,|^v|=1v=vv^ v=|v|,|v^|=1
将这个定义和纯四元数的定义结合,就得到了:
q=[0,v]q=[0,v]=[0,v^v]=[0,vv^]=v[0,^v]=v[0,v^]
然后,我们可以定义单位四元数了,它是一个s=0、vv为单位向量的四元数:
^q=[0,^v]q^=[0,v^]
我们现在可以把单位四元数的定义和四元数的加法形式结合到一起,就创造了一种新的四元数的表示法,这种表示法和复数的表示法形似:
q=[s,v]q=[s,v]=[s,0]+[0,v]=[s,0]+[0,v]=[s,0]+v[0,^v]=[s,0]+v[0,v^]=s+v^q=s+vq^
这就给了我们一种和复数非常相似的四元数表示法:
z=a+biz=a+biq=s+v^qq=s+vq^
共轭四元数的计算,就是将四元数的虚向量取反:
q=[s,v]q=[s,v]q∗=[s,−v]q∗=[s,−v]
四元数和它的共轭四元数的乘积:
qq∗=[s,v][s,−v]qq∗=[s,v][s,−v]=[s2−v⋅(−v),−sv+sv+v×(−v)]=[s2−v⋅(−v),−sv+sv+v×(−v)]=[s2+v⋅v,0]=[s2+v⋅v,0]=[s2+v2,0]=[s2+v2,0]
回忆下复数范数的定义:
|z|=√a2+b2|z|=a2+b2zz∗=|z|2zz∗=|z|2
类似的,四元数的范数可以这样定义:
q=[s,v]q=[s,v]|q|=√s2+v2|q|=s2+v2
这也让我们可以这样表达四元数范数:
qq∗=|q|2qq∗=|q|2
利用四元数范数的定义,就可以对四元数进行规范化。要让一个四元数规范化,只需要让这个四元数去除以它的范数:
q′=q√s2+v2q′=qs2+v2
举一个例子,让我们规范化下面这个四元数:
q=[1,4i+4j−4k]q=[1,4i+4j−4k]
第一步,先计算q的范数:
|q|=√12+42+42+(−4)2|q|=12+42+42+(−4)2=√49=7=49=7
然后,q除以|q|:
q′=q|q|q′=q|q|=(1+4i+4j−4k)7=(1+4i+4j−4k)7=17+47i+47j−47k=17+47i+47j−47k
四元数的逆用q−1q−1表示。要计算四元数的逆,需要用四元数的共轭四元数去除以四元数的范数的平方:
q−1=q∗|q|2q−1=q∗|q|2
为了证明这个式子,我们先根据逆的定义,有:
qq−1=[1,0]=1qq−1=[1,0]=1
两边都左乘共轭四元数 q∗q∗ :
q∗qq−1=q∗q∗qq−1=q∗
将上文中的qq∗=|q|2qq∗=|q|2代入这个式子,得到:
|q|2q−1=q∗|q|2q−1=q∗
q−1=q∗|q|2q−1=q∗|q|2
对于单位四元数,它的范数是1,所以可以写成:
q−1=q∗q−1=q∗
和向量的点积相似,我们也可以计算2个四元数的点积,只需要将各个对应的系数相乘,然后相加:
q1=[s1,x1i+y1j+z1k]q1=[s1,x1i+y1j+z1k]q2=[s2,x2i+y2j+z2k]q2=[s2,x2i+y2j+z2k]q1⋅q2=s1s2+x1x2+y1y2+z1z2q1⋅q2=s1s2+x1x2+y1y2+z1z2
我们也可以利用四元数点积,来计算四元数之间的角度差:
cosθ=s1s2+x1x2+y1y2+z1z2|q1||q2|cosθ=s1s2+x1x2+y1y2+z1z2|q1||q2|
对于单位四元数,我们可以简化上面的等式:cosθ=s1s2+x1x2+y1y2+z1z2cosθ=s1s2+x1x2+y1y2+z1z2
前面我们定义了一个特殊的复数:旋转数。它是用来旋转2D复数平面的点的:q=cosθ+isinθq=cosθ+isinθ
根据四元数和复数的相似性,应该有可能设计一个可以旋转3D空间的点的四元数:q=[cosθ,sinθv]q=[cosθ,sinθv]
让我们测试一下这个理论是否可靠,方法就是计算四元数q和向量p的积。第一步,我们把p写成纯四元数的形式:
p=[0,p]p=[0,p]
以及单位四元数q:
q=[s,λ^v]q=[s,λv^]
从而:
p′=qp=[s,λ^v][0,p]p′=qp=[s,λv^][0,p]=[−λ^v⋅p,sp+λ^v×p]=[−λv^⋅p,sp+λv^×p]
我们可以看到结果是一个同时有系数、有虚向量的四元数。
让我们先考虑特殊的情形:pp与^vv^正交。这种情况下,点乘部分等于0:−λ^v⋅p=0−λv^⋅p=0。所以上面的四元数就变成了纯四元数:
p′=[0,sp+λ^v×p]p′=[0,sp+λv^×p]
这时候,要使pp绕^vv^旋转,我们只需要代入s=cosθs=cosθ和λ=sinθλ=sinθ:
p′=[0,cosθp+sinθ^v×p]p′=[0,cosθp+sinθv^×p]
现在,让我们找一个例子来测试上面的公式。譬如绕z轴(就是k轴)旋转45度,那么我们的四元数q就变成:
q=[cosθ,sinθk]q=[cosθ,sinθk]=[√22,√22k]=[22,22k]
然后,选一个特殊的p,并且p要和k轴正交,譬如把p放到i轴上,也就是:p=[0,2i]p=[0,2i]
好了,现在计算下qp:
p′=qpp′=qp=[√22,√22k][0,2i]=[22,22k][0,2i]=[0,2√22i+2√22k×i]=[0,222i+222k×i]=[0,√2i+√2j]=[0,2i+2j]
结果是一个绕了k轴转了45度的纯四元数。 我们可以确认这个四元数的向量部分的长度是:
p′=√√22+√22=2p′=22+22=2
这正是我们所期望的!
我们可以用图像展示旋转过程:
现在,让我们考虑更一般化的四元数,即和p不正交的四元数。现在让我们把p的向量部分偏移45度:
^v=√22i+√22kv^=22i+22k
p=2ip=2i
q=[cosθ,sinθ^v]q=[cosθ,sinθv^]
p=[0,p]p=[0,p]
然后算qp:
p′=qpp′=qp=[cosθ,sinθ^v][0,p]=[cosθ,sinθv^][0,p][−sinθ^v⋅p,cosθp+sinθ^v×p][−sinθv^⋅p,cosθp+sinθv^×p]
代入我们设定的^v,pv^,p,以及θ=45∘θ=45∘,得到:
p′=[−√22(√22i+√22k)⋅(2i),√222i+√22(√22i+√22k)×2i]p′=[−22(22i+22k)⋅(2i),222i+22(22i+22k)×2i]=[−1,√2i+j]=[−1,2i+j]注意,算出来的结果已经不是纯四元数了,并且,它并没有旋转45度、范数也不再是2(反而变小了,变成√33)
我们可以用图像展示旋转过程:
严格来说,这样子在3维空间中表示p′p′是不正确的。因为它其实是一个4维的向量!为了简单起见,我只将这个四元数的向量部分显示出来。
然而,还有一线生机。Hamilton发现(但没有正式宣布),如果对qp右乘q的逆,出来的结果是一个纯四元数,并且四元数向量部分的范数可以保持不变。让我们试试应用在我们的例子里。
首先计算:
q=[cosθ,sinθ(√22i+√22k)]q=[cosθ,sinθ(22i+22k)]
q−1=[cosθ,−sinθ(√22i+√22k)]q−1=[cosθ,−sinθ(22i+22k)]
(译注:这里q−1=q∗q−1=q∗是因为q是单位四元数)
再代入θ=45∘θ=45∘,得到:
q−1=[√22,−√22(√22i+√22k)]q−1=[22,−22(22i+22k)]
12[√2,−i−k]12[2,−i−k]
现在,把前面算出来的qp再次拿出来:
qp=[−1,√2i+j]qp=[−1,2i+j]qpq−1=[−1,√2i+j]12[√2,−i−k]qpq−1=[−1,2i+j]12[2,−i−k]=12[−√2−(√2i+j)⋅(−i−k),i+k+√2(√2i+j)−i+√2j+k]=12[−2−(2i+j)⋅(−i−k),i+k+2(2i+j)−i+2j+k]=12[−√2+√2,i+k+2i+√2j−i+√2j+k]=12[−2+2,i+k+2i+2j−i+2j+k]=[0,i+√2j+k]=[0,i+2j+k]
这下是纯四元数了,并且它的范数是:
|qpq−1|=√12+√22+12=√4=2|qpq−1|=12+22+12=4=2
这和原始的p的范数一致。
下面的图像展示了旋转结果:
所以我们可以看到,这个结果是一个纯四元数,并且原四元数的向量的范数也保持住了。但是还有一个问题:向量被旋转了90度而不是45度。这刚好是我们需要的度数的两倍!为了正确地让一个向量绕某个轴向量旋转某个角度,我们必须以目标角度的一半来计算。因此,我们构造了下面的四元数:
q=[cos12θ,sin12θ^v]q=[cos12θ,sin12θv^]
这就是旋转四元数的一般形式!
在计算机图形学中使用四元数,其中一个重要原因是四元数非常适合用来表示空间中的旋转。四元数解决了其他3维空间旋转算法会遇到的恼人的问题,比如使用欧拉角来表示旋转操作时会遇到的万向节锁问题(Gimbal lock)。
使用四元数,我们可以定义好几种方案来表示3维空间的转动插值。第一种是SLERP,它被用来把一个点(物体)从一个朝向平滑地插值到另一个朝向。第二个是SLERP的扩展版本,被称为SQAD,它被用来处理用一系列朝向定义得到的一条路径的插值。
SLERP代表Spherical Linear Int*erp*olation。SLERP可以在2个朝向之间平滑地插值。
第一个朝向设为q1q1,第二个朝向设为q2q2 (请记住,这2个指示朝向的四元数是单位四元数,不然阅读下文会混乱)。被插值前的点设为pp,插值后的点设为p′p′。而插值参数t,当t=0时会把pp转到q1q1,当t=1时会转到q2q2。
标准的线性插值公式是(译注:这个公式是笛卡尔坐标系下的,不是指四元数):
p′=p1+t(p2−p1)p′=p1+t(p2−p1)
应用这个等式的一般步骤是:
- 计算p1、p2p1、p2之间的差。
- 根据参数t,计算两个点的差的小数值(因为0<=t<=1)
- 把第二步的值加上原始点的值,算出结果
我们可以把这个基础公式,套用到2个用四元数表示的朝向的插值上。
根据上面的公式的第一步,我们必须先计算q1、q2q1、q2的差。对于四元数来说,这等价于计算2个四元数的角度差(angular difference):
diff=q−11q2diff=q1−1q2
(译注:由q1pdiff=q2q1pdiff=q2推出 )
接下来的目标是干掉上面四元数的差的分数部分,方法是计算四元数的t次幂(就是上面的那个插值参数t,区间是[0,1])。
四元数的幂运算的一般化公式是:
qt=exp(tlogq)qt=exp(tlogq)
其中,(纯)四元数的exp函数的公式是:
eq=exp(q)=exp([0,θ^v])eq=exp(q)=exp([0,θv^])=[cosθ,sinθ^v]=[cosθ,sinθv^]
(纯)四元数的对数公式是:
logq=log(cosθ+sinθ^v)logq=log(cosθ+sinθv^)=log(exp(θ^v))=log(exp(θv^))=θ^v=θv^=[0,θ^v]=[0,θv^]
(译注:上述的2次公式推导,其实省略了很多证明过程。具体可以参考: 四元数公式的补充 )
对于t = 0,我们有:
q0=exp(0logq)q0=exp(0logq)=exp([cos(0),sin(0)^v])=exp([cos(0),sin(0)v^])=exp([1,0])=exp([1,0])=[1,0]=[1,0]
而对于t = 1,有:
q1=exp(1logq)=qq1=exp(1logq)=q
对于角旋转的插值计算,我们利用q1和q2的角度分数差来调整原始朝向q1:
q′=q1(q−11q2)tq′=q1(q1−1q2)t
这也就是使用四元数的球面线性插值的一般形式。然而,这不是slerp函数的常用形式。
我们可以应用类似的用于计算向量的球面插值公式,到四元数里。计算向量的球面插值的一般形式定义如下:
vt=sin((1−t)θ)sinθv1+sin(tθ)sinθv2vt=sin((1−t)θ)sinθv1+sin(tθ)sinθv2
用图像表示如下:
这个公式可以原封不动地应用到四元数:
qt=sin((1−t)θ)sinθq1+sin(tθ)sinθq2qt=sin((1−t)θ)sinθq1+sin(tθ)sinθq2
但这个公式需要提供角度θθ,我们可以计算q1q1和q2q2的点积从而得出角度θθ:
cosθ=q1⋅q2|q1||q2|cosθ=q1⋅q2|q1||q2|
cosθ=s1s2+x1x2+y1y2+z1z2|q1||q2|cosθ=s1s2+x1x2+y1y2+z1z2|q1||q2|
θ=cos−1(s1s2+x1x2+y1y2+z1z2|q1||q2|)θ=cos−1(s1s2+x1x2+y1y2+z1z2|q1||q2|)
这个方案有2个问题,必须在实现过程中加以考虑。
第一,如果四元数点积的结果是负值,那么后面的插值就会在4D球面上绕远路,这并不是我们想要的。为了解决这个问题,我们测试点积的结果,当结果是负值时,我们将2个四元数的其中一个取反,取反它的系数和向量部分,并不会改变它代表的朝向。而经过这一步操作,可以保证这个旋转走的是最短路径。
当q1q1和q2q2的角度差非常小,小到导致sinθ=0sinθ=0 时,会出现第二个问题。如果这个情况出现了,当我们除以sinθsinθ时就会得到一个未定义的结果。在这个情况下,我们可以回退去使用q1q1和q2q2的线性插值。
正如一个SLERP可以被用来计算四元数之间的插值,一个SQUAD (Spherical andQuadrangle)可以被用来对旋转路径进行平滑插值。
如果我们有四元数序列:
q1,q2,q3,⋯,qn−2,qn−1,qnq1,q2,q3,⋯,qn−2,qn−1,qn
然后我们再定义一个"辅助"四元数(sisi),它是一个中间控制点:
si=exp(−log(qi+1q−1i)+log(qi−1q−1i)4)qisi=exp(−log(qi+1qi−1)+log(qi−1qi−1)4)qi
所以,沿着子曲线的朝向可以定义为:
qi−1,qi,qi+1,qi+2qi−1,qi,qi+1,qi+2
在t时刻的朝向就是:
squad(qi,qi+1,si,si+1,t)=slerp(slerp(qi,qi+1,t),slerp(si,si+1,t),2t(1−t))squad(qi,qi+1,si,si+1,t)=slerp(slerp(qi,qi+1,t),slerp(si,si+1,t),2t(1−t))
除了特别难理解之外,相比矩阵或欧拉角,四元数在表示旋转这个事情上,拥有一些明显的优点。
SLERP和SQUAD,提供了一种使得在朝向之间可以平滑过渡的方法。
使用四元数来串联"旋转",要比使用矩阵快得多。
对于单位四元数,逆向旋转可以通过对向量部分取反来实现。而计算一个矩阵的逆矩阵是被认为比较慢的,如果这个矩阵未被标准正交化的话(标准正交矩阵的逆矩阵是它的转置矩阵)。
从四元数转换到矩阵,要比从欧拉角转换到矩阵快一点。
四元数只需要4个数字(如果旋转四元数已经单位化了那么只需要3个,实数部分可以在运行时计算)来表示一个旋转,而矩阵需要至少9个数字。
尽管使用四元数有这么多优点,还是有缺点存在的。
因为浮点数的舍入运算错误,四元数可能会变无效。不过,这个错误可以通过重新单位化四元数来避免。
使用四元数最具威慑性的地方,还是四元数的理解难度大。我希望这个问题可以通过阅读本文来解决。
存在一些已经实现了四元数、并且是正确的的数学程序库。在我的个人经验里,我发现GLM(OpenGL Math Library)是一个优秀的数学库,它的四元数的实现极其不错。如果你对在你的程序中使用四元数感兴趣,那么我会推荐你使用这个数学库。
我实现了一个小demo来演示一个四元数如何被用来旋转一个3维物体。这个demo是用Unity3.5.2实现的,你可以免费下载它和阅读它的脚本。zip文件也包含了一个Windows版的Unity程序。当然你可以自己构建一个Mac的版本。
Understanding Quaternions.zip
Understanding Quaternions 中文翻译《理解四元数》相关推荐
- 四元数左乘右乘_理解四元数
Understanding Quaternions 中文翻译<理解四元数> 正文 在这篇文章中我会尝试用简单的方式去解释四元数的概念,即用可视化的方式解释四元数以及几种对四元数的操作.我将 ...
- 对话系统中的中文自然语言理解 (NLU) 任务介绍
每天给你送来NLP技术干货! 来自:看个通俗理解吧 Chinese Natural Language Understanding, NLU, in Dialogue Systems 1&2 T ...
- CV文章摘要中文翻译集(目标检测,纹理分类)
CV文章摘要中文翻译 一.SRN-Side-output Residual Network for Object Sysmetry Detection in the Wild 2017.CVPR 用于 ...
- NLPer福利-中文语言理解基准测【CLUEbenchmark】
NLPer福利-中文语言理解基准测[CLUEbenchmark] 公众号:ChallengeHub 官方链接:https://www.cluebenchmarks.com Github链接:https ...
- Why Memory Barriers?中文翻译(上)
转载自:Why Memory Barriers?中文翻译(上) 本文是对perfbook的附录C Why Memory Barrier的翻译,希望通过对大师原文的翻译可以弥补之前译者发布的关于memo ...
- Why Memory Barriers中文翻译(下)
转载自:Why Memory Barriers中文翻译(下) 在上一篇why memory barriers文档中,由于各种原因,有几个章节没有翻译.其实所谓的各种原因总结出一句话就是还没有明白那些章 ...
- 抱抱脸(hugging face)教程-中文翻译-模型概要
模型概要 这是一个总结的模型可在Transformers.假设您熟悉最初的Transformers模型.或者温柔的介绍,看看有注释的Transformers.在我们关注模特之间的高度差异之前.你可以在 ...
- 实在智能参与中文自然语言理解评价标准体系(CLUE)阶段性进展回顾
「实在智能」简介 「实在智能」(杭州实在智能科技有限公司)是一家人工智能科技公司,聚焦大规模复杂问题的智能决策领域,通过AI+RPA技术打造广泛应用于各行业的 智能软件机器人,即"数字员工& ...
- 【转】关于HTTP中文翻译的讨论
http://www.ituring.com.cn/article/1817 讨论参与者共16位: 图灵谢工 杨博 陈睿杰 贾洪峰 李锟 丁雪丰 郭义 梁涛 吴玺喆 邓聪 胡金埔 臧秀涛 张伸 图钉派 ...
最新文章
- Python3入门(十一)——IO编程
- 计算机网络英语第二章,计算机网络英文题库(附答案)chapter2.doc
- 矩阵学习摘记,欢迎指正
- java.lang.IllegalArgumentException: Does not contain a valid host:port authority: ignorethis
- 你离Python大神就差这课树了!建议收藏|Python技能树测评
- 【读】这一次,让我们再深入一点 - TCP协议
- NGN学习笔记2——软交换技术
- linux服务器恶意程序检查,扫描Linux服务器查找恶意软件和rootkit的5款工具
- 禅道的下载和安装教程(Linux版)
- 什么是数据库?什么是数据库管理系统? 说明两者的区别和联系。
- sql server中binary怎么得到char类型
- BGP路由属性和选路
- latex参考文献居中_latex参考文献常见问题
- 学习Flash制作高射炮游戏
- 管控内网安全 六项措施守护企业核心机密
- 国产源表之纳米水伏发电材料研究
- 2021年中国ERP软件市场现状发展与供应商发展分析
- 微信小程序保留小数点
- 2022.11.13 英语背诵
- 用vb编制一个计算机程序,VB程序题:编一模拟袖珍计算器的完整程序,界面如下图所示。要求:输入两个操作数和一个操作符,根据操作符决定所做的运算。 VB源码 龚沛曾...
热门文章
- SQL Server 中系统视图sysobjects中type字段的说明
- 利用@jsonView注解来实现自定义返回字段
- java 如何把源码导出为jar包,以及如何使用导出的jar包
- 不能在DropDownList 中选择多个项
- [系统安全] 四.OllyDbg动态分析工具基础用法及Crakeme逆向破解
- 【数据结构与算法】之深入解析“两数相除”的求解思路与算法示例
- 【数据结构与算法】之深入解析“有效的括号”的求解思路与算法示例
- LeetCode Algorithm 414. 第三大的数
- unable to access ‘https://github.com/***.git‘: OpenSSL SSL_read: Connection was reset, errno 10054
- Django-RQ介绍