(十 七)张量函数的微分与导数
本文主要内容如下:
- 1. 范数
- 2. 线性表示定理
- 3. 张量函数的连续、微分与导数
1. 范数
定义 设 V \mathscr{V} V 为“向量空间”,定义由向量空间到实数的映射 ∣ ∣ ∙ ∣ ∣ : V → R ||\bullet||:\mathscr{V}\rightarrow \R ∣∣∙∣∣:V→R,若该映射满足:
(1) ∣ ∣ u ∣ ∣ ≥ 0 且 ∣ ∣ u ∣ ∣ = 0 ⟺ u = 0 ||u||\ge0\ 且\ ||u||=0\Longleftrightarrow u=0 ∣∣u∣∣≥0 且 ∣∣u∣∣=0⟺u=0;
(2) ∣ ∣ α u ∣ ∣ = ∣ α ∣ ⋅ ∣ ∣ u ∣ ∣ ||\alpha u||=|\alpha|\cdot||u|| ∣∣αu∣∣=∣α∣⋅∣∣u∣∣
(3) ∣ ∣ u + v ∣ ∣ ≤ ∣ ∣ u ∣ ∣ + ∣ ∣ v ∣ ∣ ||u+v||\le||u||+||v|| ∣∣u+v∣∣≤∣∣u∣∣+∣∣v∣∣
其中, u , v ∈ V ; α ∈ R u,v\in\mathscr{V};\alpha\in\R u,v∈V;α∈R 。则称 ∣ ∣ u ∣ ∣ ||u|| ∣∣u∣∣ 为定义在 V \mathscr{V} V 上向量 u u u 的范数,向量空间 V \mathscr{V} V 称为线性赋范空间。
2. 线性表示定理
定理 对于将 r r r 阶张量映射为 s s s 阶张量的线性映射 Ψ : F r ( V ) → F s ( V ) : Φ ↦ Ψ ( Φ ) \bold{\Psi}:\mathscr{F}_r(\mathscr{V})\rightarrow\mathscr{F}_s(\mathscr{V}):\bold{\Phi}\mapsto \bold{\Psi(\Phi)} Ψ:Fr(V)→Fs(V):Φ↦Ψ(Φ),存在唯一的 Θ ∈ F r + s ( V ) \bold\Theta\in\mathscr{F}_{r+s}(\mathscr{V}) Θ∈Fr+s(V) 使得上述线性映射可以由张量的 r r r 阶并联式点积表示,即
Ψ ( Φ ) = Θ ( ∙ r ) Φ 或 Ψ ( Φ ) = Φ ( ∙ r ) Θ \bold{\Psi(\Phi)}=\bold\Theta(^r_\bullet)\bold\Phi \quad或\quad \bold{\Psi(\Phi)}=\Phi(^r_\bullet)\bold\Theta Ψ(Φ)=Θ(∙r)Φ或Ψ(Φ)=Φ(∙r)Θ
证明: Ψ ( Φ ) \bold{\Psi(\Phi)} Ψ(Φ) 表示将 r r r 阶张量映射为 s s s 阶张量的映射,故:
Ψ ( g ⃗ i 1 ⊗ g ⃗ i 2 ⊗ ⋯ ⊗ g ⃗ i r ) = Θ j 1 , j 2 , … , j s ( i 1 , i 2 , … , i r ) g ⃗ j 1 ⊗ g ⃗ j 2 ⊗ ⋯ ⊗ g ⃗ j s \bold\Psi(\vec{g}_{i_1}\otimes\vec{g}_{i_2}\otimes\dots\otimes\vec{g}_{i_r})=\Theta^{j_1,j_2,\dots,j_s}(i_1,i_2,\dots,i_r)\vec{g}_{j_1}\otimes\vec{g}_{j_2}\otimes\dots\otimes\vec{g}_{j_s} Ψ(g i1⊗g i2⊗⋯⊗g ir)=Θj1,j2,…,js(i1,i2,…,ir)g j1⊗g j2⊗⋯⊗g js
需要说明的是:对于确定的指标 i 1 , i 2 , … , i r i_1,i_2,\dots,i_r i1,i2,…,ir 而言, Θ j 1 , j 2 , … , j s ( i 1 , i 2 , … , i r ) \Theta^{j_1,j_2,\dots,j_s}(i_1,i_2,\dots,i_r) Θj1,j2,…,js(i1,i2,…,ir) 为 s s s 阶张量的分量,但 Θ j 1 , j 2 , … , j s ( i 1 , i 2 , … , i r ) \Theta^{j_1,j_2,\dots,j_s}(i_1,i_2,\dots,i_r) Θj1,j2,…,js(i1,i2,…,ir) 整体表示的数集却不一定为张量的分量。根据映射的线性性,对于任意的 r r r 阶张量 Φ = Φ i 1 , i 2 , … , i r g ⃗ i 1 ⊗ g ⃗ i 2 ⊗ ⋯ ⊗ g ⃗ i r \bold\Phi=\Phi^{i_1,i_2,\dots,i_r}\vec{g}_{i_1}\otimes\vec{g}_{i_2}\otimes\dots\otimes\vec{g}_{i_r} Φ=Φi1,i2,…,irg i1⊗g i2⊗⋯⊗g ir 有:
Ψ ( Φ ) = Φ i 1 , i 2 , … , i r Θ j 1 , j 2 , … , j s ( i 1 , i 2 , … , i r ) g ⃗ j 1 ⊗ g ⃗ j 2 ⊗ ⋯ ⊗ g ⃗ j s \bold{\Psi(\Phi)}=\Phi^{i_1,i_2,\dots,i_r}\Theta^{j_1,j_2,\dots,j_s}(i_1,i_2,\dots,i_r)\vec{g}_{j_1}\otimes\vec{g}_{j_2}\otimes\dots\otimes\vec{g}_{j_s} Ψ(Φ)=Φi1,i2,…,irΘj1,j2,…,js(i1,i2,…,ir)g j1⊗g j2⊗⋯⊗g js
根据商法则知: Θ j 1 , j 2 , … , j s ( i 1 , i 2 , … , i r ) \Theta^{j_1,j_2,\dots,j_s}(i_1,i_2,\dots,i_r) Θj1,j2,…,js(i1,i2,…,ir) 为 r + s r+s r+s 阶张量的分量。 若定义:
Θ j 1 , j 2 , … , j s ( i 1 , i 2 , … , i r ) ≜ Θ i 1 , i 2 , … , i r j 1 , j 2 , … , j s \Theta^{j_1,j_2,\dots,j_s}(i_1,i_2,\dots,i_r)\triangleq\Theta^{j_1,j_2,\dots,j_s}_{\qquad\quad\ \ i_1,i_2,\dots,i_r} Θj1,j2,…,js(i1,i2,…,ir)≜Θ i1,i2,…,irj1,j2,…,js
则
Ψ j 1 , j 2 , … , j s = Θ i 1 , i 2 , … , i r j 1 , j 2 , … , j s Φ i 1 , i 2 , … , i r ⟺ Ψ = Θ ( ∙ r ) Φ \Psi^{j_1,j_2,\dots,j_s}=\Theta^{j_1,j_2,\dots,j_s}_{\qquad\quad\ \ i_1,i_2,\dots,i_r}\Phi^{i_1,i_2,\dots,i_r}\Longleftrightarrow \bold\Psi=\Theta(^r_\bullet)\bold\Phi Ψj1,j2,…,js=Θ i1,i2,…,irj1,j2,…,jsΦi1,i2,…,ir⟺Ψ=Θ(∙r)Φ
若定义:
Θ j 1 , j 2 , … , j s ( i 1 , i 2 , … , i r ) ≜ Θ i 1 , i 2 , … , i r j 1 , j 2 , … , j s \Theta^{j_1,j_2,\dots,j_s}(i_1,i_2,\dots,i_r)\triangleq\Theta_{i_1,i_2,\dots,i_r}^{\qquad\quad\ \ j_1,j_2,\dots,j_s} Θj1,j2,…,js(i1,i2,…,ir)≜Θi1,i2,…,ir j1,j2,…,js
则
Ψ j 1 , j 2 , … , j s = Φ i 1 , i 2 , … , i r Θ i 1 , i 2 , … , i r j 1 , j 2 , … , j s ⟺ Ψ = Φ ( ∙ r ) Θ \Psi^{j_1,j_2,\dots,j_s}=\Phi^{i_1,i_2,\dots,i_r}\Theta_{i_1,i_2,\dots,i_r}^{\qquad\quad\ \ j_1,j_2,\dots,j_s}\Longleftrightarrow \bold\Psi=\Phi(^r_\bullet)\bold\Theta\qquad Ψj1,j2,…,js=Φi1,i2,…,irΘi1,i2,…,ir j1,j2,…,js⟺Ψ=Φ(∙r)Θ
最后证明唯一性,设
Ψ ( Φ ) = Θ 1 ( ∙ r ) Φ = Θ 2 ( ∙ r ) Φ \bold{\Psi(\Phi)}=\bold\Theta_1(^r_\bullet)\bold\Phi=\bold\Theta_2(^r_\bullet)\bold\Phi Ψ(Φ)=Θ1(∙r)Φ=Θ2(∙r)Φ
则
( Θ 1 − Θ 2 ) ( ∙ r ) Φ = 0 \bold(\Theta_1-\Theta_2)(^r_\bullet)\bold\Phi=0 (Θ1−Θ2)(∙r)Φ=0
由 Φ \bold\Phi Φ 的任意性知:
Θ 1 = Θ 2 ( 证毕 ) \bold\Theta_1=\bold\Theta_2\quad(证毕) Θ1=Θ2(证毕)
3. 张量函数的连续、微分与导数
定义 对于张量函数 f : F r ( V ) → F s ( V ) : u ↦ f ( u ) f:\mathscr{F}_r(\mathscr{V})\rightarrow\mathscr{F}_s(\mathscr{V}):u\mapsto f(u) f:Fr(V)→Fs(V):u↦f(u),若
∀ ε ∈ R + , ∃ δ ∈ R + , s . t . ∣ ∣ f ( u ) − f ( u 0 ) ∣ ∣ < ε , p . t . ∣ ∣ u − u 0 ∣ ∣ < δ \forall\ \varepsilon\in R^+,\exist\ \delta\in R^+,s.t. ||f(u)-f(u_0)||<\varepsilon,p.t. ||u-u_0||<\delta ∀ ε∈R+,∃ δ∈R+,s.t.∣∣f(u)−f(u0)∣∣<ε,p.t.∣∣u−u0∣∣<δ
则称张量函数 f ( u ) f(u) f(u) 在 u 0 u_0 u0 处连续。
定义 对于张量函数 f : F r ( V ) → F s ( V ) : u ↦ f ( u ) f:\mathscr{F}_r(\mathscr{V})\rightarrow\mathscr{F}_s(\mathscr{V}):u\mapsto f(u) f:Fr(V)→Fs(V):u↦f(u),若满足对 ∀ u ∈ F r ( V ) \forall\ u\in \mathscr{F}_r(\mathscr{V}) ∀ u∈Fr(V),均存在由 r r r 阶张量到 s s s 阶张量的映射 f ′ ( v ) [ u ] f'(v)[u] f′(v)[u] 使得对于 ∀ h ∈ R \forall\ h\in\R ∀ h∈R,均有:
f ( v + h u ) = f ( v ) + h f ′ ( v ) [ u ] + o ( h u ) \ f(v+hu)=f(v)+hf'(v)[u]+o(hu) f(v+hu)=f(v)+hf′(v)[u]+o(hu)
其中,
lim h → 0 ∣ ∣ o ( h u ) ∣ ∣ ∣ ∣ h u ∣ ∣ = lim h → 0 ∣ ∣ o ( h u ) ∣ ∣ ∣ h ∣ ⋅ ∣ ∣ u ∣ ∣ = lim h → 0 ∣ ∣ o ( h u ) ∣ ∣ ∣ h ∣ = 0 \lim_{h\rightarrow 0}\frac{||o(hu)||}{||hu||}=\lim_{h\rightarrow 0}\frac{||o(hu)||}{|h|\cdot||u||}=\lim_{h\rightarrow 0}\frac{||o(hu)||}{|h|}=0 h→0lim∣∣hu∣∣∣∣o(hu)∣∣=h→0lim∣h∣⋅∣∣u∣∣∣∣o(hu)∣∣=h→0lim∣h∣∣∣o(hu)∣∣=0
则称 f ( u ) f(u) f(u) 在 v v v 处可微, f ′ ( v ) [ u ] f'(v)[u] f′(v)[u]称作 f ( u ) f(u) f(u)的微分,且根据张量函数可微的定义知:
f ′ ( v ) [ u ] = lim h → 0 f ( v + h u ) − f ( v ) h = d f ( v + h u ) d h ∣ h = 0 ( ∗ ) f'(v)[u]=\lim_{h\rightarrow 0}\frac{f(v+hu)-f(v)}{h}=\left. \frac{df(v+hu)}{dh}\right|_{h=0}\qquad(*) f′(v)[u]=h→0limhf(v+hu)−f(v)=dhdf(v+hu)∣ ∣h=0(∗)
上式给出了张量函数微分的计算方式,最后一个等号是因为:
d f ( v + h u ) d h ∣ h = 0 = lim Δ h → 0 f ( v + ( h + Δ h ) u ) − f ( v + h u ) Δ h ∣ h = 0 = lim Δ h → 0 f ( v + u Δ h ) − f ( v ) Δ h = f ′ ( v ) [ u ] \begin{aligned} &\quad\ \left. \frac{df(v+hu)}{dh}\right|_{h=0}\\\\ &=\left.\lim_{\Delta h\rightarrow0}\frac{f(v+(h+\Delta h)u)-f(v+hu)}{\Delta h}\right|_{h=0}\\\\ &=\lim_{\Delta h\rightarrow0}\frac{f(v+u\Delta h)-f(v)}{\Delta h}\\\\ &=f'(v)[u] \end{aligned} dhdf(v+hu)∣ ∣h=0=Δh→0limΔhf(v+(h+Δh)u)−f(v+hu)∣ ∣h=0=Δh→0limΔhf(v+uΔh)−f(v)=f′(v)[u]
通过 ( ∗ ) (*) (∗) 还可知由 r r r 阶张量到 s s s 阶张量的映射 f ′ ( v ) [ u ] f'(v)[u] f′(v)[u] 为线性映射,因为:
( 1 ) f ′ ( v ) [ α u ] ( α ∈ R ) = lim h → 0 f ( v + h α u ) − f ( v ) h = α lim k → 0 f ( v + k u ) − f ( v ) k ( h ≜ k α ) = α f ′ ( v ) [ u ] ( 2 ) f ′ ( v ) [ u + w ] = lim h → 0 f ( v + h u + h w ) − f ( v ) h = lim h → 0 f ( v + h u + h w ) − f ( v + h u ) h + lim h → 0 f ( v + h u ) − f ( v ) h = f ′ ( v ) [ w ] + f ′ ( v ) [ u ] \begin{aligned} &(1)\quad\ f'(v)[\alpha u]\quad(\alpha\in R)\\\\ &=\lim_{h\rightarrow 0}\frac{f(v+h\alpha u)-f(v)}{h}\\\\ &=\alpha\lim_{k\rightarrow 0}\frac{f(v+k u)-f(v)}{k}\quad(h\triangleq\frac{k}{\alpha})\\\\ &=\alpha f'(v)[u]\\\\ \\\ &(2)\quad\ f'(v)[u+w]\\\\ &=\lim_{h\rightarrow 0}\frac{f(v+hu+hw)-f(v)}{h}\\\\ &=\lim_{h\rightarrow 0}\frac{f(v+hu+hw)-f(v+hu)}{h}+\lim_{h\rightarrow 0}\frac{f(v+hu)-f(v)}{h}\\\\ &=f'(v)[w]+f'(v)[u] \end{aligned} (1) f′(v)[αu](α∈R)=h→0limhf(v+hαu)−f(v)=αk→0limkf(v+ku)−f(v)(h≜αk)=αf′(v)[u](2) f′(v)[u+w]=h→0limhf(v+hu+hw)−f(v)=h→0limhf(v+hu+hw)−f(v+hu)+h→0limhf(v+hu)−f(v)=f′(v)[w]+f′(v)[u]
那么,根据线性表示定理
f ′ ( v ) [ u ] = d f d v R ( ∙ r ) u 或 f ′ ( v ) [ u ] = u ( ∙ r ) d f d v L f'(v)[u]=\frac{df}{dv}_R(^r_\bullet)u\quad或\quad f'(v)[u]=u(^r_\bullet)\frac{df}{dv}_L f′(v)[u]=dvdfR(∙r)u或f′(v)[u]=u(∙r)dvdfL
其中, d f d v L , d f d v R \dfrac{df}{dv}_L,\dfrac{df}{dv}_R dvdfL,dvdfR 均为 r + s r+s r+s 阶张量,将其分别称作张量函数的左、右导数(梯度)。
(十 七)张量函数的微分与导数相关推荐
- matlab如何就导数,Matlab微分和导数
Matlab 的 Matlab微分和导数 MATLAB提供用于计算符号导数的diff命令. 以最简单的形式,将要微分的功能传递给diff命令作为参数. 例如,计算函数的导数的方程式 - 例子 创建脚本 ...
- 微分和导数的关系是什么?两者的几何意义有什么不同?为什么要定义微分 ?...
撸了今年阿里.头条和美团的面试,我有一个重要发现.......>>> 马同学 微信公众号:matongxue314,把数学讲清楚 -------------------------- ...
- SLAM本质剖析番外-李群李代数的微分和导数
0. 简介 这几个月,博主已经从SLAM算法的使用向着算法的数学推导进行了记录和分享,之前也分享了李群李代数关注核心一文,从现象中解释了李群和李代数表达的含义.但是这还不够,所以这次作者作为SLAM本 ...
- latex 常用数学符号(数值函数、根式、微分与导数、模运算、极限、范围与预测)
目录 数值函数 根式 微分与导数 模运算 极限 范围与预测 数值函数 符号 latex exp a b = a b \exp_a b = a^b expab=ab \exp_a b = a^b ...
- 微分和导数的关系是什么?
在初学微分和导数时,虽然感觉概念不复杂,但是我对两者的关系有点模糊,比如以下问题就觉得模棱两可: 对于导数链式法则, dydx=dydududx\frac {dy}{dx} = \frac {dy}{ ...
- 第二十三讲 解一阶微分方程组
例题 {u1′=−u1+2u2u1′=u1−2u2\left\{\begin{matrix}{u_{1}}'=-u_{1}+2u_{2}\\ {u_{1}}'=u_{1}-2u_{2}\end{mat ...
- 什么是微分?导数和微分的区别是什么?微分和积分的联系?
看之前推荐您阔以拿一只笔和一张纸,遇到看不懂的就画一画,增量啊什么的,会好理解很多. 先总的抽象地说一下微分是什么,假设有一个函数y=f(x).假设y轴上有一个增量,把这个增量叫做Δy.字面上理解,什 ...
- MATLAB微分和导数
MATLAB提供用于计算符号导数的diff命令. 以最简单的形式,将要微分的功能传递给diff命令作为参数.例如,计算函数的导数的方程式 - 例子创建脚本文件并在其中键入以下代码 -syms t f ...
- 函数微分和导数的定义
1.我们先来看可导的定义: 相信这个大家都看的懂. 2.接下来我们看可微的定义: 你们有没用想过为什么会有可微,他是用来干什么的,我们接下来看下面这张图,特别是结合图2-11来说, 我们可以看到书上说 ...
最新文章
- R语言交互式可视化包CanvasXpress
- ③pycharm的基本使用
- 数据分析实战-PUBG数据集EDA
- linux 中将文件设置密码,linux – 如何使用公钥在openssl中加密大文件
- maven mirror 优先级
- LeetCode--11.盛最多的水(双指针,暴力)
- 微信小程序加载本地图片方法
- Javascript第二章中for循环第四课
- CDN实战:访问苹果开发者网站太慢、访问github太慢
- 软件测试常见分辨率测试,如何用imatest测分辨率 imatest软件测试分辨率图文教程...
- ArcPad8新功能介绍
- cpda项目数据分析师与cda数据分析师的区别?不建议考CPDA
- 智慧水务管理系统提升城市水务管理智慧化水平
- tap10.app cn.html,Tap连点器
- OSChina 周三乱弹 —— 领悟人生,一百块钱都不给?
- 大学计算机第一课知识点,大学计算机基础第一课
- Excel中计算加权平均数
- 常见的域名劫持类型及如何修复
- 龙芯3U板卡学习资料第706篇: GEC-2K1000 龙芯3U板卡
- 腾讯可信区块链方案白皮书 QA
热门文章
- can总线短距离不用双绞线_电磁干扰很严重,如何提高CAN总线电磁兼容性
- docker系列一 docker 安装和常用命令
- Sliding Window滑动窗口(单调队列)
- 时间分辨率、频率分辨率
- c开发 易语言支持库,易写易库-用易语言开发易语言支持库.pdf
- 浅谈:C/C++中for( ; ; )和while(1)的区别
- 史上最简单的SpringCloud教程 | 第九篇: 服务链路追踪(Spring Cloud Sleuth)(Finchley版本)
- 加推超级IP名片正式上线!联合京东打造个人轻商城
- amd 服务器 主板芯片组,amd主板芯片组是什么
- Android 文字转语音使用讯飞语音SDK(eclipse版 无UI)