tsujimotterの下書きノート

このブログは「tsujimotterのノートブック」の下書きです。数学の勉強過程や日々思ったことなどをゆるーくメモしていきます。下書きなので適当です。

記事一覧はこちらです。このブログの趣旨はこちら

メインブログである「tsujimotterのノートブログ」はこちら

偏微分の連鎖律の証明

今日は偏微分の連鎖律について。

 z = h(u, v)) u = f(x, y) v = g(x, y) がそれぞれ偏微分可能な関数として、特に  h C^1 級関数とする。このとき、

 \displaystyle \newcommand{\dd}[2]{\frac{\partial {#1}}{\partial {#2}}} \frac{\partial z}{\partial x} = \frac{\partial z}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial z}{\partial v} \frac{\partial v}{\partial x}
 \displaystyle \frac{\partial z}{\partial y} = \frac{\partial z}{\partial u} \frac{\partial u}{\partial y} + \frac{\partial z}{\partial v} \frac{\partial v}{\partial y}

が成り立つ。

つまり、 z x で微分したものは、 z u で微分したものと  u x で微分したものの積に、 z v で微分したものと  v x で微分したものの積を足したものである、という定理です。

偏微分を連鎖的に計算していくので、連鎖律といいます。


この証明を自力で行おうとしてだいぶ苦労してしまったので、メモがてらまとめてみようと思います。

なお、条件にある「 h C^1 級」の意味ですが、 h x, y でそれぞれ偏微分可能であって、 h_x, h_y h x, y で偏微分して得られる関数)がそれぞれ連続であることをいいます。偏微分した結果も連続ということですね。実はこの条件が証明の際にかなり効いてきます。

1変数の場合

2変数でいきなりやるのではなく、まずは1変数で考えるのが無難です。

1変数の場合は、いわゆる合成関数の微分という、次のような主張になります:

 \displaystyle \frac{d}{dx}\left\{ f( g(x) )\right\} = f'(g(x))\cdot g'(x)

(証明)
微分の定義より

 \displaystyle  \frac{d}{dx}\left\{ f( g(x) )\right\} = \lim_{\Delta x\to 0}\frac{f( g(x+\Delta x) ) - f( g(x) )}{\Delta x}

である。右辺の分母分子に  g(x+\Delta x) - g(x) をかけると

 \displaystyle   = \lim_{\Delta x\to 0}\frac{f( g(x+\Delta x) ) - f( g(x) )}{g(x+\Delta x) - g(x)} \cdot \frac{g(x+\Delta x) - g(x)}{\Delta x}

となり、 \frac{g(x+\Delta x) - g(x)}{\Delta x} \xrightarrow{\Delta x \to 0} g'(x) である。

また、 u = g(x) とし  \Delta u = g(x+\Delta x) - g(x) とすると

 \displaystyle \frac{f( g(x+\Delta x) ) - f( g(x) )}{g(x+\Delta x) - g(x)} = \frac{f( u + \Delta ) - f( u )}{\Delta u}

となり、 \Delta x \to 0 のとき  \Delta u \to 0 なので、 \frac{f( u + \Delta ) - f( u )}{\Delta u} \xrightarrow{\Delta x \to 0} f'(u) = f'(g(x)) である。

したがって、 \displaystyle \frac{d}{dx}\left\{ f( g(x) )\right\} = f'(g(x))\cdot g'(x) が示された。

(証明おわり)


上の証明は一見良さそうなのですが、実は下線部のところが問題。たとえば、 g(x) = 1 のような関数を考えたときに、 g(x + \Delta x) - g(x) = 0 になってしまい、0割りになってしまう。

しかし、よくよく考えてみれば、 g(x + \Delta x) - g(x) = 0 のときは   g(x + \Delta x) = g(x) なので、割らずとも連鎖律は直ちに示される。したがって、適切に場合分けしてあげれば解決する。なので、省略。

2変数の場合の証明

2変数の場合も1変数の場合と同じ、として省略されることが多いのだが、実はかなり面倒なのでここに書く価値はあると思う。

(証明)
偏微分  \frac{\partial z}{\partial x}の定義より

 \displaystyle \frac{\partial z}{\partial x} = \lim_{\Delta x \to 0} \frac{h( f(x+\Delta x, y), g(x+\Delta x, y) ) - h(f(x,y), g(x, y) )}{\Delta x}

である。ここで、 \Delta u = f(x+\Delta, y)  - f(x, y) \Delta v = g(x+\Delta, y)  - g(x, y) とおくと

 \displaystyle \frac{\partial z}{\partial x} = \lim_{\Delta x \to 0} \frac{h( u+\Delta u, v+\Delta v) - h(u, v)}{\Delta x}

と表される。ここで、

 \displaystyle \frac{\partial z}{\partial x} = \lim_{\Delta x \to 0} \frac{h( u+\Delta u, v+\Delta v) - h( u+\Delta u, v ) + h( u+\Delta u, v ) - h(u, v)}{\Delta x}

のように、打ち消される項を追加すると

 \displaystyle \frac{\partial z}{\partial x} = \lim_{\Delta x \to 0}\left( \frac{h( u+\Delta u, v+\Delta v) - h( u+\Delta u, v )}{\Delta x} + \frac{h( u+\Delta u, v ) - h(u, v)}{\Delta x} \right)

ここで、第2項目は  y v を定数とみれば、 x についての1変数の合成関数  F(x) :=  h( f(x, y), v ) の変微分だと思うことができる。よって、合成関数の微分を用いて

 \displaystyle \frac{h( u+\Delta u, v ) - h(u, v)}{\Delta x} = \frac{F(x+\Delta x) - F(x)}{\Delta x} \xrightarrow{\Delta x \to 0} \frac{\partial z}{\partial u} \frac{\partial u}{\partial x}

とできる。

残るは第1項目だけである。ここで、 \frac{h( u+\Delta u, v+\Delta v) - h( u+\Delta u, v )}{\Delta x} において、もしも  u+\Delta u の部分が  u であったとしたら、 第2項目と全く同様に  \Delta x \to 0 において  \frac{\partial z}{\partial v} \frac{\partial v}{\partial x} と表せることになります。

しかしながら、そう簡単にはいきません。そこで、少し工夫が必要です。

 h( u+\Delta u, v+\Delta v) h( u+\Delta u, v ) において、動いているのは  v だけですので、 h v についての1変数関数だと思って「平均値の定理」を使います。すると、ある  v_0 \in (v, v+\Delta v) が存在して

 \displaystyle h( u+\Delta u, v+\Delta v) - h( u+\Delta u, v ) = h_v( u+\Delta u, v_0 ) \cdot (v+\Delta v - v)

が成り立ちます。両辺  \Delta x で割ると

 \displaystyle \frac{h( u+\Delta u, v+\Delta v) - h( u+\Delta u, v )}{\Delta x} = h( u+\Delta u, v_0 ) \cdot \frac{v+\Delta v - v}{\Delta x}

であるが、

 \displaystyle \frac{v+\Delta v - v}{\Delta x} \xrightarrow{\Delta x \to 0} \frac{\partial v}{\partial x}

であり、また  u + \Delta u \to u かつ  v_0 \to v なので、 h_y は連続関数より( h C^1 級であるという仮定がここで活かされます)

 \displaystyle h_v( u+\Delta u, v_0 ) \xrightarrow{\Delta x \to 0} h_v( u, v )

が成り立ちます。 h_v( u, v )  = \frac{\partial z}{\partial v} なので

 \displaystyle \frac{\partial z}{\partial x} = \frac{\partial z}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial z}{\partial v} \frac{\partial v}{\partial x}

が示されたことになります。

(証明おわり)


連鎖律とヤコビアン

連鎖律を改めて再掲します:

 \displaystyle \frac{\partial z}{\partial x} = \frac{\partial z}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial z}{\partial v} \frac{\partial v}{\partial x}
 \displaystyle \frac{\partial z}{\partial y} = \frac{\partial z}{\partial u} \frac{\partial u}{\partial y} + \frac{\partial z}{\partial v} \frac{\partial v}{\partial y}


このような式を見ると行列に見えてきますが、このように変形できます:

 \displaystyle \begin{pmatrix} \dd{z}{x} \\ \dd{z}{y} \end{pmatrix} = \begin{pmatrix} \dd{u}{x} & \dd{v}{x} \\ \dd{u}{y} & \dd{v}{y} \end{pmatrix} \begin{pmatrix}  \dd{z}{u} \\ \dd{z}{v} \end{pmatrix}

ここに出てきた変換行列

 \displaystyle J = \begin{pmatrix} \dd{u}{x} & \dd{v}{x} \\ \dd{u}{y} & \dd{v}{y} \end{pmatrix}

ヤコビアンといいます。これは座標変換

 \begin{cases} u = f(x, y) \\
v = g(x, y) \end{cases}

に伴って現れる量になっていますね。

つまり、上の座標変換によって、 (x, y) \to (u, v) と変換すると、 (u, v) の関数  z (x,  y) の関数と思ったときの偏微分は、 (u, v) の偏微分にヤコビアンをかけたような形で表せるということですね。面白いです。


これは、多様体の  \frac{\partial}{\partial x}, \frac{\partial}{\partial y} で張られる接空間が2次元のベクトル空間であり、接空間を与える対応が関手的であることから言えそうです。座標変換則を接空間に写すと、線形写像となり、それがヤコビアンとして現れていると見れるわけですね。

参考資料

今回の証明については、以下の原隆先生の講義資料が大変参考になりました。原先生は岩澤理論関係の文献を調べているときに度々お見かけするのですが、この講義資料も原先生のものだと知って驚きました。非常に教育的に書かれているものかと思います。
著者は岩澤理論の原先生だと勘違いしておりましたが、実際は別の原先生だったようです。失礼いたしました。ご指摘いただきありがとうございました。
https://www2.math.kyushu-u.ac.jp/~hara/lectures/12/biseki1213b.pdf