数学メモ帳

なんかとりあえず数学する

ひとくち数学「ディリクレ積分をゴリゴリっと計算する」

Problem次の積分を求めよ.\[\int_{0}^{\infty}\frac{\sin x}{x}\ dx\]

 

今回はディリクレ積分について最近色んな方法を知ったので今回はなるべく前提知識を仮定しない方法でどれだけできるかを試したいと思います.

基本的なこととして,これはみればわかりますが広義積分です.一見積分範囲の両端がやばいように見えますが,\[\lim_{x\to +0}\frac{\sin x}{x}=1\]である事は承知のとおりだと思うので,実質的に問題なのは\(\infty\)の部分です.まあそのへんを睨みつつ頑張って行きましょう.

で,問題をとく前にですがこれが収束する事は一応確認事項ではあるので確認はしておきましょう.

注意点としてこの積分絶対収束しません!というのはご存知かと思われますが,これがあるためガバガバっと不等式で抑えることはできません.

ちなみにですが,広義積分\[\int_{0}^{\infty}f(x)\ dx=\lim_{R\to\infty}\int_{0}^Rf(x)\ dx\]なので,広義積分が収束するとは上の極限があれば良いということになります.

しかし,極限値が簡単に求まればわざわざこんなに前置きをして書く事はないので,次を示します:\[R>M,\ \left|\int_{M}^R\frac{\sin x}{x}dx\right|\to 0\ (as\ R,M\to\infty)\]

所謂Cauchyの収束判定法というやつで,これは簡単に示せます.

今,中身を部分積分すると,\[(LHS)=\left| \left[ \frac{-\cos x}{x}\right]_{M}^R-\int_{M}^R\frac{\cos x}{x^2}\ dx\right|\leq \frac{1}{R}+\frac{1}{M}+\int_M^R\frac{1}{x^2}\ dx\to 0\ (as\ R,M\to\infty)\]

ということで収束する事は大丈夫そうです.絶対収束しないことを言うには\(R\)を自然数\(n\)に変えてやってみると出来ると思います.ややテクニカルではありますが.

まあ有名な積分なのでダラダラやっても仕方ないので早速解法に移ります.

で,方法としてはひたすらゴリゴリと計算します.エレガントさはないですが,ある意味こういうゴリ押し計算も解析の醍醐味(?)だったりします.

でアイデアとしては次のようなことをしたいと考えます:

\[\int_{0}^{\infty}\frac{\sin x}{x}\ dx=\int_{0}^{\infty}\left(\int_{0}^{\infty}e^{-xu}\ du\right)\sin x\ dx\]

一見ギョッとしますが,これは\[\int_{0}^{\infty}e^{-xu}\ du=\frac{1}{x}\]になるということを利用した変形で上のことはそのまま積分すればわかります.

さらに良いこととして,ひとまず積分の順序交換を認めて,\(x\)から先に積分すると

\[\int_{0}^{\infty}e^{xu}\sin x\ dx=\frac{1}{u^2+1}\]が2回部分積分をすると得られます.これのいいところは計算結果が\(\tan^{-1}u\)の微分になっているので

\[\int_{0}^{\infty}\frac{1}{u^2+1}\ du=\frac{\pi}{2}\]となってうまく計算ができることにあります.

さてこの交換を正当化するためにまずは\(\infty\)を一旦排除して考えていくことにしましょう.

具体的には\[\int_{0}^{R}\frac{\sin x}{x}\ dx\]をかんがえましょう.今,\(R,M>0\)として,次のように変形します:

\[\int_{0}^{R}\frac{\sin x}{x}\ dx=\int_{0}^{R}\left(\int_{0}^{M}e^{-xu}\ du\right)\sin x\ dx+\int_{0}^{R}\frac{\sin x}{x}e^{-Mx}\ dx\]

まず,この変形について説明すると先ほどの積分を増やす操作を\(M\)で一旦止めてやってみました.しかしこれでは\(\infty\)の時は消えてくれていたものがのこるので,それを打ち消すための第2項目がでてきます.

ここで第一項目は\(e^{-ux}\sin x\)が連続なので,積分の順序交換を簡単に行うことができます.有限で止めたのはこのためです.

しかし,その弊害として余分な第二項目が出てしまったわけですがこれは\(M\)の極限を取ることで消すことができます.

実際,\[\left|\int_{0}^R\frac{\sin x}{x}e^{-Mx}\ dx\right|\leq \int_{0}^{R}e^{-Mx}dx=-\frac{e^{-MR}}{M}+\frac{1}{M}\to 0\ (as\ M\to\infty)\]となります.

従って,ここまでで,結論の半分である\[\int_{0}^R\frac{\sin x}{x}\ dx=\int_{0}^{\infty}\left(\int_{0}^Re^{-ux}\sin x\ dx\right)\ du\]がわかりました.

次に,\[\int_0^Re^{-ux}\sin x\ dx=\frac{1}{u^2+1}-\frac{e^{-Ru}}{u^2+1}(\cos R+u\sin R)\]

となり,第二項目の積分\[\int_{0}^{\infty}\frac{e^{-Ru}}{u^2+1}(\cos R+u\sin R)\ du\]が\(0\)に収束すれば結論が得られるのでそれを示します.

今,\(\mid\cos R+u\sin R\mid \leq 1+u\)が成り立つので, \[\left|\int_{0}^{\infty}\frac{e^{-Ru}}{u^2+1}(\cos R+u\sin R)\ du\right|\leq \int_{0}^{\infty}\frac{e^{-Ru}}{u^2+1}\mid\cos R+u\sin R\mid\leq\int_{0}^{\infty}\frac{e^{-Ru}}{u^2+1}(u+1)\ du\leq \int_{0}^{\infty}(u+1)e^{-Ru}\ du\]となり,これは\(R\to\infty\)のとき\(0\)に収束するので結論が得られました. \(\Box\)

ということでゴリゴリと計算することで今回は極限値を求めましたが,これよりも楽に求める方法はいくらでもあるので,これにこだわる必要はない気がしますが,これもまた一つの解法としてとても良いと感じなので書いてみました.

以上で今回は終わります.

複素解析覚書き2-積分定理とか

今回は複素線積分について適当に話します.

その前に正則関数の定義から行きましょう.

Definition複素関数\(f\)が点\(z_0\)で正則であるとは,ある\(r>0\)が存在して,\(z_0\)の\(r\)近傍\(U_r(z_0)=\{z;\ \mid z-z_0\mid<r\}\)上微分可能であることをいう.また領域\(D\)で正則であるとは,\(f\)が\(D\)の任意の点で正則である事をいう.

 

正則関数については次の命題が基本的です.

proposition\(D\)を領域とし,\(D\)上の複素関数\(f\)を\(f(z)=u(x,y)+iv(x,y)\)とするとき,\(u,v\)が\(C^1\)級であって,\(D\)上\(u,v\)がCauchy-Riemann方程式を満たすならば,\(f\)は\(D\)上正則である.

 

これに関しては証明はいいと思うので飛ばします.

さて次に複素積分の定義をするので,少しだけ準備です.

Definition\(I=[a,b]\)に対し,複素平面上の曲線\(C\)のパラメータ表示を\(z(t)\)とするとき\(C\)が区分的に滑らか(Piecewiese Smooth)であるとは,\(z(t)\)は\(I\)上連続であり,区間のある分割\[a_0=a<a_1<\cdots <a_n=b\]が存在して,各\([a_k,a_{k+1}]\ (k=0,\cdots, n)\)で\(C^1\)級かつ,\(z(t)\neq 0\)であることを言う.特に,\(z(t)\)が閉曲線であるとは,\(z(a)=z(b)\)となることである.また,\(z(s)=z(t)\)なる\(s,t\in I\)が\(a,b\)以外存在しないとき,単純閉曲線(Jordan 曲線)であるという.

 

複素積分を次のように定義します.

Definition\(I=[a,b]\)とし,PS(piecewise smooth)曲線\(C\)のパラメータ表示を\(z(t)\)とし,複素関数\(f\)を\(C\)の近傍で連続とする.このとき\(C\)上の複素積分を\[\int_C f(z)\ dz=\int_{a}^b f(z(t))z'(t)dt=\sum_{k=1}^n\int_{a_k}^{a_{k+1}}f(z(t))z'(t)dt\]で定義する.また,\[\int_C f(z)\ \mid dz\mid =\int_{a}^b f(z(t))\mid z'(t)\mid\ dt\]を弧長に関する線積分という.

 

基本的なこととして,\[\left| \int_C f(z)\ dz\right |\leq \int_C\mid f(z)\mid\mid dz\mid\]

が成り立ちます.さらに曲線に関して次を定義します.

Definition\(D\)を領域とし,\(D\)内の曲線\(C_1,C_2\)のパラメータ表示を\(I=[a,b]\)に対し,それぞれ\(z_1(t),z_2(t)\)とする.このとき,\(C_1\)と\(C_2\)が\(D\)でホモトープであるとは,ある連続写像\(h\colon I\times [0,1]\to D\)が存在して\[h(t,0)=z_1(t),\ h(t,1)=z_2(t),h(a,s)=z_1(a)=z_2(a),h(b,s)=z_1(b)=z_2(b)\]が成り立つことである.これを\(C_1\sim C_2\)と表す.また,\(h\)をホモトピーという.さらに,\(D\)内の任意の連続閉曲線が定数曲線にホモトープのとき,\(D\)は単連結であるという.

 

上ではパラメータ表示の定義域を同じとしましたがそれはあまり本質的なことではないです.変数変換すればいいだけですからね.

ところで,ホモトープは同値関係です.これはまぁそんなに難しくないのでいいでしょう.

さて.ここまで定義したところで,Cauchyの積分定理についてのべましょう.

Theorem\(D\)を領域とする.\(f\)が\(D\)上正則であり,\(D\)内の2つのPS曲線\(C_1,C_2\)が\(C_1\sim C_2\)であり,ホモトピー\(h\)が\(C^1\)級ならば\[\int_{C_1}f(z)\ dz=\int_{C_2}f(z)dz\]が成り立つ.特に,\(D\)が単連結で,PS曲線\(C\)が閉曲線ならば,\[\int_C f(z)dz=0\]となる.

 

よく知られているCauchyの積分定理はホモトープという概念を導入することで上のように一般化できます.

が,あまりにもその証明には労力が必要なのでここに証明を書く事は大変なのでしません.この証明は概ね3,4段階くらいに領域を一般化しつつ証明します.

ところで,上ではホモトピーが\(C^1\)であると仮定していますが,実際は連続曲線に対しても複素積分はうまく定義が可能なので,この仮定は必要ないです.

さて,ここまで証明もなしにやっていると何かさみしいものがあるので,2つほど簡単な場合を証明しておきましょう.

 

まず次のことが成り立ちます.

 

Theorem\(D\)を領域とし,\(D\)が閉三角形\(T\)を含むとする.このとき,\(D\)上正則な関数\(f\)に対して,\[\int_{\partial T} f(z)dz=0\]となる.ただし,閉三角形であるとは,\(a,b,c\in D\)なる三点を結ぶ線分で囲まれる領域(境界を含む)をさし,\(\partial T\)は\(T\)の境界を表す.

 

これは所謂Cauchy-Goursatの定理です.この場合領域自体の性質に特に条件をおいていませんが,代わりに積分経路が制限されています.このようにCauchyの積分定理は積分経路や領域に制限をつけ少しずつ証明をしていくのです.

これを示す前に,ひとつ補題を上げておきます.

 

Lemma(Cantorの区間縮小法)\(\mathbb{C}\)内のコンパクト集合の列\(\{K_n\}\)が\(K_n\neq \emptyset,k_{n+1}\subset k_n\)ならば,\(\bigcup_{n\in\mathbb{N}}^{\infty}K_n\neq\emptyset\)である.特に,\[d(K_n)=\sup\{\mid z_1-z_2\mid;\ z_1,z_2\in K_n\}\to 0\ (as\ n\to \infty)\]ならば\(\bigcup_{n\in\mathbb{N}}^{\infty}K_n\)は一点集合である.

 

これは距離空間なので点列コンパクト性を使ったほうが良いかと思います.実際,各\(K_n\)からひとつずつ元をとり,数列\(\{z_n\}\)を作りますあとは単調減少性と点列コンパクト性を駆使すれば,空でないことはわかります.

一点集合となることに関しては,共通部分から2点をとり,その絶対値を考えると\(d(K_n)\)より小さくなるので,極限を考えればよいでしょう.

さて,これを踏まえCauchy-Goursatの定理を証明します.

proof

まず,\[I(T)=\int_{\partial T} f(z)\ dz\]とします.閉三角形\(T\)の頂点を\(a,b,c\)とするとき,各辺\(ab,bc,ca\)の中点を\(a_1,b_1,c_1\)とし,それぞれを結ぶ線分を取ります.

このとき元の\(T\)は4つの合同な三角形\(T_{1,1},T_{1,2},T_{1,3},T_{1,4}\)に分かれます.(シェルピンスキーガスケットみたいな感じ)

元の三角形を\(T_0\)とおき,\(T_1\)を上の三角形のどれか一つのうち,\(\mid I(T)\mid\leq 4\mid I(T_1)\mid\)となるものとして,今度は\(T_1\)に同じ操作を適用すると\(T_2\)が得られます.

これを繰り返すと,\(\{T_n\}\)という閉三角形の列が取れます.これはコンパクト集合列です.このとき,\(T\)の周の長さを\(L\)と置くと,\[d(K_n)\leq\frac{L}{4^n}\]が成り立ちます.

よって区間縮小法により,\(\exists a\in D;\ \bigcap_{n=0}^{\infty}T_n=\{a\}\)が成り立ちます.

一方で,\(f\)は\(D\)内で正則なので,\(a\)のある近傍上\(U_r(a)\)で,\[f(z)=f(a)+f'(a)(z-a)+\delta(z)(z-a)\]とかけます.ただし,任意の\(\varepsilon>0\)に対し,\(\mid \delta(z)\mid<\varepsilon\ \ \ z\in U_r(a)\)です.

今.\(d(K_n)\)は\(0\)に収束するので,\(n\)が十分大きければ,\(T_n\subset U_r(a)\)となります.従ってこのとき

\[\left|\int_{\partial T_n}f(z)dz\right |=\left |\int_{\partial T_n} f(a)+f'(a)(z-a)dz+\int_{\partial T_n} \delta(z)(z-a)dz\right | \]

ここで,絶対値の中身の第一項は計算すれば\(0\)となることがわかるので,

\[\left|\int_{\partial T_n}f(z)dz\right |\leq \varepsilon\frac{L^2}{4^n}\]が成り立つことがわかります.

また,\[\mid I (T)\mid \leq 4^n\mid I(T_n)\mid\]が取り方により成り立つので,\(I(T)=0\)でなければなりません.\(\Box\)

またこれを用いてもう少し扱いやすい形のものが示せます.その前に二つほど定義をしておきます.

Definition領域\(D\)が凸領域であるとは任意\(D\)の点\(z_1,\ z_2\)を結ぶ線分\[ z(t)=z_1(1-t)+tz_2\ t\in [0,1]\]が\(D\)内に含まれることである.+

 

Definition\(D\)を領域とし,\(D\)上の複素関数\(F\)が\(f\)の原始関数であるとは,\[F'(z)=f(z)\ z\in D\]が成り立つことである..

 

ここで,基本的なこととして,\(f\)に原始関数\(F\)が存在するならば,\[\int_C f(z)\ dz=F(z(b))-F(z(a))\]が成り立ちます.

これを踏まえ次が成り立ちます.

Theorem\(D\)を凸領域とし,\(f\)は\(D\)上正則とする.このとき任意のPS閉曲線\(C\)に対して,\[\int_C f(z)dz=0\]が成り立つ.

proof

証明ですが,結局原始関数の存在が示せればよいので,それを示します.

\(z_0\)を一つ固定すると,任意の\(z\in D\)と\(z_0\)を結んだ線分は\(D\)に含まれます.

従って,関数\(F\)を次のように定義します:\[F(z)=\int_{\overline{zz_0}}f(z)dz\]ただし,\(\overline{zz_0}\)は\(z_o,z\)を結ぶ線分を表します.

今,任意の\(a\in D\)に対し,\(F'(a)=f(a)\)を示します.\(\Delta z\)を\(a+\Delta z\in D\)となるようにとります.

このとき,三点\(z_0,a,a+\Delta z\)がつくる閉三角形をTとする.このとき,Cauchy-Goursatの定理より

\[\int_{\partial T} f(z)dz=\int_{\overline{z_0a}-\overline{z_0(a+\Delta z)}-\overline{a(a+\Delta z)}}f(z) dz=0\]ですので,\[F(a+\Delta z)-F(a)=\int_{\overline{a(a+\Delta z)}}f(z) dz\]が成り立ちます.

よって,\[\mid\frac{1}{\Delta z}(F(a+\Delta z)-F(a))-f(a)\mid =\left |\frac{1}{\Delta z}\int_{\overline{a(a+\Delta z)}}f(z) dz-f(a)\right |\]となりますが,ここで,

\[f(a)=\frac{1}{\Delta z}\int_{\overline{a(a+\Delta z)}}f(a) dz\]より,

\[\left |\frac{1}{\Delta z}\int_{\overline{a(a+\Delta z)}}(f(z)-f(a)) dz\right |\leq \sup\{\mid f(z)-f(a)\mid ;\ \mid z-a\mid \leq\mid \Delta z\mid\}\to 0\ (as\ \Delta z\to 0)\]となり原始関数であることがわかります.\(\Box\)

という事で,特別な場合はこのように割と簡単に示せるのですが,それ以外だとまあまあ大変です.次回は暇だったら一致の定理とかについてやろうと思います.

複素解析覚書き1-複素数の定義とか

最近,複素解析もまた忘れてきてるなーと思ったので使いそうなものを覚書き.内容は面白いものでもないかもですが

ということでまずは複素数の定義から.

ここでは複素数をある程度数学的にまともな定義を与えたい気がするので,そうします.

定義は様々ありますが,ここでは実係数多項式環を使って定義を行いたいと思います.

実係数多項式環\(\mathbb{R}[x]\)は次のように定義されます:\[\mathbb{R}[x]=\{f\ ;\ f(x)=a_o+a_1x+a_2+\cdots =\sum_{i\geq 0}a_ix^i,\ a_i\in\mathbb{R}\ ただし,有限個を除き,a_i=0\}\]ただし,形式上\(x^0=1\)とします.

さて一般論として,\(\mathbb{R}\)は体なので,\(\mathbb{R}[x]\)はユークリッド整域です.従って,既約元から生成されるイデアルは極大イデアルです.

従って,\(x^2+1\)は\(\mathbb{R}[x]\)の既約元なので,剰余環\[\mathbb{R}[x]/(x^2+1)\mathbb{R}[x]\]は体となるので,これを\(\mathbb{C}\)と定義します.

このとき,任意の多項式\(f\)は\(\mathbb{R}[x]\)がユークリッド整域であることから,ある多項式\(q\)と実数\(a,b\)が存在して,\[f(x)=(x^2+1)q(x)+a+bx\]とかけます.

よって,\(\mathbb{C}=\{\overline{a+bx}\ ;\ a,b\in\mathbb{R}\}\)となります.

また\(\mathbb{R}\)から\(\mathbb{C}\)への標準的な単射(\(a\mapsto \overline{a}\))により,\(\mathbb{R}\subset\mathbb{C}\)とみなせます.

従って,単に\(a\)などと書く事にすると,\(\overline{a+bx}=a+b\overline{x}\)であり,\({\overline{x^2}}=-1\)より,\(x\)を\(i\)と書く事にすれば,

\[z\in\mathbb{C}\Leftrightarrow z=a+bi\ (a,\ b\in\mathbb{R})\] となり,複素数体の構成を行うことができました.

最後に解析には欠かせない複素数\(z=a+bi\)の絶対値は,共役複素数\(\overline{z}=a-bi\)として,\[\mid z\mid =\sqrt{z\overline{z}}=\sqrt{a^2+b^2}\]と定義します.これは当然のことながら,

    \( (1)\ \mid z\mid \geq 0\)特に,\(\mid z\mid =0\Leftrightarrow z=0\)
    \((2)\ \alpha\in\mathbb{C},\ \mid \alpha z\mid=\mid\alpha\mid\mid z\mid\)
    \((3)\ z_1,\ z_2\in\mathbb{C},\ \mid z_1+z_2\mid\leq \mid z_1\mid+\mid z_2\mid\)

を満たします.これで概ね必要なものは揃ったので以上で複素数の定義を終わります.

他にも複素数の構成はいくつか方法がありますがこれが一番早いでしょう.馴染みはないかもしれませんが.

一番わかりやすいのはハミルトンによる\(\mathbb{R}^2\)を使った定義でしょう.あれは直感的にもわかりやすいので,構成するのは楽ですが,体であることをチェックするのが面倒です.

次に複素微分について.まず定義から.

Definition複素関数\(f\)が点\(z_0\)で複素微分可能であるとは,\[\lim_{z\to z_0}\frac{f(z)-f(z_o)}{z-z_0}=\lim_{\Delta z\to 0}\frac{f(z_0+\Delta z)-f(z_0)}{\Delta z}\]が存在することをいう .

 

一応注意しておくと,ここでの極限の定義は,\[\lim_{z\to z_0}f(z)=\alpha\Leftrightarrow\forall\varepsilon>0,\ \exists \delta>0;\ 0<\mid z-z_0\mid <\delta\Rightarrow \mid f(z)-\alpha\mid <\varepsilon\]です.

さて,複素微分について重要なのは次の関係です.

Theorem複素関数\(f(z)=u(x,y)+iv(x,y)\ (z=x+iy)\)が点\(z_0=x_0+iy_0\)で複素微分可能であることと,\(u,\ v\)が\((x_0,\ y_0)\)で全微分可能であって,Cauchy-Riemann方程式\[\frac{\partial u}{\partial x}=\frac{\partial v}{\partial y},\ \frac{\partial u}{\partial y}=-\frac{\partial v}{\partial x}\]を満たすことは同値である.

proof

以下,\[u_x=\frac{\partial u}{\partial x},\ u_y=\frac{\partial u}{\partial y}\]などと書きます.(\(v\)も同じく)

証明ですが,複素微分可能ならば明らかに全微分可能かつ,Cauchy-Riemann方程式を満たします.従って,逆のみ示します.

今全微分可能なので,微分積分の一般論から次が成り立ちます:

\[u(x_0+h,y_0+k)=u(x_0,y_0)+u_x(x_0,y_0)h+u_y(x_0,y_0)k+\varepsilon_1(h,k)\]ただし,\[\ \lim_{(h,k)\to (0,0)}\frac{\varepsilon_1(h,k)}{\sqrt{h^2+k^2}}\]

これは\(v\)についても同様に,

\[v(x_0+h,y_0+k)=v(x_0,y_0)+v_x(x_0,y_0)h+v_y(x_0,y_0)k+\varepsilon_2(h,k)\]

ただし,\[\ \lim_{(h,k)\to (0,0)}\frac{\varepsilon_2(h,k)}{\sqrt{h^2+k^2}}\]

となります.さて,\(\Delta z=h+ik\)とおくと,

\[f(z_0+\Delta z)-f(z_0)=u(x_0+h)-u(x_0,y_0)+i(v(x_0+h,y_0+k)-v(x_0,y_0)\]

で先ほどの式を適用すると,

\[=u_x(x_0,y_0)h+u_y(x_0,y_0)k+\varepsilon_1+i(v_x(x_0,y_0)h+v_y(x_0,y_0)k+\varepsilon_2)\]

となります.ここで,Cauchy-Riemann 方程式を適用すると,

\[\frac{f(z_0+\Delta z)-f(z_0)}{\Delta z}=u_x(x_0,y_0)+iv_x(x_0,y_0)+\frac{\varepsilon_1}{\Delta z}+\frac{\varepsilon_2}{\Delta z}\]

従って,\(\varepsilon_1,\ \varepsilon_2\)の性質から結論を得ます. \(\Box\)

今回はこれで終わり.次回はCauchyの積分定理周辺の定理とかについてまとめようと思います.

ひとくち数学「次元の話」

3次元は立体で2次元は平面で・・・なんて説明はここ最近だとよく耳にします.まぁそれこそ二次元という言葉も今では馴染みのある言葉になりました.

そんな直感的にはなんとなく理解している次元ですが,数学的にはどのように定義されるのでしょうか?ということで,今回も線形代数のお話です.

まず,次元を定義しておきましょう.

Definition

\((1)\) \(V\)を複素ベクトル空間とする.\(V\)のベクトルの集合\(\{x_i\}_{i\in I}\) (ただし添字集合\(\)は無限でもよい)が有限個の\(i\)に対して,\(\alpha_i\neq 0\)となるような複素数を係数として,\[\sum_{i\in I}\alpha_ix_i\]なる形式的無限和を 一次結合(線形結合)という. このとき,一次結合全体の空間\[\langle\{x_i\}_{i\in I}\rangle=\Bigl\{\sum_{i\in I}\alpha_ix_i\} \Bigr\}\]を\(\{x_i\}_{i\in I}\)が生成する部分空間(張る空間)という.

\((2)\)\[\sum_{i\in I}\alpha_ix_i=0\Rightarrow \forall i\in I,\ \alpha_i=0\]が成り立つ時,\(\{x_i\}_{i\in I}\)は一次独立または線形独立という.特に,\(L\subset V\)に対して,\(\{x\}_{x\in L}\)が一次独立となるとき,\(L\)は一次独立であるという.(だたし便宜上空集合は一次独立であるとする.)

\((3)\)\(\langle \{x_i\}_{i\in I}\rangle=V\)かつ一次独立であるとき,\(\{x_i\}_{i\in I}\)は\(V\)の基底であるという.

\((4)\)特に基底の元が有限個であるとき,\(V\)は有限次元であるという.またその基底の元の個数を\(V\)の次元といい,\(\dim V\)で表す.有限次元でないときは便宜上\(\dim V=\infty\)と表す.

 

ということで,これが次元の定義です.つまり基底の元の個数としたわけですね.ですが,この定義はきちんとされているのか問題があります.なぜなら

    ・そもそも基底なんてものは存在するのか?
    ・基底があったとしても,きちんと次元という値が1つに定まるのか?

という二つの問題があります.一つ目はそのままで,そもそも基底がなければこの定義は破綻します.なので必ず基底が取れるということをいう必要があります.二つ目は仮に基底が複数あったとして,基底の元の数が一致しなければ次元はひとつに定まらずこの定義は破綻してしまいます.

従って,今回はこれを頑張って示していこうってことになります.

まず基底の存在についてですね.

Theorem \(V\)を複素ベクトル空間とし,一次独立な\(V\)の部分空間\(U\)を含むような\(W\)によって\(V\)が生成されるとき,\[U\subset B\subset W\] を満たすような\(V\)の基底\(B\)が存在する.

Remark

\(U=\emptyset,\ W=V\)の場合でもよい.この時は\(V\)自身が基底であることを意味する.

proof

さて,証明ですが,Zorn補題を使います.今\[\mathcal{A}=\{B;\ U\subset B\subset V,\ かつBは一次独立\}\]とおきましょう.

この時,\(U\in\mathcal{A}\)であるから空でないです.

今,\(\mathcal{A}\)は集合の包含関係に関して半順序関係となるので,\(\mathcal{A}\)の全順序部分集合を\(\mathcal{B}\)とおきます.

このとき,\[B'=\bigcup_{B\in \mathcal{B}}B\]と定義すると,\(U\subset B'\subset V\)であるから,\(B'\)が一次独立であれば良いです.

ここで,\(B'\)の一次結合\(\sum\alpha_ix_i\)を考えると,各\(x_i\)は\(\mathcal{B}\)のある集合に属しますが,全順序部分集合なので,結局1つの集合にすべて属します.

従って,一次独立となり\(B'\)は上界であることがわかります.よって,Zorn補題より,極大元\(B\)が存在します.この\(B\)が基底であることを最後に示します.

取り方から一次独立であることは明らかなので,\(\langle B\rangle=V\)を示します.これは背理法によります.

すなわち,そうでないとすると,\(v\in V\setminus\langle B\rangle\)となる\(v\neq 0\)が存在します.これより,\(B\cup\{v\}\)は一次独立となりますが,これは極大元であることに矛盾します.

よって,生成される空間は\(V\)に一致して,基底であることがわかります. \(\Box\)

なお,\(W\)が有限の場合は明らかに極大元があるので,その場合はZorn補題は必要ないです.

さて、基底の存在がわかったところで,次の問題は基底の元の個数が一致するかどうかですね.ここからはすべて\(V\)の基底の元の個数は有限個としましょう.

Theorem \(V\)を複素ベクトル空間とし,\(n\)個のベクトルが\(V\)を生成するとき,\(V\)内で線形独立な元の個数は\(n\)以下である.

proof

\(n\)に関する帰納法によって示します.\(n=0\)のときは自明なので,\(n-1\)まで成立すると仮定しましょう.

すなわち,\(n-1\)個で生成されるベクトル空間\(V'\)で線形独立な元は\(n-1\)個以下であると仮定します.

今\(n\)のとき,\(V\)を生成するベクトルを\(\{x_i\}_{i=1}^n\)とし,\(\langle x_1,\cdots x_{n-1}\rangle=W\)としましょう.さて,\(n+1\)個のベクトル\(y_1,\cdots ,y_{n+1}\)が一次独立でないことを示しましょう.

とりあえず,\(x_1,\cdots x_n\)の一次結合で各\(y_j\)は表せるわけですが,これは結局ある\(y'_j\in W,\ \alpha_j\in \mathbb{C}\)があって,\[y_j=y'_j+\alpha_j x_n\]とかけることになります.

ここで帰納法の仮定により,\(y'_1,\cdots y'_{n+1}\)はすべて\(W\)の元なので,一次独立でないということになります.

もし,任意の\(j\)に対して,\(\alpha_j=0\)ならば主張が成り立つので,ある\(j\)があって,\(\alpha_j\neq0\)としましょう.

このとき,\[x_n=\alpha^{-1}_jy_j-\alpha^{-1}_jy'_j\]であり,\(i=1,\cdots n+1,\ i\neq j\)であるとすると,\[y_i-\alpha_i\alpha^{-1}_jy_j=y'_i\alpha_i\alpha^{-1}_jy'_j\]となります.

ということはまた右辺の方を\(w_i\)とでもおくと,\(W\)の元で\(n\)個ありますから一次独立でないです.

よって,これは\(y_1,\cdots y_{n+1}\)が一次独立でないことになります.(\(\{w_i\}\)が一次独立でない式を考え,式変形をするとわかります.)

故に,定理が成り立ちます. \(\Box\)

これの系として,次のことが成り立ちます.

corollary \(V\)を複素ベクトル空間とし,\(\{x_i\}_{i=1}^n,\ \{y_j\}_{j=1}^{m}\)を\(V\)の基底とするとき,\(n=m\)である.

proof

証明は簡単で,上の定理より,お互いに一次独立でかつ\(V\)を生成するので,\(n\leq m\)かつ\(m\leq n\)です.\(\Box\)

かくして,次元の定義が正当化されることになり,うまいこと次元が定義できました.次元というのも中々数学的に定義しようとすると手間ですねぇ

今回は線形代数の代数っぽいところについて書いてみました.以上で終わります.

ひとくち数学:表現行列の話

表現行列

 

Definition\(V,\ W\)を有限次元複素ベクトル空間とし,\(T\colon V\to W\)を線形写像,\(\{v_1,\ \cdots v_n\},\ \{w_1,\ \cdots w_m\}\)を\(V,\ W\)の基底とする.このとき,\(n\times m\)行列\(A\)で\[(T(v_1)\ T(v_2)\cdots T(v_n))=(w_1\ \cdots w_m)A\]を満たす行列を基底\(\{v_1,\ \cdots v_n\}\)と\( \{w_1,\ \cdots w_m\}\)に関する\(T\)の表現行列という.

唐突に定義から始まりましたが今日は線形代数の話です.

線形代数の問題で,「基底~及び基底~についての\(T\)の表現行列を求めよ」的な問題をやった覚えがあります.

しかし,当時あまり真面目でなかった私にとって表現行列って結局何のかわからず,解法だけ覚えてよくわかっていなかったという一番良くないことをしてました.

定義がかなり形式的に書かれているので,頭の悪い私にとっては当時理解できなかった記憶があります.

まぁ、私の頭悪い自慢はいいのですが,最近久しぶりに線形代数の教科書をみたときにこのような問題があったので,昔よりほんの少しだけ賢くなった私が表現行列のお話をしたいと思います.

さて,結論から言ってしまうと線形写像\(T\)が\(V\)から\(W\)への最短ルートなら,表現行列というのはある意味遠回りをして\(V\)から\(W\)に行くような第2のルートをつなぐ橋です.

まず,任意に\(v\in V\)をとります.このとき,\(V\)の基底があるので,ある複素数\(a_1\cdots a_n\)が一意的に存在して,\[v=\sum_{i=1}^na_iv_i\]とかけます.

同様に,\(T(v)\)も\(W\)の基底を用いて,\[T(v)=\sum_{j=1}^mb_jw_j\]と表すことができます.

さて,\(v\)が数ベクトルならかなり話は早いですが,一般にはそうではありませんので,このままでは話が進みません.

なので,数ベクトルじゃないのならしてしまえばいいということになるので,つぎのような写像を考えます:

\[\forall v\in V,\ \phi(v)={}^t\!(a_1,\cdots a_n)\]と定義します.(\(t\)転置行列を表します.ようは縦ベクトルってことですね)

このベクトルに対する係数は一意なのでこの定義はwell-definedになります.

さて,このように定義すると実は同型写像になります.つまり,\(\mathbb{C}^n\)の話に落とし込むことに成功したわけです.

やはり同様にして,\[\forall w\in W,\ \psi(w)={}^t\!(b_1,\cdots b_m)\]と定義すると同型写像になります.

ここまでくれば話は簡単で,\(a_1\)から\(a_n\)と\(b_1\)から\(b_m\)の間になんか関係があればいいなぁという感じです.

さて,実はまだ\(T\)で写してないベクトルがあります.それは\(V\)の基底です.こいつらを今度は写したいと思います.

そうすると,各\(T(v_i)\)はやはり,\(W\)の元ですから,\[T(v_i)=\sum_{j=1}^mc^i_jw_j\]と表すことができます.

さらに,\(T\)は線形写像なので,上のように表されている\(v\)は\[T(v)=T(\sum^n_{i=1}a_iv_i)=\sum^n_{i=1}a_if(v_i)\]となるので,さっきのと合わせれば

\[T(v)=\sum_{i=1}^na_i\Bigl(\sum_{j=1}^mc_j^iw_j\Bigr)=\sum_{j=1}^m\Bigl(\sum_{i=1}^na_ic_j^i\Bigr)w_j\]

と表すことができます.さて,ここで思い出して欲しいのは,係数は一意だったことです.これにより,

\[\left( \begin{array}{ccc} b_1 \\ \vdots \\ b_m \end{array} \right)=\left( \begin{array}{ccc} \sum_{i=1}^na_ic^i_1\\ \vdots\\ \sum_{i=1}^na_ic^i_m \end{array} \right)\]

となるので,これは行列の計算の定義から,

\[\left( \begin{array}{ccc} c^1_1\cdots c^n_1 \\ \vdots\\ c^1_m\cdots c^n_m \end{array} \right)\left( \begin{array}{ccc} a_1\\ \vdots\\ a_n \end{array} \right)=\left( \begin{array}{ccc} b_1 \\ \vdots \\ b_m \end{array} \right)\]

ということで、実はここで現れる行列を\(A\)と表すとしたようなルートの途中にあります.

\[\begin{CD} V @>T>> W \\ @VV{\mathop\phi}V @AAA{\mathop\psi}^{-1} \\ \mathbb{C}^n @>A>> \mathbb{C}^m \end{CD}\]

つまり上の図のように遠回りに\(W\)に写す際の橋になるのがこの行列だったわけですね.

従って,\(T\)は間接的に行列で表されることになります.さてこのように作った行列は上の表現行列の定義を満たします.

ちなみにですが,表現行列だったら上の図の話が成り立つので,結局このようにとったものが表現行列というわけですね.

つまり表現行列はこの橋の役割をしていたわけで、しかも\(\phi,\ \psi\)は同型だったので,結局のところ線形写像を調べるにはこの表現行列を調べる方が手っ取り早いというわけです.

ということで,今回は懐かしの線形代数の話でした.正直間違いがないか心配です.それではまた.