解析力学 運動方程式の一般化

出典: フリー教科書『ウィキブックス(Wikibooks)』
ナビゲーションに移動 検索に移動
メインページ > 自然科学 > 物理学 > 解析力学 > 解析力学 運動方程式の一般化

変分法[編集]

等周問題[編集]

たとえば、ある滑らかな閉曲線があったとして、一定の周長で、その図形の閉曲線で囲まれた面積が最大になる図形とは、円である。

数学者ラグランジュなどが、変分(へんぶん)という計算法を用いて証明した。(変分と偏微分は名前が似てるが別の計算法)

(※ 等周問題の説明図を追加してください。)

この問題の解法の計算法を述べると、かりに答えの関数を未知関数 y(x) でおいて、関数形を変えていったときに、面積が最大になるものを選べば良い。「関数形を変える」という事の意味が、とりあえず、その候補の関数の集合 y(x) そのものを変数としてしまうのである。 たとえば、y1(x)、y2(x)、y3(x)、・・・(無限に続く)など、いくつもyの候補を考える。 つまり、 y(x) を変数とする、べつの関数 L(y) を考える。ここで、Lは、けっしてxの変数ではない。なぜなら、L(y)の変数のyは、いくつもある関数y(x)の候補 y1(x)、y2(x)、y3(x)、・・・ のことであり、L(y)での変数に相当する部分はy1(x)、y2(x)、y3(x)、・・・の添え字の番号1、2,3・・・のことであるからだ。

(※ ここに式を記述してください)

Lをyで偏微分するという事は、yの関数形そのものを少しだけ形を変えていったときに(このとき添え字の番号が変わる)、Lがどれだけ変化するかを微分して導出したことに相当する。

さて、関数 y(x) の作る閉曲線内の面積を、未知関数y(x)を変数とした多変数関数 L(y、y´、y´´、・・・) として記述していき(y´は導関数。y´とはy1(x)、y2(x)、y3(x)・・・のこと)、関数Lを偏微分(変数yなどで)して極値を求めるという方法で、「ある閉曲線があったとして、一定の周長で、その図形の閉曲線で囲まれた面積が最大になる図形とは、円である。」が証明される。

yとy´を別の変数と考えるのが分かりづらいかもしれないが、L中のyは候補y1(x)、y2(x)、y3(x)、・・・のことであり、つまりL中のuは、もはやxの変数ではないので、よってyはy´の変数ではないし、同様にy´もyの変数ではない。だからLではyとy´を別の変数として扱わなければならない。

このように、ある条件下で、ある量を最大・最小にする関数を考えることを変分(へんぶん)という。ちなみに、さきほどの一定の周長の条件で最大面積を求める問題のことを等周問題(とうしゅう もんだい)という。

  • 変分法だけでは証明にならない

この変分法の対象になる図形や関数は、(物理的に言うと)滑らかな関数だけである。ギザギザした曲線などのように、関数で表したさいに微分不可能な箇所を含む図形や関数は、変分法の対象にならない。

なので、変分法だけでは証明にならず、変分計算をもとめた後には、「解を適用しても平気か?」どうか、吟味が必要である。

懸垂線[編集]

水平な2点を、その2点間距離を ややこえる長さのロープ(べつに糸でもヒモでもいい)で結んだ場合、当然、ロープは、たれる。 このように、ロープなどを垂らした時にできる曲線のことを懸垂線(けんすいせん)という。

実は、この垂れたロープの形状は、双曲線関数で精度よく記述できる事が知られている。

いっぽう2次関数は、(双曲線関数で近似した場合と比べ、)あまり精度が良くない。

(※ 図を追加してください。)
(※ 計算例を記述してください)

計算例のように、導関数y’で偏微分するという操作が必要になる。

これの意味は 等周問題でも説明したように、要するに、曲線の集団は曲面であると見なして良いので、こういう記法は正当化できる。


最速降下線[編集]

また、力学では、ある2点間を結び、最速で移動できる曲線は、その2点間を結ぶサイクロイド曲線である、ことが証明されている。(最速降下線)

(※ 図を追加してください。)
(※ ここに計算例を記述してください)


ラグランジアンと最小作用の原理[編集]

「変分」という考えを用いて、運動方程式の定義を数式で書く事を、この記事では考える。以下、力学における変分の計算方法を説明していく。


ラグランジアン[編集]

では、変分を用いてニュートン方程式を書き換えることを考える。まず古典力学でのニュートン方程式は

の形で書かれる。

変分をするためにラグランジアンという量を導入する。まだ、ラグランジアンの具体的な形は分からないけど、ある質点などの座標位置をとして、その位置の時間微分(つまり速度)をとすれば。

という形になる事が分かっており、加速度は考えなくて良い事が分かっている。やや天下り的だが、が運動量というの係数倍に相当するからである。運動量は、運動している質点などの保存量である。いっぽう、加速度は、運動している質点の保存量ではないからである。(なお、ラグランジアンLはスカラー量(ベクトルでない数)である。)

最小作用の原理[編集]

ラグランジアンをある時間の範囲で積分したものを、

と書き、作用と呼ぶ。ここで運動方程式を得るための原理として、"運動方程式は、少しだけ を変化させたとしても、作用が変化しないような値を出す の関係によって与えられる。"ということを要求する[注 1]

このとき、 を変化させたときの実際の作用の変化 δS を計算すると(δはデルタと読む)、

常微分関数で偏微分することの数学的正当性が理解しづらいかもしれないが、ひとまず、こう計算してもらいたい。詳細は後述する。 ここで、2行目から3行目では、部分積分によって

とした。右辺で部分積分で出てくる項を消すために、" は積分範囲の両端である t = ti , tf では変化しない"という要請を加えた[注 2]

最小作用の原理によると、このときにδS = 0 でなくてはならない。δq の値に関わらずδS = 0 が成り立つためには、

が成り立つ必要がある。よって、この式が運動方程式となる。

特にq が通常の座標x である時のことを考える。ここで、

とおくと、式(1)は、

となり、通常の自由な粒子の運動方程式に一致する。ここで、

は粒子の運動エネルギーである。

また、保存力の中で、特に物体の速度によらない力を受けて運動している粒子に対しては、その力によって得られる位置エネルギーをV (q ) 、物体の運動エネルギーをT と表すとき、

とすると、式(1)は、

となるが、右辺は保存力に対する力を表わすのでこのときのラグランジアンは

で与えられることが分かる。

また、自由な角運動量に対するラグランジアンは

によって与えられ、これは剛体の角運動量が持つ(慣性モーメントは剛体以外持つことが出来ないことに注意)エネルギーを表わす。


ラグランジアンは、単に、高校物理でも習うような運動方程式の定義を、「変分」という数学的手法にもとづいて、大学風に言い換えただけの作業にすぎない。だから、(ある物体の、具体的な運動軌跡などのような、)運動方程式の解は、ラグランジアンだけでは未定であり、解は不明である。

(大学2年で習うような)常微分方程式を解く時、境界条件を指定する必要がある場合もある。ラグランジアンも、同様である。具体的な運動方程式を、境界条件的に、追加しないと、具体的な解は求まらない。


なお、量子力学において、古典物理でいう「運動方程式」に対応するのは、シュレーディンガー方程式である。いっさい、ラグランジアンではない。そして量子力学では、ラグランジアンを用いずとも、シュレーディンガー方程式だけで、具体的な解を求められる。

人類がさいしょにシュレーディンガー方程式を発見したときには、ラグランジアン的な予想法には意義があったかもそれないが、いったんシュレーディンガー方程式を発見した以上、もはやその解を求めるのに、量子力学のラグランジアン化は不要であるし、ラグランジアン化をしただけでは何も解は求まらない。

ラグランジアンは、物理学において公式を導くための、物理の(ほぼ全ての分野での)共通の指針にすぎない。なので、導かれた公式の解そのものは、ラグランジアンでは求まらない。

古典電磁気学では、古典力学でいう「運動方程式」に対応するのは、ローレンツ力の公式である。(後述する、)荷電粒子の「シュワルツシルトのラグランジアン」は、ローレンツ力の公式を、変分という形で、言い換えただけにすぎない。

古典電磁気学では、物理学史においては「シュワルツシルトのラグランジアン」よりも先にローレンツ力の公式が見つかったので、古典電磁気学の問題を解くだけならラグランジアンは不要であるし、そもそも、ローレンツ力を受ける荷電粒子の具体的な軌跡は、ラグランジアンでは求まらない。しかし超電導などの電磁気関連の現代物理の公式を発見する際に、「シュワルツシルトのラグランジアン」は活用できる。


変分法の幾何学的な根拠[編集]

CTスキャンによる撮影画像(人間の頭部)

よく病院などで「CTスキャン」というのがある。このCTスキャンで、人体の断面映像を見られる。

さて、人体の断面映像を、いくつも、つなぎ合わせることで、もとの立体の形状を想像できる。(医者などは、脳内で、こういう、断面映像つなぎあわせの思考処理を行っているわけだ。)

ここで、幾何学的に重要な事は、断面映像は2次元だが、つなぎあわせた結果の立体は3次元である事だ。

つまり、2次元図形をつなぎあわせる事により、3次元図形を作成する事が、数学的・幾何学的に、可能である。


逆に言うと、3次元図形を断面にスライスする事によって、複数個の2次元図形を創りだすこともできる。


さて、上述のハナシは、2次元と3次元の場合だった。


いっぽう、物理学的に興味あるのは、1次元と2次元である。なぜなら、質点物体の運動の軌跡曲線は、1次元図形である。正確にいうと、通常の質点の軌跡曲線は、1変数関数(たとえば、時間を変数にすればいい)の図形である。「y(t)」などと言った軌跡を、よく力学の教科書で見かけただろう。もちろん「y(x)」のように、時間ではなくx座標を変数とするのも可能である。

さて、軌跡の曲線が、初期条件を変えていく等して、何パターンも軌跡が考えられるとき、それら(何パターンもある軌跡たち)をつなぎあわせて曲面図形にしてしまえば、曲面は2変数関数として記述される図形なので(大学1年の微積で習うように、曲面図形は2変数関数で記述される)、この曲面図形は偏微分などが可能ある。

上述の思考で、我々が何を行ったかというと、曲線の集団を、「曲面である」とみなしたのである。


逆の思考法として、曲面をスライスする場合を考えれば、わかりやすいだろう。大学1年の微積の教科書に書いてあるような、通常の曲面図形(2変数関数の図形)を管あげよう。

普通の滑らかな曲面なら、もし曲面を無限に薄くスライスすれば、無限個の少しずつ形の変わる曲線の集合に近似できる。

つまり2変数関数は、無限個の少しづつ形の変わる1変数関数の集合に変換できる。

これの逆演算を行うと、少しずつ形を変えていった無限個の1変数関数は、2変数関数として扱える、という原理になる。

(※ 困ったことに、大学数学の教科書には、こういう変分法の幾何的な証明が書いていない。数学の教科書では、計算方法を集合論で記述しているだけである。数学者が理解していない。当然、物理学者も、理解していない。)

これらの証明は、物理法則でなく、数学的事実である。幾何学的な図形の性質の事実である。以上の説明には、物理的な「エネルギー」やら「運動量」などの概念は、まったく用いてない。

  • 曲線の集団は曲面と見なせる

たとえば、曲線族(曲線の集まりのことを曲線族という)

y(x) = Cx (Cは任意定数) ・・・①

のような1変数の1次関数の あつまり を考える。 ①式を説明すると、たとえば任意定数とは、定数関数なら、C=1でもC=2でも、C=125.35でも何でもいいので、①式は

{ y = 0x 、 y=1x , y=1.3x , y=-42x ,・・・ }

のような、1変数の1次関数の集まりと考えることができる。1変数の1次関数は、常微分が可能なので、さっそく微分すると

dy/dx = C = y´(x) 

である。Cが任意の値を取れるので、y´もCと同じ値であれば、任意の定数となる。

C = y´ より、
y = Cx = y´x 

である。 いっぽう、y = Cx はyの値が、Cの値とxの値によって決まるので、yはCとxを変数とする2変数関数 y(x、C) とも考えられる。二変数関数はグラフにあらわすと曲面になるので、つまり、

「曲線の集合は曲面を表せる」

と考えられる。 あるいは

「1変数関数の集合は、2変数関数として表現できる」

と考えられる。y(x、C)は

y = Cx = y´x  より、 y(x、y´)という2変数関数である。Cの値が、xとは独立に任意に取れて、Cを独立変数と見なしたのだから、C = y´ より、
y´(x)もxとは独立な変数と見なさなければならない。つまり、「関数の集合では、xと、xを変数とする導関数y(x)とは、お互いに独立である。」ということになる。または
y = y´x ⇔  y´= x/y 

より、y´(x、y)という2変数関数を考えることもできる。 このように、曲線の集合を扱う計算では、1本の曲線を扱う計算とは違った現象が起こる。曲線の集合は曲面とみなせるので、偏微分も定義できる。

たとえば、y = y´x をy´で偏微分すると、xとなる。 以上の議論は、1次関数の集合に限らず、2次関数の集合 y=c・x^2 、 3次関数の集合でも同類の議論ができて、1変数の関数の集合を2変数関数とみなすこともできる。 また、任意定数が2つ以上の場合も、同様の議論によって、1変数関数の集合を、多変数関数とみなせる。

結局、曲線の集団は曲面と見なせる。

そして、1変数関数y(x)の集合を変数とする関数L(y)は、上述の理由により、多変数関数L(y、y´、y´´、・・・)となる。


「曲線の集団を、数学的には、仮想的な曲面と見なせる」ので、偏微分して良い、・・・と考えれば、

水流などの流体分子運動のように、いくつもの粒子が運動している状態を、仮想的な曲面とみなせば、偏微分できるようになる。

これが、流体力学の発想法のひとつである。

流体力学にある流れ場が偏微分できるのは、上述のような定理が裏にある。

逆に言うと、流体力学の「流れ場」の手法そのものも、理論物理ではラグランジアンに変換できるらしい。解析力学の理論には、流体のラグランジアンの公式もあるらしい。

しかし、機械工学や土木工学などで扱うような古典的流体の具体的な解を求めるだけなら流体ラグランジアン(仮名)は不要であろうし、そもそも解が求まらないだろう。流体の解が求まる場合の具体的な解は、古典物理の流体力学の教科書に書いてある計算例である。

相対性理論や素粒子論などを研究する場合なら、相対論的流体力学のラグランジアン化などの手法が、役立つのかもしれない。

一般化座標[編集]

ところで、角運動量に関する方程式は

と書かれる(I は慣性モーメント、 は角速度、 は物体に働く力のモーメント)。

角運動量の式は、ニュートン方程式に似ている。

ニュートン方程式

と良く似た形である。


ラグランジアンは、このような運動法則を統一的に記述できる。

統一的に記述できると、ある場合には都合が良い。このような座標の記述方法の統一化の目的で、よくラグランジアンや後述のハミルトニアンが利用される事もある。


※ 何が言いたいかというと、制御工学やロボット工学などの教科書によく書いてある、ラグランジアンの公式は、既存のアルゴリズムをプログラミングされたロボットに対して、「そのロボットの今後の運動軌跡を求めたい」という目的では無意味な作業である、・・・と主張しているわけだ。未知の運動軌跡アルゴリズムそのものの探求・探索にしか、ラグランジアンは活用できない。

ラグランジアンは、さまざまな運動法則の記述方法の統一化意外に、意味はない。


運動量、ハミルトニアンの定義[編集]

ラグランジアンを用いるとき、運動量p

と定義される。実際、自由な粒子に対しては、

が得られ、正しいことが分かる。速度に依存した力を考える場合、p は必ずしも一般的な運動量と一致しない。

このとき、ここで定義した運動量を一般化された運動量と呼んで通常の運動量と区別する。

次に、エネルギーの記述を一般化することを考えよう。これから説明するハミルトニアン H が、エネルギーを一般化したものに相当する。

L を変数として用いる量である。しかし、それよりもq , p を変数として用いた方が便利なことがある。このような量を の間のルジャンドル変換によって作ることが出来る。これをハミルトニアンH と呼び、

で定義する。特にを満たす場合、

が得られ、H は系の全エネルギーと一致する。この結果はエネルギー保存則の導出に用いられる。

  • (電磁気のローレンツ力の場合の例)

高校で習った磁場中の荷電粒子に働くローレンツ力の計算式は、磁場が均一の場合であった。磁場が不均一でもローレンツ力は定義できる。(ただし、電磁放射が起きるが、放射を無視して記述する。)そして、このような不均一磁場の場合も考えると、磁場のベクトルポテンシャルAを用いて、qAがローレンツ力による運動量に相当する。

結局、もとの質点の運動量mvとあわせて、合計 mv+qA が、荷電粒子の運動量 p である。つまり p=mv+qA である。原子物理などで磁場と物質波の関係などを計算するときも、この mv+qA の式を利用でき、そして電子の電荷は -e だから、 p=mv-eA とすればよい。

ローレンツ力の方程式などの変分を行いたければ、これらの結果を利用すればよい。 結果は、「シュバルツシルトの(荷電粒子の場合の)ラグランジアン」として知られている。(なお、名前が似ているが、相対論のシュワルツシルド解のラグランジアンとは別物である。)

正準方程式[編集]

ハミルトニアンにおいて

が成り立つ。これを正準方程式という。

ポアッソン括弧[編集]

脚注[編集]

  1. ^ この原理は量子力学の経路積分によって正当化される。
  2. ^ この要請を外すと別の値が出て来て、ある場合には便利になるようである。