古典力学 (classical mechanics) とは、量子力学 と対をなす用語で、量子論から見て古典的 (classical) な、非量子論的な力学一般を指す言葉です。古典力学に含まれる理論は、大きく分けてニュートン力学 (Newtonian mechanics) と相対性理論 (relativity theory) の 2 つがあります。ニュートン力学は、この理論を創始した自然哲学者のアイザック・ニュートン に因むもので、相対論と区別して、非相対論的 (non-relativistic) な力学 (mechanics) と呼ばれることがあります。
相対論は特殊相対論 (special relativity theory) と一般相対論 (general relativity theory) の 2 つに分けられます。特殊相対論と一般相対論の大きな違いは、特殊相対論では重力 (gravitation) が扱われないことにあります。
ニュートン力学と相対論の違いは、一つは時間 に対する取り扱いにあります。ニュートン力学では、私達が日常的にそうしているように、時間は普遍的なものとして扱われ、誰にとっても時間の進み方は同じであることを仮定しています。相対論では、誰にとっても時間は同じではなく、それぞれが固有の時間を刻むことが結論されます。
逆に、2 つの理論に共通する事柄として、因果律 (causality) の成立があります。因果律とは、原因となる事象 (event) が結果として生じる事象より先に必ず現れること、あるいは未来の出来事が現在の出来事に影響を及ぼさないことを言います。この「未来」や「現在」の取り扱いはニュートン力学と相対論で大きく異なりますが、いずれの理論においても因果律が生じるのです。
因果律の成立は、離れた場所を結ぶ情報伝達や力の影響の仕方について大きな制約を与えます。ニュートン力学においては時間がすべての物にとって共通していたため、因果律はまだ大きな役割を演じることはありませんが、相対論においては、情報が伝播する最大速度に対する制限として現れることになります。この最大速度は、電気 や磁気 に関する研究(電磁気学 )から、何もない空間を光が進む速さに一致することが知られています。
この光速 を中心に据えてニュートン力学について述べるなら、光速が無限に大きいと見なせるような世界の力学がニュートン力学であると言うことができるでしょう。
さて、はじめに述べた通り、古典力学は相対論とニュートン力学の総称と言ってよいものですが、相対論とニュートン力学では、そこで取り扱われる原理やそれを支える物理学的な思想に大きな隔たりがあり、単に技術的な部分にのみ注目しても、相対論で扱われる問題とニュートン力学で扱われる問題とでは要求される知識が質的に異なっています。したがって、多くの書籍や講義などと同じように、本書においてはニュートン力学だけを紹介することとします。
この章ではニュートン力学の大まかな紹介と、ニュートン力学を学ぶための予備知識として多少の数学と物体の運動に関する概念の導入を行います。
また、この分野は高等教育の力学 に当たります。初学者は該当教科書が理解の助けとなりますので学習に行き詰まったら参照してください。
ニュートンは、りんごが木から落ちるのを見て万有引力 (universal gravitation) を発見したという有名な逸話があります。この逸話は後世の創作であると見なされていますが、ともあれ、地上でりんごに及ぼされる重力 と、天上にある太陽 と惑星 の間に働く引力とが同じ万有引力の法則によって記述されるという不思議さを鮮やかに示したものだと言えるでしょう。ニュートン力学の強力さは、扱う事象や概念が私達にとって非常に馴染み深いものであるにもかかわらず、ときに日常の感覚を超えて様々な現象を説明する普遍性にあります。実際、私達の日常にある地上での現象のみならず、月 などの天体 の運動のような非常にスケールの大きなものに至るまで、ニュートン力学の知識によって説明を与えることができます。私達の身のまわりで起こる現象のほとんどは、巨視的 (macroscopic) な現象ですが、生物を構成するタンパク質 のような微視的 (microscopic) な対象についても、ニュートン力学からその機能を理解することができ、理論の適用範囲は非常に広範です。ニュートン力学の及ばない現象については、相対性理論 や量子力学 のような理論が必要となるのですが、これらについては別の機会に述べることとしましょう。
力学は、物体の運動を支配するメカニズムに関する理論です。ニュートン力学においては、物体の運動は力 (force) と呼ばれる量を中心として説明されます。この力は、物の重さや物に触れたときに感じる手応えのような、私達の日常の感覚を反映したものです。その意味でニュートン力学は、力と物体の運動という日常に存在する現象の関係性についてを述べる理論だと言うことができます。
有名なニュートンの運動方程式 (Newton's equation of motion) は、
m
a
=
F
{\displaystyle m{\boldsymbol {a}}={\boldsymbol {F}}}
と書くことができます。これは、慣性系 (inertial frame of reference) において質量
m
{\displaystyle m}
が一定の物体に働く合力
F
{\displaystyle {\boldsymbol {F}}}
が物体に加わる加速度
a
{\displaystyle {\boldsymbol {a}}}
と質量
m
{\displaystyle m}
の積に等しい、ということを表していて、物体に働く力はその物体に加わる加速度の原因となることを示しています。慣性系 という用語が出ましたが、一先ずは上に挙げた方程式が成り立つような場所と理解しておきましょう。
また上記の関係は、質量
m
{\displaystyle m}
が大きい物体ほど同じ加速度を得るには大きな力が必要であることを示しています。では質量の大きな物体とはどのようなものでしょうか。その答えは物体に働く重力の法則によって示されます。ガリレオ・ガリレイ の逸話でも有名なように、物体が落下する際の運動の仕方は物体の重さによらず同じであることが知られています。この落体の法則 によって、様々な物体に加わる重力加速度はすべて等しいことが導かれ、しかし物体に加わる力の大きさは物体の重さそのものを示しているため、結局物体の質量と物体の重さは比例することが示されます。つまり、重い物体ほど質量が大きいのです。
先に述べた通り、ニュートン力学では物体の加速度と物体に働く力の関係を中心に物体の運動を調べるのですが、物体の加速度は物体の速度の時間に対する変化の割合であり、物体の速度 の時間微分 によって表すことができます。したがってニュートンの運動方程式は以下のように書き換えられます。
m
d
v
d
t
=
F
.
{\displaystyle m{\frac {d{\boldsymbol {v}}}{dt}}={\boldsymbol {F}}.}
また物体の速度は物体の位置の時間に対する変化の割合であり、物体の位置の時間微分によって表すことができます。加速度を速度を用いて表したのと同様にして、ニュートンの運動方程式は物体の位置を用いて以下のように書き換えられます。
m
d
2
x
d
t
2
=
F
.
{\displaystyle m{\frac {d^{2}{\boldsymbol {x}}}{dt^{2}}}={\boldsymbol {F}}.}
ここで
v
{\displaystyle {\boldsymbol {v}}}
は物体の速度、
x
{\displaystyle {\boldsymbol {x}}}
は物体の位置を表します。この書き換えによって、ニュートンの運動方程式は物体の速度や位置を解とする微分方程式 として表され、微分方程式に関する様々なテクニックを利用できるようになります。
この節は書きかけです。この節を編集してくれる方 を心からお待ちしています。
力学において、運動を記述する対象は物体 (body) と呼ばれます[ 1] 。物体には必要に応じて様々な性質が与えられ、たとえば形状や物体を構成する物質 、あるいは分子モーター のような動力などが、物体の運動を特徴づけ、あるいは運動そのものを決定する要素として考察されます。
物体の中でも、動力を持たず形状が無視できるものを粒子 (particle) と呼びます。形状が無視できるということは、たとえば物体の自転が注目している運動の性質に寄与しないことなどから判断されます(このような判断は必ずしも古典力学の立場から保証されるようなものではなく、多くの場合にはむしろ粒子の運動として記述できないような性質が実験などを通じて明らかになることによって、モデル に不足している要素を捉えられるようになります)。粒子は特徴的な大きさを持たず、点 状のものとして扱われます。注意すべきこととして、粒子が点として扱われることは、原理的に粒子の大きさが決定できない場合を除き、単純に興味のある運動のスケールに比べて粒子の大きさが非常に小さい場合や、大きさを決定するための情報が不足していることに起因していて、実際に物体が点状であるかどうかを議論の対象としているわけではありません(もちろん、扱うモデルから逸脱しないのであれば、そのモデルの中では「実際に」物体は点状であると言えます)。
物体の運動を記述する最も基本的な要素は、物体の位置 (position) と速度 (velocity) です。位置はしばしば座標 (coordinate) とも呼ばれます。物体の位置は空間上の一点によって表され、具体的には適当な座標系 (coordinate system) を用いて表されます。最もよく知られる座標系としてデカルト座標系 [ 2] (Cartesian coordinate system) があります(図1)。
図1: 2次元のデカルト座標系。縦軸は変数
y
{\displaystyle y}
、横軸は変数
x
{\displaystyle x}
の値に対応する。縦軸と横軸の交わる点(紫色の点:• )
(
x
,
y
)
=
(
0
,
0
)
{\displaystyle (x,y)=(0,0)}
は原点 (origin) と呼ばれる。縦軸と横軸の向きは特に決まっていないが、横軸は右が正であることが多い。この図では縦軸は正の方向を上にとっているが、画像や画面のスキャン順序に対応させる場合など、縦軸を下向きにして表すことも多い。物理学においては、座標系の取り方は自由に変えてよく、座標系に依存する数量などは意味を持たないので、その時々に便利なものが扱われる。
デカルト座標系では物体の位置を、互いに直交し原点を共有するいくつかの座標軸上の数の組として表します。たとえば、平面上の物体であれば、横方向と縦方向の座標軸について「原点から右に 2 メートル、上に 3 メートル進んだ場所」といったように物体の位置を表すことができます。通常はより簡便な記法として、(2 [m], 3 [m]) のように表します。
物体の位置は原点から測った距離によって表現されるため、長さの次元 (dimension) を持ち、具体的な数量は長さの単位 と数値の積で表されることになります。このことは座標系によらず言えることです。
速度は物体の位置の時間変化率として定義されます。たとえば 2 秒の間に 4 メートルだけ物体が動いた場合、1 秒当たり 2 メートルだけ移動したことになるので、その間の物体の平均速度 (average velocity) は 2 メートル毎秒となります。これが平均の速度であることは、たとえば最初の 1 秒間に 4 メートルだけ進んで残りの 1 秒間は止まっているような場合でも速度が同じになることから理解できるでしょう。平均速度は、指定された時間に一定の速度で物体が動くと仮定した場合の速度を表しています。速度も位置と同じように、デカルト座標系を用いて、それぞれの座標軸に対する物体の位置の時間変化率の組として表現することができます。たとえば先に挙げた平面上の座標系を用いれば、(−3 [m/s], 1 [m/s]) は「毎秒左に 3 メートル、上に 1 メートルの速さ」を表していることになります。
物体の位置から物体の速度を求めるには 2 つの異なる時刻における物体の位置を比較して、その時間経過の間にどれだけ位置が異なっているかを求める必要があります。最も単純な場合として直線運動をする物体の速度を例にとりましょう。物体が直線的な運動をしている場合には、物体の位置を表す量は、物体の軌道上にある原点から測った物体までの距離となります。原点の取り方は自由ですが、物体の運動を記述し始めた最初の時刻における物体の位置を原点として与えることにします。言い換えれば、物体ははじめにある座標系の原点を出発点として運動をしているということです。
ある時刻における物体の位置とその時刻の関係は位置と時刻の組が描く曲線として表され、特に物体の運動が直線上に限定される場合には位置と時刻がなす平面上の曲線として描くことができます。物体の速度は、位置と時間の曲線の異なる 2 点を結ぶ直線 の傾き として求めることができます。時刻を
t
{\displaystyle t}
で表し、時刻
t
{\displaystyle t}
における物体の位置を
x
(
t
)
{\displaystyle x(t)}
と表せば、時刻
t
1
{\displaystyle t_{1}}
から
t
2
{\displaystyle t_{2}}
の間の物体の速度は次のように表されます[ 3] 。
v
(
t
1
;
t
2
)
=
x
(
t
2
)
−
x
(
t
1
)
t
2
−
t
1
(
t
1
<
t
2
)
.
{\displaystyle v(t_{1};t_{2})={\frac {x(t_{2})-x(t_{1})}{t_{2}-t_{1}}}\quad (t_{1}<t_{2}).}
これが
(
t
,
x
)
=
(
t
1
,
x
(
t
1
)
)
{\displaystyle (t,x)=(t_{1},x(t_{1}))}
という点と
(
t
,
x
)
=
(
t
2
,
x
(
t
2
)
)
{\displaystyle (t,x)=(t_{2},x(t_{2}))}
という点を結ぶ直線の傾きになっていることは 2 点を通る直線の方程式を求めることで分かります。
(
t
,
x
)
{\displaystyle (t,x)}
平面上の直線は傾き
a
{\displaystyle a}
と切片
b
{\displaystyle b}
によって特徴づけられ、一般に
x
=
a
t
+
b
{\displaystyle x=at+b}
と表されます。この直線が
(
t
,
x
)
=
(
t
1
,
x
(
t
1
)
)
{\displaystyle (t,x)=(t_{1},x(t_{1}))}
および
(
t
,
x
)
=
(
t
2
,
x
(
t
2
)
)
{\displaystyle (t,x)=(t_{2},x(t_{2}))}
を通るためには、
x
(
t
1
)
=
a
t
1
+
b
{\displaystyle x(t_{1})=at_{1}+b}
および
x
(
t
2
)
=
a
t
2
+
b
{\displaystyle x(t_{2})=at_{2}+b}
を満たす必要があります。2 つの方程式から、切片
b
{\displaystyle b}
を求めれば、
b
=
x
(
t
1
)
−
a
t
1
{\displaystyle b=x(t_{1})-at_{1}}
および
b
=
x
(
t
2
)
−
a
t
2
{\displaystyle b=x(t_{2})-at_{2}}
という関係が得られます。ここで求められた 2 つの切片は一致していなければならないので、
x
(
t
1
)
−
a
t
1
=
x
(
t
2
)
−
a
t
2
(
=
b
)
{\displaystyle x(t_{1})-at_{1}=x(t_{2})-at_{2}\left(=b\right)}
となる必要があります。最後に、直線の傾き
a
{\displaystyle a}
を求めれば、
a
=
x
(
t
2
)
−
x
(
t
1
)
t
2
−
t
1
{\displaystyle a={\frac {x(t_{2})-x(t_{1})}{t_{2}-t_{1}}}}
であることが分かります。これは先に示した物体の速度
v
(
t
1
;
t
2
)
{\displaystyle v(t_{1};t_{2})}
そのものです。
ここまでで紹介した平均の速度
v
(
t
1
;
t
2
)
=
x
(
t
2
)
−
x
(
t
1
)
t
2
−
t
1
{\displaystyle v(t_{1};t_{2})={\frac {x(t_{2})-x(t_{1})}{t_{2}-t_{1}}}}
は
t
1
{\displaystyle t_{1}}
および
t
2
{\displaystyle t_{2}}
の 2 つ時刻の選び方に依存します。しかしながら、物体の運動に関して「物体が速度を持つ」という場合、速度は 1 つの時刻に対して一意に定まるようなものでなければなりません。まず、物体の平均速度が時刻によらないような例を考えると、
v
(
t
1
;
t
2
)
=
v
{\displaystyle v(t_{1};t_{2})=v}
として、
v
=
x
(
t
2
)
−
x
(
t
1
)
t
2
−
t
1
{\displaystyle v={\frac {x(t_{2})-x(t_{1})}{t_{2}-t_{1}}}}
は
t
1
{\displaystyle t_{1}}
および
t
2
{\displaystyle t_{2}}
に関する項に分離することができ、
x
(
t
1
)
−
v
t
1
=
x
(
t
2
)
−
v
t
2
{\displaystyle x(t_{1})-vt_{1}=x(t_{2})-vt_{2}}
x
(
t
)
−
v
t
{\displaystyle x(t)-vt}
は時刻
t
{\displaystyle t}
によらず一定であることが言えます。この関係を満たすような
x
(
t
)
{\displaystyle x(t)}
は、
x
(
t
)
=
v
t
+
x
(
0
)
{\displaystyle x(t)=vt+x(0)}
であり、これは
(
t
,
x
)
=
(
t
,
x
(
t
)
)
{\displaystyle (t,x)=(t,x(t))}
が傾き
v
{\displaystyle v}
、切片
x
(
0
)
{\displaystyle x(0)}
の直線をなすことを意味しています。この場合には物体の速度はどのような時間でも
v
{\displaystyle v}
となり、この速度は物体が持っているものだと考えることができるでしょう。つまり任意の時刻
t
{\displaystyle t}
における瞬間の速度 (instantaneous velocity) は
v
(
t
)
=
v
{\displaystyle v(t)=v}
と表すことができます[ 4] 。
一般の運動についても、ある時刻と時刻の間で曲線
(
t
,
x
(
t
)
)
{\displaystyle (t,x(t))}
が直線と見なせる場合には同様にして瞬間の速度を見出すことができます。物体の位置
x
(
t
)
{\displaystyle x(t)}
が滑らかに変化し、どの時刻についても曲線
(
t
,
x
(
t
)
)
{\displaystyle (t,x(t))}
の接線 が一つだけに定まるとき、時刻
t
{\displaystyle t}
における物体の速度
v
(
t
)
{\displaystyle v(t)}
は時刻
t
{\displaystyle t}
で曲線
(
t
,
x
(
t
)
)
{\displaystyle (t,x(t))}
に接する接線の傾きとして定義されます。この接線の傾きは、充分短い時間における平均の速度によって与えられます。時刻
t
{\displaystyle t}
から
t
+
h
{\displaystyle t+h}
までの平均速度について、時間間隔
h
{\displaystyle h}
が 0 の近傍にある場合、時刻
t
{\displaystyle t}
における瞬間の速度
v
(
t
)
{\displaystyle v(t)}
は
v
(
t
)
=
lim
h
→
0
x
(
t
+
h
)
−
x
(
t
)
(
t
+
h
)
−
t
{\displaystyle v(t)=\lim _{h\to 0}{\frac {x(t+h)-x(t)}{(t+h)-t}}}
と定まります[ 5] 。これは
t
{\displaystyle t}
の近傍の時刻
t
+
h
{\displaystyle t+h}
における物体の位置
x
(
t
+
h
)
{\displaystyle x(t+h)}
が
x
(
t
+
h
)
≈
x
(
t
)
+
v
(
t
)
h
{\displaystyle x(t+h)\approx x(t)+v(t)h}
という形に漸近し、
x
(
t
+
h
)
{\displaystyle x(t+h)}
と
x
(
t
)
+
v
(
t
)
h
{\displaystyle x(t)+v(t)h}
の差分が
h
{\displaystyle h}
より大きな次数の項となること表します。
h
{\displaystyle h}
の 2 次以上の項は、
h
{\displaystyle h}
の 1 次の項より素早く小さくなるので、
x
(
t
+
h
)
{\displaystyle x(t+h)}
に関して
h
{\displaystyle h}
の影響は 1 次の項で押さえられます。
瞬間の速度を定義する際に使った極限操作 を、位置
x
(
t
)
{\displaystyle x(t)}
の時刻
t
{\displaystyle t}
に関する微分 (derivative of position
x
(
t
)
{\displaystyle x(t)}
with respect to time
t
{\displaystyle t}
)、あるいは省略して位置
x
(
t
)
{\displaystyle x(t)}
の時間微分 (time derivative) といいます。微分を表す記法にはいくつかあり、
ライプニッツの記法 :
v
(
t
)
=
d
x
(
t
)
d
t
,
{\displaystyle v(t)={\frac {dx(t)}{dt}},}
ニュートンの記法 :
v
(
t
)
=
x
˙
(
t
)
,
{\displaystyle v(t)={\dot {x}}(t),}
ラグランジュの記法 :
v
(
t
)
=
x
′
(
t
)
,
{\displaystyle v(t)=x'(t),}
などがあります。たとえばライプニッツ記法では微分の定義は以下のように表現されます。
d
x
(
t
)
d
t
:=
lim
h
→
0
x
(
t
+
h
)
−
x
(
t
)
(
t
+
h
)
−
t
.
{\displaystyle {\frac {dx(t)}{dt}}{:=}\lim _{h\to 0}{\frac {x(t+h)-x(t)}{(t+h)-t}}.}
記号の読み方について、ライプニッツ記法
d
x
d
t
{\displaystyle {\frac {dx}{dt}}}
は "dx by dt", あるいは "dx dt" と読みます。ニュートン記法
x
˙
{\displaystyle {\dot {x}}}
は "x dot" と読み、ラグランジュ記法
x
′
{\displaystyle x'}
は "x prime" と読みます。
一般的にはライプニッツの記法が好まれますが、記述が煩雑になる場合にはニュートンやラグランジュの記法が用いられ、特に時間微分に対してはニュートンの記法が慣習的に使われています。多くの場合、変数がある条件を満たすような領域について特に興味があり、微分によって得られた新しい関数[ 6] が特定の領域で示す値を知りたいことがあります。ライプニッツの記法では、微分する変数とそれに対応する関数の変数が同じ記号で示される必要があるので、たとえば
d
x
(
0
)
d
t
=
?
{\displaystyle {\frac {dx(0)}{dt}}=~?}
のような書き方をすると
x
(
0
)
{\displaystyle x(0)}
の微分を示しているのか
d
x
(
t
)
d
t
{\displaystyle {\frac {dx(t)}{dt}}}
の
t
=
0
{\displaystyle t=0}
における値を示しているのか分からなくなることがあります。大抵の場合は後者の意味でとればよく、実際にそのような書き方は一般的に行われているのですが、紛らわしく思える箇所については、
d
x
(
t
)
d
t
|
t
=
0
=
v
(
0
)
{\displaystyle \left.{\frac {dx(t)}{dt}}\right|_{t=0}=v(0)}
と関数に傍線をつけ、傍線に関数の引数が満たす条件を添えることがあります。
【例題】
具体的な物体の位置について、その瞬間の速度を求めよ。
例題で紹介したような物体の軌跡が具体的に分かっている場合については、その物体の瞬間の速度を物体の位置の時間微分によって求めることができます。しかしながら、ナイーブに考えると、あらゆる時刻における物体の位置を完全に知ることは原理的に不可能であり、微分を用いた速度の定義は、単なる数学上の高級品かあるいは絵に描いた餅のように思えます。このことは極端に捉えれば全く正しいのですが、物理学に限らず数理科学一般における基本的な立場とは完全に反します。物体の位置のような対象がある関数や方程式として表されることは、その対象について完全な理解を得られたことによるものではなく、いくつかの仮定に基いて推定したことによるものです。置かれた仮定の正しさは既知の現象をよい精度で再現し、未知の現象を精密に予測し得ることによって保証されます。悪く言えばその場凌ぎと言えますが、「完全に合致する」という評価基準そのものが無根拠である限り、それよりいくらか弱い評価基準を構成することは適切な処置であるとも言えるでしょう(後で充分な根拠を用意できるなら)。私達は現実の世界がどうなっているかに興味があるのではなく、現実がどのように捉えられるか、あるいはより限定して、現実世界はどのような特徴を持っているかに興味があるのだということを忘れてはなりません。
さて、例題では具体例によって示しましたが、微分にまつわる重要な関係について再度まとめておきましょう。ある関数が 2 つの関数
f
(
t
)
,
g
(
t
)
{\displaystyle f(t),g(t)}
の和になっている場合、関数
f
(
t
)
+
g
(
t
)
{\displaystyle f(t)+g(t)}
の微分は(ラグランジュ記法を用いて)
(
f
(
t
)
+
g
(
t
)
)
′
=
f
′
(
t
)
+
g
′
(
t
)
{\displaystyle (f(t)+g(t))'=f'(t)+g'(t)}
とそれぞれの関数の微分の和に書き直すことできます。また、ある関数の定数倍
c
f
(
t
)
{\displaystyle cf(t)}
の微分は
(
c
f
(
t
)
)
′
=
c
f
′
(
t
)
{\displaystyle (cf(t))'=cf'(t)}
のように元の関数の微分の定数倍になります。より一般には、2 つの関数
f
(
t
)
,
g
(
t
)
{\displaystyle f(t),g(t)}
の積
f
(
t
)
g
(
t
)
{\displaystyle f(t)g(t)}
の微分について、
(
f
(
t
)
g
(
t
)
)
′
=
f
′
(
t
)
g
(
t
)
+
f
(
t
)
g
′
(
t
)
{\displaystyle (f(t)g(t))'=f'(t)g(t)+f(t)g'(t)}
が成り立ちます。これが定数倍の場合の一般化になっていることは
g
(
t
)
=
c
{\displaystyle g(t)=c}
と置き換えれば分かるでしょう。
ある関数
f
(
t
)
{\displaystyle f(t)}
について
f
(
t
)
=
y
{\displaystyle f(t)=y}
を満たすような
t
=
t
(
y
)
{\displaystyle t=t(y)}
を
f
(
t
)
{\displaystyle f(t)}
の逆関数 といいます。逆関数の微分について、次の関係が成り立ちます。
d
f
(
t
)
d
t
d
t
(
y
)
d
y
|
y
=
f
(
t
)
=
1.
{\displaystyle {\frac {df(t)}{dt}}\left.{\frac {dt(y)}{dy}}\right|_{y=f(t)}=1.}
例えば
f
(
t
)
=
t
n
{\displaystyle f(t)=t^{n}}
の場合、
f
′
(
t
)
=
n
t
n
−
1
{\displaystyle f'(t)=nt^{n-1}}
から、
d
t
(
y
)
d
y
|
y
=
f
(
t
)
=
1
n
t
n
−
1
{\displaystyle \left.{\frac {dt(y)}{dy}}\right|_{y=f(t)}={\frac {1}{nt^{n-1}}}}
となります。
f
(
t
)
{\displaystyle f(t)}
が正の場合には、累乗根 を用いて
t
=
(
f
(
t
)
)
1
/
n
=
y
1
/
n
{\displaystyle t=(f(t))^{1/n}=y^{1/n}}
と書くことで、
d
t
(
y
)
d
y
=
1
n
y
1
n
−
1
(
y
>
0
)
{\displaystyle {\frac {dt(y)}{dy}}={\frac {1}{n}}y^{{\frac {1}{n}}-1}\quad (y>0)}
が得られます。
1
n
{\displaystyle {\frac {1}{n}}}
を
n
{\displaystyle n}
に置き換えれば、この関係もまた
(
y
n
)
′
=
n
y
n
−
1
{\displaystyle \left(y^{n}\right)'=ny^{n-1}}
という形になっていることが分かります。
物体の運動が平面上に限られる場合、物体の運動方向には上下と左右の 2 つの自由度が与えられます。これに対応して時刻
t
{\displaystyle t}
における物体の位置
x
(
t
)
{\displaystyle {\boldsymbol {x}}(t)}
はデカルト座標系の 2 つの軸上の位置
x
1
(
t
)
,
x
2
(
t
)
{\displaystyle x_{1}(t),x_{2}(t)}
を用いて
x
(
t
)
=
(
x
1
(
t
)
x
2
(
t
)
)
{\displaystyle {\boldsymbol {x}}(t)={\begin{pmatrix}x_{1}(t)\\x_{2}(t)\end{pmatrix}}}
と表すことができます。
x
1
(
t
)
{\displaystyle x_{1}(t)}
および
x
2
(
t
)
{\displaystyle x_{2}(t)}
をそれぞれ
x
{\displaystyle {\boldsymbol {x}}}
の成分 (component) といいます。一次元の場合には 2 つの物体 A, B の相対的な位置関係は単に 2 つの物体の位置の差
x
A
−
x
B
{\displaystyle x_{\mathrm {A} }-x_{\mathrm {B} }}
として表すことができましたが、一般には相対位置をデカルト座標系で表す場合にはそれぞれの成分についての差をとったものとして表されます。たとえば二次元の場合には
x
A
−
x
B
=
(
x
A
1
x
A
2
)
−
(
x
B
1
x
B
2
)
=
(
x
A
1
−
x
B
1
x
A
2
−
x
B
2
)
{\displaystyle {\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {x}}_{\mathrm {B} }={\begin{pmatrix}x_{\mathrm {A} _{1}}\\x_{\mathrm {A} _{2}}\end{pmatrix}}-{\begin{pmatrix}x_{\mathrm {B} _{1}}\\x_{\mathrm {B} _{2}}\end{pmatrix}}={\begin{pmatrix}x_{\mathrm {A} _{1}}-x_{\mathrm {B} _{1}}\\x_{\mathrm {A} _{2}}-x_{\mathrm {B} _{2}}\end{pmatrix}}}
となります。また物体間の距離 について、一次元の場合には位置の差の絶対値
|
x
A
−
x
B
|
{\displaystyle \left|x_{\mathrm {A} }-x_{\mathrm {B} }\right|}
によって定められますが、二次元の場合にはピタゴラスの定理 を利用して、以下の形で与えられます。
|
x
A
−
x
B
|
=
(
x
A
1
−
x
B
1
)
2
+
(
x
A
2
−
x
B
2
)
2
.
{\displaystyle \left|{\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {x}}_{\mathrm {B} }\right|={\sqrt {\left(x_{\mathrm {A} _{1}}-x_{\mathrm {B} _{1}}\right)^{2}+\left(x_{\mathrm {A} _{2}}-x_{\mathrm {B} _{2}}\right)^{2}}}.}
距離は最も直接的には上記の形式で表されますが、ベクトルの内積 を
x
⋅
y
=
x
1
y
1
+
x
2
y
2
{\displaystyle {\boldsymbol {x}}\cdot {\boldsymbol {y}}=x_{1}y_{1}+x_{2}y_{2}}
のように定めれば内積を用いて距離を表すことができます。
|
x
A
−
x
B
|
=
(
x
A
−
x
B
)
⋅
(
x
A
−
x
B
)
.
{\displaystyle \left|{\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {x}}_{\mathrm {B} }\right|={\sqrt {\left({\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {x}}_{\mathrm {B} }\right)\cdot \left({\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {x}}_{\mathrm {B} }\right)}}.}
また、ベクトルを 1 行または 1 列の行列 と見なせば[ 7] 、行ベクトルと列ベクトルの積
(
x
1
x
2
)
(
y
1
y
2
)
=
x
1
y
1
+
x
2
y
2
{\displaystyle {\begin{pmatrix}x_{1}&x_{2}\end{pmatrix}}{\begin{pmatrix}y_{1}\\y_{2}\end{pmatrix}}=x_{1}y_{1}+x_{2}y_{2}}
を用いて[ 8]
|
x
A
−
x
B
|
=
(
x
A
−
x
B
)
T
(
x
A
−
x
B
)
{\displaystyle \left|{\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {x}}_{\mathrm {B} }\right|={\sqrt {\left({\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {x}}_{\mathrm {B} }\right)^{\mathrm {T} }\left({\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {x}}_{\mathrm {B} }\right)}}}
と書くこともできます。記号
T
{\displaystyle \mathrm {T} }
は行列の転置 を表し、ここでは列ベクトルを行ベクトルにする操作を示しています[ 9] 。
x
=
(
x
1
x
2
)
,
x
T
=
(
x
1
x
2
)
.
{\displaystyle {\boldsymbol {x}}={\begin{pmatrix}x_{1}\\x_{2}\end{pmatrix}},\quad {\boldsymbol {x}}^{\mathrm {T} }={\begin{pmatrix}x_{1}&x_{2}\end{pmatrix}}.}
1. 平行移動
平面上の物体の位置
x
{\displaystyle {\boldsymbol {x}}}
について、座標系を平行移動させ平面上のある点
X
{\displaystyle {\boldsymbol {X}}}
を原点としたものを新たに
x
′
{\displaystyle {\boldsymbol {x}}'}
と表せば[ 10] 、
x
′
=
x
−
X
{\displaystyle {\boldsymbol {x}}'={\boldsymbol {x}}-{\boldsymbol {X}}}
と書くことができます。右辺は古い座標系における量で左辺が新しい座標系を表します。明らかに
x
=
X
{\displaystyle {\boldsymbol {x}}={\boldsymbol {X}}}
のとき
x
′
=
0
{\displaystyle {\boldsymbol {x}}'={\boldsymbol {0}}}
となり、古い座標系における点
X
{\displaystyle {\boldsymbol {X}}}
が新たな座標系の原点となっていることが分かります。また、上記の関係を各成分ごとに分けて表せば以下のようになります。
(
x
1
′
x
2
′
)
=
(
x
1
x
2
)
−
(
X
1
X
2
)
=
(
x
1
−
X
1
x
2
−
X
2
)
.
{\displaystyle {\begin{pmatrix}x_{1}'\\x_{2}'\end{pmatrix}}={\begin{pmatrix}x_{1}\\x_{2}\end{pmatrix}}-{\begin{pmatrix}X_{1}\\X_{2}\end{pmatrix}}={\begin{pmatrix}x_{1}-X_{1}\\x_{2}-X_{2}\end{pmatrix}}.}
座標系の平行移動に関して注目すべき点として、2 点間の相対的な位置関係は変わらないということが挙げられます。ある座標系における物体 A の位置を
x
A
{\displaystyle {\boldsymbol {x}}_{\mathrm {A} }}
、物体 B の位置を
x
B
{\displaystyle {\boldsymbol {x}}_{\mathrm {B} }}
と表し、元の座標系を
X
{\displaystyle {\boldsymbol {X}}}
だけ平行移動した座標系における物体の位置をそれぞれ
x
A
′
,
x
B
′
{\displaystyle {\boldsymbol {x}}_{\mathrm {A} }',\,{\boldsymbol {x}}_{\mathrm {B} }'}
と表すと、それぞれの座標系における物体 B に対する物体 A の相対的な位置は
x
A
−
x
B
{\displaystyle {\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {x}}_{\mathrm {B} }}
および
x
A
′
−
x
B
′
{\displaystyle {\boldsymbol {x}}_{\mathrm {A} }'-{\boldsymbol {x}}_{\mathrm {B} }'}
と書くことができますが、平行移動した座標系における物体 A, B の位置はそれぞれ
x
A
′
=
x
A
−
X
{\displaystyle {\boldsymbol {x}}_{\mathrm {A} }'={\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {X}}}
および
x
B
′
=
x
B
−
X
{\displaystyle {\boldsymbol {x}}_{\mathrm {B} }'={\boldsymbol {x}}_{\mathrm {B} }-{\boldsymbol {X}}}
と表すことができるため
x
A
′
−
x
B
′
=
(
x
A
−
X
)
−
(
x
B
−
X
)
=
x
A
−
x
B
{\displaystyle {\begin{aligned}{\boldsymbol {x}}_{\mathrm {A} }'-{\boldsymbol {x}}_{\mathrm {B} }'&=({\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {X}})-({\boldsymbol {x}}_{\mathrm {B} }-{\boldsymbol {X}})\\&={\boldsymbol {x}}_{\mathrm {A} }-{\boldsymbol {x}}_{\mathrm {B} }\end{aligned}}}
と書き換えられます。このことから、座標系を平行移動しても物体間の距離が変化しないことがすぐに確かめられます。
2. スケール変換
平行移動以外の代表的な座標系の変換として、スケール変換 (scale transformation) があります。スケール変換された座標系における物体の位置を
x
′
{\displaystyle {\boldsymbol {x}}'}
とし、変換前の座標系における物体の位置を
x
{\displaystyle {\boldsymbol {x}}}
とすると、スケール変換は以下のように表すことができます。
x
′
=
s
x
{\displaystyle {\boldsymbol {x}}'=s{\boldsymbol {x}}}
ここで
s
{\displaystyle s}
は正の実数であり、スケール因子 と呼ばれます。
s
=
1
{\displaystyle s=1}
ならば変換前と変換後の座標系は完全に一致します。
s
{\displaystyle s}
が 1 でない場合について、原点から物体までの距離を考えるとスケール変換後の距離は、
|
x
′
|
=
|
s
x
|
=
s
|
x
|
{\displaystyle \left|{\boldsymbol {x}}'\right|=\left|s{\boldsymbol {x}}\right|=s\left|{\boldsymbol {x}}\right|}
となり、
s
>
1
{\displaystyle s>1}
の場合は
|
x
′
|
>
|
x
|
{\displaystyle \left|{\boldsymbol {x}}'\right|>\left|{\boldsymbol {x}}\right|}
、
s
<
1
{\displaystyle s<1}
の場合は
|
x
′
|
<
|
x
|
{\displaystyle \left|{\boldsymbol {x}}'\right|<\left|{\boldsymbol {x}}\right|}
という関係が成り立ちます。これらの関係は物体間の距離に関しても成り立ちます。「実際の」距離はスケール変換によって変わらないとすれば、この変換は長さの基準を変えることに他ならず、
s
>
1
{\displaystyle s>1}
の変換は基準の長さを小さくする変換であり、
s
<
1
{\displaystyle s<1}
の変換は基準の長さを大きくする変換であると考えることができます。
3. 回転
平行移動とスケール変換は一次元の場合にも同様に行うことができますが、二次元の場合と一次元の場合で扱い方の異なる変換も存在します。その中でも最も基本的なものとして座標系の回転操作、特に原点を中心とする回転が挙げられます。右手系 で座標系を時計回り に角度
θ
{\displaystyle \theta }
だけ回転させる場合、ベクトルの成分は反時計回り に回転されたように見えるため、物体の位置は変換後の座標系において以下のように表されます。
x
′
=
R
θ
x
=
(
cos
(
θ
)
−
sin
(
θ
)
sin
(
θ
)
cos
(
θ
)
)
(
x
1
x
2
)
=
(
cos
(
θ
)
x
1
−
sin
(
θ
)
x
2
sin
(
θ
)
x
1
+
cos
(
θ
)
x
2
)
{\displaystyle {\boldsymbol {x}}'={\textrm {R}}_{\theta }{\boldsymbol {x}}={\begin{pmatrix}\cos \left(\theta \right)&-\sin \left(\theta \right)\\\sin \left(\theta \right)&\cos \left(\theta \right)\end{pmatrix}}{\begin{pmatrix}x_{1}\\x_{2}\\\end{pmatrix}}={\begin{pmatrix}\cos \left(\theta \right)x_{1}-\sin \left(\theta \right)x_{2}\\\sin \left(\theta \right)x_{1}+\cos \left(\theta \right)x_{2}\end{pmatrix}}}
行列
R
θ
{\displaystyle {\textrm {R}}_{\theta }}
は回転行列 (rotation matrix) と呼ばれ、ベクトルの回転操作を表します。回転行列の各成分として与えられる回転角
θ
{\displaystyle \theta }
の関数
cos
,
sin
{\displaystyle \cos ,\,\sin }
をそれぞれ余弦関数 (cosine function) および正弦関数 (sine function) といい、これらは三角関数 と呼ばれる関数たちの一つに数えられます。
座標系の回転について、物体間の距離や物体と原点の間の距離は変わらず、次の関係が成り立ちます。
|
R
θ
x
|
=
|
x
|
.
{\displaystyle |{\textrm {R}}_{\theta }{\boldsymbol {x}}|=\left|{\boldsymbol {x}}\right|.}
成分表示をすると、
{
(
cos
θ
)
2
+
(
sin
θ
)
2
}
(
x
1
2
+
x
2
2
)
=
x
1
2
+
x
2
2
{\displaystyle {\sqrt {\left\{\left(\cos \theta \right)^{2}+\left(\sin \theta \right)^{2}\right\}\left(x_{1}^{2}+x_{2}^{2}\right)}}={\sqrt {x_{1}^{2}+x_{2}^{2}}}}
すなわち
(
cos
θ
)
2
+
(
sin
θ
)
2
=
1
{\displaystyle \left(\cos \theta \right)^{2}+\left(\sin \theta \right)^{2}=1}
という関係が得られます。これはピタゴラスの定理そのものです。
座標系の回転に対して距離が変化しないという性質は、距離を行ベクトルと列ベクトルの積の形に書き直せば、左辺について
|
R
θ
x
|
=
(
R
θ
x
)
T
R
θ
x
=
x
T
R
θ
T
R
θ
x
{\displaystyle |{\textrm {R}}_{\theta }{\boldsymbol {x}}|={\sqrt {({\textrm {R}}_{\theta }{\boldsymbol {x}})^{\mathrm {T} }{\textrm {R}}_{\theta }{\boldsymbol {x}}}}={\sqrt {{\boldsymbol {x}}^{\mathrm {T} }{\textrm {R}}_{\theta }^{\mathrm {T} }{\textrm {R}}_{\theta }{\boldsymbol {x}}}}}
となるので、これが右辺の
|
x
|
=
x
T
x
{\displaystyle |{\boldsymbol {x}}|={\sqrt {{\boldsymbol {x}}^{\mathrm {T} }{\boldsymbol {x}}}}}
に等しいことから回転行列
R
θ
{\displaystyle {\textrm {R}}_{\theta }}
は
R
θ
T
R
θ
=
R
θ
R
θ
T
=
I
{\displaystyle {\textrm {R}}_{\theta }^{\mathrm {T} }{\textrm {R}}_{\theta }={\textrm {R}}_{\theta }{\textrm {R}}_{\theta }^{\mathrm {T} }={\textrm {I}}}
という関係を満たすことが分かります。ここで
I
{\displaystyle {\textrm {I}}}
は単位行列 (identity matrix) であり
I
=
(
1
0
0
1
)
{\displaystyle {\textrm {I}}={\begin{pmatrix}1&0\\0&1\end{pmatrix}}}
と書くことができます。自身の転置行列との積が単位行列となるような実正方行列は直交行列 (orthogonal matrix) と呼ばれ、回転行列はその一種であることが分かります。
他にも座標系の回転について、回転角の和が等しければ回数や順序によらず同じ座標系が得られるので、次の関係が成り立ちます。
R
ϕ
R
θ
=
R
θ
R
ϕ
=
R
θ
+
ϕ
.
{\displaystyle {\textrm {R}}_{\phi }{\textrm {R}}_{\theta }={\textrm {R}}_{\theta }{\textrm {R}}_{\phi }={\textrm {R}}_{\theta +\phi }.}
これらの行列の積をあらわに書くと、
(
cos
(
θ
)
cos
(
ϕ
)
−
sin
(
θ
)
sin
(
ϕ
)
cos
(
θ
)
sin
(
ϕ
)
+
sin
(
θ
)
cos
(
ϕ
)
−
sin
(
θ
)
cos
(
ϕ
)
−
cos
(
θ
)
sin
(
ϕ
)
−
sin
(
θ
)
sin
(
ϕ
)
+
cos
(
θ
)
cos
(
ϕ
)
)
=
(
cos
(
θ
+
ϕ
)
sin
(
θ
+
ϕ
)
−
sin
(
θ
+
ϕ
)
cos
(
θ
+
ϕ
)
)
{\displaystyle {\begin{pmatrix}\;\;\cos \left(\theta \right)\cos \left(\phi \right)-\sin \left(\theta \right)\sin \left(\phi \right)&\;\;\cos \left(\theta \right)\sin \left(\phi \right)+\sin \left(\theta \right)\cos \left(\phi \right)\\-\sin \left(\theta \right)\cos \left(\phi \right)-\cos \left(\theta \right)\sin \left(\phi \right)&-\sin \left(\theta \right)\sin \left(\phi \right)+\cos \left(\theta \right)\cos \left(\phi \right)\end{pmatrix}}={\begin{pmatrix}\;\;\cos \left(\theta +\phi \right)&\sin \left(\theta +\phi \right)\\-\sin \left(\theta +\phi \right)&\cos \left(\theta +\phi \right)\end{pmatrix}}}
より
{
cos
(
θ
)
cos
(
ϕ
)
−
sin
(
θ
)
sin
(
ϕ
)
=
cos
(
θ
+
ϕ
)
cos
(
θ
)
sin
(
ϕ
)
+
sin
(
θ
)
cos
(
ϕ
)
=
sin
(
θ
+
ϕ
)
{\displaystyle {\begin{cases}\cos \left(\theta \right)\cos \left(\phi \right)-\sin \left(\theta \right)\sin \left(\phi \right)=\cos \left(\theta +\phi \right)\\\cos \left(\theta \right)\sin \left(\phi \right)+\sin \left(\theta \right)\cos \left(\phi \right)=\sin \left(\theta +\phi \right)\end{cases}}}
という三角関数に関する加法定理が得られます。
座標系の原点と基底
さて、ここまで座標系の変換の具体例をいくつか紹介しましたが、上に挙げた例では変換前と変換後の座標系で同一のベクトルを表した際に、ベクトルの成分がどのように変化するかという視点で説明しました。
この観点において、実際にはベクトル自体は何の変換も受けないにもかかわらずベクトルが変化してしまっているように見えることと、座標系に対する変換を成分に対する変換として表してしまっていることは、事情を必要以上に複雑に見せる場合があり不満が残ります。そこで、座標系を特徴づける基底ベクトル (basis vector) および原点をあらわに書いて座標系の変換を書き直します。
基底ベクトルは座標系の軸に対応するベクトルであり、(考察対象である)任意のベクトルは、基底ベクトルの定数倍の和、すなわち基底ベクトルの線形結合 (linear combination) によって一意に表すことができます。ベクトルの成分とは、ベクトルをある基底ベクトルの線形結合として表した際に出てくる[ 11] 、基底ベクトルの係数の組のことをいいます。
変換前の基底ベクトルの組を
{
e
(
1
)
,
e
(
2
)
}
{\displaystyle \{\mathbf {e} ^{(1)},\mathbf {e} ^{(2)}\}}
、変換後の基底ベクトルの組を
{
e
′
(
1
)
,
e
′
(
2
)
}
{\displaystyle \{\mathbf {e} '^{(1)},\mathbf {e} '^{(2)}\}}
とすれば、変換前後における位置ベクトル
x
{\displaystyle {\boldsymbol {x}}}
はそれぞれ以下のように表すことができます。
x
=
x
1
e
(
1
)
+
x
2
e
(
2
)
=
x
1
′
e
′
(
1
)
+
x
2
′
e
′
(
2
)
.
{\displaystyle {\boldsymbol {x}}=x_{1}\mathbf {e} ^{(1)}+x_{2}\mathbf {e} ^{(2)}=x'_{1}\mathbf {e} '^{(1)}+x'_{2}\mathbf {e} '^{(2)}.}
座標変換の後と前とにおける基底ベクトルは互いの線形結合によって表すことができ、変換前の基底を変換後の基底によって展開したものは
e
(
1
)
=
P
11
′
e
′
(
1
)
+
P
12
′
e
′
(
2
)
e
(
2
)
=
P
21
′
e
′
(
1
)
+
P
22
′
e
′
(
2
)
{\displaystyle {\begin{aligned}\mathbf {e} ^{(1)}&=P'_{11}{\mathbf {e} '}^{(1)}+P'_{12}{\mathbf {e} '}^{(2)}\\\mathbf {e} ^{(2)}&=P'_{21}{\mathbf {e} '}^{(1)}+P'_{22}{\mathbf {e} '}^{(2)}\end{aligned}}}
となり、変換後の基底を変換前の基底によって展開したものは
e
′
(
1
)
=
P
11
e
(
1
)
+
P
12
e
(
2
)
e
′
(
2
)
=
P
21
e
(
1
)
+
P
22
e
(
2
)
{\displaystyle {\begin{aligned}{\mathbf {e} '}^{(1)}&=P_{11}\mathbf {e} ^{(1)}+P_{12}\mathbf {e} ^{(2)}\\{\mathbf {e} '}^{(2)}&=P_{21}\mathbf {e} ^{(1)}+P_{22}\mathbf {e} ^{(2)}\end{aligned}}}
となります。ここで現れる係数の組
{
P
i
j
}
,
{
P
i
j
′
}
{\displaystyle \{P_{ij}\},\,\{P'_{ij}\}}
はあからさまに行列の形をしており、
基底ベクトルの組を単に
e
,
e
′
{\displaystyle \mathbf {e} ,\,\mathbf {e} '}
と表し、基底の展開係数の組を行列
P
′
,
P
{\displaystyle {\textrm {P}}',\,{\textrm {P}}}
によって表せば、上記の関係は以下のようにまとめられます。
{
e
=
P
′
e
′
e
′
=
P
e
{\displaystyle {\begin{cases}\mathbf {e} \;={\textrm {P}}'\mathbf {e} '\\\mathbf {e} '={\textrm {P}}\mathbf {e} \end{cases}}}
これらの関係から、基底の変換行列が満たすべき条件を導くことができます。座標変換前の基底から変換後の基底に移ったのち、再び座標変換前の基底に戻るという操作は
e
=
P
′
e
′
=
P
′
(
P
e
)
{\displaystyle \mathbf {e} ={\textrm {P}}'\mathbf {e} '={\textrm {P}}'({\textrm {P}}\mathbf {e} )}
と書けます。同様に、座標変換後の基底を出発して元に戻る場合には
e
′
=
P
e
=
P
(
P
′
e
′
)
{\displaystyle \mathbf {e} '={\textrm {P}}\mathbf {e} ={\textrm {P}}({\textrm {P}}'\mathbf {e} ')}
となります。これらの結果から
P
′
P
=
P
P
′
=
I
{\displaystyle {\textrm {P}}'{\textrm {P}}={\textrm {P}}{\textrm {P}}'={\textrm {I}}}
という関係が得られます。つまり、行列
P
′
{\displaystyle {\textrm {P}}'}
は行列
P
{\displaystyle {\textrm {P}}}
の逆行列 (inverse matrix)
P
−
1
{\displaystyle {\textrm {P}}^{-1}}
であり、
P
′
=
P
−
1
(
P
=
P
′
−
1
)
{\displaystyle {\textrm {P}}'={\textrm {P}}^{-1}\qquad ({\textrm {P}}={\textrm {P}}'{}^{-1})}
基底を移し替える操作
P
{\displaystyle {\textrm {P}}}
にはそれを元に戻す逆操作が必ず存在することが分かります[ 12] 。
ここで得られた座標変換の行列
P
{\displaystyle {\textrm {P}}}
を用いてベクトル
x
{\displaystyle {\boldsymbol {x}}}
の展開を書き換えると、
x
=
x
1
e
(
1
)
+
x
2
e
(
2
)
=
x
1
{
P
11
′
e
′
(
1
)
+
P
12
′
e
′
(
2
)
}
+
x
2
{
P
21
′
e
′
(
1
)
+
P
22
′
e
′
(
2
)
}
=
(
{
P
−
1
}
11
x
1
+
{
P
−
1
}
21
x
2
)
e
′
(
1
)
+
(
{
P
−
1
}
12
x
1
+
{
P
−
1
}
22
x
2
)
e
′
(
2
)
{\displaystyle {\begin{aligned}{\boldsymbol {x}}&=x_{1}\mathbf {e} ^{(1)}+x_{2}\mathbf {e} ^{(2)}\\&=x_{1}\left\{P'_{11}{\mathbf {e} '}^{(1)}+P'_{12}{\mathbf {e} '}^{(2)}\right\}+x_{2}\left\{P'_{21}{\mathbf {e} '}^{(1)}+P'_{22}{\mathbf {e} '}^{(2)}\right\}\\&=(\{{\textrm {P}}^{-1}\}_{11}x_{1}+\{{\textrm {P}}^{-1}\}_{21}x_{2}){\mathbf {e} '}^{(1)}+(\{{\textrm {P}}^{-1}\}_{12}x_{1}+\{{\textrm {P}}^{-1}\}_{22}x_{2}){\mathbf {e} '}^{(2)}\end{aligned}}}
となります。ここで変換後の成分を取り出すと以下の関係が得られます。
x
1
′
=
{
P
−
1
}
11
x
1
+
{
P
−
1
}
21
x
2
x
2
′
=
{
P
−
1
}
12
x
1
+
{
P
−
1
}
22
x
2
{\displaystyle {\begin{aligned}x'_{1}&=\{{\textrm {P}}^{-1}\}_{11}x_{1}+\{{\textrm {P}}^{-1}\}_{21}x_{2}\\x'_{2}&=\{{\textrm {P}}^{-1}\}_{12}x_{1}+\{{\textrm {P}}^{-1}\}_{22}x_{2}\end{aligned}}}
また成分ベクトルを
ξ
T
=
(
x
1
,
x
2
)
{\displaystyle {\boldsymbol {\xi }}^{\mathrm {T} }=(x_{1},\,x_{2})}
とすれば、上記の関係は以下のように整理できます。
ξ
T
e
=
ξ
T
P
′
e
′
=
ξ
T
P
−
1
P
e
=
(
{
P
−
1
}
T
ξ
)
T
P
e
.
{\displaystyle {\boldsymbol {\xi }}^{\mathrm {T} }\mathbf {e} ={\boldsymbol {\xi }}^{\mathrm {T} }{\textrm {P}}'\mathbf {e} '={\boldsymbol {\xi }}^{\mathrm {T} }{\textrm {P}}^{-1}{\textrm {P}}\mathbf {e} ={(\{{\textrm {P}}^{-1}\}^{\mathrm {T} }{\boldsymbol {\xi }})}^{\mathrm {T} }{\textrm {P}}\mathbf {e} .}
基底ベクトルの変換の具体例としては座標系の原点を中心とする回転操作や、座標系のスケール変換が当てはまります。ただし、座標系の平行移動は座標系の原点に対する変換であり、基底ベクトルに対する変換ではありません。位置ベクトル
x
{\displaystyle {\boldsymbol {x}}}
は空間上のある点
O
{\displaystyle \mathrm {O} }
を原点として別のある点
X
{\displaystyle \mathrm {X} }
を指すベクトルです。
x
=
O
X
→
.
{\displaystyle {\boldsymbol {x}}={\overrightarrow {\mathrm {OX} }}.}
空間上の点
X
{\displaystyle \mathrm {X} }
を指す位置ベクトルは原点
O
{\displaystyle \mathrm {O} }
の取り方に応じて無数に存在します。たとえば別の原点
O
′
≠
O
{\displaystyle \mathrm {O'} \neq \mathrm {O} }
と点
X
{\displaystyle \mathrm {X} }
を結ぶ位置ベクトルを
x
′
=
O
′
X
→
{\displaystyle {\boldsymbol {x}}'={\overrightarrow {\mathrm {O'X} }}}
と表すことができ、また
O
′
X
→
≠
O
X
→
{\displaystyle {\overrightarrow {\mathrm {O'X} }}\neq {\overrightarrow {\mathrm {OX} }}}
です。2 つの位置ベクトルはお互いの原点を結ぶ位置ベクトル
O
O
′
→
{\displaystyle {\overrightarrow {\mathrm {OO'} }}}
によって結び付けられます。
O
X
→
=
O
O
′
→
+
O
′
X
→
.
{\displaystyle {\overrightarrow {\mathrm {OX} }}={\overrightarrow {\mathrm {OO'} }}+{\overrightarrow {\mathrm {O'X} }}.}
【例題】
具体的な基底や変換行列について、その性質を確かめよ。
この節は書きかけです。この節を編集してくれる方 を心からお待ちしています。
^ ただし物体の個数は「三体問題 」のように「体」で数えます。
^ デカルト座標系という呼び名は、発見者の一人であるフランスの哲学者ルネ・デカルト に因むものです。英語の Cartesian はデカルトのラテン語名 Cartesius に因み、日本語でもデカルト座標系を「カルテシアン座標系」などと書くことがあります。ただし英語の Cartesian の発音は(無理に日本語で表せば)「カーティージェン」とか「カーティジャン」に近く、「ティ」の部分にアクセントが置かれます。
^ 以下の
v
(
t
1
;
t
2
)
{\displaystyle v(t_{1};t_{2})}
のように記号の後ろに括弧書きで記号が順番に列記されているものは、関数 を表します(この場合、
v
{\displaystyle v}
は
t
1
{\displaystyle t_{1}}
と
t
2
{\displaystyle t_{2}}
の関数である、ということです)。関数とは、ある数と別の数を結びつける規則のことをいいます。たとえば「ある数
x
{\displaystyle x}
を 2 倍して 3 を足したものを与える」関数は、それを
f
{\displaystyle f}
と表せば、
f
(
x
)
:=
2
x
+
3
{\displaystyle f(x):=2x+3}
と書くことができます。
^ この節においては「瞬間の速度」ないし「瞬間速度」などと呼びますが、一般には「瞬間の」をつけず単に「速度」と呼びます。瞬間の速度と平均の速度を混同する虞れがない限り、本書でも単に「速度」と書けば瞬間の速度を指します。
^ 行き掛かり上、暗に微小量
h
{\displaystyle h}
を正の場合に限定して説明しますが、実際には
h
{\displaystyle h}
が負の場合についても極限が定まり、正負の極限が一致することで初めて瞬間の速度が定義できます。たとえば
t
≥
0
{\displaystyle t\geq 0}
で
x
(
t
)
=
t
{\displaystyle x(t)=t}
、
t
<
0
{\displaystyle t<0}
で
x
(
t
)
=
0
{\displaystyle x(t)=0}
となるような曲線について、
v
(
0
)
{\displaystyle v(0)}
を決定することはできません。この
x
(
t
)
{\displaystyle x(t)}
のように折れ曲がった曲線や、連続していない曲線に対しては極限を定めることができず(つまり接線を一意に引くことができない)、極限が定まるためには極限をとる点の近傍で曲線に折れ曲がりや飛びがないこと、言い換えれば曲線が滑らか であることが必要となります。微小量
h
{\displaystyle h}
が正であっても負であっても同じ形で(つまり正の極限と負の極限の場合を分けて書く必要がなく)瞬間の速度が求められることは、分子と分母の両方に負符号をつけても全体の符号は変わらないことから分かります。特別に正の極限を求める場合は
lim
h
↓
0
{\displaystyle \lim _{h\downarrow 0}}
とか
lim
h
→
0
+
{\displaystyle \lim _{h\to 0^{+}}}
と書き、負の極限を求める場合は
lim
h
↑
0
{\displaystyle \lim _{h\uparrow 0}}
とか
lim
h
→
0
−
{\displaystyle \lim _{h\to 0^{-}}}
と書きます(これらは片側極限 (one-sided limit) と呼ばれ、特に前者は右極限 (right-sided limit)、後者は左極限 (left-sided limit) と呼ばれます)。単に
lim
h
→
0
{\displaystyle \lim _{h\to 0}}
と書いた場合は正負の両側の極限を取ることを意味します。
^ 微分によって与えられる関数を導関数と呼ぶことがあります。たとえば微分演算そのものと微分演算から得られる関数を区別する場合には、関数の方を導関数と呼び演算を微分と呼んで区別できます。また、導関数と特定の点に対する導関数の値を区別する上で、導関数が示す値を微分係数と呼ぶことがあります。
^ 横の並びを行 (row)、縦の並びを列 (column) と呼びます。また行が
m
{\displaystyle m}
個あり、列が
n
{\displaystyle n}
個あるような行列を
m
×
n
{\displaystyle m\times n}
行列と呼びます。特に
1
×
n
{\displaystyle 1\times n}
の行列として表されるベクトルを行ベクトル (row vector)、
m
×
1
{\displaystyle m\times 1}
の行列として表されるベクトルを列ベクトル (column vector) と呼びます。
m
×
n
{\displaystyle m\times n}
行列は
n
{\displaystyle n}
成分の行ベクトルを成分として持つ
m
{\displaystyle m}
成分の列ベクトル、あるいは
m
{\displaystyle m}
成分の列ベクトルを成分とする
n
{\displaystyle n}
成分の行ベクトルと見なすことができます。
(
a
11
a
12
⋯
a
1
n
a
21
a
22
⋮
⋮
⋱
⋮
a
m
1
a
m
2
⋯
a
m
n
)
=
(
(
a
11
a
12
⋯
a
1
n
)
(
a
21
a
22
⋯
a
2
n
)
⋮
(
a
m
1
a
m
2
⋯
a
m
n
)
)
=
(
(
a
11
a
21
⋮
a
m
1
)
(
a
12
a
22
⋮
a
m
2
)
⋯
(
a
1
n
a
2
n
⋮
a
m
n
)
)
{\displaystyle {\begin{pmatrix}a_{11}&a_{12}&\cdots &a_{1n}\\a_{21}&a_{22}&&\vdots \\\vdots &&\ddots &\vdots \\a_{m1}&a_{m2}&\cdots &a_{mn}\end{pmatrix}}={\begin{pmatrix}{\begin{pmatrix}a_{11}&a_{12}&\cdots &a_{1n}\end{pmatrix}}\\{\begin{pmatrix}a_{21}&a_{22}&\cdots &a_{2n}\end{pmatrix}}\\\vdots \\{\begin{pmatrix}a_{m1}\!&a_{m2}\!&\cdots &a_{mn}\!\end{pmatrix}}\end{pmatrix}}={\begin{pmatrix}{\begin{pmatrix}a_{11}\\a_{21}\\\vdots \\a_{m1}\end{pmatrix}}&{\begin{pmatrix}a_{12}\\a_{22}\\\vdots \\a_{m2}\end{pmatrix}}&\cdots &{\begin{pmatrix}a_{1n}\\a_{2n}\\\vdots \\a_{mn}\end{pmatrix}}\end{pmatrix}}}
^ 一般の行列の積について、
m
×
r
{\displaystyle m\times r}
行列
A
{\displaystyle {\textrm {A}}}
の
i
j
{\displaystyle ij}
成分を
{
A
}
i
j
=
a
i
j
{\displaystyle \{{\textrm {A}}\}_{ij}=a_{ij}}
、
r
×
n
{\displaystyle r\times n}
行列
B
{\displaystyle {\textrm {B}}}
の
i
j
{\displaystyle ij}
成分を
{
B
}
i
j
=
b
i
j
{\displaystyle \{{\textrm {B}}\}_{ij}=b_{ij}}
として、
B
{\displaystyle {\textrm {B}}}
の左から
A
{\displaystyle {\textrm {A}}}
を掛けた積
AB
{\displaystyle {\textrm {AB}}}
の各成分は
{
AB
}
i
j
=
∑
k
=
1
r
a
i
k
b
k
j
(
i
=
1
,
…
,
m
;
j
=
1
,
…
,
n
)
{\displaystyle \{{\textrm {AB}}\}_{ij}=\sum _{k=1}^{r}a_{ik}b_{kj}\quad \left(i=1,\dots ,m;\,j=1,\dots ,n\right)}
となります。
^ より一般には
m
×
n
{\displaystyle m\times n}
行列
A
{\displaystyle {\textrm {A}}}
に対して
{
B
}
i
j
=
{
A
}
j
i
{\displaystyle \{{\textrm {B}}\}_{ij}=\{{\textrm {A}}\}_{ji}}
を満たす
n
×
m
{\displaystyle n\times m}
行列
B
{\displaystyle {\textrm {B}}}
を行列
A
{\displaystyle {\textrm {A}}}
の転置行列といいます。行列の積
AB
{\displaystyle {\textrm {AB}}}
の転置について成り立つ重要な性質として、
(
AB
)
T
=
B
T
A
T
{\displaystyle ({\textrm {AB}})^{\mathrm {T} }={\textrm {B}}^{\mathrm {T} }{\textrm {A}}^{\mathrm {T} }}
という関係が成り立つことがあります。その成分表示が
{
AB
}
i
j
=
∑
k
{
A
}
i
k
{
B
}
k
j
=
∑
k
{
B
T
}
j
k
{
A
T
}
k
i
{\displaystyle \{{\textrm {AB}}\}_{ij}=\sum _{k}\{{\textrm {A}}\}_{ik}\{{\textrm {B}}\}_{kj}=\sum _{k}\{{\textrm {B}}^{\mathrm {T} }\}_{jk}\{{\textrm {A}}^{\mathrm {T} }\}_{ki}}
となることから確認できます。
^ ここで
x
′
{\displaystyle {\boldsymbol {x}}'}
のプライムは
x
{\displaystyle {\boldsymbol {x}}}
の微分を意味していません。
^ このようにあるベクトルをある基底ベクトルの線形結合として表現することを「ベクトルを(その基底によって)展開する」といいます。
^ このような逆行列を持つ行列を正則行列 (regular matrix)、または可逆行列 (invertible matrix) といいます。