X86アセンブラ/x86アーキテクチャ

x86アーキテクチャ

x86アーキテクチャは、インテル社が1978年に8086プロセッサで導入し、その後継世代で発展してきたCPUアーキテクチャです。

主な特徴は、可変長命令セット、CISC（複合命令セットコンピューティング）アーキテクチャ、レジスタアーキテクチャにあります。初期は16ビット、その後32ビット（IA-32）、そして64ビット（x86-64/AMD64）へと進化しました。

レジスタ構成は、AX、BX、CX、DXの汎用レジスタ、SI、DIのインデックスレジスタ、SP、BPのスタック関連レジスタなどで構成されています。命令セットは、複雑で多機能な命令を特徴とし、効率的なコード生成を可能にしています。

動作モードは、リアルモード、プロテクトモード、仮想8086モード、ロングモードへと発展し、各モードで異なるメモリ管理と実行環境を提供してきました。

x86アーキテクチャは、パーソナルコンピューティングの発展に大きく貢献し、多くのデスクトップ、ノートパソコン、サーバーで広く使用されています。インテル社とAMD社が主要な開発と製造を担っており、現代のコンピューティングの基盤となっています。

レジスタ構成

歴代x86アーキテクチャのレジスタ構成の変遷を時系列で説明します。

8086/8088（16ビット）

16ビット汎用レジスタ
AX, BX, CX, DX
SP, BP（スタック関連）
SI, DI（インデックス）
CS, DS, ES, SS（セグメントレジスタ）

80286（16ビット protected mode）

前世代と同様
保護モード用の追加レジスタ
GDTR, LDTR, IDTR（テーブルレジスタ）

80386（32ビット）

32ビット拡張
EAX, EBX, ECX, EDX
ESP, EBP
ESI, EDI
セグメントレジスタ拡張

x86-64/AMD64（64ビット）

RAX, RBX, RCX, RDX
RSP, RBP
RSI, RDI
R8〜R15の追加レジスタ
RIP（命令ポインタ）

各世代で徐々にレジスタ数と機能が拡張されてきました。

フラグレジスタ

フラグレジスタは、命令実行結果やプロセッサの状態を示すレジスタです。

8086（16ビット）: 主なフラグには、キャリーフラグ（CF）、ゼロフラグ（ZF）、符号フラグ（SF）、オーバーフローフラグ（OF）、パリティフラグ（PF）などがあります。
80386（32ビット）: 基本的なフラグに加え、追加のフラグが導入されましたが、根本的な役割は変わりません。
x86-64（64ビット）: 基本フラグは継承され、新しい命令や拡張に伴い、追加のフラグが使用可能。

命令ポインタ

命令ポインタは次に実行する命令のメモリアドレスを示すレジスタです。

8086（16ビット）: 16ビットの命令ポインタを使用。
80386（32ビット）: 32ビットに拡張され、広いアドレス空間を扱えるように。
x86-64（64ビット）: 64ビットに拡張され、大規模なメモリ空間にアクセス可能。

命令ポインタの拡張により、より大きな物理メモリ空間へのアクセスが可能になり、プログラムの規模も拡大しました。

プリフィックス

x86アーキテクチャのプリフィックスは、命令の動作を変更または拡張する特殊なバイトです。主な種類は以下の通りです。

セグメントオーバーライドプリフィックス

セグメントレジスタを明示的に指定
CS, DS, ES, SS, FS, GS

オペランドサイズプリフィックス

命令のオペランドサイズを変更
16ビットと32ビット間の切り替え

アドレスサイズプリフィックス

メモリアドレッシングのサイズを変更
16ビットと32ビットアドレッシングの切り替え

REX（64ビット拡張）プリフィックス

64ビットモードでのレジスタ拡張
追加レジスタ（R8〜R15）へのアクセス
オペランドサイズの制御

Lock、Repeat、Segment（各種ロック、繰り返し、セグメント）プリフィックスなども存在し、命令の挙動を詳細に制御します。

命令セットの特徴

x86とx64（またはAMD64）の命令セットは、それぞれ独自の特徴と利点を持っています。

x86の命令セットの特徴

32ビットアーキテクチャ: x86は32ビットのアーキテクチャであり、32ビットのレジスタや32ビットのアドレス空間を持っています。これは主に、物理メモリアドレスが32ビット幅までしかアクセスできないことに由来しています。
レジスタとアドレッシングモード: x86のレジスタはEAX、EBX、ECX、EDXなどの32ビットレジスタです。また、複数のアドレッシングモードが利用可能で、効率的なメモリアクセスが可能です。
命令セットの拡張: x86の命令セットは、SSE（Streaming SIMD Extensions）やMMXなどの浮動小数点演算の拡張を含んでいます。

x64（AMD64）の命令セットの特徴

64ビットアーキテクチャ: x64は64ビットのアーキテクチャで、より大きな物理メモリアドレス空間にアクセスできます。これにより、複数のギガバイトのメモリにアクセスできます。
レジスタ: x64では64ビットのレジスタ（RAX、RBX、RCX、RDXなど）が追加され、64ビット整数演算をサポートしています。
命令セットの拡張: x64にはSSEやAVXなどの拡張命令セットが含まれており、浮動小数点演算などの高度な演算を行うのに便利です。
追加の汎用レジスタと命令: x64では追加の汎用レジスタとともに新しい命令が導入され、パフォーマンスの向上や64ビットアーキテクチャの利点を最大限に引き出すための機能が追加されました。

これらの違いにより、x86とx64はそれぞれ異なる用途や要件に対応しています。x64の64ビットアーキテクチャは、より大きな物理メモリにアクセスできるため、大規模なデータ処理やメモリ集約型のアプリケーションに適しています。一方で、x86の32ビットアーキテクチャは、リソースが制限された環境や古いシステムのサポートに有用です。

x86の命令長とプリフィックス

x86アーキテクチャにおける命令の長さは可変です。命令のバイナリ表現は様々な長さになりますが、典型的なx86の命令は1バイトから始まり、オプコードと呼ばれる命令の主要部分を示します。この後に追加のバイト（オプショナルなプリフィックスやオペランドなど）が続く場合があります。

プリフィックスは、命令の挙動や動作モードを変更するための追加のバイトです。これらはオペランドのサイズを変更したり、セグメントレジスタを指定したり、アドレッシングモードを変更したりするのに使われます。

例えば、命令の先頭に 0x66 プリフィックスが付加されると、オペランドのサイズが変更され、16ビットから32ビットへと変わります。同様に、セグメントを指定するためのプリフィックスとして 0x67 が使用されます。

プリフィックスは、命令のバイナリ表現を拡張するため、全体としての命令の長さを増やす可能性があります。しかし、これらの追加のバイトは命令の主要部分であるオプコードに対するものであり、プリフィックスは特定の動作を追加するためのものです。

アドレッシングモード

x86アーキテクチャには、複数のアドレッシングモードがあります。これらのモードは、CPUがメモリ内のデータや命令にアクセスする方法を定義します。以下に一般的なx86のアドレッシングモードをいくつか挙げて解説します。

レジスタアドレッシング

最も基本的なアドレッシングモードの一つで、データへのアクセスにレジスタを使用します。例えば、次のようなコードが該当します。

MOV AX, BX

この場合、BXレジスタの内容をAXレジスタにコピーする命令です。

即値アドレッシング:

命令そのものに直接値を指定してアクセスする方法です。例えば、次のようなコードが該当します。

MOV AX, 1234h

この場合、1234h（16進数）がAXレジスタに直接ロードされます。

直接メモリアドレッシング

MOV AX, [0080h]

0080h番地からAXレジスタに読み込まれる

レジスタ関節アドレッシング

MOV AX, [BX]

BXの示す番地からAXレジスタに読み込まれる

ディスプレースメント付きレジスタ間接アドレッシング

レジスタに格納されたアドレスにオフセット（ディスプレースメント）を加えて、その場所のメモリにアクセスする方法です。例えば、次のようなコードが該当します。

MOV AX, [BX + 4]

この場合、BXレジスタの内容に4を加えたアドレスのメモリからデータをAXレジスタにロードします。

ベースレジスタとインデックスレジスタを用いたアドレッシング

ベースレジスタとインデックスレジスタにそれぞれの値を格納し、それらを組み合わせてメモリアドレスを計算します。例えば、次のようなコードが該当します。

MOV AX, [BX + SI]

この場合、BXとSIレジスタの値を足して得られるアドレスのメモリからデータをAXレジスタにロードします。

これらのアドレッシングモードは、x86アーキテクチャで広く使用される基本的なものです。プログラムがメモリ内のデータや命令にアクセスする際に、これらのモードが使われます。

x86アーキテクチャにおけるアドレッシングモードは、時代とともに進化してきました。

主な変遷を以下に示します。

初期のx86（8086、8088など）: 初期のx86プロセッサは、基本的なアドレッシングモードをサポートしており、レジスタ間接アドレッシングや即値アドレッシングが主流でした。ディスプレースメントアドレッシングや基底レジスタとインデックスレジスタを用いたアドレッシングモードも存在しましたが、制限されていました。
80386以降: 80386プロセッサ以降のx86世代では、アドレッシングモードが大幅に拡張されました。新たなアドレッシングモードとして、スケールドインデックスモードやベースレジスタとインデックスレジスタの加算や減算によるアドレッシング、複雑なメモリ演算などが追加されました。これにより、より柔軟なメモリアクセスが可能になりました。
x86-64（AMD64）: x86-64アーキテクチャの導入により、より多くのレジスタや拡張されたアドレッシングモードが利用可能になりました。64ビットアーキテクチャにおいて、さらに大容量のメモリにアクセスするためのアドレッシングモードが提供されました。これは大規模なデータ処理や高速なアクセスに役立ちます。

x86アーキテクチャの進化に伴い、新たなレジスタや複雑なアドレッシングモードが導入され、プログラマがより柔軟にメモリにアクセスできるようになりました。この進化は、高度なアプリケーションや処理能力向上に貢献しています。

スタック

x86アーキテクチャにおけるスタックは、メモリ内の特定領域であり、主にサブルーチンの呼び出しやローカル変数の格納など、プログラム実行中に一時的なデータを管理するのに使われます。スタックはLIFO（Last In, First Out）の原則に基づいており、最後に追加されたデータが最初に取り出されます。

x86のスタックは次の特徴を持っています：

スタックポインタ（SP）とベースポインタ（BP）: スタックの先頭アドレスを指し示すスタックポインタ（SP）と、スタック内の特定の場所を指すベースポインタ（BP）があります。SPは通常、新しいデータの追加や削除時に自動的に変化します。一方、BPはサブルーチン内のローカル変数のアクセスなどに使用されることがあります。
PUSHとPOP命令: x86アーキテクチャには、スタック操作のためのPUSH（プッシュ）およびPOP（ポップ）命令があります。PUSH命令はスタックにデータをプッシュし、POP命令はスタックからデータをポップします。
スタックフレーム: x86アーキテクチャでは、関数が呼び出されたときに作成されるスタックフレームと呼ばれる領域があります。これには、ローカル変数、関数の引数、リターンアドレスなどが含まれます。BPレジスタがスタックフレームの先頭を指すことが一般的です。
スタックの成長方向: x86では、スタックは通常、メモリの高いアドレスから低いアドレスの方向に成長します。つまり、新しいデータがスタックにプッシュされると、スタックポインタは低いアドレス方向に移動します。

スタックは、関数の呼び出しや戻り、一時的なデータの保持など、プログラム実行中の様々な操作に広く利用される重要なメモリ構造です。

i80186で追加されたENTERとLEAVEは、x86アセンブリ言語で使用されるスタック操作のための命令です。

ENTER:
- ENTER命令は、スタックフレームを作成します。主にサブルーチンのプロローグで使用され、ローカル変数のためのスタック領域を確保します。
- ENTER命令は次のような構造になっています：
- sizeはローカル変数の合計サイズを指定し、nesting_levelはスタックフレームのネストレベルを指定します。
- この命令は、ローカル変数領域の確保とスタックポインタの調整を行います。
LEAVE:
- LEAVE命令は、スタックフレームを破棄します。主にサブルーチンのエピローグで使用され、スタックフレームを解放します。
- LEAVE命令は、ENTER命令で確保されたスタックフレームを解放するために使用されます。
- 典型的なLEAVE命令は次のようになります：
- この命令は、スタックフレームの解放とスタックポインタの調整を行います。

ENTERおよびLEAVE命令は、x86アセンブリ言語においてサブルーチンでのスタック操作を簡略化し、スタックフレームの作成と解放を効率的に行うための手段です。ただし、最近のコンパイラでは、これらの命令はあまり使用されず、代わりにより最適化された手法が採用されることがあります。

BP（Base Pointer）はx86アーキテクチャのレジスタの一つで、主にスタックフレーム内での相対的なアドレス計算に使用されます。BPレジスタは通常、現在のスタックフレームのベースアドレスを指す役割を果たします。

BPレジスタには次のような役割があります：

スタックフレームへのアクセス:
- BPレジスタは、特にサブルーチン（関数やプロシージャ）内でのローカル変数や引数、以前のスタックフレームへのアクセスに利用されます。通常、スタックフレームの先頭を指し示すことが多いです。
相対アドレス指定:
- BPをベースにして相対的なアドレス指定が行えます。例えば、[BP+4]のように記述すると、BPレジスタが指すアドレスから4バイト後ろのアドレスを指定します。
デバッグ目的:
- デバッガにおいて、BPレジスタはスタックフレームの特定のアドレスに対するアクセスを容易にします。デバッグ時にローカル変数や関数の引数へのアクセスに使用されることがあります。

一般的に、BPレジスタはサブルーチン内でのスタックフレームのアクセスや相対的なアドレス指定に利用されます。しかし、最近のコンパイラは最適化や高度なアセンブリ生成により、BPの利用を最小限に抑え、スタックフレームのアクセスにはより効率的な方法を採用することがあります。

x86アーキテクチャにおけるスタックフレームは、関数（サブルーチンやプロシージャ）が実行される際に、ローカル変数、引数、戻りアドレスなどの情報を格納するメモリ領域です。スタックフレームは、関数呼び出し時にスタック上に動的に生成され、関数の実行が終了すると破棄されます。典型的なx86アーキテクチャにおけるスタックフレームの構造は以下のような形です：リターンアドレス: 関数が終了した後に戻るべき次の命令のアドレスを示す値が格納されます。通常、関数呼び出し前にプログラムカウンタの値（次に実行される命令のアドレス）がスタックにプッシュされます。ベースポインタ（BP）: スタックフレーム内での相対的なアドレス指定のために使用されるベースポインタが含まれます。BPは通常、現在のスタックフレームの始めを指し示します。ローカル変数: 関数内で定義されたローカル変数や一時的な変数がスタックフレーム内に確保されます。これらの変数は通常、BPレジスタを基準に相対的な位置に配置されます。引数: 関数に渡された引数もスタックフレーム内に格納されます。引数は通常、関数のプロローグでスタックにプッシュされます。スタックフレームの構造は、コンパイラの呼び出し規約によって異なる場合があります。一般的な規約には、引数の受け渡し方法、スタックのクリーンアップ方法、レジスタの使用方法などが含まれます。これらの規約は、関数呼び出し時にスタックフレームの構築と解放を効率的に行うために使用されます。

X86/X64の動作モード

X86/X64アーキテクチャには主に4つの動作モード（エグゼクティブモード）があります。

リアルモード: 初期の16ビット環境で、1MBのメモリ空間、直接ハードウェアアクセス、セキュリティ機能なし。システム起動時とBIOS処理で使用されます。
プロテクトモード: メモリ保護、マルチタスク、特権レベル（リング）の概念を導入。セグメンテーションとページング機構により、プロセス間の分離を実現します。
仮想8086モード: プロテクトモード内で16ビットのリアルモードアプリケーションを実行するための互換性モード。
ロングモード: 64ビット環境で、R0〜R15のレジスタ、理論上256TBのメモリ空間、64ビットポインタを提供。下位互換性を保ちながら、大規模な計算処理を可能にします。

リアルモード

リアルモードは、x86プロセッサの初期の動作モードで、Intel 8086プロセッサ以来の最も基本的な実行環境です。

このモードでは、プロセッサは16ビットのセグメント方式でメモリを扱い、1MBまでのメモリ空間しかアクセスできません。セグメントとオフセットを組み合わせてメモリアドレスを生成し、プログラムは直接ハードウェアに干渉できる非常に低レベルな環境で動作します。

リアルモードは、オペレーティングシステムの起動時や、BIOSルーチンの実行、ブートプロセスの初期段階で使用されます。セキュリティ機構や保護機能が存在せず、プログラムは制限なくハードウェアを直接操作できるため、現代のマルチタスク環境では使用されません。

プロテクトモードやロングモードへの移行により、リアルモードは徐々に重要性を失いましたが、システム起動の最初の段階では依然として重要な役割を果たしています。

プロテクトモード

プロテクトモードは、インテル x86アーキテクチャにおけるCPUの動作モードで、マルチタスキングとメモリ保護を実現する重要な仕組みです。

このモードでは、オペレーティングシステムが複数のプロセスを安全に実行できるようになります。各プロセスは独立したメモリ空間を持ち、他のプロセスのメモリ領域に不正にアクセスすることを防ぎます。セグメンテーションとページング機構により、プロセス間の分離と保護を実現しています。

特権レベル（リング0〜リング3）の概念を導入し、オペレーティングシステムカーネル（リング0）と、アプリケーション（リング3）の間にセキュリティ境界を設けています。これにより、システムの安定性とセキュリティが大幅に向上しました。

プロテクトモードは、リアルモードから進化し、32ビットコンピューティングの基礎を築いた重要な技術的breakthrough（画期的な技術革新）と言えます。現代のオペレーティングシステムの多くは、このモードの上に構築されています。

仮想8086モード

仮想8086モードは、プロテクトモード内で16ビットのリアルモードアプリケーションを実行するための特殊な互換性モードです。

このモードは、古いDOS時代のアプリケーションやゲームを、より新しい32ビットのオペレーティングシステム上で実行するために開発されました。仮想8086モードは、各16ビットプログラムに仮想の8086プロセッサ環境を提供し、それぞれを独立した仮想マシンのように扱います。

主な特徴として、各プログラムは独自の仮想アドレス空間を持ち、他のプログラムから分離されます。オペレーティングシステムは、これらのプログラムのメモリアクセスや割り込み要求を管理し、システムの安定性を維持します。

しかし、仮想8086モードには制限もあり、完全な16ビットリアルモードの環境を再現できるわけではありません。特に、直接ハードウェアにアクセスする部分では制約があります。

Windows 95からWindows XPの初期バージョンまで、この仮想8086モードは古いDOSアプリケーションの互換性維持に重要な役割を果たしました。現代のオペレーティングシステムでは、エミュレーションや仮想マシン技術に置き換えられつつあります。

ロングモード

ロングモードは、x86-64アーキテクチャにおける64ビット動作モードであり、プロセッサの重要な拡張機能を提供します。このモードでは、従来の32ビット環境から大きく進化し、64ビットレジスタと広大なメモリアドレス空間を実現しています。

CPUは、R0からR15までの新しい汎用レジスタを導入し、RAXがR0に対応するなど、レジスタ体系を大幅に拡張しました。これにより、より大規模で複雑な計算処理が可能となり、理論上256テラバイトのメモリにアクセスできるようになりました。

また、ロングモードは下位互換性を維持しており、32ビットコードの実行も可能です。64ビットオペレーティングシステム専用のこのモードは、レジスタ数の増加とメモリアドレス空間の拡大により、高性能な計算環境を提供しています。これは現代のコンピューティングにおける重要な技術的進歩の一つと言えるでしょう。

フラットメモリモデル

フラットメモリモデルは、コンピューターのメモリアクセス方式の一つで、プログラムが連続した単一のメモリ空間として物理メモリを扱うアプローチです。

このモデルでは、メモリは1次元の連続したアドレス空間として扱われ、セグメンテーションや複雑なメモリマッピングを必要としません。各メモリ位置は、オフセットによって直接アクセス可能な単一の大きなメモリ空間内に配置されます。

フラットメモリモデルの主な利点は、メモリアクセスの簡素化と効率化です。プログラマーは複雑なメモリセグメンテーションを意識することなく、直接的かつ線形的にメモリを扱えます。これは特に64ビットアーキテクチャで顕著で、広大なメモリ空間を均一に扱えることから、現代のオペレーティングシステムやアプリケーションで広く採用されています。

このモデルは、特にx86-64アーキテクチャのロングモードにおいて典型的に実装され、効率的で直感的なメモリ管理を可能にしています。

X86S

X86Sは、Intelが提案した新しいCPUアーキテクチャのバリエーションで、従来のx86アーキテクチャを簡素化したものです。この設計は、歴史的なレガシー機能を削除し、64ビットモードのみに焦点を当てています。X86Sの「S」は「Simplification（簡素化）」を意味し、モダンなコンピューティング環境の要件に合わせて設計されています。

概要: X86Sアーキテクチャは、64ビット（x64）アーキテクチャをベースに、レガシーな要素やモード（例えばリアルモードや16ビットプロテクトモード）を排除しています。これにより、CPUの設計と動作が合理化され、プログラムの開発やパフォーマンスの向上が期待されます。
特徴: 64ビットモードのみ: X86Sは64ビットモード専用であり、32ビットモードや16ビットモードはサポートされません。; レガシーサポートの排除: リアルモードやセグメンテーションなど、過去のアーキテクチャで必要だったレガシーなメモリモデルや命令セットが削除されています。; 簡素化されたブートプロセス: 従来のx86アーキテクチャで複雑だった初期化とブートプロセスが簡略化され、現代のOSの要件に合わせたシンプルな設計になっています。; 高速化と効率化: 不要なレガシー機能を排除することで、CPUの動作が効率化され、パフォーマンスの向上が見込まれます。
利点: 開発の簡素化: 64ビットモードのみをサポートすることで、開発者は複雑な互換性問題を避け、最新の技術に集中できます。; パフォーマンスの向上: 不要なセグメンテーションやレガシーモードの排除により、効率的なコード実行が可能になります。; セキュリティの強化: 不要な古いモードを削除することで、セキュリティリスクが低減し、攻撃の可能性が減少します。
使用ケース: モダンOS: X86Sは、64ビットOS専用に設計されており、WindowsやLinuxなどの現代のオペレーティングシステムが、X86Sアーキテクチャ上での動作を効率的に行うことができます。; 組み込みシステムとサーバー: 過去のアーキテクチャに依存しないことで、組み込みシステムやサーバー向けのCPU設計が簡素化され、コスト効率とパフォーマンスが改善されます。
比較

x86/x64とX86S
特徴	x86/x64	X86S
メモリモード	16ビット、32ビット、64ビット	64ビットのみ
セグメンテーション	あり	なし
レガシーサポート	豊富	限定的
ブートプロセス	複雑	簡素化されたプロセス

考慮点: X86Sは新しい試みであり、既存のレガシーソフトウェアを直接サポートしないため、移行に際してはアプリケーションの互換性や移行計画が必要です。ただし、レガシー機能を切り捨てたシンプルな設計により、モダンなアプリケーション開発の基盤として期待されています。

x86とx64の差異

x86とx64（AMD64とも呼ばれる）は、IntelおよびAMDによって開発された異なる命令セットアーキテクチャです。以下は、主な相違点です。

アドレス空間: x86は32ビットのアドレス空間を持ち、最大4GBの物理メモリにアクセスできます。一方、x64は64ビットのアドレス空間を持ち、理論的には大規模なメモリにアクセス可能です。
レジスタ: x86の汎用レジスタ（EAX、EBX、ECX、EDX）は32ビットですが、x64ではこれらが64ビットに拡張され、さらに追加の汎用レジスタ（R8～R15）も使用できます。
命令セット: x64は、新しい命令や拡張された命令セットを提供し、パフォーマンスや機能の向上を実現しています。
引数の渡し方: x86ではスタックを用いて引数を渡しますが、x64では最初の数個の引数がレジスタで渡されます（WindowsではRCX、RDX、R8、R9など）。
システムコール: x86ではINT命令が用いられるのに対し、x64ではSYSCALL命令が使用され、パフォーマンスが向上します。
浮動小数点演算: x64はSSEやAVXなどの拡張命令セットを標準搭載し、効率的な浮動小数点演算が可能です。x64ではSSEサポートが前提であり、x86では80x87 FPUの存在すら仮定できません。

これらの違いは、プログラムのパフォーマンスや機能性に大きな影響を与えます。それぞれのアーキテクチャの特性を活かし、最適な開発環境を選択することが重要です。