KMC Staff Blog:QEMU の Microsoft x64 環境での不具合

2011年08月04日

QEMU の Microsoft x64 環境での不具合

シミュレータはメモリを大量に使うので、64 ビット Windows 環境では、できれば互換モード（32 ビットモード）ではなく、64 ビットモードで動かしたいところです。

QEMU は、Linux などの x86_64 環境では、普通に動作しています。
ならば Windows でも 64 ビットモードで動くのではないかと思い、MinGW-w64でビルドして
みたのですが、ビルド自体はできたものの、SEGV が発生してまともに動きませんでした。
原因を調査してみると、x86_64 と x64 環境の、さまざまな相違点が明らかになってきました。

- データモデルの違い（LP64 環境と LLP64 環境）

Linux, BSD, MacOS X などの、QEMU がサポートする 64 ビット OS 環境は、全て LP64 というデータモデルです。
これは、long 型とポインタ型のデータサイズが 64 ビットという意味です。(int は 32 ビット。)
そのため、ポインタを long にキャストしても、データに欠損が生じません。
QEMU の TCG (JIT) の内部では、long 型変数にホストメモリアドレス (malloc() などで確保したメモリ) を格納しているところが多々あり、この特徴は実際重要です。

一方、Microsoft x64 環境 (VC++ や MinGW-w64) では、LLP64 モデルが採用されています。
この環境では、long が 32 ビット、ポインタが 64 ビットになります。
当然、ポインタを long にキャストしてしまうと、上位 32 bit が欠損します。

ポインタの場合は警告が出るので (実際 MinGW-w64 で QEMU をビルドすると、「warning: cast from pointer to integer of different size」のような警告が大量に出ます。) まだマシなのですが、例えば uint64_t 型の変数の値を long 型変数に代入してデータが欠けた場合は (少なくとも QEMU のデフォルトの警告オプションでは) 警告が出ないため、修正は困難なものとなります。

OS とコンパイラは独立しているので、x64 環境で LP64 のコンパイラを使用するという手もあることはありますが、x64 環境を前提に書かれているライブラリなど全てを LP64 対応に修正するというのは、現実的では無いでしょう。地道に long 型変数を、intptr_t 型変数などに、適切に置き換えていくしかありません。

これは過去に QEMU の ML でも話題になったことがありますが、もともと QEMU のメンテナたちは Windows サポートに熱心ではない感じで、流されてしまった感じです。

一応 patch を公開している方がいるのですが、これはおそらく target-i386 しか確認していないのではないかと思います。（patch の詳細が不明なため、未確認。少なくとも target-arm は、次に示す呼び出し規約の問題があるので、この patch だけではまともに TCG が動くとは思えません。）

VirtualBox も QEMU の TCG を使用していて、これは 64 ビットモードでも動作しているようですが、target-i386 のみサポートというところが重要だと思います。i386 の場合は、（ホストが i386 の場合は）コード変換が不要なため、もしかしたら上記のような patch だけで動作する可能性があります。（もちろん、VirtualBox 独自の修正がされている可能性もあります。）

参考
データ型モデルー電算用語の基礎知識

- 呼び出し規約の違い

x86_64 (System V AMD64 ABI convention) 環境では、関数の第一引数は、整数データの場合は RDI レジスタに渡されます。
一方、x64 環境では、第一引数が RCX レジスタに渡されます。

ところが、QEMU の TCG は、x86_64 規約しかサポートしていません。

target-arm の TCG は、ARM 命令を x86 命令に変換し、uint8_t code_gen_buffer[] の中に書き込みます。
code_gen_buffer は、実行可能属性が付けられている特殊なホストメモリ領域です。
uint8_t *tc_ptr という、code_gen_buffer 領域内を指すポインタから、変換済みコードの実行が開始されます。

      next_tb = tcg_qemu_tb_exec(tc_ptr);

これは、以下のようなマクロです。tc_ptr を直接関数ポインタにキャストしてコールするのではなく、いったん code_gen_prologue という code_gen_buffer と同じようなバッファを経由しています。

#define tcg_qemu_tb_exec(tb_ptr) ((long REGPARM (*)(void *))code_gen_prologue)(tb_ptr)

code_gen_prologue には、以下のようなコードが生成されているのですが、これが x86_64 前提なのが問題です。（以下は KMC の社内ツールであり、一般には販売されていない PARTNER-WIN64 デバッガでデバッグした際の表示です。）

tc_ptr             = @0000000000790040

code_gen_buffer    = @0000000000790040

code_gen_prologue  = @00000000710440F0



00000000710440F0    55              push rbp

00000000710440F1    53              push rbx

00000000710440F2    4154            push r12

00000000710440F4    4155            push r13

00000000710440F6    4157            push r15

00000000710440F8    4883C480        add rsp, 0xffffffffffffff80

00000000710440FC    FFE7            jmp rdi

rdi に tc_ptr の値が入ってないので、0 番地に jmp してクラッシュしまいます。
tc_ptr に jmp できれば、その先には、以下のようなコードが生成されています。

0000000000790040    418B2E          mov ebp, [r14]

0000000000790043    BF02000100      mov edi, 0x10002     # EXCP_DEBUG

0000000000790048    41892E          mov [r14], ebp

000000000079004B    BD04000000      mov ebp, 0x4

0000000000790050    41896E3C        mov [r14+0x3c], ebp

0000000000790054    E847378470      call dword 0x70fd37a0 helper_exception

ここでも x86_64 前提の関数呼び出しコードが生成されているので、helper_exception(uint32_t excp) の引数が edi (RDI レジスタの下位 32 ビット) レジスタに渡されています。

ところが helper_exception() 関数の方は、x64 規約でコンパイルされているため、RCX に第一引数が来ると思っているので、メチャクチャになります。

参考

MSDN / x64 ソフトウェア規約 / レジスタの使用
System V Application Binary Interface AMD64 Architecture Processor Supplement (PDF)

kmckk at 09:45│コメント(0)│トラックバック(0)│qemu | 若槻

トラックバックURL

コメントする

名前
	情報を記憶評価顔星

記事検索

KMC 京都マイクロコンピュータ株式会社

2011年08月04日

QEMU の Microsoft x64 環境での不具合

「qemu」カテゴリの最新記事

トラックバックURL

コメントする