LLVM 上の TypeScript：単相化とネイティブコード生成

なぜ TypeScript に LLVM なのか？

事前（AOT）コンパイラは JIT とはまったく異なる領域で生きています。JIT はユーザーが待っている間にコンパイルするため、コンパイルのレイテンシそのものが制約になります。Perry のような AOT コンパイラは、開発者のマシン上や CI 上で一度だけコンパイルし、そのバイナリはその後何百万回も実行されます。この非対称性こそ、重量級のオプティマイザが元を取れる場所です。

LLVM は20年分のミドルエンドの成果をもたらします：ループのベクトル化、ループ不変コードの移動、グローバル値番号付け、疎な条件付き定数伝播、積極的なインライン化、エイリアス解析。 Perry の仕事は、実際に最適化できる IR をその機構に渡すことです——ここで TypeScript の型情報が生きてきます。

ローワリングパイプライン

ソースは SWC でパースされたのち、型付きの高レベル IR（HIR）へと下げられます。興味深い決定はすべて、LLVM がコードを目にする前にここで行われます。

単相化。 ジェネリックな関数やクラスは、具体的なインスタンス化ごとに特殊化されます。Rust や C++ が使うのと同じ戦略です。Stack<number> と Stack<string> は2つの独立した完全に型付けされた関数になります——そのためオプティマイザは汎用のディスパッチの塊ではなく具体的な型を扱うことになり、ジェネリクスは実行時に一切コストがかかりません。
静的ディスパッチ。 レシーバーの型がコンパイル時に判明している場合、メソッド呼び出しはハッシュテーブルの参照ではなく、LLVM がインライン化できる直接呼び出しにコンパイルされます。
直接的なフィールドアクセス。 オブジェクトのフィールドはコンパイル時のインデックスに解決されるため、プロパティの読み取りは辞書の参照ではなく固定オフセットのロードになります。

NaN-boxing とインラインローワリング

値が動的な場合、Perry は NaN-boxing を使用します：すべての値は64ビットのワードです。倍精度浮動小数点数はそのまま格納され、オブジェクト、文字列、真偽値、null、undefined は IEEE 754 の quiet NaN の未使用ビットパターンにエンコードされます。数値はゼロコストです——ボクシングも、算術のためのアロケーションも発生しません。

問題は、数値以外の値に対する操作は unpack-operate-repack のビット列を必要とすることです。これらの列が別途コンパイルされたランタイムへの呼び出しとして存在していると、LLVM からは不透明なブラックボックスに見え、その内側をまたいで最適化することができません。そこで Perry は、プロパティ読み取り、メソッドディスパッチ、オブジェクト割り当てといったホットな操作を、オプティマイザが融合・単純化できるインラインの LLVM IR として出力します。たとえばオブジェクト割り当ては、インラインのスレッドローカルなバンプアロケーションへとコンパイルされます。

LLVM IR — inline bump allocation

%off_ptr = getelementptr i8, ptr %state, i64 8
%offset  = load i64, ptr %off_ptr        ; current bump offset
%new_off = add i64 %offset, 96           ; headers + 8 fields
%sz_ptr  = getelementptr i8, ptr %state, i64 16
%size    = load i64, ptr %sz_ptr         ; block capacity
%fits    = icmp ule i64 %new_off, %size
br i1 %fits, label %fast, label %slow

なぜ Cranelift ではないのか？

Perry の最初のバックエンドは Cranelift でした——wasmtime を支えるコード生成基盤で、高速かつ予測可能なコンパイルのために作られています。出発点としては正しい選択であり、JIT やサンドボックス化されたランタイムにとっては今も優れた選択肢です。 2つの要因が乗り換えを迫りました。

オプティマイザの天井。 Cranelift は意図的に高速な単一ティアのコンパイラです：「まともなコードを素早く」というのは、JIT にとっては正しいトレードオフであり、ネイティブパフォーマンスを売りにする AOT コンパイラにとっては誤ったトレードオフです。
arm64_32。 Apple Watch は Cranelift がサポートしていない ABI （64ビット命令、32ビットポインタ）を使用しています。 watchOS をターゲットとして成立させるには LLVM が必要であり、2つのバックエンドを維持することは2組のバグ、テスト、パフォーマンス基準を維持することを意味しました。

この移行は無償ではありませんでした。ホットな操作が当初は不透明なランタイムヘルパー呼び出し経由になっていたため、最初の LLVM 専用リリースは一部のベンチマークで最大70倍も後退しました。そこから回復する過程——インラインローワリング、上記のバンプアロケータ、より良いインライン化の境界——でバックエンドは Cranelift の数値を超え、落ち着いた頃には Perry はスイート内のすべてのベンチマークで Node.js を1.7倍から24.6倍上回り、2つのタイがありました（2026年4月）。この後日談は一読の価値があります：From Cranelift to LLVM。

さらに詳しく

コンパイラ内部構造のページでは、NaN-boxing、単相化、静的ディスパッチをさらに詳しく解説しています。ブログでは、Optimizing Everything がリリースごとの最適化作業を追いかけており、Gen GC, lazy JSON, and defensible benchmarks ではベンチマーク手法（RUNS=11、中央値 + p95）について説明しています。全体像をつかむには、TypeScript ネイティブコンパイラの概要から始めてください。

LLVM 上の TypeScript

なぜ TypeScript に LLVM なのか？

ローワリングパイプライン

NaN-boxing とインラインローワリング

なぜ Cranelift ではないのか？

さらに詳しく

出力を自分の目で確かめよう