LLMトレーダーは人間と似た行動を示し、市場バブルを再現する
この論文は、大規模言語モデル(LLM)で動く自律的なAIエージェントを市場に参加させる実験で、AIの売買行動と市場全体の動きを調べた研究です。研究者は三つの主要な結果を報告します。第一に、個々のAIは人間で知られる行動パターンを示しました。第二に、そうした個別の傾向が集まると、古典的な実験市場で観察される価格ダイナミクスを再現しました。第三に、エージェントに与える「プロンプト」(指示文)を変えることで、特定の行動メカニズムを強めたり弱めたりでき、その結果としてバブルの大きさを可変にできました。
実験の舞台は、古典的な「オープンコールオークション」形式の模擬市場です。取引は練習を含めて20の主要期間で行われます。市場には現金(無リスク資産)と確率的配当を出すリスク資産があり、現金には年率換算で5%の利回りがつきます。リスク資産の配当は二つの値(0.4か1.0)が同じ確率で出るという既知の仕組みで、期待配当は0.7です。期末に全株が固定の終値で買い取られる「終端買い取り」ルールを入れることで、理論上の基準価値(ファンダメンタル値)は常に14に保たれます。各エージェントは同じ初期保有(現金100単位、株4株)で取引を始め、研究には最先端の14種類のLLMが使われました。
個別行動の面では、AIエージェントは二つの特徴を示しました。ひとつは「処分効果」(値上がりした資産は売り、値下がりした資産を保持しやすい)です。もうひとつは、最近の価格変動に重みを置いて将来価格を予想する「最近重視の外挿的期待」です。人間の投資家ではしばしば期待と実際の取引が弱く結びつくことが知られますが、この実験ではAIは人間的な摩擦(注意不足や取引コストなど)を持たないため、表明した期待が比較的直接的に取引行動に反映されました。
市場全体では、こうした個別のヒューリスティック(簡略判断)が集まって古典的な実験結果を再現しました。具体的には、需要と供給のズレを示す指標(買値と売値の差に相当するもの)が将来の価格変化を予測する力を持ち、参加者間の意見の乖離が取引量の増加と正の相関を示しました。さらに、エージェントが自分で生成する理由のテキストを抽出し、20のメカニズムからなる採点枠組みで分析したところ、バブル期には「モメンタム追随(勢いに乗る)」や「バブルを享受する」などの投機的な理由が増えることが分かりました。これにより、定量データだけでなく、エージェントの内的な思考からも行動の原因を示す証拠が得られました。
重要な介入実験では、研究者がプロンプトを工夫して特定の行動バイアスを抑えたり強めたりしました。その結果、バイアスを抑える指示はバブルの大きさを有意に減らし、逆にバイアスを強める指示はバブルを拡大しました。これは、LLMベースのトレーダーがプロンプトで「プログラム可能」であり、設計次第で市場の安定性に影響を与えうることを示唆します。ただしこの結果には重要な留意点があります。本研究はシミュレーションに基づく実験であり、使用したLLMは大部分が人間生成データで訓練されています。したがってAIの振る舞いが人間の行動パターンを反映している可能性は高い一方で、実際の現場の取引や他のAIアーキテクチャにそのまま当てはまるかは慎重に検討する必要があります。論文自体も第7節で解釈上の限界を議論しており、外部妥当性(実世界への一般化)には不確実性が残ると述べています。