## Memo
## Abstract
フォールト・ローカライゼーション(FL)は、デバッグ・プロセスにおいて不可欠なステップである。最近の大規模言語モデル(Large Language Models: [[LLM]])は、コード理解能力が高いため、コード内のバグを診断する上で有望な性能を示している。しかしながら、LLMは長いコンテキストを処理する性能に限界があるため、既存のLLMに基づく障害局所化は、小さなコードスコープ(すなわち、メソッドやクラス)内のバグを局所化することに留まっており、大きなコードスコープ(すなわち、ソフトウェアシステム全体)のバグを診断するのに苦労している。この限界に対処するため、本論文ではChatGPTをベースとした自動故障特定用マルチエージェントシステムAgentFLを紹介する。人間の開発者の行動をシミュレートすることにより、AgentFLはFLタスクを理解、ナビゲーション、確認の3ステッププロセスとしてモデル化します。各ステップにおいて、AgentFLは多様な専門知識を持つエージェントを採用し、各エージェントは特定のタスクを処理するために異なるツールを利用します。特に、各ステップにおける課題を克服するために、テスト行動追跡、文書誘導型検索、多ラウンド対話などの一連の補助戦略を採用する。広く使用されているDefects4J-V1.2.0ベンチマークで評価した結果、AgentFLはTop-1内の395個のバグのうち157個を特定することができ、これは他のLLMベースのアプローチを凌駕し、最先端の学習ベースの技術との補完性を示している。さらに、AgentFLの各コンポーネントが不可欠であることをアブレーション調査により確認し、ユーザ調査によりAgentFLの使いやすさを実証した。最後に、コスト分析により、AgentFLは1つのバグに対して平均0.074ドルと97秒しか費やしていないことが示された。