2024__arXiv__Towards a Middleware for Large Language Models

## Memo ## Memo with LLM この論文は「大規模言語モデル（LLM）のためのミドルウェア」についての研究提案です。主要なポイントは以下の通りです： 1. 背景と必要性：企業がLLMをサービスとして導入する際、プライバシー、コスト、カスタマイズニーズを考慮して、主要クラウドプロバイダーに依存せず自社でホスティングする「LLM as a Service」が求められています。 2. 課題：LLMの自社ホスティングには複雑さ（モデルサイズ、状態管理）、既存サービスとの統合、リソース割り当て、マルチテナンシー、モデル並列処理、スケーラビリティなどの課題があります。 3. 提案するアーキテクチャ： - ユーザーレジストリ：認証と権限管理 - スケジューラ：ワークロード割り当てと管理 - キャッシュ：計算コスト削減のための応答キャッシング - 説明可能性：信頼性向上と幻覚軽減のためのコンポーネント - 観測可能性：モニタリングと異常検出 4. LLMをゲートウェイとして活用：LLMが企業アプリケーションエコシステムの入り口として機能し、サービス発見やプロトコル適応などの伝統的なミドルウェア機能を担うビジョン。 5. 実装と評価：電卓サービスとLLMを統合した概念実証では、LLM単体より高い精度を示し、特に引数が増えると顕著な差が現れました。著者らは、この研究がLLMの企業導入を容易にし、複数サービスとの統合を可能にするミドルウェアの開発に向けた第一歩になると結論づけています。 ## Abstract 大規模な言語モデルは、自然言語の入力を処理し、学習データから得られる洞察を生成する能力で、真の人工知能に近い品質で広く人気を集めている。この進歩により、世界中の企業が自社のサービスに[[LLM]]を統合するようになった。これまでのところ、この取り組みはOpenAIの[[ChatGPT]]やMicrosoft Azureのような商用クラウドベースのソリューションが中心となっている。しかし、技術が成熟するにつれて、プライバシー、コスト、カスタマイズの必要性から、「LLM as a Service」をセルフホストすることで、大手クラウドプロバイダーから独立したいという強い動機が生まれつつある。実際には、LLMを独自にホスティングすることは、その複雑さと既存システムとの統合の問題により、大きな課題をもたらす。この論文では、LLMが完全なアプリケーション・エコシステムへのゲートウェイとして機能し、従来ミドルウェアに割り当てられていた機能をある程度吸収するような高度なユースケースにおいても、企業におけるLLMの展開と採用を促進する、将来を見据えたミドルウェア・システム・アーキテクチャのビジョンについて述べる。