最近のAIについて考えていること。
先日のOpenAI Dev Dayの発表をきっかけに、昨年から続く生成AIの台頭にますますの拍車がかかっているように感じています。生成AIがもたらす多岐にわたる影響の中でも、特にITサービスのプロダクト設計に関わる近い未来の話を見解を述べたいと思います。
- 「エージェント」。 テキストや画像などのコンテンツを生成するAI、チャットボットに留まらない「エージェント」の時代へ。エージェントは、特定の指示を持ち、追加知識を活用し、タスクを遂行するためにモデルやツールを呼び出すことができる目的に応じたAI。
- 「個別化指向」。人がシステムに合わせるのではなく、システムが人に合わせる時代へ。
- ITサービスの
先日のOpenAI Dev Dayの発表では、GPT4のチューンアップ版、誰でも自然言語でAIアプリがつくれるGPTs、開発者向けには、マルチモーダルに対応したAPI、JSONモード、Function Callingの複数対応などの重要なリリースが多数含まれています。 [OpenAI がまたやった!OpenAI DevDay 総まとめ|ChatGPT研究所](https://chatgpt-lab.com/n/n0554df7f1b80)
発表では「エージェント」という用語が多用されており、単なるコンテンツの生成やチャットボット以上の可能性をその言葉にみている方もいるようです。
[オペレーティング・システムから、オペレーティング・エージェントへ|深津 貴之 (fladdict)](https://note.com/fladdict/n/nf4c104d4ed2b)
> OpenAIはChatGPTを「言語で命令できるオペレーティングエージェント」と位置付け、人生のあらゆるタッチポイントで新たなゲートキーパーとなろうとしているように思える。
深津さんの記事では、人間のユーザーがサービスを呼び出し、サービスがGPTを呼び出すのではなく、
OpenAIが目指すのは、人間のユーザーがまずエージェント(GPT)に命令し、エージェントがサービスを呼び出す構造を目指しているのではないかと考察されています。
Layer Xの松本さんは、次の記事で
[Labsから事業部へ、生成AIによるプロセスのリデザイン|Matsumoto Yuki](https://note.com/y_matsuwitter/n/nf6a1b781d447)
> チャットや対話は確かに真新しく面白いものなのですが、上手く業務を改善するにはPromptのリテラシーという非常に高い壁がそびえ立つためです。
> リデザインとは、あくまで人を中心に置き、人の業務をアシストするAIを組み合わせて新たな業務プロセスを生み出すことと考えています。
> そして、これまでのSaaSでは「システムに人が合わせる」という時代でしたが、LLMを組み合わせることで「人にシステムが合わせる」が実現できる時代が来ました。
OpenAIの発表後に [[Copilot Workspace]]は、人間が書いたIssueを起点にCopilotがIssueに対応した仕様を書き、実装計画を示し、それに沿ってコーディングや既存のコードの修正を行い、ビルドをしてエラーがあれば修正まで行う。
エンドユーザーを起点に、サービス設計、アプリケーション設計、インフラ設計が決まっていく流れ。
クラウド事業者の方向性は、AIを作りたい事業者と、使いたい事業者がある。
AIを作りたい事業者は、OpenAIにフロントの座を渡したくないと考えるでしょう。国家的にもGPTではなく国産のAIを普及させたい思惑もあるかもしれません。そうすると、さくらのGPUクラウドのようにモデルを学習するための計算機基盤が必要です。モデルの学習だけでなく、モデルを使いやすくするためのシステム開発も必要になります。チャットUIや、先日のGPTsのような特定のタスクに特化したエージェントを作成・公開するアプリケーションが必要になります。こうしたアプリケーションを高速に開発・デプロイする基盤が必要となるでしょう。
- 一般ユーザー向け:レンサバのような一般ユーザー向けには、自然言語で作りたいサイトを表現すれば、コンテンツが生成され、ホスティングまでやってくれる。
- そもそもウェブサイトを作る時代ではなくなる可能性もあります。エンドユーザーはエージェントを介してサービスを使用するのであれば、サービスが提供するのはサイトではなくAPIやUIの部品のようなもののみになるかもしれません。それらを用いて、エージェントがその都度、ユーザーに最適化されたUIを動的に生成するようになるかもしれません。
- プロユーザー向け:さくらのクラウドのユーザーのようなITエンジニア向け。エージェントを介する前提であれば、ITサービス提供者としてはAPIサーバを高速で開発できるようなクラウド基盤が必要になるかもしれません。Copilot Workspaceで、アプリケーションコードが生成されるようになれば、そのあとはそのコードを直接クラウドに展開する