エージェント型 AI とは
エージェント型 AI は、人間の介入を最小限に抑えながらデータやツールと対話するように設計されたソフトウェアシステムです。エージェント型 AI (AI エージェントとも呼ばれる) は目標指向の動作に重点が置かれており、手順のリストを作成してそれを自律的に実行することでタスクを達成します。
エージェント型 AI は、自動化に大規模言語モデル (LLM) のクリエイティブな能力を組み合わせたものと考えることができます。エージェント型 AI を実際に稼働させるには、LLM に外部ツールへのアクセスを提供するシステムと、AI エージェントがそれらのツールをどのように使用すべきかを指示するアルゴリズムを作成します。
エージェントがツールと通信する方法にはオーケストレーションが使用され、フレームワークによってはフローやグラフが必要になります。このアプローチにより、LLM は「推論」を行い、質問に回答する最善の方法を決定することができます。たとえば、利用可能な情報に基づいてクエリに回答できるかどうかや外部検索が必要かどうかを判断することができます。
エージェント型 AI ができること
AI エージェントは、他のソフトウェアツールの上に配置され、それらを操作するエンティティであると捉えることができます。エージェント型 AI は、物理的な構造の中で、または、ソフトウェアプログラムとして提供され、その 2 つの組み合わせたものもあります。
ロボットシステムの AI エージェントは、カメラ、センサー、モニターを使用して環境に関するデータを収集し、その情報をソフトウェアと並行して実行して、次のステップを決定します。これはセンサーフュージョンと呼ばれるプロセスです。
一方、ソフトウェア環境におけるエージェント型 AI は、API、オンライン検索、テキストプロンプト、データベースなど、エージェントが知覚や文脈を認識するのに役立つ他のソースからデータを収集します。
エージェント型 AI の特殊な機能について、もう少し詳しく見ていきましょう。
エージェント型 AI は適応型で動的
エージェント型 AI は過去のパターンやデータから学習します。つまり、受信した新しい情報や変化する情報に基づいて、リアルタイムで戦略を変更できます。従来のワークフローは前進するだけですが、エージェント型 AI ワークフローは前進と後退が可能で、進行中に後戻りしてエラーを修正することができます。言い換えれば、エージェント型 AI はニーズをプロアクティブに予測し、自身の作業に反映させることができます。
たとえば、自動運転車はエージェント型 AI を使用して、道路上のゴミとリスの違いを感知する能力を向上させることができます。自身の動作を継続的に監視し分析することで、動作の結果を改善できます。
エージェント型 AI はタスクを自主的に管理し完了できる
エージェント型 AI は、自律型 AI とも呼ばれます。人間のユーザーや別の AI エージェントに代わって、他の AI システムやデジタル・インフラストラクチャと通信し、連携する能力があるからです。
たとえば、夕食にスパゲッティを作りたいと AI エージェントに伝えるとします。すると AI エージェントは必要な手順、つまり、レシピの検索、材料リストの作成、地元の食料品店から自宅への材料の配達注文を完了することができます。
エージェント型 AI には「連鎖」能力がある
これは、AI システムが 1 つの要求に応じて一連のアクションを実行できることを意味します。たとえば、AI エージェントに「Web サイトを作成する」ように依頼すると、そのタスクを実行するために必要なすべての手順を実行できます。つまり、AI エージェントは 1 つのプロンプトから、サイト構築のためのコード作成、ページへのコンテンツの追加、ビジュアルのデザイン、応答性のテストといったタスクを実行できます。
Red Hat のリソース
エージェント型 AI のメリット
エージェント型 AI が特に有用なのは、継続的な監視や迅速な意思決定を必要とするタスクです。エージェント型 AI には次のようなメリットがあります。
生産性の向上 - AI エージェントにタスクの権限を委任することで、組織に付加価値をもたらす取り組みにさらに重点を置くことができます。24 時間、年中無休で働くインターンのようなものです。
コストの削減 - エージェント型 AI は人為的エラーを削減し、非効率性、見落とし、ミスによって生じるコストをなくします。
情報に基づいた意思決定 - エージェント型 AI は機械学習を使用して、人間では不可能なほど大量のリアルタイムデータをフィルタリングし、処理します。より大規模で良質なデータプールから洞察を得ることで、より優れた予測と戦略が可能になります。
ユーザーエクスペリエンスの向上 - 従来、自動化されたワークフローを作成するには、エンジニアリングとコーディングの専門知識が必要でした。エージェント型 AI を使用すると、ChatGPT などのプラットフォームで対話するのと同じように、平易な言葉で対話できます。
エージェント型 AI のユースケース
独自の機能を持つエージェント型 AI は、さまざまな目的に使用できます。ここでは、さまざまな業界の現場におけるエージェント型 AI の使用例をご紹介します。
- 事業運営においては、サプライチェーンの管理、在庫レベルの最適化、需要の予測、物流の計画に AI エージェントを使用できます。
- 医療分野では、患者とのやり取り、ニーズの監視、治療計画の実行、パーソナライズされたサポートの提供に AI エージェントを使用できます。
- ソフトウェア開発では、デバッグコードの自動生成、開発ライフサイクルの管理、システム・アーキテクチャの設計にエージェント型 AI を使用することで、効率が向上する可能性があります。
- ソフトウェア運用では、ネットワークやその他の IT インフラストラクチャまたはサービスの自律運用にエージェント型 AI を使用できます。
- サイバーセキュリティでは、ネットワークトラフィックの監視、問題の検出、脅威へのリアルタイム応答を支援する AI エージェントが役立ちます。
- 研究者は、実験の設計と実行、データの分析、新たな仮説の策定にエージェント型 AI を使用できます。1 人の人間 (または研究者のグループ) よりも迅速に作業できるため、イノベーションのペースを加速できます。
- 金融および貿易においては、エージェント型 AI による機能強化が可能です。エージェント型 AI は、リアルタイムのデータストリームにアクセスして市場動向を継続的に分析し、取引の決定を下し、戦略を調整することができます。
エージェント型ワークフローとは
エージェント型 AI により、自立して動作し、効果的に連携し、データとのインタラクションから学習することが可能なインテリジェントシステムの構築へとさらに近づきます。エージェント型 AI は、エージェント型ワークフローと呼ばれるプロセスによって機能します。
エージェント型ワークフローは、AI エージェントが管理および完了する、構造化された一連のアクションです。完了すべき目標が与えられると、AI エージェントは 1 つのタスクを小さな個別の手順に分割し、それらの手順を実行することでワークフローを開始します。
この一連の手順を実行するために、AI エージェントは自身のバージョンを他にも複数起動し、マルチエージェント・システム (MAS) を作成します。このワークフローでは、メインエージェント (メタエージェント、オーケストレーター、スーパーバイザーとも呼ばれる) が他のエージェントにタスクの権限を委任し、値を割り当てて、フィードバックループでメモリーと対話します。権限を委任されたエージェントは連携し、目標が完遂するまで並行して作業を進めます。
この MAS 内では、各エージェントは、システム内で独立して機能することも協調して機能することもできる内部構造で構成されています。このコラボレーションは、個人の知識、過去の経験、信念の状態に関するコンテキストを提供する共有メモリーストアに依存します。
エージェント型 AI と生成 AI
生成 AI が作成に重点を置くのに対し、エージェント型 AI は実行に重点を置きます。生成 AI は、予測モデリングと線形回帰を使用して新しいコンテンツを作成します。エージェント型 AI は、数学的システムを使用して予測モデリングに基づく意思決定を行いますが、ユーザーに代わって 1 つまたは一連のアクションを実行するという点で、さらに一歩進んでいます。
生成 AI は、入力されたプロンプトに基づいて出力を作成します。エージェント型 AI は、アクションを開始する能力を備えているという点で従来の AI とは異なります。たとえば、AI エージェントは、アクセスできる情報に基づいて独自の追加のプロンプトと出力を作成できます。
エージェント型 RAG とは
検索拡張生成 (RAG) は、LLM を代替指示プロンプトまたは外部リソースにリンクさせて生成 AI アプリケーションからの回答精度を高める手法です。エージェント型 RAG は、LLM が単に取得するのではなく積極的に調査できるようにすることで、従来の RAG をさらに一歩進化させました。
RAG はアクセスできるドキュメントやデータセットから回答を取得し、コンテキストを提供できますが、手動のプロンプトエンジニアリングに依存しています。また、従来の RAG はコンテキスト認識が限られており、最初のクエリのみに依存して関連情報を取得します。
それに比べてエージェント型 RAG は洗練されており、動的です。明示的に指示されなくても、独自の質問を考え出し、メモリーからコンテキストを作り出し、追加のタスクを実行することができます。従来の RAG を超えたこの機能により、エージェント型 RAG は、人間の介入に頼ることなく、ユーザーに代わってより情報に基づいた意思決定を行うことができます。
たとえば、従来の RAG では、チャットボットに質問して、ある会社の返品ポリシーを表示させることができます。エージェント型 RAG では、質問すると返品ポリシーが表示され、返品の手続きを開始するよう促されます。すると、AI エージェントが、ユーザーに代わって返品フォームに注文番号を記入し、返金のためのクレジットカード情報を確認し、取引を完了するという一連の作業を実行します。
エージェント型 AI の制限と考慮事項
エージェント型 AI は、多くのシステムにイノベーションとスピードをもたらします。しかし、倫理的および技術的にまだ解決されていない問題があります。たとえば、エージェント型システムが企業の価値観と一致していることを、どうすれば確認できるでしょうか。エージェント型 AI がミスを犯した場合、誰が責任を負うのでしょうか。場合によっては、エージェントが出力として提示する結論にどのように到達したのかがよくわからないという点で、透明性の課題があります (いわゆる「ブラックボックス」問題)。
プライバシーとセキュリティの観点から、私たちが構築または使用する AI モデルを慎重に扱うことが重要です。つまり、データフローが保護されるよう、アーキテクチャにセキュリティパラメーターが備わっていることを確認します。
また、エージェント型 AI には、多くの処理能力やストレージのニーズなど、大量のコンピューティング・リソースが必要であることにも注目すべきでしょう。環境への影響に留意することが重要です。
そして、他の先進テクノロジーと同様、習得が容易ではないことを認識する必要があります。LLM エージェント型ワークフローの実装と管理には、特にエンタープライズレベルでは専門的なスキルが必要です。
Red Hat のサポート内容
生成 AI のメリットの実現をまだ模索している組織にとって、AI エージェントは具体的なビジネス価値を見つけるための鍵となる可能性があります。Red Hat® AI と当社の AI パートナーエコシステムは、エージェント型ワークフローの構築と AI エージェントの拡張のためのフレームワークの設計に役立ちます。
Red Hat Enterprise Linux® AI は InstructLab のエージェント・オーケストレーションであり、エージェント型ワークフローで使用される LLM と SLM のファインチューニングに使用できます。
Red Hat OpenShift® AI は、マルチエージェント・システムを作成するための統合プラットフォームを提供します。さらに、AI エージェントが使用するアダプティブラーニングと推論は、OpenShift の MLOps 機能を通じて制御できます。
Red Hat 公式ブログ
Red Hat のお客様、パートナー、およびコミュニティのエコシステムに関する最新の情報を入手しましょう。