Vector データベース プロバイダーの Pinecone は、AI エージェントのトークンの制約と予算超過に対処するための最適化されたソリューションを発表しました。事前に計算されたベクトル データセットを採用することで、AI エージェントの動作速度が向上し、同社は現在、これらの最適化されたベクトル セットを企業ユーザーに提供しています。
Pinecone CEOのAsh Ashutosh氏と共同創設者兼CTOのEdo Liberty氏は、公式ブログ投稿で次のように述べている:「AIエージェントは人間を追い越し、最新の知識インフラストラクチャの主な消費者となった。このエージェント駆動型AI時代では、自動化されたエージェントは反復的なタスクを実行し、厳格な総当り計算ループに陥ることが多い。」生のベクトル データ処理は、これらのインテリジェント エージェントにとって固有の非効率性とボトルネックにつながります。
このような技術的な欠点により、タスク完了率が 50% から 60% の範囲で停滞し、予測不能な遅延と過剰なトークン消費が発生します。業界では、エージェントがコンテキスト データを取得するための効率的なメカニズムとともに、エージェントのコンテキスト シナリオに合わせてデータを前処理する方法が必要です。 Pinecone は、まさにこの需要に対応するために Nexus プラットフォームを開発しました。
Nexus Knowledge Engine は、Context Compiler と Composable Retriever という 2 つのコア モジュールで構成されています。 Context Compiler は、カスタマイズされたデータ アーティファクト、つまり生のベクトル データベース レコードから構築されたタスク固有のコンテキスト データセットを生成します。これらのアーティファクトには、RBAC アクセス スコープ、バージョン コード、データ ソース、PII 識別タグなどの包括的なメタデータが追加されます。ソース資料と明確なタスク仕様に基づいて、コンパイラーは最初に、営業、財務、マーケティング、およびエグゼクティブ CEO エージェントの 4 つの事前定義されたエージェント タイプに合わせたアーティファクトを作成します。
これらのインテリジェント エージェントは、KnowQL という名前の専用の宣言型クエリ言語を利用して、Nexus システムとインターフェイスします。この言語は、意図、フィルター、来歴、出力形状、信頼性、予算制約という 6 つの基本要素で構成されます。エージェントは、生のベクトル データを直接取得するのではなく、高レベルの KnowQL 問い合わせを Nexus プラットフォームに送信します。
Nexus の Composable Retriever は、さまざまなタイプのエージェントから KnowQL リクエストを受信する役割を果たします。 Context Compiler によって処理された事前に生成されたアーティファクトに基づいて、正確な応答を返します。公式の回路図は、このメカニズムの完全な運用ワークフローを明確に示しています。
Pinecone Nexus 環境とプロセス フロー。
このプラットフォームは、複数のユーザーと多様なワークロードに対して一元的なトークン消費管理を提供します。統合されたダッシュボードには、トークンの使用状況、コスト支出、コンプライアンスのステータスが直感的に表示され、透明性のある監視が可能になります。
Pinecone 氏は、Nexus は事前に専門的な知識成果物を事前に構造化し、コンテキスト化してコンパイルし、エージェントが計算タスクを開始する前にデータを完全に準備すると説明しました。
従来のコンパイラとは異なり、反復コンテキスト コンパイラはデータ表現を継続的に最適化します。実験的なモデリングを実施し、タスクの目標に照らして出力を評価し、最終的にはエージェントの運用ニーズに完全に一致する正確な知識フレームワークに収束します。実際の使用例を以下に示します。
-
販売代理店:Gong の通話記録、販売パイプラインのフェーズ、主要なクライアントの電子メールでの会話、Slack レコードから抽出された競合情報など、統合されたトランザクション コンテキストを収集します。
-
財務エージェント: 契約条項を請求サイクル、使用量のしきい値、ビジネス拡大指標と関連付けることにより、収益関連のコンテキストを生成します。
-
マーケティングエージェント: アトリビューション データをコンパイルし、キャンペーン インタラクション レコードを Gong からのトランザクションの成功/失敗ログと結び付け、ユーザー行動データから得られる製品認定シグナルと並行します。
-
CEOエージェント:部門横断的な洞察を統合し、ARR の変動を顧客の健康スコア、採用の進捗状況、製品開発のマイルストーンと関連付けます。
Pinecone の 2 人の幹部によれば、Nexus ユーザーは、タスク完了率の向上、実行サイクルの短縮、信頼性の高い接地された出力、およびトークン消費量の最大 90% 削減という恩恵を受けることができます。この技術アップグレードにより、構造の最適化が実現します。推論リクエストごとに繰り返し計算を実行するのではなく、複雑な推論計算を独立した知識層に移行します。
Box、Unstructed、Teradata、LlamIndex、ThoughtFocus などの複数の業界企業が、Nexus プラットフォームの公式承認を発行しています。
Nexus と協力して、Pinecone は、本番環境に対応したナレッジ アプリケーションを特徴とする新しいマーケットプレイスを立ち上げました。これらの事前構築済みソリューションは、複雑な AI インフラストラクチャ構成を必要とせずに数分以内に導入できます。マーケットプレイス カタログには、販売収益、保険、不動産、法令順守、人事、顧客サービス分野をカバーする 90 を超えるすぐに使えるソリューションが含まれています。
立ち上げ段階では、マーケットプレイスは引き続き完全に無料で使用でき、市販のサードパーティ ソリューションが今後リリースされる予定です。ユーザーは公式リンクからプラットフォームにアクセスできます。
Pinecone は、月額 20 ドルの低コストの Builder 層を導入することで、ベクター データベースの価格設定も最適化しました。さらに、同社はクラウド展開の対象範囲を、eu-central-1 アベイラビリティーゾーンを備えた AWS ヨーロッパ (フランクフルト) リージョンに拡大しました。
さらに、ネイティブの全文検索機能が Pinecone のコア ベクター データベースに組み込まれており、現在パブリック プレビューで利用可能です。
Nexus と KnowQL の早期アクセス プログラムは現在、企業クライアントとパートナーに公開されています。対象となるユーザーは、金融サービス、ヘルスケア、法律サービス、エンタープライズ SaaS 業界にわたるエージェント ネイティブ アプリケーションを開発しているユーザーであり、エージェントが複雑な独自の知識データを処理する必要があるシナリオです。
北京乾興解放科技有限公司
サンディ・ヤン/グローバル戦略ディレクター
WhatsApp / WeChat: +86 13426366826
電子メール: yangyd@qianxingdata.com
ウェブサイト: www.qianxingdata.com/www.storagesserver.com
ビジネスの焦点:
ICTプロダクト流通/システムインテグレーション&サービス/インフラソリューション
20 年以上の IT 流通経験を持つ当社は、主要な世界的ブランドと提携して、信頼性の高い製品とプロフェッショナルなサービスを提供しています。
「テクノロジーを活用してインテリジェントな世界を構築する」信頼できる ICT 製品サービス プロバイダー!