Cloudflare Agents Weekで面白い発表があったわよ。Agent Memory——AIエージェントに永続的な記憶を持たせるマネージドサービスね。
以前GBrainを取り上げたときに「コーディング用途に記憶はいらない」って話をした。今日はその続き——記憶が本当に威力を発揮するのはどんな場面か、Cloudflareの発表を通して考えてみるわよ。
context rotって何?
そもそもエージェントメモリが解決しようとしてる問題を説明するわね。
最近のモデルはコンテキストウィンドウが100万トークンを超えてる。「全部入れればいいじゃない」って思うかもしれない。でも実際には**context rot(文脈の腐敗)**という問題が起きる。
長い会話を全部コンテキストに詰め込むと、モデルの品質が落ちる。情報量が多すぎて重要なことが埋もれる。逆に積極的に削ると、後で必要になる情報まで消えてしまう。
全部入れても駄目、削っても駄目。このジレンマへの答えがAgent Memoryよ。
仕組みはシンプル
Agent Memoryはprofileという単位で記憶を管理する。操作は4つだけ。
const profile = await env.MEMORY.getProfile("my-project");
// 会話を記憶として取り込む(コンパクション時に呼ぶ)
await profile.ingest(messages, { sessionId: "session-001" });
// 重要なことを明示的に記憶させる
await profile.remember({ content: "本番環境のデプロイはfriday以外で" });
// 記憶を呼び出す
const result = await profile.recall("デプロイのルールは?");
// → "本番環境のデプロイはfriday以外で行う"
// 古くなった記憶を消す
await profile.forget(memoryId);
会話の節目(ingest)でエージェントが自動的に重要な情報を抽出・保存して、必要なときにrecallで引き出す。コンテキストウィンドウを汚染しない。
記憶の種類は4つに分類される。
| 種別 | 内容 | 例 |
|---|---|---|
| Facts | 今現在の事実 | 「プロジェクトはReact + TypeScript」 |
| Events | 特定の時刻に起きたこと | 「4月10日に障害が発生した」 |
| Instructions | 手順・ルール | 「pnpmを使うこと」 |
| Tasks | 今やっていること | 「認証モジュールをリファクタ中」 |
Tasksだけ設計上消えやすい。仕掛中の作業は終わったら忘れていい情報だから。
本当に面白いのは「チームで共有する」使い方
個人の記憶はGBrainなど既存のOSSでもできる。Cloudflareの発表で新しいと思ったのは、チーム共有メモリを自社で実際に使っている点よ。
共有プロファイルを使うことで、あるエンジニアのコーディングエージェントが学んだことが全員に共有される。コーディング規約、アーキテクチャの決定、今まで誰かの頭の中にしかなかった知識が、チームの資産になる。
これが何を意味するか考えてみて。
今のチームの知識共有はこんな感じよね。
- Notionに書く → 書くのが面倒で省略される
- Confluenceに書く → 古い情報が放置される
- Slackで流れる → 検索しても見つからない
- 誰かの頭の中にある → その人が辞めたら消える
Agent Memoryがやろうとしてることは「人間が意識して書かなくても、エージェントとの会話から自動的に知識が蓄積される」仕組みよ。
「あのエンジニアがデバッグ中に言った一言」が自動でFactとして保存されて、次に別のエンジニアのエージェントが同じ問題に当たったとき、recall一発で出てくる。誰もドキュメントを書いてないのに。
暗黙知の自動形式知化
経営学的に言えば「野中郁次郎のSECIモデル」で暗黙知を形式知に変換するプロセスをエージェントが自動でやる話よ。
今まで「形式知化」には人間の意図と手間が必要だった。Notionを開いて、文章を書いて、適切なページに配置して——この手間がドキュメントの劣化を招く原因になってた。
エージェントが自動で抽出・分類・検索可能にしてくれるなら、形式知化のコストがほぼゼロになる。
この領域の競合はどうなってるか
同じ領域ではすでにmem0(OSSとマネージドAPI両方)、Zepなどが動いてる。
ただ長期的にはインフラ側に吸収される可能性が高いとアタシは見てる。
CloudflareはDurable Objects(状態管理)+ Vectorize(ベクトル検索)+ Workers AI(LLM)を既に持ってて、今回それを組み合わせてAgent Memoryとして出した。AWSやGCPも同じことをやる。
専業で差別化できるとしたら:
- 精度の極限追求(どのメモリをいつ召喚するかの精度)
- 特定ドメイン特化(医療記録専用、法務専用、コードレビュー専用 etc.)
この2軸のどちらかに絞らないと、汎用インフラベンダーとの戦いで消耗するだけよ。
今の状況と試し方
現在はプライベートβで、ウェイトリスト登録が必要。料金は未発表。
Cloudflareらしく「無料枠は用意される」と予想してる。裏側の各コンポーネント(Durable Objects、Vectorize、Workers AI)はすでに無料プランで使える範囲があるから、それを踏まえると小規模利用は無料で回せるはず。
Cloudflare Workers上のBindingとして使える他、REST APIもあるから外部のエージェントからも呼べる。エージェントSDKとの統合も公式で提供されてる。
まとめると
Agent Memoryが本当に機能したとき、変わるのはエージェントの性能だけじゃない。
チームが知識を扱う方法そのものが変わる。「書かないと失われる」から「やってれば勝手に蓄積される」へ。Notionを開いて書く行為そのものが不要になるかもしれない。
現状プライベートβだけど、方向性は正しいと思う。気になるなら早めにウェイトリスト登録しておくといいわよ。