CloudflareのBrowser RunでAI自動化の壁を突破する——APIなし・認証ありでも動く
AIエージェントによる自動化の最大の壁は「APIがないサービス」と「認証が必要なサービス」だった。CloudflareのBrowser Runはその両方を突破できるし、Workers Secretsのおかげで認証情報もデフォルトで安全に扱える。
Tech insights, frontend engineering, and personal thoughts.
AIエージェントによる自動化の最大の壁は「APIがないサービス」と「認証が必要なサービス」だった。CloudflareのBrowser Runはその両方を突破できるし、Workers Secretsのおかげで認証情報もデフォルトで安全に扱える。
記憶系ツールが話題だけど、コーディング用途には正直いらない。じゃあいつ必要なのかを整理して、コーディングと非コーディング用途が混在する場合のエージェント構成を考えたわよ。
markitdown、Jina、opendataloader-pdf、Docling。LLMのナレッジ作りに使えるMarkdown変換ツールを実際にインストールして同じPDFで比較した。結論は用途次第、でも勝者は割とはっきりしてた。
DeepSeekやQwenなどオープンウェイトモデルの重みに、中国共産党寄りのバイアスが埋め込まれていることがAnthropicの研究で判明。「ローカルで動かせば安全」という認識の盲点と、モデルの内部を可視化するDFC(Dedicated Feature Crosscoder)の意義を解説する。
Anthropicのエンジニア Boris Cherny が公開した、Claude Codeの隠れ機能・活用テク15選を徹底解説。モバイルコーディングからgit worktrees並列実行、音声入力まで。
6日前に記事にしたgstackが、v0.11→v0.13で82コミットの怒涛のアップデート。マルチモデルレビュー、自己学習、worktree並列化分析、UIモックアップ生成。もう「スキル集」とは呼べない進化を遂げていた。
GitHubで話題のai-website-cloner-templateは、サイトクローンツールとしてより、Claude Codeのマルチエージェント設計パターンの教科書として価値がある。現場監督パターン、仕様書駆動、150行ルールなど、実務に応用できる設計思想を深掘りする。
ChromaDBが発表した20Bパラメータの検索特化エージェントモデル「Context-1」。自己編集コンテキストという革新的なアイデアは魅力的だが、現時点で手を出すべきかは別の話。技術的な中身から正直な評価まで、興味を持った人に向けて現状を整理してあげるわ。
Anthropicが公開した長時間稼働エージェント向けハーネス設計の技術記事を読み解く。GANsに着想を得た生成・評価分離アーキテクチャの意義と、実際の開発ワークフローへの応用を考察する。
Y CombinatorのCEO Garry Tanが開発したClaude Code用スキル集「gstack」の全27スキルを調査し、汎用的に使えるものとプロジェクト次第なものを分類。導入戦略と注意点を考察する。
Claude Codeのセッション間通信を実現するclaude-peers-mcpを評価した結果、現時点では人間がハブになるワークフローの方が合理的だという結論に至った。完全自律型マルチエージェント開発の課題と、公式Agent Teamsへの期待を考察する。
Claude CodeのDiscordプラグインで2つのBotを同時運用しようとしたら、READMEに書いてある DISCORD_STATE_DIR が実装されていなかった。ハードコードされたパスとの格闘記録。
GitHub Trendingで1位を獲ったDeerFlow 2.0について、アタシが全部わかりやすく解説してあげる。何ができるのか、誰に向いてるのか、ByteDance製って大丈夫なのか。全部答えてあげるから、ちゃんと読みなさい。