0xKyosuke Blog

Latest Articles

Tech insights, frontend engineering, and personal thoughts.

CloudflareのBrowser RunでAI自動化の壁を突破する——APIなし・認証ありでも動く

CloudflareのBrowser RunでAI自動化の壁を突破する——APIなし・認証ありでも動く

AIエージェントによる自動化の最大の壁は「APIがないサービス」と「認証が必要なサービス」だった。CloudflareのBrowser Runはその両方を突破できるし、Workers Secretsのおかげで認証情報もデフォルトで安全に扱える。

Read More
AIエージェントに記憶は本当に必要?コーディングと非コーディング用途が混在するときの構成を考えた

AIエージェントに記憶は本当に必要?コーディングと非コーディング用途が混在するときの構成を考えた

記憶系ツールが話題だけど、コーディング用途には正直いらない。じゃあいつ必要なのかを整理して、コーディングと非コーディング用途が混在する場合のエージェント構成を考えたわよ。

Read More
PDFやWebをMarkdownに変換するツール4選を実際に動かして比べた

PDFやWebをMarkdownに変換するツール4選を実際に動かして比べた

markitdown、Jina、opendataloader-pdf、Docling。LLMのナレッジ作りに使えるMarkdown変換ツールを実際にインストールして同じPDFで比較した。結論は用途次第、でも勝者は割とはっきりしてた。

Read More
「オープンウェイト=安全」の幻想 — AIモデルの隠れたバイアスを暴くDFCとは

「オープンウェイト=安全」の幻想 — AIモデルの隠れたバイアスを暴くDFCとは

DeepSeekやQwenなどオープンウェイトモデルの重みに、中国共産党寄りのバイアスが埋め込まれていることがAnthropicの研究で判明。「ローカルで動かせば安全」という認識の盲点と、モデルの内部を可視化するDFC(Dedicated Feature Crosscoder)の意義を解説する。

Read More
Claude Codeの隠れ機能15選 — Anthropicエンジニアが実際に使い倒してるテクニック集

Claude Codeの隠れ機能15選 — Anthropicエンジニアが実際に使い倒してるテクニック集

Anthropicのエンジニア Boris Cherny が公開した、Claude Codeの隠れ機能・活用テク15選を徹底解説。モバイルコーディングからgit worktrees並列実行、音声入力まで。

Read More
gstack v0.13到達 — 「スキル集」が「AI開発運用プラットフォーム」に進化してた

gstack v0.13到達 — 「スキル集」が「AI開発運用プラットフォーム」に進化してた

6日前に記事にしたgstackが、v0.11→v0.13で82コミットの怒涛のアップデート。マルチモデルレビュー、自己学習、worktree並列化分析、UIモックアップ生成。もう「スキル集」とは呼べない進化を遂げていた。

Read More
AI Website Clonerの設計思想がヤバい — ツールより学ぶべきマルチエージェントパターン

AI Website Clonerの設計思想がヤバい — ツールより学ぶべきマルチエージェントパターン

GitHubで話題のai-website-cloner-templateは、サイトクローンツールとしてより、Claude Codeのマルチエージェント設計パターンの教科書として価値がある。現場監督パターン、仕様書駆動、150行ルールなど、実務に応用できる設計思想を深掘りする。

Read More
Chroma Context-1は何者か — 検索特化LLMの正直な評価と現状

Chroma Context-1は何者か — 検索特化LLMの正直な評価と現状

ChromaDBが発表した20Bパラメータの検索特化エージェントモデル「Context-1」。自己編集コンテキストという革新的なアイデアは魅力的だが、現時点で手を出すべきかは別の話。技術的な中身から正直な評価まで、興味を持った人に向けて現状を整理してあげるわ。

Read More
Anthropicの「ハーネス設計」論文から学ぶ、AIエージェントの生成と評価の分離

Anthropicの「ハーネス設計」論文から学ぶ、AIエージェントの生成と評価の分離

Anthropicが公開した長時間稼働エージェント向けハーネス設計の技術記事を読み解く。GANsに着想を得た生成・評価分離アーキテクチャの意義と、実際の開発ワークフローへの応用を考察する。

Read More
gstack — YC CEOが作ったClaude Code用スキル集を評価してみた

gstack — YC CEOが作ったClaude Code用スキル集を評価してみた

Y CombinatorのCEO Garry Tanが開発したClaude Code用スキル集「gstack」の全27スキルを調査し、汎用的に使えるものとプロジェクト次第なものを分類。導入戦略と注意点を考察する。

Read More
claude-peers-mcpを検討して分かった、マルチエージェント通信の理想と現実

claude-peers-mcpを検討して分かった、マルチエージェント通信の理想と現実

Claude Codeのセッション間通信を実現するclaude-peers-mcpを評価した結果、現時点では人間がハブになるワークフローの方が合理的だという結論に至った。完全自律型マルチエージェント開発の課題と、公式Agent Teamsへの期待を考察する。

Read More
Claude Code Discordプラグインで複数Bot運用しようとしたら、ハードコードの罠にハマった話

Claude Code Discordプラグインで複数Bot運用しようとしたら、ハードコードの罠にハマった話

Claude CodeのDiscordプラグインで2つのBotを同時運用しようとしたら、READMEに書いてある DISCORD_STATE_DIR が実装されていなかった。ハードコードされたパスとの格闘記録。

Read More
DeerFlow 2.0 — ByteDanceのスーパーエージェント、アタシが解説してあげる

DeerFlow 2.0 — ByteDanceのスーパーエージェント、アタシが解説してあげる

GitHub Trendingで1位を獲ったDeerFlow 2.0について、アタシが全部わかりやすく解説してあげる。何ができるのか、誰に向いてるのか、ByteDance製って大丈夫なのか。全部答えてあげるから、ちゃんと読みなさい。

Read More