O’Reilly(オライリー)は、テクノロジートレンドを伝える自社ブログ「Radar Blog」で、2026年6月版の注目トレンドをレポートした。以下はその概要だ。
ソフトウェアエージェントがタスク実行の域を超え、複数のステップからなる操作を自律的に実行するようになっている。この変化は、最近発表されたいくつかの製品やプロトコルによって示されている。CloudflareとStripeの提携により、アカウントの作成、ドメインの登録、アプリケーションの展開を最小限の人的介入で実行できるエージェントがリリースされた。また、StripeはTempoおよびiWalletと共同で、無人での金融取引を可能にするためのマシン間決済標準を発表した。エージェントの機能がオフィス文書、ブラウザーセッション、さらには電話インターフェイスにまで拡大していることは、人間の監視を代替するのではなく、人間の生産性を増幅させる機会であると説明されている。
AIモデルの分野は多様化を続けており、大規模なオープンウェイトの競合製品と、音声、タイミング、プライバシーフィルタリング、その他のニッチなタスクに対応する専門的な小規模モデルの両方が存在する。Anthropicは、コーディングパフォーマンスを向上させ、不確かな主張をフラグ付けする可能性を高める小規模な改善として、Opus Claude 4.8をリリースした。同社は、別のMythosモデルを準備していると報じられた。Claude Codeは、多数のサブエージェントにわたる動的なワークフローを介して大規模な問題を計画するための機能強化を受け、Cowork機能により、問題に投入される計算作業を制御できるようになったとされている。
Cohereが2180億個のパラメーターと250億個のアクティブなパラメーターを持つエキスパート混合モデルであるCommand A+を発表。これは、2つのH100 GPUなどのハードウェアで実行可能なまま、最先端モデルと競合する。GoogleはI/Oで、マルチモーダル入出力用のOmni、より高速なコーディングモデルであるGemini 3.5 Flash、パーソナルエージェントを配置するGemini Spark、インテリジェントアイウェアへの新たな取り組みなど、一連の開発を発表した。AlibabaはQwen3.7-Maxを発表し、Thinking Machinesは会話の流れとターンテーキングをサポートするように設計されたインタラクションモデルをプレビューし、OpenAIは、単純な呼び出しと応答ではなく、会話への参加とアクションテイキングを目的としたリアルタイム音声モデルであるGPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisperをリリースした。
O’Reillyは、業界のコストとパフォーマンスの変化も強調した。OpenRouterのコスト比較では、GPT-5.5はトークン当たりの価格が上昇する一方で、一般的なトークン消費量が減少していることが示された。一方、Claude Opusの会話は安定した価格でより多くのトークンを使う傾向があり、月々の推論料金について疑問が生じた。GoogleのGemma 4アップデートは、マルチトークン予測によりトークン生成速度が3倍に向上したと主張し、IBMはより小さなモデルのスイートとしてGranite 4.1をリリースした。「推論の罠」を紹介する学術論文では、より優れた推論のためのトレーニングは、ツールの使用における幻覚のリスクを高める可能性もあると警告した。ニッチな取り組みとしては、歴史的な信憑性を確保するために1931年以前のデータのみでトレーニングされたTalkieや、デバイス上でPIIを削除することを目的としたOpenAIのコンパクトなプライバシーフィルターモデルなどがある。
O’Reillyはソフトウェア開発の実践における兆候をまとめ、チームがエージェントの生産性とトークンコスト、品質ベースのパフォーマンス指標とのバランスを取るにつれて、トークンマキシングの短い時代が終わる可能性があると報告した。Agentic AI Foundationは、ステートレスな動作、拡張プロセス、OAuth/OpenID標準との整合性を備えた更新されたMCPプロトコルのリリース候補を準備した。GoogleはGemini CLIからAntigravityに焦点を移した。Antigravityはデスクトップとコマンドラインで利用できるがオープンソースではないエージェント開発プラットフォームである。実験的なツールとランタイムが登場した。エージェントチームをデプロイするためのGas Town 2.0と類似のSDK、安全なサンドボックス化されたエージェント実行のためのOpenShell、大規模な人間のようなウェブインタラクションのためのFirecrawl、ループをより安価なオープンモデルにルーティングするコスト削減構成としてのDeepclaudeなどである。GitHubは、Copilotの課金を使用量ベースの価格設定に移行する一方で、リポジトリーワークフローと統合されたCopilotデスクトップアプリのプレビューを公開した。OpenAIは、既存モデル向けのファインチューニングAPIの提供終了を発表し、Codex for WorkやClaude for Office 365といったオフィス向けアシスタントの開発に注力するとともに、Outlookとの連携は別のサービスとして提供すると発表した。
O’Reillyは、AIのコストとインフラストラクチャーに関する意思決定において、モデル提供と効率的な推論がトレーニングを凌駕する「推論時代」の到来を示唆するインフラストラクチャーのトレンドを報告し、CPUがGPUと並んで相対的に重要性を増していることを明らかにした。プラットフォームの信頼性も懸念事項として浮上しており、GitHubの稼働時間に関する継続的な問題が代替案の検討を促し、推論に特化したクラウドホストがオープンウェイトモデルへのアクセスを拡張する上で注目されている。
また、O’Reillyは、攻撃者と防御者が同じAIツールセットを共有することが増え、脆弱性を修正する時間が狭まるにつれて、セキュリティーのダイナミクスは依然として深刻であると警告した。ブラウザーからのSSD I/Oを監視することで訪問したウェブサイトを推測するFROSTなどの新しい技術は、ステルス脅威として説明された。注目度の高い事件としては、サイバー犯罪グループによる悪意のある拡張機能攻撃で大手コードホスト上の数千の内部リポジトリーが侵害されたこと、および公開から1日以内にLinuxカーネルのcopy.fail脆弱性が急速に悪用されたことなどが挙げられる。OpenAIのAdvanced Account Securityは、より強力な保護のためにパスキーとハードウェアトークンに移行し、セキュリティー重視のGPT-5.5バージョンは少数の信頼できるユーザーに限定されていると報告された。Claude Codeが許可されたコマンドと認証情報をローカルの.claudeディレクトリーに保存し、公開アーティファクトに秘密情報が漏洩する可能性があることが判明し、ツールのリスクが浮上した。同時に、防御側も新たな能力を獲得した。FirefoxチームはMythosを使って、これまで知られていなかった数百もの脆弱性を発見したと報じられており、AIを活用した監査がいかに防御体制を向上させることができるかを実証した。
O’Reillyは、政策転換やウェブ全般の変化について取り上げ、arXivが不適切な使用に対して1年間の禁止措置を講じることでAI生成コンテンツに関する規則を強化したこと、中国のデータガバナンスのアプローチがデータを国家資源として扱っていること、そしてGoogleが従来の検索をGemini 3.5 Flashを搭載したAI検索に置き換える計画を発表したことなどを指摘した。このレポートにはソフトウェア以外の分野の動向も含まれており、3Dプリントされた人工卵殻が胚からヒヨコの発生を可能にするものとして紹介され、ブラジルが進めている1回接種型のデング熱ワクチンの開発は、医療主権の推進という文脈で位置付けられた。
出典:O'Reilly
この製品の詳細については、O'Reilly製品ページをご覧ください。