Robinhood:AIエージェントが代わりに取引・支出を行う未来
Robinhoodの新ツールは、AI主導の取引と金融取引を主流にする可能性がある。
- Robinhoodはユーザーに代わって取引や支出の意思決定を実行するAIエージェントを開発中。
- これらのツールは、日常の取引をAIに任せることで金融操作を簡素化することを目指す。
デイリー
2026-05-29 の厳選ニュース 10 件をトピック別に整理します。その他はアーカイブに折りたたみます。
Robinhoodの新ツールは、AI主導の取引と金融取引を主流にする可能性がある。
本稿では、人工知能が中央集権型統治と分権型統治のバランスをどのように変え、全体主義の台頭を促進する可能性があるかを考察する。歴史的に通信技術が独裁体制を強化した例を振り返り、ハイエクの知識問題やセレクター理論などの構造的メカニズムを分析。AIによる情報処理、監視、プロパガンダのコスト低下が、民主主義と独裁の間のパフォーマンス格差を縮小する可能性を論じる。
このモデルは企業の複雑なワークフローを支援し、アプリケーションに適したモードを選択できるようにします。
MCP Bridgeは、ハイブリッド検索とAIエンリッチメントを用いて、エンタープライズAPIをAIエージェントが読めるようにする課題に取り組んでいます。APIのレスポンス形状から自動的に意味のある名前と説明を生成し、ツール選択の精度を劇的に向上させます。
本記事では、2026年のDataHackサミットで講演する25人の最も影響力のあるAIパイオニアを紹介します。Google DeepMind、Microsoft AI、Walmartなどからの研究者、データサイエンティスト、創業者、企業AIリーダーが含まれ、AIの技術的限界を押し広げ、コミュニティを構築し、モデルを製品に変えています。
EUのサイバーレジリエンス法(CRA)が間もなく施行され、組織にサイバーセキュリティの責任が課せられます。報告義務は2026年9月から、完全なコンプライアンスは2027年12月から開始されます。この規制はEUで販売されるすべての接続製品とソフトウェア(AI生成コードを含む)に適用されます。主な要件は、セキュア・バイ・デザイン、ライフサイクル全体の脆弱性管理、SBOMの透明性、悪用された脆弱性の24時間以内の報告です。組織は今すぐ監査、文書化、SBOMツールの導入を進める必要があります。「AIがやった」では通用しません。
Gemini in Android Autoは運転をより安全で楽しく、生産的にし、車内の時間を待ち遠しいものに変えた。
BYDが中国初の車載グレード4nmスマート運転チップ「Xuanji A3」を発表。3チップで2100 TOPS超、専用NPUアーキテクチャにより消費電力20%削減、演算効率100%向上。王伝福氏はスマート運転中の事故を無制限に補償する方針を示した。
GoogleのCoralプラットフォームは、エッジAI向けのフルスタックソリューションを提供し、ソフトウェアおよびハードウェア開発者がローカルでAIモデルを展開できるようにします。
毎秒3000トークンを処理する高速LLMプレイグラウンド。オープンWeb UIを備えています。
2026年1月1日から、米国の700以上の病院がCMS TEAMプログラムに基づき、5つの高頻度外科エピソードの総コストと質を管理することを義務付けられます。成功には、統一されたAI対応データプラットフォームによるプロアクティブな介入が必要で、典型的な成果としてSNFコストの15%削減と再入院率の12%削減が挙げられます。
TheFoundryは、トークン消失、無限ループ、アーキテクチャドリフト、エージェント衝突といった現代のAIコーディングの重要な失敗点を解決する、ユーザーフレンドリーでエンタープライズ対応のマルチエージェントシステム(MAS)ブートストラッピングフレームワークです。プル型ワークフロー、共有カンバン、コンテキストスコーピング、ステップ予算、TOMLベースの決定論的通信、および一時的ブートストラッパーを採用し、複数の専門AIエージェントが自律的にソフトウェアプロジェクトを構築できるようにします。
SnykはEvo Continuous Offensive Security(COS)を発表し、AI生成コードとエージェント型攻撃者の時代における企業の脆弱性発見と修正のギャップを埋める。従来の年15日間のテストを継続的な代替案に置き換え、350日の空白を解消。プラットフォームのコンテキストを活用し、決定的スキャンとLLM推論を組み合わせ、ビジネスロジックの脆弱性や権限バイパスなどを検出する。
Adaptive Runtimeは、ステートフルAIシステム向けのランタイムインテリジェンス層を提供するオープンソースのPythonライブラリです。5つのコアエンジン(状態、コンテキスト、信頼度、決定、リカバリ)を備え、プロダクション環境でのクラッシュリカバリ、状態永続化、信頼度スコアリングなどの問題を解決します。GPU不要で、低コストのVPSで動作します。
PPIO は非凡産研が発表した「2026 Global AI 100」リストに選ばれました。このリストは非凡大賞 – 年次 AI グローバリゼーション成長サミットで選定され、グローバルな AI ネイティブ企業を表彰するものです。PPIO はグローバル分散型コンピューティングインフラ、フルスタッククラウドサービス、DeepSeek・GLM などのモデルプラットフォーム、革新的なエージェントサンドボックスを提供。2026年4月時点で4,800以上の分散ノードを統合し、日次トークン呼び出しは1兆回超、開発者は57万人超。また、上海市デジタル海外サービスプラットフォームのパイロットユニットやGDAパイロットサービスステーションにも選ばれています。
本記事では、AIがプログラミングのスキルを低下させている現象を、過去10年のフロントエンド開発の変化と比較して考察する。脱技能化、抽象化、漏れやすい抽象化、そしてバウハウス運動の教訓について論じる。
著者は、AIが官僚制から解放するどころか、新たな無責任な官僚制を生み出したと主張する。AIはメールの要約や経費精算のような日常業務に優れる一方、目的の理解を欠き、安全訓練によりリスク回避的になる。その結果、'ワークスロップ'を生み出し統治に抵抗する官僚機械が誕生した。AIの確率的性質と説明責任の欠如は、問題が起きても解雇できる者がいない状況をもたらす。
従来の生成AIは次の単語を予測するだけであり、正確な法的分析にはリスクが高すぎます。次世代の法務技術は、ニューロシンボリックAI(厳密な論理と法源の階層を強制)とGraphRAG(データを相互接続ネットワークにマッピングして文脈を理解)を組み合わせ、幻覚のリスクを低減し、監査可能な推論を提供します。
Pondは、Crabbox.shで関連するリースをグループ化し、互いの発見と一括解放を可能にする軽量な仕組みです。複数のトランスポートプレーン(Tailscale、URLブリッジ、SSHメッシュ)をサポートし、異なるプロバイダーを混在させることができます。この記事では、Pondの基本概念、クイックスタート、コマンド、トランスポートプレーン、ユースケース、Tailscale統合などを説明します。
Flathubはポリシーを更新し、提出されるアプリケーションおよび提出自体にAIが生成または支援したコード、ドキュメント、その他のコンテンツを含めることを明確に禁止しました。また、AIツールを使用したプルリクエストの生成、自動化、レビュー依頼も禁止されています。成熟した適切にメンテナンスされたプロジェクトには例外が認められる場合があります。
Adobeの最新AI画像アシスタント「Firefly AI Assistant」は、PhotoshopやIllustratorなどのアプリを操作してマルチステップのプロジェクトを実行できる、マルチタスクの仲介役です。編集タスクを実行するだけでなく、そのプロセスを説明し、限界も率直に認めます。結果は完璧ではないものの、そのインタラクション方法は斬新で、ユーザーがデザインスキルを学ぶのに役立ちます。
Cognitionは、Lux Capital、General Catalyst、8VCが主導する260億ドルの評価額で10億ドル以上の資金調達を発表。AIソフトウェアエンジニアDevinのエンタープライズ利用は年初から10倍以上に成長し、年換算収益は4億9200万ドルに達した。メルセデス・ベンツなどの顧客は8か月のプロジェクトを8日に短縮。Cognitionは自律的なソフトウェア開発へと移行しており、社内コードの89%がDevinによってコミットされている。
面壁智能は5月25日から29日まで、OpenBMBコミュニティと共同でエッジ大規模言語モデル(LLM)オープンソースウィークを開催し、BitCPM-CANN(1.58ビット低ビットトレーニングモデル、昇華対応)、MiniCPM5-1B(2倍のパラメータモデルを凌駕)、ForgeTrain(AIが自ら書いた訓練フレームワーク、Megatronより10%高速)、PilotDeck(エージェントOS)、UltraData(コアデータセット)の5つの成果をリリースした。これらの成果はフルスタックのシステム革新を構成し、エッジAIの競争は単一技術ではなくシステム工学であることを示している。MiniCPM5-1BはGPT-4oの一部を超え、「密度の法則」を実証。面壁智能の2年の先行と体系的な優位性が業界の変革をリードする。
Lenovoが世界初の商用AIホストシリーズを発表。一人会社(OPC)や成長企業向けに、ローカル+クラウドのハイブリッド構成でトークンコストとデータセキュリティ問題を解決。豊富なトークンプレゼントとすぐに使える設計。
次のAI創作の波はゲーム分野に来ている。テンセントがAIゲーム創作プラットフォーム「コードネームCraft」を発表。自然言語でプレイ可能なゲームを生成でき、2D/3D両対応、AIGCツールや無料アセットを備え、ゲーム制作のハードルを大幅に下げる。
テンセントは、画像、動画、UI/UX、3D生成を統合したAIクリエイティブスタジオ「Miora」を発表しました。記憶システム、マルチモーダルキャンバス、カスタマイズ可能なスキルを備え、一人でクリエイティブスタジオ全体を運用できるようにします。
本記事は、Claude CodeなどのAIコーディングエージェントにおけるセキュリティリスク(コマンドの誤解釈、認証情報の流出、プロンプトインジェクションなど)を考察する。人間による監視には「権限疲れ」の問題があり、サンドボックス、オートモード、フックなどの緩和策を紹介し、開発コンテナと最小権限の原則の重要性を強調している。
AIはクロスプラットフォームアプリ開発を1つのUIフレームワークから、エージェントがネイティブサーフェスを生成するための1つの製品グラフへと変える可能性がある。
PromptLayerは開発者向けのAI可観測性ツールです。単一のタイムラインとウォーターフォールビューでリクエスト、ワークフロー、トークン使用量、レイテンシ、コスト、障害を追跡します。マルチステップAIシステムの完全な実行パスを可視化し、デバッグを支援します。現在無料ベータ版を提供中。
AIが生成するシステムコードの影響を探る。
CodePulseは、持続的なgit差分認識インデックスを維持し、セッション開始時にコンパクトなスナップショットを注入することで、AIコーディングアシスタントのトークン予算を60~80%節約するオープンソースのコードベースインデクサーです。Claude Code、OpenAI Codex CLI、Cursorなどのツールをサポートし、タスク認識ランキング、git認識ランキング、自動バジェットなどの機能を提供します。CLI、MCPサーバー、複数の統合方法を備えています。
LithiumはPostgreSQL ltreeをベースにした階層型バージョン管理ストレージエンジンで、決定論的でスコープ指定された検索、組み込みのバージョニング、ゼロランタイム依存を提供します。MCPサーバーを介してAIツールと統合し、AIエージェントのメモリ、意思決定追跡などのユースケースに適しています。
Waylandでのクリップボード同期の問題に悩まされた著者が、Claude Codeを使ってJavaプロジェクトClipCascadeをRustに書き換え、軽量バイナリのclipboardwireを作成した。発見した要点は、AIのボトルネックはコード生成能力ではなくフィードバックの質であり、UIテストが信頼性のある反復を可能にするガードレールだということ。
この記事では、Deep Agents、LangSmith、You.com Finance Research APIを使用して構築されたマクロ経済調査エージェントを紹介します。このエージェントは、EU全27加盟国のGDPデータを分析し、異常値を検出し、約45分で引用付きのブリーフィングを作成します。アイルランドの異常な成長とドイツの縮小の詳細を分析し、トレーサビリティと監査可能性の重要性を強調しています。
オープンモーションプランニングライブラリ(OMPL)は2008年の初回リリース以来、モーションプランニングコミュニティの基盤となり、幅広い最先端のサンプリングベースのアルゴリズムを提供してきました。約20年にわたる継続的な開発を経て、OMPL 2.0はハードウェアアクセラレーションによるリアルタイムモーションプランニングを目指し、現代のAI研究ワークフローとシームレスに統合されます。
本研究では、4人用不完全情報カードゲームBig 2における自己対戦強化学習フレームワークを開発し、PPOがモンテカルロQ近似、SARSA、Q学習を上回る性能を示した。適度なエントロピー正則化がPPOの過度な決定論的方針を防ぎ、現在方針自己対戦がチェックポイント自己対戦や固定対戦者訓練より優れたカリキュラムを提供する。Big 2は不完全情報、マルチプレイヤー相互作用、遅延報酬、可変アクションセットにおける深層強化学習の制御可能なベンチマークとして有用である。
Rubyの生みの親であるYukihiro Matsumoto(Matz)は、AnthropicのClaudeを利用して、Ruby用の実験的な先行時間コンパイラSpinelを構築している。SpinelはRubyコードをCコードに変換し、MiniRubyと比較して約11.6倍の速度向上を達成しているが、evalやスレッドなどの機能が未対応という制限がある。
repo-brainは、コードベース全体を1つのMarkdownコンテキストファイルに圧縮し、最大96%の圧縮率を実現してAIトークン使用量を大幅に削減するオープンソースツールです。静的解析、アーキテクチャ解析、意味的関係の発見に対応し、複数のAIプロバイダーをサポートします。
Anthropicは9650億ドルの評価額で650億ドルのシリーズHラウンドを完了し、470億ドルの年換算収益を開示。同時にClaude Opus 4.8(判断力・正直さ・自律動作時間を改善)とClaude CodeのDynamic Workflows(数百の並列サブエージェントを可能にする)をリリースした。
ReadyToTalkは中小企業向けのAI受付サービスです。全ての電話を2秒以内に応答し、24時間365日対応、30以上の言語をサポートし、ウェブサイトからビジネス情報を自動学習します。月額39ドル(7日間無料トライアルあり)で、技術スキル不要でセットアップ可能です。
Dis Dat は、AIコーディングエージェントに画面上の任意の情報を視覚的に提示できるツールで、コード生成の精度と効率を高めます。
この記事では、AIプレゼンテーションツールGensparkの限界を分析し、2026年の6つの代替案(Smallppt、Plus AI、Prezi、Vector Shift、Beautiful.ai、ClickUp)を紹介。各ツールの強みを比較し、ニーズに合った選択を支援します。
theta-spec は、AIコーディングエージェントのための宣言的でハーネスに依存しない設定標準です。単一の theta.toml ファイルが、命令、ルール、ツール、スキル、サブエージェントといった設定の全表面を定義します。この設定ファイルのライフサイクルのためのプロトコルが規定され、準拠する実装はそれを任意のサポートされたハーネスに解決、ロック、キャストできます。プロジェクトにはRust製の参照実装(theta CLI)が含まれ、Claude Code、Codex CLI、Cursor、GitHub Copilotなどのハーネスをサポートしています。
ヘッジファンド大手Citadelの創業者Ken Griffinは、AIエージェントが数時間で完了した複雑な作業を見て、AIに対する態度を一転させた。これは、経済成長と雇用が連動しない可能性を示唆し、GDPだけでは経済の健全性を測れなくなる懸念を引き起こしている。
Together AIは、ASRを単なるGPU推論問題ではなく、システム全体の問題として捉えることで、Artificial Analysisで最速の音声認識スタックを実現しました。本記事では、実際の音声形状に対応したTensorRTマルチプロファイルエンジン、条件付きCUDAグラフによるCPU往復の排除、共有メモリによるデータコピー削減、イベント駆動I/O、そしてgc.freeze()によるGCテールレイテンシの除去など、最適化の詳細を解説します。
本稿では、大規模言語モデルの後学習における強化学習の実践について説明し、現在のボトルネックはアルゴリズムではなくインフラストラクチャであると指摘します。Modalは大規模なRL後学習の経験を共有し、オープンソースライブラリがマルチノードトレーニング、環境管理、GPU利用率などの主要な問題を解決する方法を紹介します。
Serenityは、脳に着想を得たNeural Node Networkメモリアーキテクチャを採用したオープンソースのローカルAIエージェントです。因果関係を記憶し、ドメインを横断して推論し、自律的に動作し、すべてローカルマシン上で実行されます。
Liquid AIは、ツール呼び出しに特化したデバイス向けMixture-of-Experts(MoE)モデルLFM2.5-8B-A1Bをリリースしました。総パラメータ数8.3B、トークンあたりアクティブなパラメータはわずか1.5Bで、コンシューマーハードウェア上で動作します。128Kのコンテキストウィンドウ、推論機能、9言語対応を備えています。前世代モデルと比較して、非幻覚率が7.46から63.47に向上するなど、ベンチマークで大幅な改善を示しています。
AI、WordPress、コンプライアンス、広告追跡を統合したソフトウェアで、無料のアフィリエイトマーケティングのチートシートを提供します。
Open House で ClickHouse コミュニティに発表されたオブザーバビリティの 3 つの主要アップデート:ClickStack Cloud(フルマネージドサーバーレスオブザーバビリティプラットフォーム)のプライベートプレビュー開始、Managed ClickStack の一般提供開始、AI Notebooks のベータ版、そして ClickStack MCP サーバーのオープンソース化。AI Notebooks は永続的な調査ワークスペースで、分岐探索を可能にします。MCP サーバーは外部エージェントがオブザーバビリティプリミティブを利用できるようにし、調査効率を向上させます。
AI駆動のコーディングツールは高度な自律性を獲得し、誰でもソフトウェアを開発できるようになったが、基盤となるインフラは旧態依然としており、非効率を招いている。AIネイティブな新しいオペレーティングシステムが必要である。
Firecrawl は /monitor を発表。ウェブページの変更を自動検出し、webhook 経由で AI エージェントに通知、LLM トークン使用量を最大 90% 削減。
この記事では、AIチャットボットを「思考パートナー」として利用するリスクを探ります。モデル固有の追従傾向、認知バイアスの増幅、真の対立的相互作用の欠如により、ユーザーは過信、認知低下、さらには誤った判断に陥る危険性があると指摘。ユーザーに警戒を促し、AIラボと規制当局に認知的完全性の保護を求めます。
AIツールの普及により、ソフトウェアエンジニアの面接プロセスは時代遅れになっています。従来のコーディングテストではAIを活用する能力を評価できず、求職者と採用担当者の双方に課題が生じています。一部の企業はAI使用を許可するテストや現場作業を試みていますが、問題は未解決のままです。
Perplexityは、プログラマーのラップトップ上のリスクのあるパッケージ、拡張機能、AIツール設定をスキャンするためのオープンソース開発セキュリティツール「Bumblebee」をリリースしました。このツールは読み取り専用で、インストールスクリプトやパッケージマネージャーを実行せず、言語パッケージマネージャー、AIエージェント設定、エディター拡張機能、ブラウザー拡張機能の4つの攻撃面に焦点を当てています。コンテナとパイプラインに重点を置くChainguardとは異なり、Bumblebeeは開発者のローカル環境を対象としています。
2026年のGoogle I/Oで、Google Researchは科学発見、健康、エッジコンピューティング、気象予測における画期的な技術を発表。Gemini for Science(ERA、Co-Scientist)、Google Healthアプリ、Symptom AI、AMIE、Coral NPU、AIによる極端気象予測など、人間の創意工夫を増幅するAIの可能性を示した。
この記事では、ReactフロントエンドとFlaskリバースプロキシを使用してAWS SigV4認証を処理し、AWS CDKでデプロイする、SageMaker AI MLflowアプリUIを埋め込んだカスタムポータルの構築方法を学びます。このソリューションは、事前署名付きURLやAWSコンソールアクセスを必要とせず、永続的でブックマーク可能なURLを提供します。
この記事は、LangChainのディープエージェント評価に関する知見とAnthropicのAIエージェント評価ガイドを組み合わせた実践ガイドです。5つの評価パターンの適用方法、pytestとLangSmithを使用したオフライン評価の構築方法、および本番環境向けのオンラインモニタリングの設定方法を学びます。ウォークスルーでは、Amazon Bedrockを使用したテキストto SQLディープエージェントを例に、開発から本番までのライフサイクル全体をカバーします。
新たなエージェントAI機能のローンチにより、スタートアップはソフトウェア買収を活用してエージェントのトレーニングと推論のためのAIハードウェア・ソフトウェアスタックを開発している。
連邦判事エレノア・ロスが Chambers 内で高官と不倫関係にあったことが発覚。司法当局は匿名化を試みたが、AI が公開文書の詳細を活用して瞬時に身元を特定。裁判所が AI の能力を過小評価している実態と、法律専門家が技術リテラシーを高め、秘密保持戦略を再考する必要性を浮き彫りにした。
企業リーダーは、AIエージェントを迅速に展開しながらも、ガバナンス、信頼、コスト管理を損なわないという緊張に直面しています。この記事では、責任あるAIエージェントの拡大のための5つの実践方法を紹介します。
大規模AI帝国に対する世界的な抵抗運動をまとめたリスト。抗議、法的措置、代替ツール、コミュニティ組織化など、希望と行動を喚起する多様なアプローチを紹介する。
Databricks は Unity Catalog を最も包括的で相互運用性が高く、プロダクション対応の Apache Iceberg カタログとして位置づけ、Managed Iceberg、Iceberg v3、Foreign Iceberg を GA としました。5つの主要機能:オープンAPI、カタログフェデレーション、クロスエンジンアクセス制御、ゼロコピーセキュア共有、AI主導の最適化。将来の Iceberg v4 と Delta 5.0 は統一メタデータ構造に収束します。
本記事は、AIコーディングツールが開発者と密接に連携するローカルワークフローから、非同期のバックグラウンドエージェントへと進化する過程を探り、2025年12月のモデルの変曲点が「スペックからPRへ」のワークフローを実用的にしたこと、そしてDevinやOpenInspectのアーキテクチャ、セキュリティ、テスト、メモリ、マルチエージェントオーケストレーションについて詳しく解説している。
AWSはOpenSearch Serverlessをほぼ完全に再構築し、ストレージとコンピューティングを分離してアイドル時にゼロスケール、コストを60%削減、オートスケールを20倍高速化しました。AIエージェントのバースト的なワークロードに対応し、GPUアクセラレーション、VercelやKiro IDEとの統合も実現。将来のエージェントメモリやログ分析への道筋も示しています。
このアップデートにより、OpenSearch はエンタープライズ向けの基盤インフラストラクチャとして位置づけられ、高速でスケーラブルな検索が可能になります。
SIAは、メタエージェント、タスクエージェント、フィードバックエージェントを連携させ、ベンチマークタスクにおけるAIシステムの性能を自律的に向上させるオープンソースフレームワークです。LawBenchで56.6%の向上、GPUカーネル実行時間の91.9%削減、単一細胞RNAデノイジングで502%の改善を達成し、MLE-Bench Hardで第1位を獲得。ローカル実行とカスタムタスクに対応し、MITライセンスで提供されています。
マイクロン・テクノロジーは5月26〜27日に時価総額1兆ドルを突破し、SKハイニックスと同一週に達した。これは純粋なメモリチップメーカーとして初の快挙。エージェント型AIワークロードによるHBM需要が原動力で、UBSは長期供給契約を理由に目標株価を3倍の1,625ドルに引き上げた。マイクロンの株価は年初来3倍以上に上昇。
2026年5月時点で、7つの主要なAIエージェントフレームワーク(DSPy、Claude Agent SDK、OpenAI Agents SDK、CrewAI、AutoGen、LangGraph、Google ADK)は、設計思想、アーキテクチャ、プロダクション対応度などで異なる。LangGraphがプロダクション展開でリードし、Claude Agent SDKは最も強力なシングルプロバイダー機能を提供し、OpenAI Agents SDKは最もクリーンなマルチエージェントハンドオフを提供し、CrewAIは開発速度に優れる。市場は2025年の78.4億ドルから2030年には526.2億ドルに成長すると予測されている。
Anthropicの最新ClaudeモデルOpus 4.8は、誠実さを重視し、根拠のない主張を減らし、不確かな場合にそれを認めるようになった。また、大規模タスク向けに数百のサブエージェントを調整する動的ワークフローを導入。標準料金は変わらず、高速モードは安価に。
この記事では、金融サービスにおいて最も労働集約的なワークフローの1つであるアンチマネーロンダリング(AML)アラートトリアージを自動化することで、統合の実際の動作を紹介します。Amazon Quick Flows と Snowflake Cortex を、Amazon Quick モデルコンテキストプロトコル(MCP)統合を介して接続したトリアージワークフローを構築します。テスト環境では、Amazon Quick を使用した自動化ワークフローにより、アラート調査時間を30~90分から5分未満に短縮しました。実際の結果は、アラートの複雑さとデータ量によって異なる場合があります。
Data Formulator 0.7は、データ接続、エージェントガイドによる探索、ビジュアライゼーションの改善を共有ワークスペースで統合した、エンタープライズデータ分析向けのオープンソースAIシステムです。
Fireworks AIはServerless 2.0を発表し、予約容量なしでStandard、Priority、Fastの3つの推論パスを1つのAPIで提供します。Priorityパスは混雑時により強いリクエスト許可を提供し、Fastパスは約2倍のスループットを実現。また、負荷制限(503)とレート制限(429)を明確に分離し、リトライロジックとアラートを改善します。
Anthropicは、Altimeter Capital、Dragoneer、Greenoaks、Sequoia Capitalが主導するシリーズHラウンドで650億ドルを調達し、評価額は9650億ドルとなりました。調達資金はAI安全性研究の推進、計算能力の拡大、およびClaudeの需要増加に対応するために使用されます。
本日、ElevenLabs は革新的な AI 吹き替えモデル Dubbing v2 をリリースしました。従来のテキストベースの吹き替えとは異なり、Dubbing v2 は元のパフォーマンスそのものに直接条件付けし、声の調子、テンポ、感情を 90 以上の言語にわたって保持します。これにより、翻訳された音声があたかも元の話者が実際にその言語で話したかのように聞こえるようになります。
KeptWellは、医療書類の整理・理解・共有を支援するAIプラットフォーム。重要な情報の抽出、検査値の傾向追跡、診察時の質問生成、家族のコラボレーションを実現。プライバシー重視、広告なし、データエクスポート可能。
ペンシルベニア州立大学の研究者らによる新たな研究では、AI搭載チャットボットが一般ユーザーの日常的な健康に関する質問に約76%の精度で回答していることが明らかになり、現実世界の対顧客アプリケーションにおける信頼性に疑問が生じています。産科・婦人科や耳鼻咽喉科ではAIのパフォーマンスが最も良く、内科、神経科、皮膚科では最も悪かったとされています。研究者らは、AIツールは患者よりも医師が使用する方が適していると示唆しています。
新しい研究で、文体ではなく物語構造の分析によりAI生成小説と人間創作を区別する手法StoryScopeが提案された。61,608話の物語から304の特徴を抽出し、人間対AI検出で93.2%のマクロF1を達成。さらに、Claude、GPT、Geminiなど異なるLLMに固有の物語指紋を特定した。
研究者がAIを活用してFreeBSDカーネルのセキュリティ監査を実施し、5つのローカル権限昇格やbhyveゲストからのホスト脱出を含む15のバグを発見。3つのLPEエクスプロイトを公開し、手法を共有してメンテナを支援する。
著者はテキスト分析、統計的証拠、AI検出ツールを用いて、教皇レオ1世の最初の回勅『Magnifica Humanitas』の相当部分がAI(特にClaude)によって書かれたと論じています。回勅におけるダッシュや「genuinely」の使用頻度が過去の回勅をはるかに上回り、Pangram検出器が複数の段落をAI生成と判定したことを挙げています。個々の証拠は説明可能かもしれませんが、複数の角度からの証拠の一致は無視しがたいとしています。
研究者らは、ロボットの重心加速度の均一性を動的等方性で定量化する「動的対称性」の概念を提案。シミュレーションと物理実験を通じて、高い動的対称性が軌道追従、タスク成功率、ロバスト性、回復力、エネルギー効率を大幅に向上させることを発見。Argusシリーズの球状ロボット、特にほぼ極限の動的等方性を達成した20脚の変種は、姿勢に依存しない移動、複雑地形の走破、高速自己安定化、部分的なアクチュエータ故障への耐性を示した。
本論文では、視線(LoS)幾何学を利用してRF伝搬をガイドし、隠れたシーンの安定した物理的に整合性のある3次元再構成を実現する統一フレームワークGeRaF 2.0を紹介する。RFベースの幾何学再構成において最新技術を達成した。
研究者が偽の皮膚疾患を作り出してAIをテストしたところ、AIチャットボットはそれを真実と信じ込んだ。この実験はAI医療アドバイスの危険性と、トレーニングデータにおける人間の監視不足を浮き彫りにしている。
Trelk は、一度購入すればサブスクリプション不要の知識管理アプリです。デバイス上の AI を使用して記事や論文、メモを保存・整理・接続します。ハイブリッド検索、知識グラフ、RAG チャット、フラッシュカードの分散復習、コミュニティコレクションなどの機能を備え、プライバシー重視でオフラインでも動作します。
OpenAIは、フロンティアシステムのモデル能力、安全対策、妥当性を評価する方法を網羅した第三者AI評価ガイダンスを公開。
この記事は、生成AI(GenAI)の倫理的側面を包括的に考察し、ソフトウェア開発などの分野での利点と、膨大なエネルギー消費、電子廃棄物、誤情報の拡散、教育や科学への脅威、民主主義への危険、そしてデジタル植民地主義といった欠点を分析する。著者らは、倫理的行動は利益と損害のバランスを考慮する必要があり、多くの場合、トレードオフを伴うと主張する。
リチャード・サッカリーとフィル・スネルがウェンディ・リューのAIに関する記事に応答し、AIは好奇心を減退させるどころか、むしろ高めていると主張する。
Googleは「Preferred Sources」機能をAI OverviewsとAI Modeに拡張し、ユーザーがお気に入りのサイトを設定してAI検索結果で目立たせることができるようにしました。新しいソースカルーセルや「Highly Cited」バッジも追加されました。
AnthropicがClaude Opus 4.8を発表。ベンチマークスコアよりも信頼性、誠実さ、自律ワークフロー実行能力に重点を置く。価格は据え置き、高速モードは大幅値下げ。
新しいレビュー論文は、自律型AIエージェントの真のボトルネックは言語モデル自体ではなく、その周りのソフトウェア層(ツール、メモリ、テスト、権限境界)であると主張しています。Deepseekは北京に専用の「Harness」チームを立ち上げ、モデル+ハーネス=AIエージェントという公式を確認しています。
BraintrustのエンジニアはCodexとGPT-5.5を使って実験とコーディングを高速化しています。
本記事は、オープンウェイトモデルやオープンプロトコル(MCPなど)がどのように私有化されるかという、オープンソースAI戦略の限界を探る。AnthropicによるStainless買収をケーススタディとして、補完的キャプチャと堀の移動を説明し、AIインフラの開発者体験層がプラットフォーム大手によって統合されつつあると指摘する。オープンソースの影響はその依存関係に大きく左右されるため、エコシステム全体の視点で分析する必要性を強調する。
AnthropicはClaude Opus 4.8をリリースしました。Opus 4.7のアップグレード版で、コーディング、エージェント作業、推論、知識作業の改善を謳っています。新機能として努力制御、動的ワークフロー、Messages APIのライブ更新を搭載。標準料金は百万トークンあたり入力5ドル、出力25ドル、高速モードは入力10ドル、出力50ドル(2.5倍速)で据え置き。初期テスターからはGPT-5.5とのコストパリティやツールステップの減少が報告されています。将来のロードマップとしてMythosクラスのモデルやサイバーセキュリティプロジェクトGlasswingも発表されました。
『イメージ・エンパイア』は、現代のAIモデルにおける現実と仮想の融合を描いたアニメーション寓話です。この映画は、アラン・ウォーバートンが取り組む研究プロジェクトの一部であり、研究論文や一連の関連イベントも含まれます。
NexusCortex は、Go 言語で構築されたスパース AI 皮質システムであり、従来の LLM とは異なります。スパース計算により効率的な推論を実現し、Opus 4.8 の競合と見なされています。
Hexo Labsは、MITライセンスの下で自己改善ループ「SIA(Self-Improving AI)」を公開しました。フィードバックエージェントが各実行の軌跡を読み取り、scaffoldを書き換えるか、gpt-oss-120b上でLoRA重み更新をトリガーします。両方のレバーを組み合わせることで、LawBench、TriMul GPUカーネル、scRNA-seqデノイジングにおいて、scaffoldのみの反復を上回る結果を示しました。
本論文は、大規模言語モデル(LLM)と音響移動ロボットを組み合わせた非接触物体操作のための分散型フレームワークを提案する。Whisper音声認識、LLM意味解析、JSONタスクスケジューリングを用いて、音声コマンドを調整されたマルチロボットアクションに変換する。2台のTurtleBot3ベースの音響ロボットを用いた実験では、逐次タスク96%、並列タスク86%、同期協調タスク70%の成功率を達成し、LLM駆動自動化のヒューマンロボットインタラクションにおける可能性を示している。
本論文は、ラベルなしのターゲットドメインデータを活用して医用画像AIのクロスデバイス汎化を改善する、ターゲット認識型自己教師あり事前学習とモデルアンサンブル戦略を提案する。小児手首骨折のポイントオブケア超音波評価に適用し、ターゲットドメインでDiceが6%以上向上し、ラベル効率的でプライバシー保護のアプローチを示した。
14のオープンソース安全ガードモデルの包括的評価により、Qwen Guard(4Bパラメータ)が83.97%の再現率でトップであることが明らかになった。一方、Llama Guard(12B)やGPT-OSS Safeguard(20B)などの大規模モデルは保守的で、最大75%の不適切コンテンツを見逃した。モデルサイズと安全性検出性能には相関がなく、汎用ガードモデルが専門モデルよりも優れていることが示された。
Aryabhata 2は、JEEやNEETなどの競争的STEM試験に特化した推論言語モデルであり、GPT-OSS-20Bを強化学習で後訓練したものです。PhysicsWallahの内部問題バンクを活用し、段階的にロールアウトグループサイズを拡大することで探索を促進します。評価では、ベースモデルを上回る性能を示し、出力トークンを最大64%削減しました。
本論文は、Qwen2.5-0.5Bをベースに語彙注入とエッジ優先デプロイメントを採用した518Mパラメータのアラビア語特化LLM、RightNow-Arabic-0.5B-Turboを提案する。アラビア語ベンチマークで平均精度35.9%を達成し、同クラスのオープンモデルを凌駕。COPA-arではFalcon-H1-1.5Bと同等の成績を1/3のサイズで達成。量子化後は398MB、単一H100上で635トークン/秒の推論速度を実現する。
大規模言語モデル(LLM)の影響力が拡大するにつれ、その意思決定を理解することが不可欠になっています。本論文では、低コストで線形プローブを用いてLLMの埋め込み内の概念を検出し、モデルが「考えている」内容を監視する手法を提案します。概念定義、プローブ訓練、およびコンテキスト間追跡のプロセスを4つの概念と3つのLLMで実証し、スケーラブルなモデル透明性への道を開きます。
マルチモーダル学習では、収束の速いモダリティが最適化を支配し、他のモダリティが未学習となるモダリティ不均衡が問題となる。既存手法は弱いモダリティを強化するか勾配を調整するが、強いモダリティの最適化能力を犠牲にすることがある。本論文では、ラベル側の設計からマルチモーダルバランスを促進する初めての手法であるBalanced Multimodal Label Reshaping(BMLR)を提案する。BMLRはクロスモーダルラベル空間を再形成し、各モダリティの写像困難度を均等化することで、モダリティ間の相互作用を促進し、リッチなクラス間情報を注入する。実験により、BMLRは一貫してマルチモーダル性能を向上させ、多様なモデル設計と互換性があることが示された。
本稿では、トークンの初期化と訓練に幾何学的制約を統合し、時系列トークンの連続性と順序性を保持する戦略COMを提案。複数のベンチマークでトークンベースの時系列LLMの性能を一貫して向上させる。
TRACEは、ツール選択を逐次意思決定問題として定式化する軌道認識型LLM推論エージェントであり、構造制約下での将来を見据えた最適化を実現し、ADMET最適化タスクで高い成功率と特性改善を達成する。
最近の研究では、強化学習(RL)が教師あり微調整(SFT)よりも事前の能力を効果的に保持することが示されています。本論文はこれをメカニズムレベルに拡張し、微調整中の回路劣化を測定する「差分回路脆弱性」を導入します。Qwen2.5-3B-Instructを科学質問応答に適用した実験では、SFTはタスク適応が速いものの回路破壊と忘却が大きく、RLは回路を保持する代わりに適応が遅いことが明らかになりました。結果は、回路保持がRLの破局的忘却に対する頑健性を説明することを示唆しています。
本研究は、TradeArenaテストベッドを用いて、金融意思決定環境における大規模言語モデル(LLM)エージェントの行動アライメントと表現ダイナミクスを分析する。計画埋め込みのドリフトや有効ランクの収縮など、測定可能な障害前兆を特定する。構造化されたリスクフィードバックは外部アライメント信号として機能するが、普遍的な性能向上策ではない。51銘柄の日中実験では、LLMの根拠が相関の高い資産への集中エクスポージャーを正当化するという相関の盲点が明らかになった。
ROMEやMEMITなどの知識編集手法は、事実固有の重み変更にもかかわらず共通のメカニズムに依存していることが明らかになった。編集された重みに学習されたバイナリマスクは70%以上の編集を逆転させ、共通の機能的部分空間を示す。このマスクは後期層の過剰注意を排除することで機能し、編集時に注入すると成功率が98%から38%に低下する。編集は知識を上書きするのではなく抑制するため、関連事実への伝播に失敗する。この研究は不正な編集の検出と防御に役立つ。
VFEAgentは、入力画像と問題記述から直接有限要素解析(FEA)のモデリングとシミュレーションを自動化するエンドツーエンドのマルチエージェントシステムです。マルチモーダル視覚言語マルチエージェントパイプラインと検証優先のコード合成フレームワークを組み合わせ、ReAct駆動の推論で構造化FEA仕様を抽出し、自己デバッグとフォールバック機構により実行可能性と物理的妥当性を確保します。実験では、完全で物理的に有効なシミュレーションを生成する成功率が高く、信頼性と正確性においてLLMベースのベースライン手法を上回り、エンジニアを退屈な手動分析から解放する可能性を示しています。
新たな研究では、AnthropicとOpenAIの5つのフロンティア大規模言語モデルを「エージェントキュレーター」として自己完結型ワークスペースで動作させ、表現型注釈を自動化。エージェントは人間のキュレーターのばらつき範囲内の一貫性を達成し、従来のNLPツールを大幅に上回り、オントロジーキュレーションのスケーラビリティ問題に取り組む。
本論文は、科学論文に対するLLM生成レビューと人間レビューの整合性を実証的に評価し、整合性は限定的であり、プロンプトやモデルによって大きく変動することを明らかにした。さらに、著者がLLMレビューに基づいて論文を反復修正することで、最大35%の論文で統計的に有意なスコア向上が得られる「ゲーム可能性」を示した。
Cognitive Categorical Transformer(CCT)は306Mパラメータのアーキテクチャで、GPT-2 Smallに認知科学と圏論に基づくコンポーネントを追加し、WikiText-103で21.27のパープレキシティを達成。微調整ベースラインから2.92(12%)の改善。アブレーション実験により、改善の84%がGT-Full単体的メッセージパッシングによるものと判明。また、構造/一貫性の区別というパターンも発見。
OpenAI は Rosalind Biodefense を立ち上げ、審査済みの開発者と米国政府パートナーに対し、生物防衛、公衆衛生、パンデミック対策を推進するために GPT-Rosalind への信頼できるアクセスを拡大します。
清華大学出身のスタートアップ、Shishi Technologyは独自の並列最適化技術により、異種計算リソースと推論最適化エンジンを統合し、トークンあたりのコストを40%削減。国産トークン最適化工場を目指し、AI導入の障壁を低くする。
Anthropicは650億ドルのシリーズH資金調達の中で、年換算売上高が2026年5月初旬に470億ドルを超えたと発表した。これは4月の300億ドル、2月の140億ドルからの急増であり、2025年末の90億ドルから約5倍の成長となる。一部の懐疑論はあるが、資金調達発表における虚偽は証券詐欺に当たるため信頼性は高いと指摘されている。
AnthropicがClaude Opus 4.8をリリース。前モデルからの「控えめだが確かな改善」と説明。正直さが向上し、根拠のない主張を避ける傾向が強まった。コードの欠陥を見逃す率は4分の1に減少。また、会話途中でのシステムプロンプト変更やプロンプトキャッシュの最小トークン数引き下げなどの新機能を搭載。
Anthropicが最新フラッグシップモデルClaude Opus 4.8をリリース。端末エンジニアリングと知識作業で改善が見られ、一部ベンチマークでMythosを凌駕。誠実性が大幅に向上し、コード欠陥の見逃し率が前世代の4分の1に。新機能「Dynamic Workflows」により、タスクを数百の並行サブエージェントに分割して実行可能。
llm-anthropic 0.25.1 では、Claude Opus 4.8 モデルのサポート、有効な組織向けの高速モードオプション、各モデルのデフォルト max_tokens が8192から各モデルの最大出力に変更されました。
「否定無視」に関する新たな研究により、大規模言語モデルは訓練データ中で明らかに虚偽とラベル付けされた記述でも吸収してしまうことが判明。合成文書で微調整後、テストしたモデルでは虚偽の主張に対する「信念率」が2.5%から92.4%に急上昇し、LLMが幻覚を起こす理由の一端を説明している。
Anthropic が Claude Opus 4.8 を発表し、Claude Code の2つのアップデートを同時にリリース。動的ワークフローは最大1,000のサブエージェントを並列実行し、高速モードは出力速度を2.5倍に向上しつつ価格を3分の1に低減。両方とも研究プレビュー。
アゼルバイジャンの通信事業者Azercellは、AWS Generative AI Innovation Centerと協力し、Amazon SageMaker AI上でアゼルバイジャン語LLMを構築。カスタムトークナイザー、FSDP、Liger Kernelの最適化により、トレーニングスループット23%向上、ピークGPUメモリ58%削減、トークン効率2倍を達成。
AnthropicはClaude Opus 4.8をリリース。多くのベンチマークでGPT-5.5やGemini 3.1 Proを上回り、コードエラーの自己検出率は前世代比4倍。同時に、数百の並列サブエージェントを起動して大規模なコードベース移行などを処理する動的ワークフローも導入した。
すべての新モデルが宣伝通りとは限りません。本トラッカーは各リリースを同種モデルと比較し、どのモデルが時間を費やす価値があるかを示します。この記事では、Claude Opus 4.8、GPT-5.5 Instant、Nemotron 3 Nano Omni、GPT-5.5、ChatGPT Images 2、Claude Opus 4.7、Claude Mythos(プレビュー)、GPT-5.4、Claude Opus 4.6、GPT-5.3-Codexなど、2026年現在の主要なモデルリリースとその特徴、重要性をまとめています。
Claude Code はワンクリックでのモデル切り替え、BYOK、Anthropic および OpenAI との互換性をサポート。月額5ドルから始められ、障害やレート制限を回避できます。
フランスのスタートアップ企業Mistral AIは、Digital Realtyのパリ南キャンパスで10メガワットのコンピューティング能力を確保しました。
Anthropic はフラッグシップモデル Opus 4.8 をリリース。ユーザーは Claude の「努力」レベルを調整可能になり、動的ワークフローで大規模コーディングタスクに対応、高速モードの価格が従来の3分の1に。ベンチマークでは GPT-5.5 や Gemini 3.1 Pro をリードするが、端末コーディングでは OpenAI に劣る。誠実さと自律性サポートが向上し、欺瞞率が大幅に低下。
Anthropic の最先端 Opus モデルである Claude Opus 4.8 が Amazon Bedrock および AWS 上の Claude Platform で利用可能になりました。コーディング、エージェントタスク、プロフェッショナルワークにおいて改善がもたらされ、長期運用の本番ワークフロー向けの一貫性と自律性が向上しています。
Anthropic は木曜日に Claude Opus 4.8 をリリースし、「正直さ」を強調。初期テスターは、モデルが不確実性を積極的に示し、根拠のない主張を減らす傾向があると報告。評価では、コードの欠陥を見逃す割合が前世代比で約4分の1に低減。さらに、ユーザーはタスクに割く努力量を調整可能で、「動的ワークフロー」機能により数百のエージェントを並行実行できる。
Anthropic は Claude Opus 4.8 をリリースしました。これはフラッグシップモデルの最新バージョンで、ベンチマーク、協調性、正直性などで大幅な改善を遂げています。また、努力制御、動的ワークフローなどの新機能も導入されました。Opus 4.8 はコーディング、エージェントタスク、推論、知識作業のテストで前モデルを凌駕し、価格は据え置きです。さらに、より高知能なMythosクラスのモデルも予告されています。
開発経験ゼロの失業者が、AIツールとノーコードプラットフォームBase44を使って一晩でOne Tileを構築し、Redditで20万ビューを達成しました。
フェラーリ初の電気自動車「Luce」は、ジョニー・アイヴ卿のデザインで従来のフェラーリとは一線を画す外観が話題に。Vergecastではそのデザインや技術、EV市場への影響を議論し、AIへの消費者の反発なども取り上げる。
ボストン小児病院はOpenAIの技術を活用し、患者ケアの向上、業務負担の軽減、そして40以上の希少疾患の診断に成功しています。
ArchToCodeはコードとGitHubからAI Mermaid図を生成するツールです。
教皇レオ14世は「マグニフィカ・フマニタス」というAIに関する回勅を発表し、急速に発展する技術の利用と誤用について警告しました。著者のフランシン・プローズは感謝しており、シリコンバレーがこれを軽視するのは誤りだと述べています。
アマゾンは、従業員が意味のないAI使用でスコアを水増しし、クラウドコストが増加したため、社内AIランキングを廃止した。
コメディアンのチェン氏がハーバード大学第375回卒業式で、ユーモアを交えつつ真剣にAIについての警告を卒業生に伝えました。
Draftedは、ユーザーが瞬時に住宅空間をデザインできるAIツールです。
StudySongは、学習ノートやあらゆるテキストを完全な歌に変換するAIツールです。PDFアップロードに対応し、すべての処理がローカルで行われるためプライバシーが保護されます。
教皇レオ14世のAIに関する回勅に触発され、本記事はテクノロジーにおける最も苛立たしい40の問題をユーモアを交えて列挙する。ワンタイムパスワードが届かないことから、車のタッチスクリーン、役に立たないチャットボットまで。テクノロジー企業が人間性を無視していることを批判。
Pubflowは認証、バックエンドロジック、インフラを統合した統一システムを提供し、AIアプリ構築時のグルーコードを不要にします。マルチデータベース対応、多言語対応、プロダクション対応のスターターキットを備えています。
Microsoftは、Microsoft 365 Copilotの改良版を発表。読み込み速度が2倍になり、デザインが洗練されました。プログレッシブディスクロージャー機能やテキスト整形機能を搭載。
OperatorOS は、プライベートな AI パーソナルオペレーターで、チャットでタスクを管理します。開発者は正直なベータテスター5名を募集しています。
スーザン・オマン博士が、AIをめぐる議論から一般市民が排除されていると指摘。英国議会のAIに関する超党派グループに証拠を提出し、AIへの懸念が2年間で10%上昇し、91%が経済的利益よりも公平性を優先すべきと考えていることを示した。
派手なフェスティバルドレスを着たタイ警察官が麻薬密売人を取り囲む衝撃的な画像が世界中で拡散されたが、実際には警察署のFacebookアカウント管理者がより親しみやすいイメージを作るためにAIで生成したものだった。
19世紀の鉄道ブームと現在のAI投資ブームを比較し、巨額の資本支出、金融革新、そしてバブルと暴落の歴史的先例を強調する。AIの金融インフラは鉄道と同様に変革的であり、かつリスクも同様であると論じる。
本稿では、宇宙にAIデータセンターを建設する可能性を分析。物理的利点(継続的な太陽光、受動的冷却、真空中のレーザー通信)と工学的制約(熱放散、放射線耐性、トレーニング同期、メンテナンス)をカバー。鍵となる前提はスターシップの打ち上げコスト。複数のスタートアップ、Google、SpaceXがパイロットプログラムを発表。短期的な投資への影響は限定的だが、監視に値する。
OpenAIのCEOサム・アルトマン氏は、AIが大規模な失業を引き起こすとの以前の予測を撤回し、「雇用の終焉」は起こらない可能性が高いと述べた。彼は自身の直感が間違っていたことを認め、職場における人間同士の交流の価値が代替不可能であることを挙げた。他の業界リーダーが依然として雇用の混乱を警告する一方で、アルトマン氏の発言はAIのコスト、導入ペース、世論を考慮したものとなっている。
歴史的な技術サイクル(アインシュタインの奇跡の年、電気革命など)をAIブームに当てはめ、基礎的ブレークスルーの後には長い応用期が続くことを論じる。応用期には一部の職は消えるが、多くの新たな職が生まれる。AIは理論的ブレークスルー期にあり、応用時代が後に来る。著者は、AIを応用する人々が新たな電気技術者となり、全体としてより多くの人が利益を得ると楽観視する。
UC BerkeleyのUCCLチームがmKernelをリリース。ノード内NVLink、ノード間RDMA、高密度計算を単一の持続的CUDAカーネルに融合し、AIワークロードの通信オーバーヘッドを削減。通信はフォワードパスの43.6%、トレーニング時間の32%を占める可能性がある。5つの融合カーネルを提供し、ConnectX-7とAWS EFAバックエンドをサポート。
ChatGPTやGoogleのAI Overviews、GeminiなどのAIツールが、Elon Muskが立ち上げたAI生成百科事典Grokipediaを引用し始めており、正確性や誤情報拡散への懸念が高まっている。現在Grokipediaの引用は全体のごく一部だが、特にChatGPTでは主要な情報源として扱われる傾向があり、その割合は増加傾向にある。専門家は、人間の監督を欠いたAI生成のGrokipediaを引用することは、偏見や誤りの拡散につながると警告している。
今週、AIと仕事の対立が4つの法域で同時に表面化した。ウィキペディア編集者は人員削減に抗議してストライキを計画、アマゾン従業員は内部AIランキングを無効化、中国の裁判所はAIを理由とした解雇を禁止する枠組みを執行、英国のシンクタンクは職場へのAI導入について従業員に発言権を与えるよう提言。同時に、先端ラボは政府との関係を深めている。
本記事は PyTorch プロファイリングシリーズの第1回です。最も単純な行列乗算とバイアス加算から始め、torch.profiler の設定方法、プロファイラテーブルとトレースの読み方、CPU と GPU のアクティビティ間の時間関係、ウォームアップと行列サイズが性能に与える影響について解説します。
Appleはプライバシー重視のローカルAIを推進してきたが、最新レポートによると、SiriへのGemini統合にはGoogleやNvidiaのクラウドを多用する見込み。スマートフォンの限られた処理能力では大規模なAIモデルをローカルで動作させるのが難しく、クラウドとのハイブリッド方式が現実的だが、プライバシー面での妥協を意味する。
MITとマサチューセッツ州は、量子システム研究所(QSL)を設立する計画を発表。州からの2500万ドルの投資により、全州の研究者に開放される共有施設となり、量子研究の加速を目指す。
ウォータールー大学の学生たちが、Googleが資金提供するFutures Labで、AI生成ストーリーを使った日本語学習アプリやリアルタイム手話チューターなどのプロトタイプを開発し、教育と仕事の未来を再定義しようとしている。
誤った情報をデータに混入することで、AIモデルによる個人データの収集と利用を防ぐ方法を学びます。
ライトセイルテクノロジーがテンセント出行サービスと提携し、AI全感覚ウェアラブル端末をプラットフォームに統合。同端末はJD.comのベストセラーリストで1位を獲得し完売、新たな予約販売が割引価格で開始された。
TUC支持のIPPR報告書は「労働者支援税」を提案し、職場でのAI導入における従業員の影響力を高めるよう求めている。
英国政府は来年から国境でAI顔認識技術を導入し、未成年を装う成人移民を検知する計画だ。写真から年齢を推定する技術だが、人権団体は未成熟で子どもの権利を損なうと批判している。
Xerolithは、階層的なフラクタルボールトアーキテクチャを通じて、永続的なアイデンティティ、自律的な信念形成、基板に依存しない知識統合を実現する動作プラットフォームです。80日以上の連続運用で、2,817の生エントリを1,218の信念に圧縮し、完全な系譜追跡と内部調整を実現します。
研究者らは、自動運転におけるレイテンシと安全性のバランスを取るため、マルチ解像度エンドツーエンド深層ニューラルネットワークを提案。ランタイムに入力解像度を選択することで、CARLAシミュレーションにおいて、車線逸脱、赤信号違反、衝突などの安全指標が固定解像度ベースラインと比較して一貫して改善された。
本記事では「使い捨てソフトウェア時代」の概念を探求し、AI生成コードを産業革命の家具のように使い捨て可能として扱うことで開発を加速すべきだと主張する。実際のRailsプロジェクトの事例を用いてAIリファクタリングの成功を示し、「使い捨てコード宣言」として、意図、要件、安全性の三本柱を提案する。
この動画では、囲碁における超人間的AIに対抗する戦略と方法を探ります。AIの弱点の活用、革新的な戦術、AIの意思決定の理解などが含まれます。
AnthropicはシリーズHラウンドで650億ドルを調達し、評価額は9650億ドルに達しました。CFOのKrishna Raoによると、年換算収益は470億ドルを超えています。同社は安全性研究、計算能力の拡大、Claude製品ラインの拡充に投資する計画です。
ウィキメディア財団は2億9600万ドルの準備金とAI企業へのデータ販売で利益を得ながら、長年勤めたスタッフとコミュニティ技術チーム全体を解雇した。この行動にボランティア編集者が怒り、ストライキを脅かしている。記事はCEOのAI精神病が組織の優先順位を歪め、AIによる人間の判断力の代替がデータ品質の悪循環を生む可能性を探る。
この記事は、AIがソフトウェアエンジニアリングの面接にどのような影響を与えているかを探り、さまざまな面接タイプ(持ち帰り課題、ライブコーディング、プレゼンテーション、実際の業務)をシグナル品質と企業コストの次元で分析する。AIによって持ち帰り課題が簡単になりすぎ、ライブコーディングの重要性が低下したため、企業は面接でのAI利用を制限すべきだと主張し、従来の学校評価モデルとの類似点を挙げている。
AIトレーニングスタートアップのShiftが、無料の家庭用掃除サービスを提供するが、その代わりに掃除中を録画しロボット訓練データとして利用する。同社によると、データの価値がサービスの費用を十分に上回るという。現在はニューヨークのみで利用可能だが、まもなくサンフランシスコ、ロンドン、チューリッヒ、ミュンヘンにも拡大予定。
AI企業Anthropicが650億ドルの資金調達を発表し、評価額は9650億ドルに達した。これによりOpenAIを抜き、世界で最も価値のあるAIスタートアップとなった。エンタープライズ向けのコードアシスタントが好評で、急成長を遂げている。
このプロジェクトは、Anthropicの未発表のMythos AIサイバーセキュリティモデルに続くもので、ソフトウェアシステムの深刻なセキュリティホールを明らかにしました。
この新たな資金調達は、急成長するベンダーにとって最新のマイルストーンであり、AIコーディング市場の強さを浮き彫りにしています。
来月のトライベッカ・フェスティバルで、AI生成映画『ドリームズ・オブ・ヴァイオレッツ』が初公開されます。75分のこの作品は、イラン政府による1月の抗議者大量殺害を架空のドラマ化したもので、人物や画像はすべてAIで作成されています。制作費は2000ドルで、イラン出身の兄弟が複数のAIツールを用いて制作しました。
YouTubeがPremium加入者向けにポッドキャスト視聴を改善する新機能を発表。音声優先の「オン・ザ・ゴー・モード」、自動速度調整、AIポッドキャストレコメンデーションなどを含む。