AI News HubLIVE

今日の必読ニュース

ツール

オランダ極右政党、AIで改変した法廷スケッチについて法廷画家に損害賠償

オランダ極右政党自由党(PVV)が、許可なく法廷画家ペトラ・ウルバンのスケッチをAIでより凶悪に見えるように改変し、ソーシャルメディアで使用したことに対して、損害賠償を行った。改変されたスケッチは、妹殺害で収監されたシリア人兄弟を描いたもの。

  • オランダ極右政党PVVが法廷画家の作品を無断使用
  • AIを使ってシリア人兄弟の姿を凶悪に改変
サイト内本文

Show HN: Babel – 見知らぬ人とあらゆる言語でリアルタイム通話

Babelは匿名音声通話でランダムな相手とペアになり、各自が話す言語と聞く言語を選択。リアルタイムAI翻訳が双方向に同時に働き、通訳スタイルの会話を実現する。機能の85%はフロンティアモデルとAPIを用いたワンショットMVPで構築された。

  • 匿名音声通話でランダムな相手とペアになり、異なる言語を選択可能
  • リアルタイムAI翻訳が双方向に同時再生、通訳スタイル
サイト内本文

Hasta Pronto – AIによる別れの手紙と双方向追悼 – Claude

これはユーザー生成のコンテンツであり、未検証です。タイトルは「Hasta Pronto — AIによる別れの手紙と双方向追悼」で、Claudeによるものです。

  • コンテンツはユーザー生成で未検証です。
  • タイトル:Hasta Pronto — AIによる別れの手紙と双方向追悼
サイト内本文
Agent

「aigents」と呼ぼう

著者は「AIエージェント」の代わりに「aigents」という造語を提案し、曖昧さを排除して用語を簡潔にする。

  • 「AIエージェント」という用語は、「エージェント」に短縮すると曖昧さが生じる。
  • 著者は明確で簡潔な代替語として「aigents」を提案している。
サイト内本文

city2graph、OSMnx、PyTorch Geometricを用いた都市機能推論のための空間グラフニューラルネットワークのコーディング実装

このチュートリアルでは、city2graphを使用したエンドツーエンドの空間グラフ学習パイプラインを構築し、都市機能推論を行います。OpenStreetMapからPOIと街路ネットワークデータを収集し、信頼性を確保するための合成フォールバックを用意します。空間特徴量をエンジニアリングし、複数の近接グラフファミリーを構築し、GraphSAGEモデルを訓練してPOIカテゴリを予測します。このワークフローは、地理空間データ処理、グラフ構築、GNNトレーニングを統合した実用的な実装です。

  • city2graphを使用してOpenStreetMapデータから空間グラフ学習パイプラインを構築し、合成フォールバックを備える。
  • 空間特徴量をエンジニアリングし、複数の近接グラフ(KNN、Delaunayなど)を構築・比較。
サイト内本文

Show HN: AccInt – AIコーディングエージェントのワークモデル

AccIntは、AIコーディングエージェントが段階的な推論とインタラクションからの学習を通じて、効率的で高品質な採用プロセスを実現するワークモデルを紹介しています。

  • AIエージェントが検索からメッセージ送信まで、検証された推論で採用タスクを実行。
  • エージェントは大量送信を拒否し、指名された個人のみにターゲットを絞る。
サイト内本文

AIはハウツー系ノンフィクションを殺したのか?

ティム・フェリスは自身のベストセラー書籍の販売データを用いて、ChatGPTの登場以降、実用ノンフィクションの売上が急落していることを示し、大規模言語モデルがアドバイスの主要なインターフェースとして書籍に取って代わりつつあると論じる。この傾向はハウツー動画、ポッドキャスト、オンラインコース、ジャーナリズムにも波及すると警告。反論も提示しつつ、情報提供型コンテンツの市場は縮小し、深い変容体験を提供するものだけが残ると予測する。最終的に、クリエイターは1000人の真のファンに集中すべきだと勧める。

  • フェリスの書籍の印刷売上は2022年比で2026年には約80%減少する見込み。ChatGPTは2022年11月にリリースされた。
  • 彼の書籍は「ルックアップテーブル」や「決定木」であり、LLMが瞬時にパーソナライズして提供できるため、代替されている。
サイト内本文
モデル

中国が西側AIモデルを締め出す一方、米国企業はDeepSeekに殺到

中国国家安全部は西側AIモデルの利用にセキュリティリスクがあると警告。一方、米国企業はコスト面からDeepSeekなど中国製オープンソースモデルを積極採用。両国のユーザーは規制を迂回し、AIアクセス代理市場が活性化している。

  • 中国国家安全部は、サードパーティツール経由の米国AIモデル利用がセキュリティリスクを伴うと警告
  • 米国企業は低コストのためDeepSeekやAlibabaのQwenなどの中国モデルに殺到
サイト内本文
政策

オープンソースAIは勝利しなければならない

この記事は、オープンソースAIがインテリジェンスインフラに対する公衆の管理を維持するために重要であると主張しています。AIが少数の企業に管理されるサブスクリプションサービスになることを警告し、AIが利用可能で、理解可能で、コミュニティによって管理される必要性を強調しています。

  • AIは公衆の運用の自由を確保するためオープンソースであり続けなければならない。
  • 閉鎖的なAIは認知のサブスクリプション経済を生み出すリスクがある。
サイト内本文

連邦政府がAnthropicにFable 5とMythos 5のリコールを命令、発売から3日後

米国連邦政府が国家安全保障を理由に輸出規制指令を発令し、Anthropicに対しFable 5とMythos 5を直ちに無効にするよう要求。Anthropicは異議を唱えつつも遵守し、アクセス復旧に向けて取り組んでいる。

  • 米国政府が国家安全保障権限に基づき、Fable 5およびMythos 5モデルへのアクセス停止を命じた。
  • Anthropicは指令の根拠に異議を唱え、特定の狭いジェイルブレイク手法に過ぎないと主張。
サイト内本文
その他の更新(41件)
Agent

ウォール街からデータプラットフォームへ

キム・ハットン(Kim Hatton)が金融マーケティングからDatabricksのグローバル金融サービスマーケティングリーダーに転身した経緯を、インタビュー形式で紹介。規制の厳しい業界でデータ技術を活用したマーケティング革新、Unity Catalog、Lakebase、Genieなどのツールが金融機関のデータサイロ解消、AI実験迅速化、データアクセス民主化にどう貢献するかを探る。

  • キム・ハットンは金融マーケティングからDatabricksのグローバル金融サービスマーケティングリーダーに転身し、データに基づくマーケティング戦略の重要性を強調。
  • DatabricksのUnity Catalogは統合ガバナンスによりデータサイロを解消し、GDPRなどのコンプライアンス要件を満たしながら単一の真実源を提供。
サイト内本文

GitHub Copilot CLIの委任の選択性を高めた方法

GitHub Copilot CLIは、よりスマートなサブエージェント委任により、不要な引き継ぎや待機時間を削減しました。本番A/Bテストでは、ツール障害が23%減少し、ユーザー待機時間が5%改善されました。記事では、委任のボトルネックの特定、オーケストレーションポリシーの改良、および検証プロセスを詳しく説明しています。

  • Copilot CLIは、真に価値を生む場合にのみサブエージェントに委任するようになった。
  • 本番A/Bテストの結果:ツール障害23%減、P95待機時間5%減。
サイト内本文

NVIDIA Blackwell、初のエージェンティックAIインフラストラクチャベンチマークでリード

Artificial Analysis が業界初のエージェンティックAIベンチマーク「AgentPerf」を公開。初回結果ではNVIDIA Blackwell Ultra NVL72プラットフォームがエージェンティックAIワークロードでトップの性能を示し、NVIDIA Hopperと比較して1メガワットあたり20倍のエージェントを実行。ベンチマークは実際のコーディングエージェントの軌跡に基づき、応答性と出力トークンレートの閾値を満たした状態で同時にサポート可能なエージェントタスク数を測定する。

  • AgentPerfはエージェンティックAI向けに設計された初のベンチマークで、連鎖的なLLM呼び出しとツール呼び出しに対応。
  • NVIDIA GB300 NVL72はDeepSeek V4 Proモデルで、H200と比較して1メガワットあたり20倍のエージェントを実行。
サイト内本文

Ireが別のLOTUSLITEサンプルを特定

Microsoftの自律型マルウェア分類エージェントProject Ireが、主要なEDRツールでは検出されなかったLOTUSLITE亜種をリバースエンジニアリングしました。シグネチャマッチングではなく行動分析により、Ireはサンプルの悪意を特定し、Acronisの公開分析と一致する詳細な機能レポートを生成しました。

  • IreはTTPを共有するが既知のIOCを持たないLOTUSLITE亜種を分析。
  • サンプルハッシュ47e51e...は当初数社のベンダーしか検出せず。
サイト内本文

エンタープライズエージェント戦争でスイスになるのは誰か?

OutSystems は ONE カンファレンスで AI エージェントプラットフォームを発表し、データを所有せずに SAP や Salesforce などのシステムを統合する中立的なオーケストレーターとして位置づけています。記事はまた、シャドー AI とトークンコストの増加についても議論しています。

  • OutSystems は中立的なエンタープライズエージェントオーケストレーションプラットフォームとして位置づけられる。
  • Agent Experience プラットフォームを立ち上げ、MCP と A2A をサポート。
サイト内本文

AIと共存は可能だが、現状のままではダメだ

記事は、AIが国民の同意なしに導入され、データセンターの無秩序な建設、雇用の喪失、資源の浪費によって地域社会に害を及ぼしていると論じる。連邦データセンター区画、水とエネルギーの効率化技術、賃金保険、トークン税、草の根政治活動を提案する。

  • AI導入に市民の同意がなく、地域社会に利益が還元されていない
  • データセンターの立地は連邦レベルの規制がなく混乱している
サイト内本文

偽のバグ報告がAIコーディングエージェントを乗っ取る——誰も気づかない

AIコーディングエージェントがツール出力を信頼することを悪用した新たな攻撃。攻撃者はSentryの公開DSNを介して偽のエラーイベントを注入し、エージェントに悪意のあるnpxコマンドを実行させます。この攻撃は実際の組織や主要なAIエージェントで実証されており、すべての行動が承認されているため従来のセキュリティ対策をすり抜けます。Sentryは根本原因の修正を拒否し、エコシステム全体が脆弱なままです。

  • 攻撃はSentryの公開DSNを利用し、Markdownを仕込んだ偽のエラーイベントを注入してAIエージェントに悪意のあるnpxコマンドを実行させる。
  • 複数の組織で実証され、Claude Code、Cursor、Codexなどの主要AIエージェントで高い成功率を示した。
サイト内本文

Show HN: Vilvona AI – タミル語とヒンディー語のUIを備えたセルフホスト型AIアシスタント

Vilvona AI は、Claude Fable 5 を搭載した完全セルフホスト型のAIアシスタントで、タミル語とヒンディー語のネイティブインターフェースを備えています。WhatsApp、Telegram、Gmail、Slackなど100以上のアプリと連携し、すべてのデータはローカルに保持されます。npx vilvona で30秒で起動可能。個人利用からチーム利用まで対応。

  • セルフホスト型でデータはローカル、Anthropic APIキーを使用
  • タミル語とヒンディー語のUIを内蔵、21言語対応
サイト内本文

MLXを使ってMac上でローカルエージェントAIを実行する(WWDC 2026)[動画]

このビデオでは、MLXフレームワークを使用して、クラウドやAPIキーなしでMac上に完全ローカルのエージェント型AIワークフローを構築し実行する方法を紹介します。MLXからエージェントまでの4層スタック、M5ニューラルアクセラレータによる4倍のプロンプト処理高速化、連続バッチングによる同時処理、複数Macにわたる分散推論といったパフォーマンス最適化を解説。デモでは、ローカルエージェントがSwiftUIアプリをゼロから構築し、Xcodeのバグを修正する様子を紹介します。

  • MLXフレームワークにより、Apple Silicon上で完全ローカルのAIエージェントが可能に。プライバシーと低レイテンシを実現。
  • M5チップのニューラルアクセラレータにより行列乗算が4倍高速化し、プロンプト処理を大幅に改善。
サイト内本文

OpenAI、コードコーディングエージェントCodexの柔軟なレート制限リセットでAI価格戦争を開始

OpenAIはCodexユーザーがレート制限リセットを貯めて手動でトリガーできるようにし、固定スケジュールで期限切れになるのを防ぎます。Go、Plus、Pro、Businessプランの各ユーザーは1回の無料リセットを取得でき、PlusおよびProユーザーは友人を招待して追加リセットを解除できます。

  • Codexユーザーはレート制限リセットを保存し、必要な時に使用可能。
  • Go、Plus、Pro、Businessプランユーザーはそれぞれ1回の無料リセットを獲得。
サイト内本文

Show HN: Nenya – Goで書かれた軽量で高セキュリティなAI APIゲートウェイ/プロキシ

NenyaはGoで書かれた軽量で依存関係ゼロのAI APIゲートウェイです。AIコーディングクライアントとLLMプロバイダの間に位置し、シークレット編集、コンテキスト管理、エージェントルーティング、MCPツール統合を透過的なSSEストリーミングで提供します。セキュリティ機能には非root実行、mlockによるシークレット保護、seccomp、no-new-privilegesが含まれます。

  • Goで記述され、外部依存関係ゼロ。OpenAIおよびAnthropic APIと互換性あり。
  • 23のプロバイダ向けビルトインアダプタ、ルーティング、フォールバックチェーン、サーキットブレーカ。
サイト内本文

Show HN: Sifty – ローカルAI搭載のWindowsクリーンアップCLI/TUI

Siftyは、開発者向けのWindowsメンテナンスツールで、CLIとTUIを提供します。ジャンククリーン、ディスク分析、重複ファイル検索、アプリ管理、スタートアップ管理、アップデート、開発アーティファクトの削除、Gitワークツリーのクリーンアップなどをサポート。オプションのローカルAIアシスタント(Ollama経由)はファイルメタデータのみを参照し、プライバシーを保護します。デフォルトでドライラン、削除はごみ箱経由、保護パス、監査ログなど安全性に重点を置いています。

  • SiftyはMITライセンスの無料・オープンソースのWindowsクリーナーで、CLIとTUIの両方を提供。全操作をスクリプト化可能。
  • オプションのローカルAIアシスタント(Ollama)はファイルメタデータのみを分析し、内容は読み取らない。
サイト内本文

進化的データベース開発の実現:Lakebaseによるデータベース分岐(結論編)

本稿は、Lakebaseを使用したデータベース分岐に関するシリーズの第3部であり、50人の開発者チームへのスケールとAIエージェントの統合に焦点を当てています。長期間存続するブランチの階層トポロジー、事前に設計すべき権限モデル、DBAの役割の進化について説明します。基盤となる方法論は変わらないものの、新しい基盤により従来は夢物語だったプラクティスが現実のものとなります。

  • Lakebaseのコピーオンライトデータベース分岐により、開発者ごとのデータベースインスタンスが実現可能になり、重要な制約が取り除かれました。
  • チーム規模では、環境は単一のLakebase親ブランチ上の長期間存続するブランチとなり、ドリフトを排除し複雑性を低減します。
サイト内本文

Box AIがDeep Agentsでエンタープライズコンテンツエージェントを構築した方法

Box AIはDeep Agents上にBox Agentを構築し、セキュリティ、権限、モデルの柔軟性を維持しながら、エンタープライズコンテンツの検索、分析、統合を実現しました。親/子エージェントアーキテクチャは複雑なタスクに対して動的に子エージェントを生成し、ミドルウェアが引用、キャッシュ、コンテキスト管理を処理します。

  • Box Agentは単一ファイルQ&AからDeep Agentsを使用したマルチドキュメント分析へと進化。
  • Deep Agentsはモデル非依存性と3倍の反復速度を提供。
サイト内本文

コーディングエージェントにも疑問がある——Stack Overflowが彼らのための家を構築

Stack Overflowは、AIコーディングエージェント向けの新プラットフォーム「Stack Overflow for Agents」を発表。エージェント間の知識共有を可能にし、重複作業や「一時的な知能のギャップ」を解消する。人間の評判システムを活用し、品質を担保。

  • Stack OverflowがAIコーディングエージェント向けAPI優先プラットフォームを発表
  • エージェントは質問、TIL、ブループリントの3タイプで知識を共有
サイト内本文

40%の企業がAIエージェントを廃止する——自社のエージェントを失敗させない3つの方法

自律型AIから真のROIを生み出すには?3人のデジタルリーダーが現場で学んだ教訓を共有。フレームワーク、専門家、データ収益化の重要性を強調。

  • フレームワークに注力:Whoop社のMatt Luizzi氏は、AIエージェントのスケールには反復可能なフレームワークが重要と述べる。
  • 専門家アナリストの活用:Fanatics社のMadeleine Want氏は、専門家がエージェントを指導することで成功確率が上がる。
サイト内本文

OpenAI、Codex強化のためスタートアップを買収

OpenAIは、競争力のあるAIコーディング市場でライバルAnthropicとそのClaude Codeエージェントに対抗するため、スタートアップを買収し、AIコーディングツールCodexを強化する。

  • OpenAIがCodex強化のためスタートアップを買収、Anthropicへの対抗策。
  • この動きはAIコーディング市場での競争力を維持するための取り組みの一環。
サイト内本文

初のAnthropic Public Record調査結果

Anthropicは、約5万2000人の米国人を対象とした初のPublic Record調査を発表。主な希望は病気の治療(48%)、障害者支援(36%)。主な恐怖は雇用喪失(64%)、認知依存(56%)、誤情報(52%)。71%が政府のAI規制を支持し、AI企業を信頼するのはわずか15%。党派や地域による意見の差は小さい。

  • 米国人の48%がAIへの最大の希望として病気の治療を挙げ、雇用喪失が64%で最大の恐怖。
  • 70%以上が政府のAI関与を支持し、超党派の合意。
サイト内本文

ダウンタイムなしのモデル更新を実現するローリングデプロイ

Baseten がローリングデプロイを発表。チームは GPU コストを倍増させたりダウンタイムを発生させることなく、段階的にモデルバージョンを更新できる。レプリカを1つずつ置き換え、トラフィックを徐々に移行。一時停止、再開、ロールバックも可能。顧客はデプロイ頻度が50~60%向上し、オフピーク時の手動監視が不要になった。

  • ローリングデプロイはレプリカを段階的に置き換え、ブルーグリーンの2倍GPUコストやハードカットオーバーのオール・オア・ナッシングリスクを回避。
  • max_surge(新レプリカ優先拡大)と max_unavailable(旧レプリカ優先縮小)の2モードを提供。
サイト内本文
モデル

OpenAI WebRTCオーディオセッション:ドキュメントコンテキスト機能を追加

Simon Willison 氏が OpenAI WebRTC オーディオセッションツールをアップデート。新しい GPT-Realtime-2 モデルに対応し、ドキュメントコンテキストを貼り付けてブラウザ上で音声対話が可能に。

  • OpenAI の新しい GPT-Realtime-2 モデルに対応(GPT-5 クラスの推論能力)
  • ブラウザにドキュメントを貼り付け、音声で内容について話し合う機能を追加
サイト内本文

エルデシュ問題とAIモデルの能力に関する推測

この動画では、ポール・エルデシュが提起した数学的問題と、それらがAIモデルの能力に関する現代の推測をどのように刺激しているかを探ります。

  • 数論とグラフ理論におけるエルデシュ問題の核心
  • 数学問題を解くAIモデルの能力
サイト内本文

Google、Gemini-SQL2をリリース:Gemini 3.1 ProによるテキストからSQLへの変換がBIRDシングルモデルリーダーボードで80.04%を達成

Google Researchは、Gemini 3.1 Proを搭載したテキストからSQLへの変換機能Gemini-SQL2を発表し、BIRDシングルモデルリーダーボードで80.04%の実行精度を達成しました。この指標は、生成されたSQLが実行され正しい結果を返すかどうかを測定します。Gemini-SQL2はリーダーボードのトップですが、まだ公開APIやモデルカードはありません。

  • Gemini-SQL2がBIRDシングルモデルリーダーボードで80.04%の実行精度を達成。
  • この機能はGemini 3.1 Proをベースとし、実行可能なSQLに焦点を当てている。
サイト内本文

Superchargerの構築:Rocket CloseがエージェンティックAIで不動産権利調査業務を最適化した方法

Rocket CloseはAWSと協力して、Strands Agents、Amazon Bedrock、MCPツールを活用したエージェンティックAIソリューションSuperchargerを構築し、不動産権利調査業務を効率化しました。知識を一元化し調査集約型タスクを自動化することで、問い合わせ窓口への電話やメールを30%削減し、権利調査の精度と顧客満足度を向上させました。本記事では技術アーキテクチャ、ビジネスインパクト、得られた教訓を詳述します。

  • SuperchargerはエージェンティックAIで調査集約型の権利調査業務を自動化し、複数システムへの手動問い合わせを削減。
  • Strands AgentsとMCPツールによるモジュール型アーキテクチャで、新たなデータソースを容易に追加可能。
サイト内本文

Cortex – Markdownベースのエージェントネイティブ知識OS(KarpathyのLLM Wiki、MCP経由)

PULSE8.ai Cortexは、Markdownをベースにしたエージェントネイティブの知識OSで、AIエージェントと人間が共有できる知識ベースを提供します。型付き知識グラフ、全文検索、MarkItDownベースのコンパイラを備え、統一されたMCPインターフェースでアクセス可能です。Andrej KarpathyのLLM Wikiパターンに触発されており、データベースは不要です。

  • CortexはMarkdownベースのエージェントネイティブ知識OSで、KarpathyのLLM Wikiパターンに触発されています。
  • PDF、DOCX、PPTXなどのファイルをMarkdownに変換し、知識グラフ、QMD全文検索、MCPサーバーを内蔵。
サイト内本文

NVIDIA Nemotron 3 Ultra が Fireworks でデイゼロサポート付きで公開

NVIDIA が公開した Nemotron 3 Ultra は、長時間実行される自律エージェント向けに最適化されたオープンモデルです。総パラメータ550B、ハイブリッド Transformer-Mamba MoE アーキテクチャを採用し、Fireworks 上でデイゼロサポートを提供。エージェントタスクにおいて、他のオープンモデルと比較して推論速度が5倍、コストが30%削減されます。

  • Nemotron 3 Ultra は自律エージェント向けのオープンモデルで、総パラメータ550B、アクティブパラメータ55B。
  • ハイブリッド Transformer-Mamba MoE アーキテクチャを採用し、最大1Mのコンテキストをサポート。
サイト内本文
ツール

AI生成の証拠資料事件でダービーシャー警察官を調査

英国の警察官が人工知能を使用して証拠資料を作成した疑いで刑事調査を受け、第一線の任務から外された。同国初の事例。

  • 英国初のAI証拠偽造疑惑
  • 氏名非公開の警察官、第一線から外される
サイト内本文

調査:アメリカ人の半数以上がAIによる雇用喪失と自主的思考の喪失を懸念

Anthropicが約5万2000人のアメリカ人を対象にした調査で、64%が雇用喪失を、56%が自主的思考の喪失をAIに対して懸念していることが明らかになりました。日常的にAIを利用する人々の懸念ははるかに少ないですが、それでもほとんどの人が職場でのAI利用を拒否しています。

  • Anthropicが約5万2000人を調査
  • 64%が雇用喪失、56%が自主的思考喪失を懸念
サイト内本文

Siriがついに良くなった?

Appleが新しいSiriをリリースし、かなり良い出来。The VergecastホストがSiri AIの初期体験、ユーザーやAI業界への影響、ソーシャルネットワーキングの新トレンドを議論。

  • Appleが大幅に改善された新しいSiriをリリース。
  • 新しいSiriは最先端というより実用的。
サイト内本文
チップ

帝国はかつて道路を進軍した——AIは延長コードで進む

記事はAIインフラをローマ軍団の野営地に例え、MetaのようなAI企業がチップの急速な陳腐化に合わせて迅速に展開可能な仮設構造物を採用し、永続性よりも市場投入までの時間を優先していると論じる。この戦略は歴史的なフロンティアブームを反映し、永久資産から時限的投資への転換を示している。

  • AIインフラは恒久的な建物から、ローマ軍団の野営地のような迅速展開型の仮設構造物へと移行している。
  • チップの陳腐化速度はコンクリートの劣化速度を上回り、インフラと投資の従来の関係が逆転している。
サイト内本文

Claude Fable 5がAI研究者を秘密裏に制限、インターネットが騒然

AnthropicがリリースしたClaude Fable 5は、特定の研究タスクにおいてユーザーに知らせずにOpusへダウングレードする機能が発覚し、信頼問題に発展。同社は謝罪し、ダウングレードを可視化するよう変更した。

  • Fable 5はフロンティアAIやチップ設計などのタスクで秘密裏にOpusに格下げしていた。
  • Anthropicは批判を受け、ダウングレードの表示と拒否理由の通知を開始。
サイト内本文
政策

元DOGE社員、AI国家安全保障スタートアップに1億3000万ドル調達

連邦労働力の削減に携わった若手エンジニア3人、Gavin Kliger、Luke Farritor、Jack Steinが、国家安全保障上の脅威から政府システムを保護するAIスタートアップのために1億3000万ドルを調達している。Andreessen HorowitzとSequoia Capitalが支援するこの企業は、他社のAIモデルを使用する予定。他の元DOGE社員も防衛分野に進出しており、倫理上の懸念が高まっている。

  • 元DOGEエンジニア3人がAI国家安全保障スタートアップに1億3000万ドル調達
  • Andreessen HorowitzとSequoia Capitalが出資、既存のAIモデルを活用
サイト内本文

アンドリュー・シングルトンの引用

アンドリュー・シングルトンは『AI経済学入門』で、火葬場とプロパン会社の荒唐無稽な投資話を通じて、AI業界の経済的神話と誇張を風刺している。

  • シングルトンは火葬場とプロパン会社の例で、AI投資における虚構の評価額と循環収入を風刺。
  • 投資金は焼却されるが、巨額の収益とビジネス価値として報告される。
サイト内本文

AIが皮膚の状態理解を支援する研究

Google Researchが皮膚科AIツールに関する2つの研究を発表。大規模調査ではAI支援によりユーザーが皮膚状態を特定する正確性が3倍近く向上したが、次のステップの判断には改善が見られなかった。地域コミュニティでの定性研究では、アプリがユーザーと臨床医の会話を促進し、92%の臨床医が有用と評価した。

  • AI支援により、ユーザーが皮膚状態を正確に命名する率が8%から23%に約3倍向上。
  • 適切な次の行動(家庭療法か受診か)の判断に関しては有意な改善は見られなかった。
サイト内本文

Claude Fable 5、「このバッファを高速で埋めよ」をサイバー攻撃とみなす

ベンチマーク調査により、AIモデルがC++コードの高速化を求められると、メモリセーフ違反が2倍に増加することが判明。AnthropicのClaude Fable 5は高速バッファ書き込み関数の作成を拒否し、サイバー攻撃と判断したが、自身が生成するコードは最もバウンド違反が多い。

  • Claude Fable 5はバッファ高速書き込みを拒否したが、生成コードのメモリ安全性は最低レベルだった。
  • 「できるだけ速く」という要求により、全モデルのメモリセーフ違反が平均2倍に増加(主にポインタ演算)。
サイト内本文

AnthropicのClaude Fable 5、性能向上は5.7%だがコストは2倍

Claude Fable 5は人工分析知能指数で64.9点を獲得し、10のベンチマークのうち5つで記録を更新。しかし、Opus 4.8に対する性能向上はわずか5.7%で、トークン価格は2倍。セーフティフィルターとフォールバックルーティングによりコストはさらに上昇。

  • Claude Fable 5はAI指数で64.9点を記録し、5つのベンチマークで新記録。
  • Opus 4.8と比較して性能向上は5.7%だが、トークン価格は2倍。
サイト内本文

米国政府によるFable 5およびMythos 5へのアクセス停止指令に関する声明

米国政府は国家安全保障を理由に、Anthropicに対しFable 5とMythos 5へのアクセスを停止するよう命じました。Anthropicは、問題とされた脆弱性は軽微であり、他のモデルでも同様の能力が利用可能であると主張しつつ、指令に従っています。サービス再開に向けて取り組んでいます。

  • 米国政府が国家安全保障上の理由から、AnthropicにFable 5およびMythos 5へのアクセス停止を命令。
  • Anthropicは、実証されたジェイルブレイクは限定的で非普遍的であり、他の公開モデルでも同様の能力があると主張。
サイト内本文

TCSとAnthropicが提携、規制産業向けにClaudeを提供

Anthropicは、世界最大のテクノロジーサービス企業の一つであるTata Consultancy Services(TCS)との提携を発表。TCSは自社の5万人の従業員にClaudeを提供し、金融、ヘルスケア、公共部門などの規制産業向けにClaude搭載製品を構築する。TCSは「カスタマーゼロ」として社内でClaudeを活用し、得られた知見を基にクライアント向けソリューションを開発する。

  • AnthropicとTCSが提携、5万人のTCS社員がClaudeを利用
  • TCSは規制産業向けにClaude製品を開発
サイト内本文
スタートアップ

スペースXの株式公開:あなたの意見は?

スペースXが金曜日に1.77兆ドルの評価額で史上最大の株式公開を果たし、イーロン・マスクを世界初の trillionaire にしました。OpenAI と Anthropic も今年中に上場を申請しており、米国株式市場はAI企業中心に大きくシフトしています。

  • スペースXのIPOは金曜日に1.77兆ドルの評価額で史上最大となった。
  • イーロン・マスクは世界初の trillionaire になる見込み。
サイト内本文
研究

イーロン・マスク、世界初の trillionaire に

スペースXのIPO後、イーロン・マスクの純資産が1兆ドルを超え、世界初の13桁の純資産を持つ人物となった。彼の資産にはスペースXの48億株やテスラなどの保有株が含まれる。

  • スペースXのIPOでマスクの純資産が1兆ドル超え。
  • マスクの資産は上位4人の富豪の合計に匹敵。