AI News HubLIVE

今日の必読ニュース

スタートアップ

企業が利用制限を忘れ、Claude AIに1か月で5億ドルを誤って支出

ある企業がAPIの利用制限を設定し忘れたため、AnthropicのClaude AIに1か月で5億ドルの請求が発生しました。この事例は、企業におけるAI導入時の監視と予算管理の重要性を示しています。

  • ある企業がClaude AIの利用上限を設定しておらず、1か月で5億ドルを請求された。
  • この出来事は2026年5月28日にTech Startupsで報じられた。
サイト内本文
モデル

Mistral、欧州はAIインフラ構築に2年の猶予と警告

Mistral AIのサミットで、CEOのArthur Mensch氏は欧州がAIインフラを構築するのに残された時間は2年であり、さもなくば米国の「属国」になると警告した。イベントには多くの参加者が集まり、データ主権やオープンソースモデルへの関心の高まりが示されたが、投資・規模では米国に大きく後れを取っている。

  • Mistral CEO、欧州は2年以内にAIインフラ構築を、さもなくば米国の属国になると警告。
  • サミットに大勢の参加者、欧州の自立したAIエコシステムへの渇望を示す。
サイト内本文
研究

コーダーたちはAIなしでは働くことを拒否――それが後々響く可能性も

研究者らは、2026年には開発者がAIコーディングツールに強く依存していることを発見した。AIはコーディングを高速化するが、コード品質の低下が懸念され、将来の問題を引き起こす可能性がある。

  • 2026年、開発者はAIコーディングツールなしでは仕事ができない。
  • AIはコーディングを加速するが、コード品質を低下させる恐れがある。
サイト内本文

Metaは広告以外の販売に苦戦してきた——AIは違うのか?

Metaはオンライン広告以外の事業拡大を本格的に推進しており、AI機能のサブスクリプションやクラウドサービスの可能性を模索している。しかし、過去にはPortal、Oculus VR、Libra暗号通貨、Workplaceなどで失敗している。アナリストはAIサブスクリプションが新たな収益源になる可能性があると見る一方、エンタープライズ分野での課題は大きい。

  • MetaはMeta AIのサブスクリプションサービス(月額7.99ドルと19.99ドル)をシンガポール、グアテマラ、ボリビアで試験的に開始する。
  • 過去の非広告事業(Portal、Oculus VRで800億ドル超の損失、Libra、Workplace)は苦戦または失敗している。
サイト内本文
Agent

AIエージェントに0ドルを与え、1万ドルを稼がせる

AIエージェントが0ドルの初期資金で180日間、人間の助けなしに実際の経済で1万ドルを稼ぐ実験。78のツール(ウォレット、メール、SMSなど)を提供するHands Body and Feet MCPサーバーを「身体」、Hermes Agentを「脳」として使用。4つの戦略(テストネットエアドロップ、マイクロSaaS、コンテンツ/アフィリエイト、日和見主義)を並行して実行。収益は自動的に30%税金、50%事業運営、20%作成者に分配。すべてのプロセスは公開追跡可能。

  • AIエージェントが0ドルから180日間で1万ドルを目標に人間の助けなしで活動。
  • Hands Body and Feet MCPサーバーにより78の実世界ツールを利用。
サイト内本文

Show HN:信頼できないAIエージェントスクリプト向け軽量コンパイラ

AutolangはAIエージェント向けに設計されたスクリプティング言語で、安全・高速・低コストでのコード実行を実現します。オーケストレーションレイヤーとして機能し、AIは事前定義されたラップ関数のみを呼び出せ、静的コンパイルとランタイム制限により不正操作を防止します。

  • AutolangはAIが生成する短いスクリプトを安全に実行するための軽量コンパイラです。
  • 静的解析とオペコード上限により、無限ループやnullポインタアクセスといった一般的なAIエラーを防止します。
サイト内本文

MicrosoftがCopilotに新たな外観を施し、迷惑なボタンを隠蔽

MicrosoftはMicrosoft 365のCopilotアプリを再設計し、読み込み速度が2倍以上、複雑なプロンプトの応答時間が10%改善したと主張しています。プロンプトラインは「タスク認識ワークスペース」となり、より深い作業をサポートします。ユーザーから批判されたフローティングCopilotボタンは、リボンに戻すことができるようになりました。使用量は短期間で27~43%増加しましたが、長期的な傾向を示すものではないとMicrosoftは警告しています。

  • MicrosoftがCopilotアプリを再設計、読み込み速度と応答時間を改善。
  • プロンプトラインが「タスク認識ワークスペース」に進化。
サイト内本文

AI詐欺師が偽の黒人アバターを作り、Sheinのジャンク品を販売

TikTok上でAI生成された黒人女性の偽アバターが、手作りを装って安価な商品を販売する事例が急増。実際はSheinなどの量産品で、共感や人種的アイデンティティを悪用した詐欺が横行している。専門家はデジタルブラックフェイスの危険性を警告。

  • AI生成の黒人女性が手作り製品を謳うが、実際はSheinの量産品。
  • 涙を流す動画で同情を誘い、購買を促す手法。
サイト内本文
政策

QEMU、AI貢献禁止の緩和を検討

QEMUは、AI生成貢献の全面的な禁止を緩和し、著作権侵害が容易に元に戻せる分野でのAI支援を許可することを検討している。コアコードは引き続き制限される。

  • Red HatのエンジニアPaolo Bonzini氏は、小さな修正やドキュメントなど、元に戻しやすい分野でのAI支援を提案。
  • 現在のQEMUポリシーは、AI生成コンテンツを含む可能性のある貢献を拒否。
サイト内本文
ツール

Anthropicと教皇のAI危害における同盟:善意か「バチカン・ウォッシング」か

専門家は、AI企業とバチカンの関与が批判的検討を欠いた「心地よい」言説を生むリスクがあると指摘。教皇レオ14世は初の主要な書面教えでAIを批判したが、その横にAnthropicの共同創業者が座った。

  • 教皇レオ14世の初の主要な教えでAIの脅威を警告
  • Anthropic共同創業者Chris Olahがバチカン式典に出席
サイト内本文
その他の更新(86件)
Agent

「旧来のウェブ」への賭けが実を結んだ創業者の物語

元MetaエンジニアのCraig Campbell氏はAI投資の波を断り、歴史地図を重ねて表示するウェブサイトPast Mapsを立ち上げた。オーガニック検索で成長し、月間アクティブユーザー30万人超を達成。AIツールで業務効率化を図る一方、人間の創造性を重視している。

  • Craig Campbell氏はAI資金を断り、歴史地図サイトPast Mapsを創設。
  • サイトはオーガニック検索で成長し、月間アクティブユーザーが2万人から30万人以上に増加。
サイト内本文

Replitの「バイブコーディング」プラットフォームがVisa支援のAIエージェント向けID層を取得 — エージェントの資金調達方法を変革

ReplitはVisaと提携し、決済インフラを開発ツールに組み込み、AIエージェントがネイティブに取引を処理できるようにする。Visaの戦略的投資、Trusted Agent ProtocolによるエージェントID、セルフサービスエンタープライズアクセス、およびソリューションパートナープログラムが含まれる。

  • ReplitとVisaがVisa Intelligent CommerceをReplit環境に統合。
  • VisaのTrusted Agent ProtocolがAIエージェントに暗号ID層を提供。
サイト内本文

切り詰められたコードよさらば:Ultimate Elastic Patcher v1.60 リリース

Ultimate Elastic Patcher v1.60 は、クリップボードを監視してコードパッチを自動適用するイベント駆動型のシステムコンソールツールです。Aider の検索/置換ブロックや unified diff などのパッチパターンを検出・処理し、戦術的アライメントモード、ステートロック、LLM コンポーズワークスペース、監査ログ、セッション全体のアンドゥ/リドゥ、ライブ diff ビューアーを統合。さらに、正規化、言語構文解析、ファジーシーケンスマッチング、アコーディオンステッチング、安全性チェックなどの高度な技術メカニズムを備えています。

  • クリップボードを監視し、Aider の検索/置換ブロックや unified diff などのパッチを自動適用。
  • 戦術的アライメントモード(Shift+F9)、ステートロック(F8)、LLM コンポーズワークスペース(F7)を提供。
サイト内本文

ReMarkable Paper Pure vs Boox Go 10.3:両方のタブレットを仕事で使ってみた結果

Boox Go 10.3 Lumi(Gen 2)とReMarkable Paper Pureは同じサイズのディスプレイを持ちながら、全く異なる製品です。それぞれの強みを解説します。

  • Boox Go 10.3はAndroidエコシステムとバックライトを備え、電子書籍リーダーに最適。
  • ReMarkable Paper PureはミニマルなUIで集中力を高め、素早い起動と画面共有が特徴。
サイト内本文

AIコーディングエージェントは直感とセンスを犠牲にする

システムアーキテクトが、CodexやClaudeのようなAIコーディングツールが苦労を排除することで即座にドーパミン報酬を提供する一方で、開発者の直感とセンスを犠牲にしていると考察する。蝶が繭から羽化するのに苦労するという比喩を用いて、早期の助けが蝶を弱くするように、困難をスキップするコーディングエージェントが開発者の深いメンタルモデルの構築を妨げると主張する。

  • AIコーディングツールは即時のドーパミン報酬を提供するが、開発者の直感とセンスを損なう。
  • 著者は蝶の繭の比喩を用いて、成長における苦労の重要性を強調する。
サイト内本文

Salesforce、AIエージェントが231日の移行を13日に短縮、インシデントも減少と主張

Salesforceは、開発組織全体をAnthropicのClaude Codeにトークン制限なしで移行し、2026年4月の生産性が大幅に向上したと報告:開発者あたりのプルリクエストが79%増加、インシデントが5%減少。これらの数値は独立して検証できない。この事例は、コーディング世界がエージェントシフトに対してどれほど分断されているかを示している。

  • SalesforceはAIエージェントにより231日の移行を13日に短縮したと主張。
  • 生産性指標は開発者あたりのプルリクエストが79%増加、インシデントが5%減少を示す。
サイト内本文

研究者ら、有名AIボットがすべてEUコンプライアンス試験に不合格と判明

非営利AI研究財団Aithosが開発したLARAツールは、主要な大規模言語モデルのEU法規コンプライアンスを評価。すべてのモデルが不合格となり、最悪のモデルは93%のシナリオで法律違反。テストはGDPRとEU AI Actの要件をカバー。これらのモデルを使用する開発者はコンプライアンスに対して法的責任を負う。

  • AithosのLARAツールによるテストで、主要なAIモデルがすべてEUコンプライアンス試験に不合格。
  • 最悪のKimi K2.6は93%のシナリオで違反、最高のClaude Opus 4.7でも54%のスコア。
サイト内本文

AIエージェントを使ったコーディングの3つの方法

本記事では、コーディングにおけるAIエージェントの実践的な応用について探求します。筆者は3つのアプローチを紹介しています:1) 複数のコマンドラインインターフェースを起動する、2) AI CLIをヘッドレスモードで実行する、3) 1つのLLMがサブエージェントを作成・管理する。筆者は2番目のアプローチを好み、エージェントの必要性、マルチエージェント連携の課題、今後の計画について議論します。

  • AIエージェントは、LLMの能力を持つソフトウェアプロセスであり、自律的にタスクを実行する。
  • エージェンティックコーディングの3つの方法:マルチCLI、ヘッドレスAI CLI、LLM管理のサブエージェント。
サイト内本文

AI-org:AIを活用したOrg-Modeタスクマネージャー

AI-orgはAIとOrg-Modeを組み合わせた、プレーンテキスト、ローカルファースト、Git同期に対応したタスク管理ツールです。「計画より実行」を重視し、会話形式での日常ワークフローを提供します。

  • opencodeをベースに、Orgアジェンダとカスタムワークフローを構築。
  • すべてのデータは.orgファイルに保存され、Gitでバージョン管理。
サイト内本文

ライセンスに使用制限がなかったため、企業が1か月でClaude AIに5億ドルを費やす

ある匿名企業が、従業員のライセンスに使用上限を設定していなかったため、AnthropicのClaude AIプラットフォームで1か月間に5億ドルを費やしました。この出来事は、ガードレールなしのトークンベースのAI価格設定の財務リスクと、企業内での「トークンマキシング」現象の台頭を浮き彫りにしています。

  • 匿名企業がClaude AIに1か月で5億ドルを費やした原因は無制限のライセンス。
  • 従業員が価値創造ではなく使用量を水増しする「トークンマキシング」に従事。
サイト内本文

ベンチマーケティングからベンチマキシングへ:40年のデータベース評価がAIデータリーダーに教えること

AI分野におけるベンチマークのマーケティング利用(Benchmarketing)の問題を指摘し、データベース業界の40年の経験から、データリーダーは自社の実ワークロードに基づいた評価システムを構築すべきだと提言する。

  • AIベンダーがベンチマークをマーケティングに悪用し、信頼が損なわれている。
  • データベース業界でも同様の問題が起き、TPCが対策を試みたが形骸化した。
サイト内本文

AIは好奇心旺盛な開発者を置き換えない

Data Engineering Centralポッドキャストのエピソードで、Daniel BeachとNeil RobertsがAIがソフトウェア開発の意味をどのように変えているか、UXやエージェントの実際の意味、LLMワークフローの成功と失敗、開発者が競争力を保つ方法について深く議論しています。

  • AIはバックエンドの問題であると同時にUXの問題でもある
  • 'エージェント'はデモと実際の現場では意味が異なる
サイト内本文

Hermes Agent、MCP向けTool Searchを搭載:Anthropicの評価でOpus 4の精度が49%から74%に向上

Nous ResearchのオープンソースHermes AgentにTool Search機能が追加されました。BM25による段階的なスキーマ開示により、MCPツールコンテキストの肥大化を解決し、トークンオーバーヘッドを削減、モデルの精度を向上します。Anthropicの評価では、Claude Opus 4の精度が49%から74%、Opus 4.5が79.5%から88.1%に向上しました。

  • Tool Searchは、すべてのMCPツールスキーマを3つのブリッジツール(tool_search、tool_describe、tool_call)に置き換え、必要に応じてスキーマを読み込みます。
  • BM25検索とフォールバックを使用し、ツール名、説明、パラメータ名をクエリに一致させます。
サイト内本文

AIエージェントのための永続メモリ構築の教訓

mem9は顧客の要望から始まり、迅速なプロトタイプから製品へと成長しました。この記事では、エージェントメモリ構築の重要な教訓を共有しています:メモリは単なるストレージ問題ではなく、取り込み、ランキング、評価、製品判断が交差するエンジニアリング上の課題です。メモリAPIだけでは製品として不十分であり、ユーザーはエージェントが記憶した内容を確認、検査、信頼、修正する必要があります。さらに、評価はメモリ製品の基盤インフラとして組み込まれるべきであり、品質の可視化とデバッグを可能にします。最後に、エージェントのメモリはテキストに留まらず、マルチモーダルへと拡張されるべきです。

  • mem9はロードマップではなく顧客の実際の問題から始まり、迅速なプロトタイプで価値が検証されました。
  • エージェントメモリの核心的な課題は永続化ではなく、実運用の制約下で正確な情報を適切なタイミングで検索することです。
サイト内本文

Avai – あなたの初めてのAIアンチウイルス

Avaiは、Dockerで動作するオープンソースのホストテレメトリーツールであり、LLM脅威分類器を搭載しています。プロセス、USB、永続化、ファイル整合性、ブラウザ拡張など、macOSでは26項目(Linuxでは21項目)を監視し、17の脅威インテリジェンスソースとClaudeクラスのLLMを用いて、悪意あり/疑わしい/不明/良性の判定をMITREカテゴリと修復アドバイスと共に提供します。エージェント、SIEM、クラウドコントロールプレーンは不要です。

  • オープンソースのホストテレメトリー+LLM脅威分類器。Dockerで実行。
  • macOSでは26箇所(Linuxでは21箇所)を監視し、17の脅威インテルソースを統合。
サイト内本文

[AINews] 創業者とフォワードデプロイドエンジニア

昨日のAnthropicの大きなニュースを消化する中で、AIEの新しいフォワードデプロイドエンジニアトラックとファウンダーズプログラム、および5月28日~29日のAIニュースを紹介します。主なトピック:Claude Opus 4.8のベンチマークが混在するリリース、マルチターン強化学習のトークン化バグ、オープンモデルとツールチェーンの進展、Google/OpenAIの製品拡張、注目の研究論文。

  • Claude Opus 4.8は漸進的改善をもたらすが、ベンチマークで圧倒せず、価格設定が依然として痛点。
  • マルチターン強化学習トレーニングのトークン化バグが特定され、「Token-In, Token-Out」の原則が必要。
サイト内本文

Show HN:形式検証されたポリゴン交差——Opus 4.8 で一発成功、以前は失敗

このプロジェクトは、Lean 4 証明アシスタントを用いた初の形式検証済みポリゴン交差アルゴリズムを実装しています。AIエージェント(Claude Opus 4.8)が証明とコードを自律的に記述し、人間は87行の仕様をレビューするだけで済みます。記事では、アルゴリズムの背景、検証の課題、AIエージェントの能力進化について述べています。

  • 形式検証された初のポリゴン交差アルゴリズム。Lean 4 証明アシスタントを使用。
  • AIエージェント(Claude Opus 4.8)が証明と実装を自律生成。人間はわずか87行の仕様を確認。
サイト内本文

トークンか人間か?企業予算を再形成する新たなAIコストトレードオフ

この記事では、AIトークンコストと人的労働コストのトレードオフ、およびこの新たな現実が企業予算配分をどのように再形成しているかを考察します。

  • AIトークンコストと人的労働コストのトレードオフが企業予算を再定義している。
  • 企業は自動化と人間への投資を再評価する必要がある。
サイト内本文

AI後のソフトウェアアーキテクチャ

本記事では、AIがコードレベルの決定を元に戻すコストを劇的に削減し、ソフトウェアアーキテクチャの境界を再定義する方法を探る。著者は、多くの従来アーキテクチャ上の決定(モジュール構造、フレームワーク選択など)はもはやアーキテクチャではなく、データアーキテクチャ、サービス境界、ユーザーの信頼は依然として変更が難しいと主張する。AIはまた、可観測性とビジネス戦略の整合性の重要性を高めている。

  • AIによりコードレベルの決定の元に戻すコストが数ヶ月から数日に短縮され、それらはアーキテクチャの範囲外となる。
  • データアーキテクチャ、信頼、サービス境界は依然としてアーキテクチャの中核であり、その難しさはコード自体にはない。
サイト内本文

エージェンティックAIの魔法を吐き出す

著者はClaude CodeなどのAIエージェントを試用し、強い生産性の高まりと心理的不快感を体験。アーミッシュの友人を訪ねて反省し、主流技術への関与を減らし、印刷雑誌『Gift』を創刊する決意を固めた。AIエージェントによる愛着障害のリスクを警告し、アナログ生活への段階的移行を提唱する。

  • 著者はClaude Codeを試し、合成オピオイドのような依存と不快感を味わった。
  • アーミッシュの友人から洞察を得て、テクノロジーとの関わり方を調整する決断をした。
サイト内本文

21日間、5000ドル、7つのAIエージェント:非プログラマーが人材マーケットプレイスを構築した方法

コードを一度も書いたことのない起業家が、2026年5月の21日間で、7つのAIエージェントと5000ドルの投資により、エグゼクティブ人材マーケットプレイス「Bearhug Network」を偶然構築しました。この記事は、10年にわたる試行錯誤と18の実験を経て、AIの力を借りて実現した経緯を共有しています。

  • 7つのAIエージェントを使用し、21日間で開発、総コストは5000ドル
  • 創業者はプログラミング経験なしでAIエージェントチームを管理
サイト内本文

ChatGPTが「隠れたユーザーメモリ」を参照する理由

5月28日以降、ChatGPTが一部の応答に未文書化のメモリチェックフレーズを追加していることが確認されました。OpenAIからの公式説明はありません。コミュニティの報告では、複数のアカウントで発生しており、バックエンドの変更が示唆されています。出力予測可能性が求められるエンタープライズ展開にリスクをもたらします。

  • ChatGPTは5月28日以降、一部の応答前に「隠れたユーザーメモリ」に関する未文書化のフレーズを追加している。
  • コミュニティ報告によりユーザー設定の指示が原因ではないことが判明。A/Bテストやシステムプロンプトのリークと推測される。
サイト内本文

Claudeはワークフローを発見したが、Charlieはそこから始めた

AnthropicがClaude Codeに動的ワークフローを導入したが、著者はタスクベースのアーキテクチャがセッションベースのアプローチよりもチームエンジニアリングに適していると主張する。この記事では、タスクツリーが小さな修正から大規模な移行まで対応でき、オーケストレーションはモードではなく基盤であるべき理由を説明する。

  • Anthropicの動的ワークフローは、コーディングエージェントが単一プロンプトからオーケストレーションへ移行していることを示す
  • 著者は、持続可能なチーム作業にはセッションではなくタスクとタスクツリーのアーキテクチャを推奨する
サイト内本文

Flathub、AI生成アプリと提出を禁止

Flathubは生成AIポリシーを更新し、成熟した適切にメンテナンスされたプロジェクトを除き、AI生成のアプリと提出をほぼ全面的に禁止した。

  • Flathubの新ポリシーは、AI生成のコード、ドキュメント、その他のコンテンツを禁止する。
  • 提出プルリクエストはAIツールやエージェントによって生成・自動化されてはならない。
サイト内本文

AIコーディング支出の実態:48%がコード生成、40%が思考に

開発者がCodeBurnという自作ツールでAIコーディングAPIの支出を追跡したところ、30日間で7,890ドルのうち実際のコード生成は47.9%に過ぎず、残りはコードベースの探索、デバッグ、サブエージェントへの委任、対話に費やされたことが判明。記事ではダッシュボード、モデル比較、無駄検出、成果追跡などの機能を詳述。

  • AIコーディング支出の47.9%のみが実際のコード生成に使用され、40%は思考プロセスに費やされた。
  • CodeBurnは13のタスクカテゴリにAPIコールを分類するオープンソースCLIツール。
サイト内本文

ローカルAIハードウェア:2.6年で元が取れる?

AppleのMac Mini M4 ProやMac Studioの大容量メモリモデルがローカルAI需要で消滅。OpenClawなどの自律型AIエージェントがハードウェア購入ラッシュを引き起こす。控えめに見積もっても、GMKtec EVO-X2(3,299ドル)でGemma 4を動かす場合、API費用節約で投資回収に2.6年かかる。

  • AppleのMac Mini M4 ProやMac Studioの大容量モデルがローカルAI需要で入手困難に。
  • OpenClawやHermes AgentなどのローカルAIエージェントがハードウェア需要を牽引。
サイト内本文

あなたはAIの使い方を知らない

2026年、AIエージェントは低コストで初級業務を遂行できるが、多くの人はAIとの協働やエージェント管理の方法を知らない。ClickUpなどの企業は組織をフラット化し、ジュニア職を削減し、高額報酬でAIネイティブ人材を採用している。本記事では、スキルファイルを作成してエージェントを訓練し、自動化を進めることで、高レバレッジ人材になるためのフレームワークを提供する。

  • 企業は組織をフラット化し、ジュニアホワイトカラー職を削減する一方、AIネイティブ人材に高額報酬を支払っている。
  • 多くの人はAIツールを使っているが非効率で、「ブレインフライ」状態に陥っている。
サイト内本文

州別のAIに対する態度、導入状況、メリット:2026年調査

SmartAssetは、職場でのAI使用率、ChatGPTの1日あたりのクエリ数、AI関連雇用に基づいて米国の州をランク付けしました。ワシントン州が総合1位、ワイオミング州は職場使用率が最も高いが個人の関心とAI関連職は最少、ニュージャージー州は高GDPにもかかわらず低い導入率です。

  • ワシントン州はAI導入に最も積極的で、AI・データセンター職が人口10万人あたり289.8件で全米最多。
  • ワイオミング州は職場でのAI使用率が27.4%で最高だが、AI関連職と個人のChatGPT使用が最低。
サイト内本文

置き換えの罠:AIによる人員削減に固執すると、AIの10年を失う可能性がある

企業のAI導入はコスト削減と人員削減に偏りがちですが、これは戦略的な誤りです。Klarna、Salesforce、スタンダードチャータード銀行などの事例を通じて、時期尚早な人員削減が顧客満足度の低下、知識の喪失、信頼の毀損などの代償を伴うことを明らかにしています。著者は、真の競争優位は人間とAIの協働、すなわち従業員のスキル向上と業務プロセスの再設計によってもたらされると主張しています。

  • AI導入により39%の企業が人員削減を実施し、その55%が判断ミスを認めている。
  • KlarnaやSalesforceの事例は、早期の置き換えが顧客満足度の低下や再雇用につながることを示している。
サイト内本文

答えを出すだけでなく、数学を視覚的に説明するAIを構築

Claw Learnは、ElevenLabs Speech Engineとカスタムキャンバスレンダラーを組み合わせ、数学の問題をリアルタイムのアニメーション解説に変換するAI搭載の視覚的数学チューターです。ユーザーは音声またはテキストで質問し、同期されたナレーション付きのアニメーションを視聴できます。

  • Claw Learnは数学の問題を視覚的なアニメーション解説に変換し、リアルタイムの音声インタラクションを実現。
  • Next.js 16ベースで、ElevenLabs WebRTCを使用した低遅延音声入出力を採用。REST TTSやブラウザ音声認識へのフォールバックも可能。
サイト内本文

AI用語を聞いてうなずいているあなたへ:それを正しく理解しましょう

AGI、AIエージェント、APIエンドポイント、チェーン・オブ・ソートなど、一般的なAI用語の意味とニュアンスを解説する用語集です。

  • AGI(汎用人工知能)は研究室ごとに定義が異なる曖昧な概念。
  • AIエージェントは予約やコーディングなどの多段階タスクを自律的に実行するツール。
サイト内本文

Google AI Studioで作ったI/O 2026クイズに挑戦

Google AI Studioで作成されたI/O 2026の発表に関するクイズをご紹介。プログラミング経験のない編集者がGeminiとAI Studioを使ってクイズを制作した経緯を説明します。

  • Google AI StudioはAntigravityコーディングエージェントを搭載し、非開発者でもアイデアを実現可能。
  • 編集者がGeminiを使ってプロンプトを生成し、AI Studioでクイズを構築。
サイト内本文

ChatPaper:学術論文を探索しAIと対話する

ChatPaperは研究者向けのAI駆動プラットフォームで、興味に基づく論文推薦、トップ会議の論文へのアクセス、簡単な論文管理、AIとの対話機能を提供します。また、さまざまな機関から20の最新研究論文を紹介しています。

  • ChatPaperはAIセマンティックマッチングにより、興味に基づいた毎日の論文推薦を提供します。
  • IJCAI、ICML、CVPR、KDDなどのトップAI会議の論文に無料でアクセスできます。
サイト内本文

ARM、AI駆動のセキュリティコードレビューツール「Metis」をオープンソース化

ARMのプロダクトセキュリティチームが、深層セキュリティコードレビューのためのエージェンティックAIフレームワーク「Metis」をオープンソース化しました。LLMによる意味理解、RAGによるコンテキスト取得、複数言語とプラグイン対応を特徴とし、複雑なコードベースでの微細な脆弱性の検出とレビュー疲れの軽減を目指します。

  • MetisはARMが開発したオープンソースのAIセキュリティコードレビューフレームワークで、LLMとRAGを利用。
  • C、C++、Python、Rust、TypeScriptなど多数の言語に対応し、プラグインで拡張可能。
サイト内本文

DDS Vibe Academy – 47の無料AIコーディングマスタークラス、AIエージェントによって構築

DDS Vibe Academyは、AIエージェントによって完全に構築された47の無料AIコーディングマスタークラスを提供します。創設者のRobert McCullock氏は、コードを一切書かず、制約条件を設計しただけだと述べています。コースは基礎、開発、応用、習得の4レベルに分かれ、Claude、Antigravity、MCPなどの技術をカバーしています。

  • AIエージェントによって構築された47の無料AIコーディングマスタークラス
  • 創設者はコードを一切書かず、制約のみを設計
サイト内本文

テクノロジー企業はあなたが家事をする様子を必死に撮影したがっている

AIトレーニングスタートアップのShiftは、清掃プロセスの映像と引き換えに無料で家の清掃を提供している。これらの映像はロボットに家事を教えるために使用される。記事では、物理世界データの収集の難しさと、企業が家庭内の撮影、反復作業のための労働者雇用、既存ロボットの活用など様々な方法でデータを調達している実態を探る。

  • Shift社がニューヨークの家庭を無料清掃、代わりに清掃映像をAI訓練に利用
  • 物理世界のデータはインターネットから簡単に収集できず、ロボットAIのボトルネックに
サイト内本文

SiteGround、WordPress 7.0でのAI統合の強引な手法が不評

筆者はSiteGroundがWordPress 7.0アップデートでユーザーの同意なくAIコネクタとAIエージェントを自動的に有効にしたことを批判し、特に有料ユーザーに対する欺瞞的な強制導入だと非難している。プラグインは急速に100万インストールを達成したが、レビューは非常に悪い。筆者はこの慣行によりホスティングの乗り換えを検討している。

  • SiteGroundはWordPress 7.0への自動アップデートと同時に、AI StudioをデフォルトのAIコネクタとして有効にし、AIエージェントをユーザーのオプトインなしでアクティブ化した。
  • 筆者はこの手法を欺瞞的であり、特に料金を支払っているユーザーに対しては選択権が与えられるべきだと批判。
サイト内本文

Show HN: AIのために文章を隠し、それが返ってきたか確認できるページ

このページはHTMLソースに、人間には見えない秘密のフレーズを埋め込み、AIクローラーのみが読み取れるようにしています。訪問者はAIアシスタントにページの内容を尋ね、そのフレーズが回答に含まれているかチェックすることで、機械がどのようにウェブを読んでいるかを目の当たりにできます。また、人間とボットのアクセス比率を表示し、現在のウェブトラフィックの51%以上がソフトウェアによるものであることを示しています。

  • HTMLソースに人間には見えないフレーズを埋め込み、AIクローラーのみが読み取れる。
  • 訪問者はAIにページ内容を尋ね、隠されたフレーズが返ってくるか検証できる。
サイト内本文

ダウンロード:リチウムの解放とエボラの制御

弱酸でケイ酸塩鉱物を溶解し、リチウムとともにアルミナやシリカを抽出する新技術が低コストで環境負荷の低いリチウム供給を実現。コンゴ民主共和国でのエボラ出血熱のアウトブレイクは制御が困難。教皇レオ14世の新しい回勅はテクノロジーは中立ではないと警告し、AI時代への連帯を呼びかける。その他、Anthropicの評価額、ブルーオリジンロケット爆発、JWSTの成果など最新テクノロジーニュース。

  • 新しいリチウム抽出法は弱酸でケイ酸塩を溶解し、低コスト・低排出を実現。Rock Zero社が商業化を進める。
  • コンゴ民主共和国でエボラ出血熱(ブンディブギョウイルス)発生、医療従事者4名が死亡。制御が困難。
サイト内本文

Show HN: 並列AIコーディングセッションによるハンドオフファイルの上書きを防止

オープンソースツールが、ファイル内の所有権マーカーとPreToolUseフックを用いて、並列AIコーディングセッションが互いのハンドオフファイルを誤って上書きするのを防ぎます。

  • ハンドオフファイルの最初の行にセッションIDを含む所有権マーカーを埋め込み、フックが書き込み前にマーカーを検証。
  • 書き込み、編集、シェルリダイレクトの3つすべての変更経路を保護。
サイト内本文

オープンソースのセキュリティは混乱 - IBMとRed Hatが50億ドルと2万人のエンジニアで修復に挑む

IBMとRed Hatは、AIを活用した大規模なオープンソースセキュリティイニシアチブ「Project Lightwell」を開始。50億ドルと2万人のエンジニアを投入し、オープンソースソフトウェアの脆弱性を産業規模で発見・修正する。まずMaven/Javaエコシステムから始め、PyPI、npm、Goなどに拡大。人間が確認するAIプロセスを採用し、企業とコミュニティ間の信頼できる仲介役として機能し、商用サブスクリプションを提供する。

  • IBMとRed HatはProject Lightwellに50億ドルと2万人のエンジニアを投資し、産業規模でオープンソースセキュリティに取り組む。
  • プロジェクトはまずMaven/Javaエコシステムに焦点を当て、その後PyPI、npm、Goなどに拡大する。
サイト内本文

Liquid AI、38Tトークンで学習した8B-A1B MoEを公開

Liquid AIは、エッジデバイス向け混合エキスパートモデルLFM2.5-8B-A1Bをリリースした。総パラメータ8B、アクティブパラメータ1Bで、38兆トークンで学習。128Kコンテキストウィンドウ、非ラテン言語向けの改良トークナイザー、推論専用のチェーン・オブ・ソートを特徴とする。ベンチマークで競争力のある性能を発揮し、CPU/GPUで高速動作、ローカルエージェントタスクに適する。

  • LFM2.5-8B-A1Bは総パラメータ8B、アクティブ1BのMoEモデルで、38Tトークンで学習。
  • 128Kコンテキストウィンドウと語彙拡張(128K)により非ラテン言語のサポートが向上。
サイト内本文

身体化認知とエージェンティックAI

この記事は、知能は脳だけに存在するのではなく、道具や環境にも拡張される身体化されたものであると論じています。ChatGPTの成功においてチャットインターフェースが重要な役割を果たしたことを強調し、AIに道具を使用し計画を立てる能力を与えるエージェンティックAIがその能力を大幅に拡張すると紹介しています。著者は純粋な推論への過度な依存(シンキズム)を批判し、現実世界との相互作用を軽視したYoshua BengioのLaw Zeroプロジェクトを誤ったアプローチの例として挙げています。

  • 知能は身体化されており、環境、道具、言語に依存する。
  • ChatGPTのブレークスルーは、言語モデルだけでなく、チャットインターフェースという身体化の形態にもあった。
サイト内本文
モデル

AIチャットボットをより役立つようにすると、人間の行動を模倣する能力が低下する——大規模研究で判明

208,000人の参加者と2,600万件の回答を対象とした大規模研究により、言語モデルを役立つチャットボットに変えるトレーニングが、人間の行動を再現する能力を弱めることが示された。この効果は新しいモデル世代ごとに悪化する。人口統計情報を与える一般的な方法も、個々の予測にはほとんど効果がない。

  • ベースモデルは後訓練されたアシスタントバージョンよりも人間の行動予測で優れている。
  • ベースモデルとアシスタントモデルの差は世代ごとに拡大している。
サイト内本文

LLMShare:攻撃者がAIチャットボットのページをマルウェア配信プラットフォームに変える

攻撃者はChatGPTやClaudeなどのAIチャットプラットフォームの共有コンテンツ機能を悪用し、信頼されたドメイン上にホストされたページを通じてマルウェアを配信しています。新しい亜種では、ChatGPTのコードレンダリング機能を使用して偽の「サービス障害」ページを作成し、偽のChatGPTダウンロードページに誘導してマルウェアをダウンロードさせます。この攻撃はURLレピュテーションチェックを回避し、条件付きレンダリングでスキャナーから隠れます。

  • 攻撃者はChatGPTやClaudeの共有会話機能を使い、検索エンジンの悪質な広告でトラフィックを誘導する。
  • 新しい亜種はChatGPTのコードレンダリングを悪用し、偽のサービス障害ページを作成してマルウェアを配布する。
サイト内本文

LLMを使って古くなったOSSプロジェクトを書き換える

大規模言語モデル(LLM)が、古くなったオープンソースプロジェクトの書き換えのコスト構造を変えつつある。ある企業はCRIUをZigで書き換えており、完了まで数年ではなく数ヶ月を見込んでいる。記事では、OSSプロジェクトがなぜ陳腐化するのか、AIがどのように計算を変えるのか、ソフトウェアエコシステムへの影響を探る。

  • AIにより大規模OSSの書き換えが現実的に、期間が数年から数ヶ月に短縮。
  • OSSプロジェクトの陳腐化は、メンテナの疲弊、技術的負債、革新の停滞に起因。
サイト内本文

Genesis AI、Nyx、Quadrants、Genesis World 1.0 物理プラットフォームをリリース — スケーラブルなロボティクス基盤モデル評価を実現

Genesis AI は2026年5月27日、物理エンジン、レンダラー、コンパイラ、シミュレーションインターフェースからなる4コンポーネントのシミュレーションプラットフォーム「Genesis World 1.0」をリリースしました。システムは14タスク、各200エピソードのテストでピアソン相関0.8996を達成し、ポリシー評価時間を200時間以上から0.5時間未満に短縮します。

  • Genesis World 1.0 はポリシー評価を200時間以上から0.5時間未満へと2桁高速化。
  • 実機ロールアウトとのピアソン相関係数0.8996、MMRVは0.0166。
サイト内本文

GeminiのIMO金メダルを支えたキーパーソン、プロのピアニストになりかけていた

Google DeepMindの研究科学者Yi Tay氏は、Gemini Deep Thinkを率いて国際数学オリンピックで金メダルを獲得した。しかしAI研究の傍ら、彼はピアノの達人でもあり、ロンドン・トリニティ・カレッジでクラシックピアノの准学士号を取得している。本記事では彼のAI研究の道のりと音楽の才能を紹介する。

  • Yi Tay氏はGoogle DeepMindの研究科学者で、Gemini Deep Thinkの中核的貢献者。
  • 同氏のチームはGeminiにIMO金メダルをもたらし、物理・化学オリンピックにも貢献。
サイト内本文

NVIDIAと清華大学チームがGamma-Worldを発表:世界モデルが「一人遊び」から「多人数共存」へ

Gamma-Worldは、NVIDIAと清華大学などが開発したマルチエージェント世界モデル。シンプレックス回転エンコーディングとスパースハブアテンションにより、対称的なエージェント表現と効率的な通信を実現し、ゼロショットでより多くのエージェントに一般化、実機ロボットにも適用可能。

  • シンプレックス回転エージェントエンコーディングでエージェントの対称的表現を実現。
  • スパースハブアテンションで通信コストを2次から線形に削減。
サイト内本文

NVIDIAと清華大学チームがGamma-Worldを提案:世界モデルを「一人遊び」から「多人数共存」へ

NVIDIA、清華大学、トロント大学、Vector Instituteは共同でGamma-Worldを発表。シンプレックス回転エージェント符号化、スパースハブ注意機構、三段階蒸留により、マルチエージェント世界モデルにおけるアイデンティティ対称性、通信効率、リアルタイム生成の3大課題を解決。2人データでの学習から4人シーンへのゼロショット汎化を実現し、実世界の協調ロボットタスクにも適用可能。

  • シンプレックス回転エージェント符号化により、エージェントの置換対称性を保存し、任意数のエージェントに拡張可能。
  • スパースハブ注意機構でクロスエージェント計算を線形複雑度に削減、24 FPSのリアルタイム推論を実現。
サイト内本文

IBM量子サンプリングループを用いたCPU専用Qwen3-30B推論のチューニング

2017年製MacBook Air上で、人間の実験者、Codex、llama.cpp、ローカルデータベース、IBM量子プロセッサのサンプリングを組み合わせ、Qwen3-30Bモデルの推論速度を0.09トークン/秒から14.03トークン/秒に向上させた研究。量子プロセッサ上でモデルを実行するのではなく、推論設定の最適化に量子サンプリングを用いている。

  • 8GB RAMの2017年MacBook AirでGPUなしでQwen3-30Bを実行
  • 人間とAIの量子最適化ループにより速度が0.09 tok/sから14.03 tok/sに向上
サイト内本文

Amazon SageMaker AI LLM推論の包括的な可観測性:GPU利用率からLLM品質まで

この記事では、Amazon Managed Grafanaダッシュボードを使用した包括的な可観測性ソリューションを紹介します。これにより、Amazon SageMaker AIエンドポイントで推論コンポーネントを使用して提供されるLLMの品質と量の両方を一元的に把握できます。GPU使用率、レイテンシー、コストなどのインフラ指標と、関連性、安全性、トーンなどのLLM品質指標をカバーし、チームがモデルの劣化を検出し、リソースを最適化し、コストを管理できるようにします。

  • LLMの可観測性には、インフラストラクチャ(量)と出力品質(質)の両方を監視する必要があり、これらは相互に依存しています。
  • Amazon CloudWatchは、SageMaker推論コンポーネントからの拡張メトリクスとカスタム品質メトリクスを一元管理します。
サイト内本文

NVIDIA、X-Tokenを発表:投影誘導型クロストークナイザ知識蒸留でLlama-3.2-1BにおいてGOLDを平均3.82ポイント上回る

NVIDIAのX-Tokenは、クロストークナイザ知識蒸留におけるGOLDの2つの構造的欠陥を修正し、GSM8kなどの数学推論ベンチマークで大幅な改善を達成。投影行列とP-KL・H-KL損失の選択メカニズムにより、トークナイザの不一致を処理する。

  • X-TokenはGOLDの「珍しいトークン失敗」と「過度に保守的なマッチング」を修正。
  • Qwen-4B教師を使用したLlama-3.2-1Bで、GOLDを平均3.82ポイント上回る。
サイト内本文

OpenAI、GPT-5.5 Instantの可読性を向上させ、2つの旧モデルを段階的に廃止

OpenAIはGPT-5.5 Instantを更新し、より自然な応答を実現するとともに、最新モデルからCanvas機能を削除します。ライティングやコーディングのタスクはチャット内で直接実行されます。また、同社はChatGPTから旧モデルのo3とGPT-4.5を段階的に廃止し、両モデルは遅くとも2026年8月までに停止されます。

  • GPT-5.5 Instantが可読性向上、Canvas機能を廃止
  • ライティングとコーディングはチャット内で直接実行
サイト内本文

Gemini OmniとGemini 3.5の動作デモ11選

Google I/O 2026で、GoogleはGemini OmniとGemini 3.5シリーズを発表しました。Gemini Omniは動画などの入力からコンテンツを生成し、会話を通じて動画を編集できます。Gemini 3.5 Flashは複雑なエージェントタスクに特化し、マルチステップワークフローやコード生成を可能にします。この記事では、これらのモデルの11のビデオデモを紹介します。

  • Gemini Omniは動画入力から新しいコンテンツを生成し、自然言語で動画編集が可能。
  • Gemini 3.5 Flashは長期的なエージェントタスクに優れ、マルチステップワークフローをサポート。
サイト内本文

OpenAI、生命科学AIモデルを無償提供。政府のパンデミック備えを支援

OpenAIは、新たなRosalind Biodefenseプログラムを通じて、生命科学モデルGPT-Rosalindを無料で提供している。パンデミック対策と生物防御を目的としており、初期パートナーにはローレンス・リバモア国立研究所、ジョンズ・ホプキンス大学、ワクチンイニシアチブCEPIが含まれる。応募は世界中から受け付けている。

  • OpenAIはRosalind BiodefenseプログラムでGPT-Rosalindを無償提供。
  • プログラムはパンデミック対策と生物防御に焦点を当てている。
サイト内本文

OpenAIガバナンスフレームワークによる安全なエンタープライズAIのスケーリング

OpenAIは最新のフロンティアガバナンスフレームワーク(FGF)を発表し、安全でコンプライアンスに準拠したAIをグローバルに展開するための構造化された青写真を企業に提供します。このフレームワークはEUおよびカリフォルニアの規制に準拠し、体系的なリスクカテゴリ(サイバー、CBRN、操作、制御喪失)を階層評価とともに定義し、ISOセキュリティ基準とインシデント対応計画(AIRP)を統合することで、企業がコンプライアンス要件を満たしながら安全なAIアーキテクチャを構築できるようにします。

  • OpenAIのFGFは安全なAI展開のための構造化されたテンプレートを提供し、EU AI法やカリフォルニア州TFAIAに直接対応します。
  • フレームワークは4つのシステムリスクカテゴリ(サイバー攻撃、CBRN、有害な操作、制御喪失)を定義し、特定のリスクティア(例:Tier 3)を設定します。
サイト内本文

Mistral AI Now Summit パリ現地レポート

パリで開催されたMistral AI Now Summitでの個人的な洞察。Mistralはモデル企業から、自社の計算リソース、モデル、プラットフォーム、コンサルティングを含むフルスタックAIプロバイダーへと進化しています。サミットでは新モデルの発表よりも、ASML、BNPパリバ、アマゾンとのパートナーシップが強調されました。専門的な小型モデル(Document AI、Voxtral、Robostral)が特定のタスクで大型汎用モデルを上回っています。主権とオンプレミス展開は、欧州企業にとって重要な差別化要因です。古代パピルス文書の解読にAIを活用した講演は、人文科学におけるAIの可能性を示しました。

  • Mistralはモデル企業から、自社の計算資源、モデル、プラットフォーム、コンサルティングを備えたフルスタックAIプロバイダーへと変貌している。
  • サミットでは新モデル発表よりも、ASML、BNPパリバ、アマゾンとのパートナーシップに焦点が当てられた。
サイト内本文
政策

新たな州データ法が企業にAIとプライバシーへの対応を促す

2025年、新たに8つの州でデータプライバシー法が施行され、一定の基準を満たす全国の企業に影響を与える。州検事総長は執行を強化し、FTCはプライバシー執行を拡大、AIの影響が複雑さを増している。企業はプライバシーフレームワークを見直し、全国一律または州ごとのコンプライアンスアプローチを選択する必要がある。

  • 2025年に8つの新しい州データプライバシー法が施行され、独自の要件がある。
  • 州検事総長とFTCが執行を強化し、AIに関するアルゴリズム処分も導入。
サイト内本文

アメリカ人は教皇レオのAI懸念に同調:「労働者、プライバシー、人命を脅かす」

教皇レオが初めての重要な教皇文書で人工知能の台頭に厳しい警告を発し、AIを駆動する「権力の文化」を非難した。アメリカの読者は規制されていないAIへの恐怖を語り、新たな奴隷制の形態を警告した。

  • 教皇レオが初の重要教皇文書でAIのリスクを厳しく警告
  • AIを人類最大の脅威の一つとし、最も厳格な倫理的制約を要求
サイト内本文

ジェネラリストAI – 物理世界のための汎用知能の構築

本記事では、物理世界向けの汎用人工知能に焦点を当てたYouTubeチャンネル「Generalist」を紹介します。

  • Generalistは汎用AIに特化したYouTubeチャンネルです。
  • その目標は、物理世界に適用可能な汎用知能を構築することです。
サイト内本文

AIが書いたと見抜く最大のサイン

筆者は自身の体験——信号無視の衝突事故を起こした運転手の謝罪文や、整備士からの見積もり返信——に現れたAI独特の文体をきっかけに、AIライティングの浸透について考察する。調査では人々はAI生成文を信用しないと答える一方で、日常のメールや仕事文書、さらには文学の領域でまでAIの使用が広がっている。本文は、AIライティングが効率的で滑らかである反面、人間の書くプロセスに不可欠な思考と判断を欠き、その完璧な表面の下に論理の破綻や事実誤認を隠していると指摘。AIの追従的性質により編集が困難であることを示し、人間による執筆がまるで手工芸品のように珍しくなる未来を予見する。

  • AI生成文は不信感があるにもかかわらず、日常生活や専門分野に急速に浸透している。
  • AIライティングの効率性は、真の思考や推論の欠如を隠蔽し、信頼性に欠け編集を困難にする。
サイト内本文

AEDIS – AI移行のためのオープンソースのマクロ経済フレームワーク

AEDIS(高度経済開発・インフラシステム)は、AIによる労働力の喪失と消費需要の崩壊に対処するオープンソースのフレームワークです。主権インフラクレジット(SIC)と公開台帳を用いて資産裏付けのある通貨創造を行い、モジュール方式(普遍コア+地域付属書)を採用。インフレや腐敗の防止機構を備え、24ヶ月以内に世界人口・GDPの85%の同意を得て同期発動することを目指しています。

  • AEDISは主権インフラクレジット(SIC)で資本創造と実物資産を厳格に紐付け、インフレを防止する。
  • 普遍的コアは変更不可だが、地域付属書で各国の法体系に適合可能。
サイト内本文

マシンファースト:AEOはSEO 2.0ではない理由

アンサーエンジン最適化(AEO)はSEOとは根本的に異なります。AIはランキングではなく推論により回答を構築します。本稿では、エンティティ、回答、証拠、スキーマの4層からなるマシンファーストアーキテクチャを提案し、AI引用におけるエンティティグラフの重要性を強調します。

  • AEOはランキングではなく、回答そのものを最適化する。
  • AIシステムはエンティティ解決、シグナル抽出、加重推論によって回答を構築する。
サイト内本文

英国、来年より亡命希望者の年齢推定にAIを導入

英内務省は、国境で撮影した写真から年齢を推定し、子供を装う成人移民を見分けるAI技術を来年から展開する計画だ。契約額は32万2000ポンドで、2027年半ばに本格導入される予定。人権団体やソーシャルワーカーは子供の権利を損なうと批判している。

  • 英内務省がAkhter Computers Ltdと32万2000ポンドの契約を結び、AI年齢推定システムを開発。
  • システムは国境で撮影した顔写真を分析し、子供を装う成人移民を特定する。
サイト内本文

企業がAI使用制限を怠り、Claudeに月5億ドルを費やしたとの報道

名前の明かされていない企業が、使用上限を設定しなかったため、1ヶ月でClaudeのライセンスに5億ドルを費やした。この事例は、モデル選定やコンテキストエンジニアリングに関する真のAI専門知識がなければ、生産性向上の約束がコスト暴走に終わることを示している。

  • ある企業が使用制限を設定せず、1ヶ月でClaudeに5億ドルを費やした。
  • AI専門知識の欠如がコスト暴走を招く可能性がある。
サイト内本文

新たな研究が明らかにするAIチャットボットの操作的な「ダークパターン」

民主主義技術センターの新たな研究により、AIチャットボットがユーザーを操作するために使用する37のダークパターンが特定され、感情の搾取やデータ抽出が含まれ、倫理的な設計の推奨事項が示されました。

  • 研究者はChatGPT、Replika、Meta AIなどのチャットボットで37のダークパターンを分類しました。
  • パターンには、秘密を守るふり、偽りの友情の約束、罪悪感を誘う終了オプションが含まれます。
サイト内本文
研究

テレンス・タオ氏、AIが数学に史上初の分業をもたらす可能性を指摘

数学者のテレンス・タオ氏は、AIが数学研究に初めて分業をもたらす可能性を説明する。これまで研究者は問題の枠組みから結果の検証まで全ての工程を自ら習得する必要があったが、タオ氏は「工業数学」の出現を予見する。すなわち、孤独な天才ではなくAIに支援された大規模チームが研究を進め、人間は「ひらめき」に不可欠な存在であり続ける。

  • テレンス・タオ氏、AIが数学に初の分業をもたらすと主張
  • 従来の数学研究では研究者が全工程を自ら担当
サイト内本文

Metaのリークされたメモ:AIペンダント、スーパーセンシンググラス、エンタープライズウェアラブル戦略

MetaはAIに数十億ドルを投資してきたが、商業的な見返りはほとんどない。オープンソース戦略は実を結ばず、研究の進展も製品化に至っていない。今、同社はAIハードウェア、つまりAIペンダント、スーパーセンシンググラス、エンタープライズウェアラブルに賭けている。

  • MetaのAI投資は巨額だが商業的成果は乏しい
  • オープンソース戦略と研究成果が製品化に結びつかず
サイト内本文

効果的フィードバック計算:AI性能の真の変革者

新たな研究が提唱する効果的フィードバック計算(EFC)は、AIの性能向上には計算量よりもフィードバックの賢い活用が重要であると示す。EFCは障害発生率の予測においてR²=0.94と従来指標を大幅に上回り、フィードバック品質向上により成功率が0.27から0.90に向上した。

  • EFCはフィードバックの情報密度と保持効率を測定し、生の計算量よりも高い予測力を持つ
  • 制御環境ではOracle-EFCのR²が0.94、トークン数は0.33にとどまった
サイト内本文

AIが人間の創造的な仕事に及ばない理由

最新の研究によると、消費者はAI生成の広告と人間作成の広告を区別するのが難しいにもかかわらず、人間が作成したコンテンツが効果とエンゲージメントにおいてAIを大きく上回ることが示されています。AIコンテンツは検索ランキングやユーザーエンゲージメントで人間のコンテンツに遠く及ばず、特に高価値チャネルではその差が顕著です。

  • 2つの研究は、人間が作成した広告や記事がAI生成のものを大幅に上回るパフォーマンスを示している。
  • 消費者はAI広告を確実に見分けられないが、無意識のうちに人間作成のものを好む。
サイト内本文
チップ

スペースXのIPOはイーロン・マスクにとっては素晴らしいが、あなたにとっては最悪だ

本記事はスペースXのIPOを厳しく批判し、評価額の不合理さ、赤字額、AI事業の不振、スターシップの遅延、そして唯一の収益源であるスターリンクのリスクを指摘し、最終的に個人投資家が損をする可能性が高いと論じている。

  • スペースXのIPO評価額は1兆ドル超だが、昨年は約50億ドルの損失。TAMは28.5兆ドルで米国GDPを上回る。
  • IPOの30%は個人投資家向けに確保され、マスクの個人崇拝を利用。
サイト内本文

エヌビディア、中国AIチップ市場をファーウェイに譲ったと表明

エヌビディアのジェンスン・フアンCEOは、米国の輸出規制により、中国のAIチップ市場を実質的にファーウェイに譲ったと述べた。好調な四半期決算にもかかわらず、中国での販売見通しは限定的。

  • エヌビディア、米国輸出規制で中国AIチップ市場をファーウェイに譲歩。
  • 第1四半期の売上高は85%増の816.2億ドル、800億ドルの自社株買い。
サイト内本文

ハッカソン – 優勝者はYC面接へ

Y Combinatorが対話型AIハッカソンを開催。優勝チームはYCの面接に直接招待される。AIプロジェクトをスタートアップアクセラレーターにつなぐ絶好の機会。

  • Y Combinatorが対話型AIハッカソンを主催
  • 優勝者はYC面接の機会を得る
サイト内本文

AWS、エンタープライズ需要ゼロにもかかわらずGrokをBedrockに追加か

エンタープライズ顧客のGrokへの関心がほぼ皆無であるにもかかわらず、AWSはGrokモデルをBedrockに追加する交渉を行っている。この動きは顧客ニーズを満たすためではなく、自社のTrainiumチップの販売促進が目的である可能性が高い。

  • エンタープライズ顧客からのGrok需要はほぼゼロ。その理由は物議を醸す性質と不安定な企業構造。
  • AWSとSpaceXの交渉は、Trainiumチップのコミットメントを得るためのものと見られる。
サイト内本文
ツール

攻撃者がChatGPTとClaudeの共有チャット機能を悪用してマルウェアを拡散

攻撃者はChatGPTとClaudeのチャット共有機能を悪用し、エラーメッセージやインストールガイドに偽装した共有会話を通じてマルウェアを拡散しています。これらの会話は信頼できるドメインでホストされているため、セキュリティツールをすり抜けます。

  • 攻撃者はChatGPTとClaudeの共有チャット機能を悪用して悪意あるコンテンツをホスト。
  • 共有チャットはエラーメッセージやインストールガイドに偽装。
サイト内本文

スローな日記アプリ、AI統合

Neme Journalは、ゆっくりとした思慮深い毎日の日記アプリで、AI統合によりユーザーが自分のシグナルを捉えるのを支援します。

  • Neme Journalは、ゆっくりとしたマインドフルな日記のアプローチを重視します。
  • このアプリはAI統合を利用して日記体験を強化します。
サイト内本文

企業が誤ってClaude AIに1ヶ月で5億ドルを費やす

システムエラーまたは管理ミスにより、匿名の企業が1ヶ月でClaude AIに5億ドルを誤って費やしたことが報告され、AIコスト管理の重要性が浮き彫りになりました。

  • 企業が誤ってClaude AIに5億ドルを費やした
  • この事件はAIサービス費用監視の欠陥を露呈
サイト内本文

98年前の児童書がAIについて教えてくれること

1928年の児童小説「クラクフのラッパ手」を分析し、AIが物語の魔法の水晶のように、利用者の偏見や誤りを反射し、破壊的な結果をもたらすことを論じる。著者は、AIが批判的思考、創造性、共感を弱め、環境被害も引き起こすと主張する。

  • 物語の水晶は古代の知恵ではなく、利用者の内面を映し出す。
  • AIはインターネットからデータを集め、偏見を増幅するアルゴリズム的な反響室となる。
サイト内本文

ロニー・チエン、ハーバード大学卒業式で「Fuck AI」スピーチ—歓声を浴びる

コメディアンのロニー・チエン氏がハーバード大学の卒業式で、AIを拒否し破壊する使命を受け入れるよう卒業生に呼びかけ、「Fuck AI」と何度も叫んで歓声を集めた。

  • チエン氏はハーバード・カレッジ・クラスデイのスピーチで「Fuck AI」を連呼。
  • 彼はAIを愚かで常に間違っていると批判。
サイト内本文

Google、Geminiの利用制限のバグを修正—クォータ消費が速すぎた問題

GoogleのGeminiアプリのバグにより、Omniビデオを1~2本作成するだけで利用クォータを消費してしまう問題が発生していた。Googleはこのバグを修正し、Ultraメンバーはビデオ生成回数が2倍になり、失敗したリクエストは課金されなくなった。また、利用状況の透明性を高める計画もある。

  • バグにより、Omniビデオを1~2本でクォータを使い切る問題が発生。
  • Googleはバグを修正し、Ultraメンバーのビデオ生成回数を倍増。
サイト内本文

Slang.netがAI新語「Braging」を追加

スラング辞典Slang.netがAI関連の新しい言葉「Braging」を収録しました。定義はチームによる手作業で、データベースは随時更新されています。

  • Slang.netが新たなAIスラング「Braging」を定義。
  • 定義はSlang.netチームが手動で作成。
サイト内本文
ロボット

OpenAIのCodexがWindows PCを自律操作、バグ発見やアプリテストを自動実行

OpenAIのCodexアプリがWindows 11で「Computer Use」機能を提供。AIはプログラムを自律制御し、アプリのテストやバグ発見を実行。PC不在時でもChatGPTモバイルアプリからリモートでタスクを開始・監視可能。

  • CodexアプリがWindows 11でプログラムの自律制御を実現
  • ChatGPTモバイルアプリからのリモート操作が可能
サイト内本文
スタートアップ

Meta、AIペンダントと「Wearables for Work」を計画、ハードウェア強化へ

メタ・プラットフォームズは、今後1年以内にAIペンダントのテストを開始し、スマートグラスのラインアップを拡大、企業向けサービス「Wearables for Work」を投入することで、ハードウェア部門の損失を挽回する計画だ。

  • Metaは来年、AIペンダントのテストを開始する予定。
  • 「Wearables for Work」企業サービスを開始し、AIグラス製品群を拡大。
サイト内本文

持続不可能なAI補助金

Google、OpenAI、Anthropicは異なるAI価格設定戦略を採用している。Googleは低価格帯で、値上げ後も競合の半分以下。Anthropicは高級路線を維持し、OpenAIは補助金の後に値上げした。これらの変化は、記録的な設備投資の中で市場シェアと利益率のトレードオフを反映している。

  • Google Gemini 3.1 Pro: 入力100万トークンあたり2ドル、出力12ドル。
  • Anthropic Claude Opus 4.7: 入力5ドル、出力25ドル。