Hugging Face AI ニュース

ソース分布

Hugging Face Blog32
Hacker News AI6
MarkTechPost4
AWS Machine Learning Blog2
AI Business1
arXiv AI1
KDnuggets1
Latent Space1

トピック分布

Agent29
チップ28
研究23
モデル14
政策11
スタートアップ3
ロボット1

タイムライン

2026-07-076
2026-06-094
2026-07-084
2026-06-173
2026-06-183
2026-06-233
2026-06-303
2026-07-013

最新動向

データキャプチャ、Hugging Face、NVMe、Route 53 統合による Amazon SageMaker HyperPod のエンタープライズ推論の強化

2026-07-10 01:38 UTC+9

本記事では、Amazon SageMaker HyperPod 推論の新機能 5 つを紹介します。監査とモデル改善のためのマルチティアデータキャプチャ、Hugging Face Hub からの直接デプロイ、コールドスタート高速化のためのローカル NVMe モデル読み込み、カスタムドメインの自動 Route 53 DNS 管理、カスタムサービスアカウントによるポッドレベル IAM です。これらの機能により、エンタープライズ向け生成 AI ワークロードのための、より高速で可観測性が高く柔軟な推論インフラストラクチャが実現します。

マルチティアデータキャプチャでは、エンドポイント、ロードバランサー、モデルポッドの各レベルで入出力を記録し、深い可観測性を提供します。
Hugging Face Hub からの直接デプロイにより、ウェイトを事前にステージングする必要がなく、ゲートアクセスとリビジョン固定をサポートします。

NvidiaとHugging Face、オープンソースロボットモデルで協力

2026-07-09 04:35 UTC+9

この動きは、物理AIのアクセシビリティと展開を支援し、Nvidiaのこの分野での既に強い存在感をさらに高めるものと見られている。

NvidiaとHugging Faceが、オープンソースのロボットモデル開発で協力することを発表。
この協力は、物理AIのアクセシビリティと展開を促進することを目的としている。

エージェントのためのデータ

2026-07-09 02:16 UTC+9

NVIDIAは、エージェントAIの構築におけるオープンデータと合成データの重要性を強調し、データの検査可能性、品質、信頼を重視しています。Nemotronデータセット、Prompt Atlas可視化ツール、地域的多様性のための合成ペルソナについて詳細に説明しています。

合成データは、独自シグナルを保護しながらエージェントAIをスケールするために重要です。
NVIDIAのNemotronオープンデータセットは、10兆以上の事前学習トークンと数百万の事後学習サンプルを含みます。

[AINews] Lilian WengがRSIのためのハーネス工学に関する35本の論文を要約

2026-07-08 11:20 UTC+9

このAINews号は2026年7月6日から7日までの幅広いAI開発をカバーしています。ハイライトには、Lilian Wengによる再帰的自己改善のためのハーネス工学への深掘り、MetaのMuse ImageとMuse Videoの発表（エージェント生成ループを備える）、Anthropic、LangChain、Googleによるエージェントプラットフォームの主要製品アップデートが含まれます。その他注目点：NVIDIAのAudexオーディオモデル、Cohereのアラビア語ASR、Hugging FaceとNVIDIAとのロボティクス統合、Liquid AIのAntidoom（推論ループ失敗削減）、Anthropicの論争を呼んだJ-space解釈可能性研究。また、エージェントと法律AIのベンチマーク、研究自動化、推論効率の進歩もカバーしています。

Lilian Wengのブログ記事は、再帰的自己改善を直接の重み変更ではなくハーネス工学的アプローチに焦点を当て直し、目標と文脈の指定にハーネス工学が重要であると強調。
MetaのMuse ImageとMuse Videoは、計画、ツール使用、自己改善を伴うエージェント生成を示し、公開リーダーボードで急速に上位にランクイン。

ネイティブ速度のvLLM transformersモデリングバックエンド

2026-07-08 09:00 UTC+9

TransformersライブラリのvLLMバックエンドが、多くのLLMアーキテクチャにおいてカスタムvLLM実装と同等以上の推論速度を達成。モデル作者は追加コードなしで超高速推論を利用可能に。

Transformers vLLMバックエンドがQwen3 4B、32B、235B MoEモデルでネイティブvLLMのスループットに匹敵またはそれを上回る。
torch.fxとastを利用して実行時に推論特化の層融合を動的に適用し、カスタムコードと同等の速度を実現。

QualcommがNexa AIを買収、Hexagon NPU向けGenAIランタイムGenieXをオープンソース化

2026-07-08 07:44 UTC+9

QualcommはNexa AIを買収し、Hexagon NPU向けに最適化されたGenAIランタイムGenieXをオープンソース化しました。Snapdragonデバイス上でLLMやVLMをローカル実行可能にし、CLI、Python、Kotlin/Java、Docker、OpenAI互換サーバーなど複数のインターフェースを提供。Hugging FaceのGGUFモデルとQualcomm AI Hubのバンドルをサポートします。

QualcommがNexa AIを買収しGenieXをオープンソース化
GenieXはSnapdragonデバイスでNPU・GPU・CPU推論をサポート

Hugging FaceからAmazon SageMaker Studioへワンクリックで

2026-07-08 06:15 UTC+9

Hugging FaceとAmazon SageMaker AIのディープリンク統合により、モデル発見からSageMaker Studioでの実験までをワンクリックで実現。権限の自動構成、GPUクォータの表示、モデルのカスタマイズとデプロイをサポートし、発想からエンタープライズ展開までの道のりを短縮します。

Hugging FaceのモデルページからSageMaker Studioへワンクリックで移動、モデルはプリロードされ環境は自動構成。
新しいStudio環境には、ファインチューニング、トレーニング、ノートブック、エンドポイントデプロイのための完全な権限が自動で設定される。

NVIDIAとHugging Face、オープンロボティクスコミュニティ向けに新モデルとフレームワークをLeRobotへ提供

2026-07-07 15:00 UTC+9

NVIDIAとHugging Faceは、ヒューマノイドロボット向けのNVIDIA Isaac GR00T 1.7モデルとIsaac TeleopフレームワークをLeRobotに統合し、さらにNVIDIA Cosmos 3の追加も計画しています。これらの統合により、開発者はロボット開発のためのよりアクセスしやすく標準化されたパスを得られ、オープンロボティクスコミュニティの革新を促進します。

NVIDIAとHugging Faceが、Isaac GR00T 1.7モデルとIsaac TeleopフレームワークをLeRobotに提供。
LeRobotがデータ収集、モデルトレーニング、シミュレーションのためのNVIDIA物理AI機能を獲得。

任意のクラウドでAIワークロードを実行し、Hugging Faceに保存：SkyPilotによるゼロエグレスストレージ

2026-07-07 09:00 UTC+9

SkyPilotとHugging Faceの連携により、モデルとデータセットをHubに保存し、SkyPilotを使っていずれのクラウドでもデータ転送料金なしで計算を実行できます。

hf:// URLとHF_TOKENを使用してHugging FaceストレージをSkyPilotジョブにマウント
20以上のクラウド、Kubernetes、オンプレミスクラスターに対応

LeRobot v0.6.0: 想像、評価、改善

2026-07-07 09:00 UTC+9

LeRobot v0.6.0 は、世界モデルポリシー（VLA-JEPA、FastWAM、LingBot-VA）、新しいVLA（GR00T N1.7、MolmoAct2など）、報酬モデルAPI（Robometer、TOPReward）、6つの新しいシミュレーションベンチマーク、DAgger補正付きデプロイメントCLI、深度センシング、自動言語アノテーション、最大2倍高速なデータローディング、クラウドトレーニング、より軽量なインストールを導入し、ロボット学習ループを閉じることを目指しています。

3つの新しい世界モデルポリシーにより、ロボットが行動前に未来を想像できるようになりました。
GR00T N1.7、MolmoAct2、EO-1、Multitask DiT、EVO1などの新しいVLAが追加され、ファインチューニングとデプロイメントが可能です。

Hugging Face から Amazon SageMaker Studio へワンクリックで

2026-07-07 07:35 UTC+9

Hugging Face と Amazon SageMaker AI は、開発者がモデル発見から SageMaker Studio での実験までワンクリックで移行できるディープリンク統合を発表しました。この統合により、権限が事前設定され、GPU クォータが表示され、微調整とデプロイのワークフローが合理化されます。

Hugging Face のモデルページに「SageMaker AI でカスタマイズ」および「SageMaker AI にデプロイ」ボタンが追加され、ワンクリックで SageMaker Studio にアクセス可能に。
新しい Studio 環境は自動的に権限が事前設定され、手動による IAM 設定が不要に。

IOL-AI 2026チャレンジ：あなたのモデルは言語学オリンピックの問題を解けるか？

2026-07-07 05:24 UTC+9

IOL-AI 2026チャレンジがHugging Face Spacesで公開され、AIモデルが言語学オリンピックの問題を解く能力をテストします。研究者は革新的なソリューションを提出できます。

言語学オリンピックの問題を基にしたチャレンジで、AIの推論能力を評価。
Hugging Face Spacesプラットフォームで開催。

PRX パート4：データ戦略

2026-07-07 00:30 UTC+9

この記事では、7Bテキストから画像へのモデルPRXのデータパイプラインについて詳しく説明しています。多様な事前学習データセットを公開・内部データセットから構築し、VLMを使用して長く正確なキャプションを生成し、データセット構築にはLance、ストリーミングにはMDSを使用しています。チームは、品質92のJPEGエンコーディングの選択、オンザフライのテキスト潜在変数の計算、データ断片化に関する教訓について説明しています。

事前学習データは公開・内部データセットの混合で構成され、一貫性のためにVLMで再キャプションされています。
長く正確なキャプションが重要であり、不完全さを制御可能な属性に変えます。

Tunix GRPO、LoRAアダプター、GSM8K報酬を用いたGemma-3の構造化数学的推論トレーニング

2026-07-06 13:26 UTC+9

このチュートリアルでは、Tunix、JAX、LoRA、カスタム報酬関数を使用して、Gemma-3がGSM8K数学問題を解決するためのエンドツーエンドのGRPOトレーニングワークフローを構築します。環境準備、Hugging Face認証、モデル読み込み、プロンプト形式設計、報酬関数定義、LoRAアダプター適用、ベースライン評価、GRPOトレーニングをカバーします。

TunixとJAXを使用したGRPOトレーニングを実装し、LoRAアダプターの重みのみを更新するため、単一アクセラレータ設定に適している。
形式報酬と数学的正解報酬を定義し、モデルに複数のフィードバック信号を提供する。

🤗 Kernels：主要アップデート

2026-07-06 09:00 UTC+9

Hugging Face の Kernels プロジェクトは、カスタムカーネルのパッケージ化、配布、利用を標準化することを目的としています。この記事では、主要なアップデートをまとめています。新しい「カーネル」リポジトリタイプによる発見性の向上、信頼できるパブリッシャーとコード署名によるセキュリティ強化、CLI の再設計、Torch Stable ABI と Apache TVM FFI のサポート拡張、エージェントによるカーネル開発の基盤、環境セットアップや互換性チェックの改善などです。

Hub に新しい「カーネル」リポジトリタイプを導入。アクセラレータ、OS、バックエンドバージョンでフィルタリング可能。
セキュリティ向上：デフォルトでは信頼できるパブリッシャーのみロード。Sigstore の一時鍵によるコード署名でクレデンシャル漏洩対策。

Leanstral 1.5：誰でも使える形式検証ツール

2026-07-03 23:18 UTC+9

Leanstral 1.5 は、無料の Apache-2.0 ライセンスモデルで、119B の総パラメータと 6B のアクティブパラメータを持ち、形式検証において大きな性能向上を実現しました。miniF2F を飽和させ、PutnamBench で 587/672 の問題を解決し、FATE-H (87%) と FATE-X (34%) で最先端の結果を達成。中間トレーニング、教師ありファインチューニング、CISPO を用いた強化学習を経て、エージェント指向の証明工学と実世界のコード検証で優れた能力を発揮し、57 のリポジトリで 5 つの未知のバグを発見しました。完全にオープンソース化され、Hugging Face と無料 API から利用可能で、Lean 4 での実用的な証明工学が可能になりました。

Leanstral 1.5 は、miniF2F で 100%、PutnamBench で 587/672 など、複数の形式数学ベンチマークでほぼ完全または最先端の結果を達成。
コード検証能力に優れ、AVL 木の時間計算量を証明し、オープンソースリポジトリで実際のバグを発見。

効率的な小型言語モデルのためのWiolaアーキテクチャ

2026-07-03 13:00 UTC+9

Wiolaは、GPT、LLaMA、Mistral、Falconなどの既存モデルファミリーとは無関係に、第一原理から構築された完全にオリジナルの小型言語モデル（SLM）アーキテクチャです。螺旋回転位置符号化（SRPE）、ゲート付き層間注意（GCLA）、適応型トークン統合（ATM）、二重ストリームフィードフォワード（DSFF）、WiolaRMSNormの5つの新しいコンポーネントを導入しています。4つのサイズ（120M、360M、700M、1.5Bパラメータ）でリリースされ、HuggingFace Transformersと完全互換です。

Wiolaは既存モデルと構造的系統を共有しない完全オリジナルのSLMアーキテクチャ。
5つの新規コンポーネント：SRPE、GCLA、ATM、DSFF、WiolaRMSNorm。

Hugging Face と Cerebras、Gemma 4 をリアルタイム音声AIに導入

2026-07-01 09:00 UTC+9

Hugging Face と Cerebras は、Gemma 4 を活用したリアルタイム音声AIシステムを発表。オープンなモジュラーアーキテクチャによりレイテンシを大幅に削減し、自然な対話を実現する。Nvidia の音声認識、Cerebras の高速推論、Alibaba の音声合成を統合し、9,000台以上の Reachy Mini ロボットに導入されている。

Hugging Face と Cerebras が Gemma 4 ベースのリアルタイム音声AIデモを公開、超低レイテンシを達成。
システムはオープンなカスケード型アーキテクチャを採用：音声入力→ASR→モデル推論→TTS→音声出力。

AI搭載アプリケーションのプレトレーニングモデルハブにおけるセキュリティリスクの解明

2026-07-01 04:10 UTC+9

研究者らは、Hugging Faceなどのプラットフォーム上のAIアプリを初めて体系的にセキュリティ分析し、5つの脅威カテゴリと10の攻撃ベクトルを特定しました。97万以上の公開AIアプリを分析した結果、数千が認証情報を漏洩し、数百がコード実行の脆弱性を持ち、数十にバックドアが埋め込まれていることが判明しました。

AIアプリプラットフォームには、アクセス制御の破綻や入力インジェクションなどの深刻なセキュリティリスクがある。
97万以上の公開AIアプリの分析により、数千が認証情報を漏洩し、数百が任意コード実行の脆弱性を持つことが判明。

ScarfBench：エンタープライズJavaフレームワーク移行のためのAIエージェントベンチマーク

2026-07-01 03:32 UTC+9

IBM Researchは、エンタープライズJavaにおけるクロスフレームワーク移行タスクのAIエージェントを評価するためのオープンベンチマークScarfBenchを発表しました。ベンチマークには34のアプリケーション、102のフレームワーク実装、204の移行タスクが含まれています。現在のトップエージェントの行動成功率は10%未満であり、移行中の振る舞い保持の難しさが浮き彫りになっています。

ScarfBenchはSpring、Jakarta EE、Quarkus間のフレームワーク移行におけるAIエージェントを評価し、ビルド、デプロイ、振る舞いの検証を要求します。
ベンチマークは34アプリケーション、約2,000のソースファイルとテストファイル、1,331の専門家作成テストで構成されています。

専門化が不可避である理由

2026-06-30 23:39 UTC+9

本稿は、最適化理論、進化生物学、競争市場、機械学習の四つの視点から、専門化が限られたリソース下でシステムの性能を向上させる必然的な道であることを論じる。著者は、汎用性は性能上の優位性ではなく、有限リソースではタスクを絞り込むことが効果的だと指摘する。また、専門化とドメイン知識の違いを明確にし、スケーリングがこの根本的な制約を変えないと述べる。

最適化理論の「No Free Lunch」定理は、アルゴリズムには適用範囲があり、専門化が高性能の鍵であることを示す。
生物学と市場経済では、リソース制限が専門化を生存・発展戦略とする。

Hugging FaceモデルページでのEvery Eval Ever結果の表示

2026-06-30 09:00 UTC+9

Every Eval Ever（EEE）とHugging Face Community Evalsが相互運用可能になり、評価結果のクロスポストと解釈が可能になり、オープンモデル、リーダーボード、統一された標準化メタデータストアへのリンクが提供されます。

EEEとHugging Face Community Evalsが相互運用可能になり、評価結果のクロスポストが可能に。
EEEは、実行主体、モデル、設定など評価の詳細を記録する統一JSONスキーマを提供。

DiScoFormer: 密度とスコアを一つのトランスフォーマーで、分布を横断して

2026-06-30 03:02 UTC+9

DiScoFormerは、データポイントの集合から分布の密度とスコア（対数密度の勾配）を一回の順伝播で推定する新しいトランスフォーマーモデルです。再学習不要で、クロスアテンション、共有バックボーン、一貫性損失を利用して分布に適応します。100次元では、最適なKDEと比較してスコア誤差を約6.5倍、密度誤差を37倍以上削減します。

再学習なしで密度とスコアを同時に推定。
一貫性損失による未知分布への適応。

Kog Laneformer 2B：Kog 推論エンジンの背後にあるレイテンシ最優先モデル

2026-06-29 17:40 UTC+9

Kog は、高速シングルリクエスト推論のために一から設計された23億パラメータの命令チューニング済みコーディングモデル「Laneformer 2B」をリリースしました。モデルアーキテクチャと推論エンジンを共同設計することで、Kog は Delayed Tensor Parallelism とレーン構造の Transformer を導入し、通信オーバーヘッドを隠蔽します。このモデルは競争力のあるコーディングベンチマーク（HumanEval+ 45.1%、MBPP+ 51.6%）を達成し、Hugging Face でオープンソース化されています。

Laneformer 2B は低レイテンシ推論に最適化された23億パラメータのコーディングモデルです。
新しいレーン構造アーキテクチャと Delayed Tensor Parallelism を使用して通信コストを最小化します。

Colabで安定したFable 5 Tracesワークフローを構築する：ツール呼び出しの解析、データ監査、ベースライン学習

2026-06-28 16:02 UTC+9

本チュートリアルでは、Hugging FaceのFable 5 Tracesデータセットを中心に、Colabで堅牢なワークフローを構築します。脆弱な依存関係を避けるため、マージされたJSONLファイルを手動で解析し、ツール呼び出しを正規化し、データ構造を監査し、秘密情報を検出・編集し、純Pythonのナイーブベイズベースラインを学習して出力タイプとツール使用を予測します。

脆弱な依存関係を避けるため、マージされたJSONLファイルを手動でダウンロードし解析する。
生の出力からツール名、引数、テキストペイロードを抽出する解析ユーティリティを開発する。

NVIDIA Open-SWE-Tracesからの教師ありファインチューニングデータ構築：軌跡解析、パッチ分析、トークンバジェット、ツール使用指標

2026-06-27 09:02 UTC+9

このチュートリアルでは、NVIDIAのOpen-SWE-Tracesデータセットを使用して、エージェント型ソフトウェアエンジニアリングの軌跡を教師ありファインチューニングに備える方法を紹介します。Hugging Faceからのストリーミング、マルチターン対話の正規化、コードパッチの解析、分析DataFrameの構築、および成功ラベル、トークン制限、言語フィルタに基づく高品質軌跡の選択について説明します。

Hugging FaceからOpen-SWE-Tracesをストリーミングし、ローカルダウンロード不要。
エージェント軌跡を正規化し、ロール数、ツール使用、パッチ情報を抽出。

1つのコマンドでHF Jobs上にvLLMサーバーを実行

2026-06-26 09:00 UTC+9

Hugging Faceのインフラ上で、サーバーのプロビジョニングやKubernetesを必要とせず、1つのコマンドでプライベートなOpenAI互換のLLMエンドポイントを起動できます。秒単位の課金です。起動、クエリ、クリーンアップ、大規模モデルへの拡張、チャットUIの作成、SSHデバッグ、コーディングエージェントのバックエンドとしての利用まで、完全なフローをカバーし、Inference Endpointsとの比較も行います。

hf jobs run コマンドとvLLM Dockerイメージ、--expose 8000 オプションを使用して、HF Jobs上でvLLMサーバーを実行します。
エンドポイントはHugging Faceトークンで認証され、ジョブの名前空間への読み取り権限が必要です。curlやOpenAI Pythonクライアントでクエリ可能です。

ハイブリッドモデルはどのトークンをより正確に予測するか？

2026-06-26 01:11 UTC+9

Ai2チームは、7BパラメータのTransformerモデルOlmo 3とハイブリッドモデルOlmo Hybridを比較。ハイブリッドモデルは内容語（名詞、動詞、形容詞）や文脈推論が必要なトークンで優れるが、繰り返しトークンや閉じ括弧では優位性が消失する。トークンレベルの損失フィルタリングにより、アーキテクチャ間の微妙な差異が明らかになった。

ハイブリッドモデルは意味のあるトークン（内容語）で予測が正確だが、繰り返しトークンでは優位性がない。
ハイブリッドモデルは一部のアテンション層を再帰層に置き換え、固定サイズのメモリで系列の状態追跡に適する。

NVIDIA NeMo AutoModelによるTransformerファインチューニングの高速化

2026-06-25 01:00 UTC+9

NVIDIA NeMo AutoModelはHuggingFace Transformers v5をベースに、エキスパート並列化、DeepEP融合オールツーオールディスパッチ、TransformerEngineカーネルを追加し、MoEモデルのファインチューニングでトレーニングスループットを3.4～3.7倍、GPUメモリを29～32%削減、API変更は不要。

NeMo AutoModelはAutoModelForCausalLMを継承し、インポート行を変更するだけで性能向上を実現。
550Bモデルではエキスパート並列化により16ノードのH100クラスタでフルファインチューニングが可能に（Transformers v5はメモリ不足で実行不可）。

CUGAを使用した本格的なエージェントアプリの構築：軽量ハーネス上の24の実働例

2026-06-23 21:51 UTC+9

CUGAはIBMが開発したオープンソースのエージェントハーネスで、エージェント構築における配管作業を処理し、開発者はツールリストとプロンプトのみを記述すればよい。本記事では、IBM Cloudアドバイザーアプリの例を通して、CUGAの計画、リフレクション、ポリシーシステムがどのように堅牢で本番運用可能なエージェントを実現するかを解説する。

CUGAはオーケストレーション、状態管理、ツール呼び出しを抽象化し、開発者はツールとプロンプトに集中できる。
cuga-appsリポジトリには24の単一ファイルアプリが含まれており、それぞれが読み取り可能でコピー可能な実働例である。

Transformers.jsにおける提案中のCross-Origin Storage APIの実験

2026-06-23 09:00 UTC+9

この記事では、Cross-Origin Storage（COS）APIの提案を紹介します。このAPIは、暗号化ハッシュを使用してファイルを識別することで、WebアプリがAIモデルやWasmランタイムなどの大規模ファイルをオリジン間で共有できるようにします。Transformers.jsを例に、現在のキャッシュ分離が引き起こす重複ダウンロードの問題と、COSがハッシュベースの識別、柔軟なアクセス制御、整合性検証によってどのように解決するかを説明します。

現在のブラウザキャッシュはオリジンごとに分離されており、異なるアプリ間で同じAIリソースが重複ダウンロードされる。
Cross-Origin Storage（COS）APIは、ファイルを暗号化ハッシュで識別し、オリジン間共有を可能にする。

AI、オープンツール、人間の監視でhuggingface_hubを毎週リリース

2026-06-23 09:00 UTC+9

Hugging Faceチームは、AIとオープンソースツールを活用してhuggingface_hubのリリースサイクルを4～6週間から毎週に短縮し、人間による最終レビューを残しました。新しいパイプラインは1リリースあたり約0.25ドルのコストで、リリースノートの品質と統合問題の発見が向上しました。

リリース間隔が4～6週から毎週に短縮
AIがリリースノートを草稿するが、決定論的検証で正確性を保証

Hugging Face 上の PP-OCRv6: 1.5M から 34.5M パラメータの 50 言語対応 OCR

2026-06-22 22:18 UTC+9

PP-OCRv6 は PaddleOCR の最新の汎用 OCR モデルファミリーで、1.5M から 34.5M パラメータの 3 つのティアにわたり、50 言語をサポートします。PP-OCRv5_server と比較して、テキスト検出の Hmean が +4.6 ポイント、認識精度が +5.1 ポイント向上しました。新アーキテクチャには PPLCNetV4 バックボーン、RepLKFPN 検出モジュール、EncoderWithLightSVTR 認識モジュールが含まれます。Paddle Inference、Transformers、ONNX Runtime の複数の推論バックエンドをサポートします。

3 つのモデルティア: tiny (1.5M)、small (7.7M)、medium (34.5M) を提供し、様々な展開環境に対応。
中国語、英語、日本語、46 のラテン文字言語を含む 50 言語をサポート。

ローカルモデルでOpenClawリポジトリのトリアージを無料で実現！*

2026-06-22 09:00 UTC+9

OpenClawのメンテナーがローカルのオープンウェイトモデル（Gemma、Qwen）をエージェントハーネスで使用し、イシューやプルリクエストをリアルタイムでトリアージするシステムを構築。クローズドモデルに匹敵する性能をローカルハードウェアで実現。

ローカルモデル（Gemma、Qwen）はGitHubのイシューやPRを効果的に分類し、トリアージに利用できる。
読み取り専用シェル（reposhell）を備えたエージェントハーネスで安全にコードを調査。

Salesforce CodeGenチュートリアル：単体テストとセキュリティチェックによるPython関数の生成、検証、および再ランク付け

2026-06-19 11:44 UTC+9

Salesforce CodeGenのエンドツーエンドワークフローを実装し、Hugging Faceからモデルをロードします。基本的な推論を超えて、関数抽出、構文チェック、静的セキュリティチェック、単体テスト検証を追加します。ベストオブN候補の再ランク付け、マルチターン合成、プロンプトスタイルの実験を行い、最後にミニベンチマークを可視化して生成アーティファクトを再利用可能なファイルとしてエクスポートします。

Hugging FaceからSalesforce CodeGenモデルをロードし、コード生成環境を準備
生成された関数の抽出、構文検証、静的セキュリティチェック、単体テスト実行

MosaicLeaks: あなたの研究エージェントは秘密を守れますか？

2026-06-19 03:13 UTC+9

ディープリサーチエージェントがプライベート文書とWeb検索を組み合わせると、クエリログを通じて機密情報が意図せず漏洩する可能性があります。MosaicLeaksベンチマークはこのプライバシーリスクを定量化し、Privacy-Aware Deep Research (PA-DR) と呼ばれる訓練手法を提案します。これにより、タスクパフォーマンスを維持しながら情報漏洩を3倍以上削減します。

MosaicLeaksは、プライベートローカル文書とパブリックWebクエリを織り交ぜたマルチホップ研究チェーンのベンチマークを導入し、意図、回答、完全情報の3つの漏洩レベルを測定します。
タスクパフォーマンスのみを訓練すると成功率と漏洩率の両方が上昇しますが、PA-DRを使用すると回答/完全情報漏洩が34.0%から9.9%に減少し、厳密なチェーン成功率は58.7%を維持します。

LoRAを超えて：最も人気のあるファインチューニング技術を打ち負かせるか？

2026-06-18 09:00 UTC+9

LoRAは最も人気のあるパラメータ効率的ファインチューニング（PEFT）技術だが、特定のタスクでは他の手法が優れることを研究が示している。本記事では、Hugging FaceのPEFTライブラリとそのベンチマークを紹介し、ニーズに応じた適切なPEFT技術の選択方法を解説し、LoRAが常に最良とは限らないと指摘する。

LoRAはPEFT技術で支配的だが、最適とは限らない。
Hugging FaceのPEFTライブラリは統一APIとベンチマークを提供し、ユーザーの選択を支援する。

それはエージェント的に十分か？独自のツールでオープンモデルをベンチマークする

2026-06-18 09:00 UTC+9

新しいベンチマークフレームワークは、AIエージェントがソフトウェアライブラリを使用する際のプロセス全体の労力を評価します。Hugging Face Transformersをケーススタディとして、トークン使用量、時間、エラー率を異なるモデルとツール階層で測定し、使いやすさとリソース消費のトレードオフを明らかにします。

標準ベンチマークは最終回答のみをチェックするが、このフレームワークはトークンコストやエラーを含むプロセス全体を測定する
3つの階層（ベアインストール、クローン、スキル）をテストし、それぞれ異なるオーバーヘッドがある

MolmoMotion：言語指導による3D動作予測

2026-06-18 00:26 UTC+9

MolmoMotionは、ビデオフレーム、オブジェクト上の3D点、および言語指示から、数秒後の3D点軌跡を予測する新しい3D動作予測モデルです。ロボット計画や制御可能なビデオ生成で既存手法を凌駕します。最大のデータセットMolmoMotion-1MとベンチマークPointMotionBenchも公開しています。

MolmoMotionは言語指示で3D動作予測を誘導し、既存手法を大幅に上回る性能を達成。
自己回帰型とフローマッチング型の2種類のバリアントを提供。

Hugging Face Hubからロボットハードウェアへ：Strands AgentsとLeRobotの統合

2026-06-17 19:18 UTC+9

AWSのオープンソースSDK「Strands Robots」がLeRobotを統合し、開発者は単一のAgentワークフローでHubデータセットから学習し、シミュレーションまたは実ロボットにポリシーをデプロイできます。本記事では5つのステップを解説し、ラップトップで実行可能なサンプルを提供します。

Strands Robots SDKはLeRobotをAgentToolsとして公開し、データセットからロボットハードウェアまでのエンドツーエンド制御を実現。
シミュレーションと実機は同一のDatasetRecorderとLeRobotDataset形式を共有し、互換性を確保。

GLM-5.2：長期間タスク向けに構築

2026-06-17 18:01 UTC+9

Z.AI が最新フラッグシップモデル GLM-5.2 を発表。長期間タスクに特化し、安定した 1M トークンコンテキストを提供。コーディングベンチマークで優れた性能を発揮し、IndexShare アーキテクチャで計算コストを削減。努力レベル制御により柔軟性を実現。MIT ライセンスで公開。

GLM-5.2 は 1M トークンの安定したコンテキストを提供し、長期間のエンジニアリングタスクをサポート。
FrontierSWE、PostTrainBench などの長期間コーディングベンチマークでオープンソースモデル中最上位。

エージェントリソースディスカバリー：エージェントに検索を任せる

2026-06-17 09:00 UTC+9

Agentic Resource Discovery（ARD）仕様は、AIエージェントがツール、スキル、他のエージェントを動的に発見できるようにする発見レイヤーを提供します。Hugging Face はHub上でリファレンスツールを実装し、自然言語検索を可能にしています。

ARDは、連合レジストリ全体でエージェント機能をカタログ化および検索するための標準を定義します。
Hugging FaceのDiscoverツールはARDを実装し、スキル、MCPサーバー、AIアプリケーションの自然言語検索をサポートします。

オープンソースはOpenAIに勝てるか？

2026-06-16 14:41 UTC+9

米中のAI競争において、オープンソースとクローズドソースの哲学の違いが勝敗を分ける可能性がある。中国のAIラボは積極的にオープンソースモデルを公開する一方、OpenAIやAnthropicなどの米国企業はクローズドソースを好む。元Hugging Faceのアジア太平洋地域エコシステム責任者であるTiezhen Wang氏が、オープンソースモデルの歴史、中国のAIラボの収益化方法、モデル蒸留と知的財産をめぐる議論について語った。

米中AI競争では、オープンソースとクローズドソースの哲学が対立。中国はオープン、米国はクローズドを志向。
オープンソースモデルはAPIサブスクリプション、インフラ支援、ブランディングを通じて収益化。

olmo-eval：モデル開発ループのための評価ワークベンチ

2026-06-13 00:56 UTC+9

olmo-evalは、LLM開発中の反復的な評価サイクルをサポートする新しい評価ワークベンチです。OLMES標準を基盤とし、柔軟なタスク定義、交換可能な実行時ポリシー、詳細な質問ごとの比較機能を提供し、開発者が介入が有意かどうかを判断するのに役立ちます。

モデル開発における反復的な評価ループ向けに設計され、ベンチマークの迅速な追加、チェックポイント間の実行、詳細な結果分析をサポートします。
Harborなどのツールとは異なり、軽量モードとサンドボックスモードの両方を提供し、ベンチマークのニーズに基づいて自動的に選択します。

PyTorch プロファイリング (第2部): nn.Linear から融合 MLP へ

2026-06-11 09:00 UTC+9

本記事は PyTorch プロファイリングシリーズの第2部であり、nn.Linear レイヤーの内部機構（転置操作、バイアス融合エピローグ技術、torch.compile の影響）を掘り下げます。その後、GeGLU 活性化関数を含む多層パーセプトロン (MLP) のパフォーマンス特性を解析し、GPU カーネルのスケジューリングと実行を示します。

nn.Linear はエピローグを介してバイアス加算を行列乗算カーネルに融合し、余分なメモリアクセスを回避します。
torch.compile は単一の nn.Linear 層には有意な高速化をもたらさないが、CPU ディスパッチのオーバーヘッドを排除します。

North Mini Code の紹介：Cohere初の開発者向けモデル

2026-06-10 00:56 UTC+9

Cohere は、エージェント型ソフトウェアエンジニアリングタスク向けに設計された、300億パラメータのMixture-of-Expertsモデル（アクティブパラメータ30億）「North Mini Code」をリリースしました。Apache 2.0ライセンスでHugging Face上で公開され、コーディングベンチマークで競争力のある性能を達成しています。

300億パラメータMoEモデル、アクティブパラメータ30億、エージェント型コーディングに最適化。
Artificial Analysis コーディングインデックスで同等のオープンソースモデルを上回る。

Hugging Face 上で今すぐ使える最高の無料画像生成器！

2026-06-09 23:00 UTC+9

この記事では、Hugging Face 上の 90,000 以上のテキストから画像へのモデルから、2026 年に注目すべき 7 つのモデルを厳選。FLUX.1 Schnell、FLUX.1 Dev、FLUX.1 Kontext Dev、Stable Diffusion 3.5 Large、FLUX.2 Dev、Playground v2.5、Kolors について、ライセンス、最適な用途、実際のトレードオフを詳しく解説します。

FLUX.1 Schnell は Apache 2.0 ライセンスで商用利用が可能で、生成速度が速い。
FLUX.1 Kontext Dev はテキスト指示による画像編集に優れ、複数回の編集でも同一性を維持。

マルチメディアビルディングブロック：Hugging Face Spacesで3Dパリギャラリーを構築

2026-06-09 19:46 UTC+9

コーディングエージェントが2つのHugging Face Space（画像生成と3Dガウシアンスプラット再構成）をagents.md経由で呼び出し、パリのモニュメントを展示する3Dウェブサイトを自動構築。画像生成ツールや3D再構築ツールを直接使うことなく、エージェントが各SpaceのAPIを連鎖させて結果を統合。本記事は、マルチメディアAIにおける「ビルディングブロック経済」の到来を示し、モデルを呼び出し可能な部品としてエージェントが自在に組み合わせることで、統合障壁を劇的に低減する可能性を強調している。

コーディングエージェントが2つのHugging Face Spacesを呼び出し、画像生成と3Dガウシアンスプラット再構成を自動連鎖させ、パリのモニュメントの3Dギャラリーを構築した。
各Gradio Spaceのagents.mdファイルには完全なAPI仕様が記載されており、エージェントは手動統合なしでSpaceを利用できる。

NeuroBait: ADHDの脳にドーパミンを引き起こすためにモデルを微調整した話

2026-06-09 18:04 UTC+9

NeuroBaitは、ADHDの脳がタスクを開始できない「実行機能障害」を克服するために、ドーパミンを刺激するように微調整されたAIモデルです。著者の妻の観察から生まれ、従来のToDoリストではなく、温かみのある流れるような散文で小さな実行可能な一歩を提供します。LoRAを用いてGemma 3 12Bを微調整し、Hugging Face Spaceにデプロイされています。ADHDに限らず、圧倒されていると感じる誰でも役立ちます。

NeuroBaitは温かく流れるような散文で、小さな実行可能なアクションを提供し、ADHDの脳がタスクを始めるのを助ける。
著者の妻のADHDの実体験に基づき、LoRAでGemma 3 12Bを微調整。データセットは小さく厳選された合成データ。

Hush: 音声AIエージェント向けオープンソースノイズ抑制ツール

2026-06-09 16:39 UTC+9

HushはWeya AIが開発したオープンソースの音声強調モデルで、音声AIエージェント向けに設計されています。CPU上でリアルタイムに主話者を分離し、背景ノイズや競合する声を抑制し、レイテンシは1ms未満です。モデルサイズは8MB、Apache 2.0ライセンスで、Hugging FaceのAudio-to-Audioリーダーボードで5位にランクインしています。

リアルタイムで主話者を分離し、背景ノイズと競合音声を除去、レイテンシ1ms未満。
CPUで動作、GPU不要、モデルサイズ8MBでリアルタイムパイプラインに最適。

Hugging Face