#distillation

AI Apr 27, 2026 1 min read

米国務省、AI蒸留を外交テーマ化　DeepSeekへ世界的警告

重要なのは、モデル模倣を巡る争いがロビー活動や企業同士の応酬では終わらなくなったことだ。Reutersは4月26日、米国務省が世界の在外公館に対し、DeepSeekを含む中国AI企業の蒸留疑惑を各国政府へ伝えるよう指示したと報じた。

AI Apr 26, 2026 1 min read

ホワイトハウス、中国発のモデル蒸留攻勢を警告　AI窃取を安保案件へ

今回のメモで、モデル蒸留は利用規約違反の話から国家安全保障レベルの技術窃取へ格上げされた。ホワイトハウスは、中国などの外国主体が数万規模のプロキシと jailbreaking 手法で米国の frontier AI を吸い出し、はるかに安いコストで一部ベンチマーク上は競合に見える製品を出せると警告した。

#white-house #china #distillation

LLM X/Twitter Apr 16, 2026 1 min read

Nature論文、LLMのtraitとmisalignmentが無関係な数列からも伝わると示した

synthetic dataで別モデルを訓練する流れに、見えにくい安全リスクが加わった。Nature論文は、owl preferenceやmisalignmentのようなtraitが意味上は無関係な数列からstudent modelへ移る場合を示した。

#ai-safety #llm #distillation

LLM Apr 16, 2026 1 min read

Lightning OPD、reasoning model post-trainingを30 GPU hoursに縮めた

Lightning OPDは、reasoning model post-trainingでlive teacher inference serverを動かし続けるコストに切り込む。4月14日のarXiv paperは、Qwen3-8B-BaseからAIME 2024 69.9%へ30 GPU hoursで到達し、standard OPD比4.0x speedupだったと報告している。

#llm #distillation #post-training

AI Mar 21, 2026 1 min read

Anthropic、Claudeを狙った大規模distillation attackの実態を公開

AnthropicはDeepSeek、Moonshot、MiniMaxがClaudeの出力を大規模に抽出しようとするindustrial-scale campaignを検知したと発表した。同社は約24,000件のfraudulent accountを通じて16 million回超のやり取りがあったとし、検知と対応のtoolingに投資していると説明している。

#anthropic #security #distillation

AI Hacker News Mar 20, 2026 1 min read

Hacker NewsがNanoGPT Slowrunのデータ効率10倍主張を追跡、固定データ時代の新実験

2026年3月19日にHacker Newsへ投稿されたNanoGPT Slowrunスレッドは、クロール時点で162ポイントと43件のコメントを集めた。Q Labsは、100M tokenで学習した1.8B parameter ensembleが通常1B tokenを要するbaselineに匹敵したと主張している。

#language-models #data-efficiency #ensembles

LLM Hacker News Mar 20, 2026 1 min read