#optimization

AI News Jul 10, 2026 1 min read

AlphaEvolveがGAへ、Google Cloudがアルゴリズム探索を商品化

Google CloudはAlphaEvolveをGemini Enterprise Agent Platformで一般提供に移した。BASFの計画モデル80%超改善、Coolblueの需要予測5%超改善、FM Logisticの倉庫routing 10.4%改善など、実運用の数字を前面に出している。

#google-cloud #gemini #agents

LLM Reddit Apr 16, 2026 1 min read

よく使うMoE expertをVRAMへ、LocalLLaMAが見た27%高速化

LocalLLaMAが反応したのは、大きなMoE modelを限られたVRAMで動かす時の痛点を現実的に突いていたからだ。投稿者はQwen3.5-122B-A10Bで、最近routeされたexpertを追跡してhotなものだけVRAM cacheに置くllama.cpp forkを試し、同程度の22GB台VRAM使用量でlayer-based offloadよりtoken generationが26.8%速いと共有した。

#local-llm #llama-cpp #moe

LLM Reddit Apr 16, 2026 1 min read

LocalLLaMAが沸いた自動チューニング、Qwen3.5-27Bが40 tok/sへ

LocalLLaMAが反応したのは、「LLMが自分のruntimeを速くする」という冗談のような仕組みに、具体的なbenchmark数字が付いていたからだ。投稿者はllm-server v2の--ai-tuneがllama-server helpをcontextとして読み、flag組み合わせを試して最速configをcacheすると説明し、Qwen3.5-27B Q4_K_Mは18.5 tok/sから40.05 tok/sへ伸びたと共有した。

#local-llm #llama-cpp #optimization

LLM Hacker News Apr 10, 2026 1 min read

コードを書く前に論文を読む agent、Hacker News が見た実務的な改善幅

Hacker News で注目された SkyPilot の記事は、coding agent がコードを触る前に papers と competing implementations を読むと <code>llama.cpp</code> 最適化の質が上がると主張した。TinyLlama 1.1B では x86 の text generation が 15%、ARM が 5% 改善し、総コストは約 29ドルだった。

#coding-agents #llama-cpp #skypilot

AI Hacker News Apr 2, 2026 1 min read

Hacker Newsが注目したMetaのBOxCrete、米国産 concrete mix設計へのAI活用

Hacker Newsでは2026年3月30日に公開されたMetaのBOxCreteが、industrial AIの実装例として再評価されている。optimization model、公開データ、そして米国内調達という目的が concrete mix 設計でどう結びつくかを示す事例だ。

#meta-ai #construction #concrete

AI Reddit Mar 20, 2026 1 min read

r/MachineLearningがClip to Grokを注視、単純なweight norm clippingでgrokking遅延短縮を主張

2026年3月17日にr/MachineLearningへ投稿されたClip to Grokスレッドは、クロール時点で56ポイントと20件のコメントを集めた。投稿者は、optimizer stepごとにdecoder weight rowをL2 clippingすることで、modular arithmetic benchmarkで18倍から66倍速いgeneralizationを得たと主張している。

#grokking #optimization #transformers

AI Hacker News Mar 19, 2026 1 min read

Hacker Newsで注目のagent-sat、MaxSAT解法を自律的に改良するAIシステム

2026年3月19日にHacker Newsで注目を集めたagent-satは、weighted MaxSAT benchmarkを相手にAIエージェントが実験とコード改良を繰り返すopen-source projectだ。READMEによれば、2024 MaxSAT Evaluationの229インスタンス中220件を解き、5件でcompetition bestを上回り、1件はnovel solveだという。

#agents #maxsat #optimization

LLM Reddit Mar 13, 2026 1 min read

r/singularity、LM head が学習信号の大半を失わせるとする論文に注目

Redditのスレッドで arXiv 論文 2603.10145 が共有され、この論文は language model の output layer が単なる softmax expressivity の問題ではなく、gradient norm の 95〜99% を抑圧する optimization bottleneck だと主張している。議論は、より良い head 設計が LLM 学習効率を大きく変え得るかに集中した。

#backpropagation #lm-head #optimization

LLM Hacker News Mar 5, 2026 1 min read

NanoGPT Slowrunを巡る議論拡大、固定データ条件でのLLM学習効率に注目

2026年3月4日のHNでQ LabsのSlowrunが注目を集めた。100M FineWeb tokensを固定し、computeを使ってdata efficiencyを高める設計が焦点になっている。

#nanogpt #data-efficiency #llm-training

Gaming Reddit Feb 18, 2026 1 min read

r/Games: LEGO Batman新作、推奨RAMを32GBから16GBへ下方修正

LEGO Batman: Legacy of the Dark KnightのSteam公式告知で、推奨RAMが32GBから16GBへ変更された。あわせて、PC要件は発売まで最終確定ではないと説明している。

#lego-batman #pc-specs #steam

Gaming Reddit Feb 15, 2026 1 min read

r/pcgaming: LEGO Batman: Legacy of the Dark Knight推奨RAMが32GBから16GBへ引き下げ

r/pcgaming投稿（723 points、118 comments）は、Steam公式「PC System Specs Update」を根拠に、LEGO Batman: Legacy of the Dark Knightの推奨RAMが32GBから16GBへ変更され、仕様は最終版ではないと共有した。

#pc-gaming #system-requirements #lego-batman

LLM Reddit Feb 15, 2026 1 min read

llama.cppのQwen3Nextグラフ最適化がマージ、LocalLLaMAで推論高速化報告

r/LocalLLaMAで注目された投稿は、llama.cpp PR #19375のマージを共有し、Qwen3Next推論の速度向上を検証した。PR本文のベンチマークとコミュニティ計測の双方で、copy削減によるt/s改善が確認されている。

#llama-cpp #qwen3next #inference