#open-weights

RSSフィード

LLM Reddit 1d ago 1 min read

Open-weight規制反対の公開書簡、LocalLLaMAで焦点になった署名企業

Microsoft主導の書簡は、open-weight modelを守る主張だけでなく、署名した企業と不在の企業によって議論を呼んだ。

#open-weights #ai-policy #local-llm

2

Thinking Machines、Inklingの重み公開でマルチモーダル競争を加速

LLM X/Twitter Jul 17, 2026 1 min read

Thinking Machines、Inklingの重み公開でマルチモーダル競争を加速

マルチモーダル推論モデルの公開競争に新しい有力候補が加わった。Thinking MachinesはInklingの全重みを公開し、64Kと256Kのコンテキスト、Tinkerでのfine-tuningを用意した。

#thinking-machines #inkling #open-weights

6

LLM Hacker News Jul 16, 2026 1 min read

Inkling公開、open-weight競争の焦点はfine-tuningへ

HNで注目されたのは単なるbenchmark順位ではない。Thinking Machines LabのInklingは、multimodal MoE、調整可能なreasoning effort、Tinkerでのfine-tuningを組み合わせたopen-weight基盤として受け止められている。

#thinking-machines #open-weights #multimodal

6

GLM 5.2、Vibe Code Bench 64%でオープンモデルの実用差を縮める新たな評価基準

LLM X/Twitter Jun 21, 2026 1 min read

GLM 5.2、Vibe Code Bench 64%でオープンモデルの実用差を縮める新たな評価基準

オープンウェイトのコーディングモデルが実用評価で一段上の水準に入った。Vals AIは、GLM 5.2がVibe Code Bench v1.1で64%を記録し、次のオープンモデルを14ポイント上回ったとしている。

#glm-5-2 #open-weights #benchmark

14

LLM Reddit Jun 18, 2026 1 min read

ローカルLLMに空いた80-160Bの中間層、unified memory勢の現実的な要望

LocalLLaMAの議論は、巨大モデルへの憧れではなく、96-128GB級メモリを持つユーザーが使える新しい中間モデルの不足を指している。

#localllama #local-llm #unified-memory

15

LLM Hacker News Jun 18, 2026 1 min read

GLM-5.2、open weightsの争点を順位からreasoning効率へ

スコアだけでなく、長いreasoning tokenと待ち時間まで含めて評価する段階に入ったことが、今回の議論の焦点だ。

#glm #open-weights #benchmarks

17

MiniMax M3の重みがHugging Faceへ、428B規模と1M文脈を提示

LLM X/Twitter Jun 13, 2026 1 min read

MiniMax M3の重みがHugging Faceへ、428B規模と1M文脈を提示

MiniMax M3はベンチマーク投稿からオープンウェイト配布へ進んだ。モデルカードは約428Bパラメータ、23B有効パラメータ、1Mトークン文脈を示している。

#minimax #open-weights #multimodal

19

Gemma 4 12B、encoder-free multimodal設計でローカルAI議論の中心へ

LLM Hacker News Jun 4, 2026 1 min read

Gemma 4 12B、encoder-free multimodal設計でローカルAI議論の中心へ

議論の焦点は「encoder-free」が実際のモデル構造で何を意味するのかに集まった。

#gemma #multimodal #open-weights

26

LLM Reddit May 26, 2026 1 min read

NuExtract3、4GB VRAMも視野に入れた文書抽出VLM

LocalLLaMAで注目されたのは、OCRの新奇性よりも公開重み、セルフホスト、低い実行要件という実務面だった。

#nuextract3 #vlm #ocr

19

LLM Hacker News May 2, 2026 1 min read

DeepSeek V4：フロンティアに迫る性能を低価格で — 最大1.6兆パラメータのオープンウェイトモデル

DeepSeekがDeepSeek-V4-Pro（総パラメータ1.6兆、アクティブ49B）とV4-Flash（284B/13B）を公開した。両モデルはMITライセンスで100万トークンコンテキストに対応するMixture-of-Expertsモデル。V4-Proはこれまでで最大のオープンウェイトモデルとなり、価格はGPT-5.4やClaude Sonnet 4.6の半分以下だ。

#deepseek #llm #open-weights

28

LLM Hacker News Apr 30, 2026 1 min read

Mistral Medium 3.5、HNが性能表より4GPU運用と遠隔エージェントに反応した理由

HNはMistral Medium 3.5を単なるモデル追加として見なかった。4GPU自前運用、オープンウェイト、遠隔コーディングエージェントの組み合わせが議論の中心だった。

#mistral #open-weights #coding-agents

42

LLM Reddit Apr 30, 2026 1 min read

128B denseでざわついたLocalLLaMA　Mistral Medium 3.5の本当の刺さりどころ

LocalLLaMAが真っ先に掴んだのは数字より形だった。Mistral Medium 3.5はreasoning、coding、agent作業を一つにまとめつつ、「これは自分でも回せるかもしれない」と思わせた。その感触がスレッドを熱くした。

#mistral #llm #open-weights

19