#long-context

RSSフィード

LLM X/Twitter Jun 13, 2026 1 min read

MiniMax M3の重みがHugging Faceへ、428B規模と1M文脈を提示

MiniMax M3はベンチマーク投稿からオープンウェイト配布へ進んだ。モデルカードは約428Bパラメータ、23B有効パラメータ、1Mトークン文脈を示している。

#minimax #open-weights #multimodal

LLM Reddit May 1, 2026 1 min read

3090一枚で218K文脈、LocalLLaMAが速度より安定性に反応した理由

LocalLLaMAが見た本題は最高速ではなかった。RTX 3090一枚で218K文脈まで伸ばし、長いtool outputでも落ちにくくした構成が評価された。

#qwen #rtx-3090 #vllm

LLM Hacker News Apr 24, 2026 1 min read

DeepSeek V4でHN騒然、API docsより先に広がった重み公開

HNがDeepSeek V4に飛びついた理由はきれいな発表ページではなかった。表のリンクがAPI docsで、実際の重みとbaseモデルがすでにHugging Faceに並んでいたことが一気に火を付けた。

#deepseek #llm #moe

LLM Reddit Apr 14, 2026 1 min read

r/LocalLLaMAが見つけたGemma 4 long contextのprivacy-first活用

人気のr/LocalLLaMA threadは、Gemma 4の256k context windowで100k+ tokenの個人journalをローカル分析した事例を示し、privacyがon-device LLMを動かす実用的な理由になり得ることを示した。

#local-llms #gemma-4 #privacy

LLM Reddit Apr 12, 2026 1 min read

Gemma 4 26B A4Bは245K contextでも実用になるのか

r/LocalLLaMAのstress testでは、Gemma 4 26B A4Bがllama.cpp上で262,144 context windowの約94%でも一貫性を保ったと主張されている。正式なbenchmarkではないが、failure modeとtuning値をあわせて公開している点が実務的だ。

#localllm #gemma-4 #long-context

LLM X/Twitter Mar 27, 2026 1 min read

Together Research、divide-and-conquer長文脈パイプラインがGPT-4o single-shotを上回りうると報告

Together Researchは2026年3月27日、divide-and-conquerを使う小型モデルがlong-context taskでGPT-4o single-shotを上回りうると発表した。TogetherのブログとarXiv論文によれば、この方式はplanner-worker-manager構成とtask、model、aggregator noiseの分析に基づいている。

#together-ai #long-context #multi-agent

LLM Hacker News Mar 15, 2026 1 min read

HN: Anthropic、Opus 4.6とSonnet 4.6で1M contextを標準価格に拡大

AnthropicはOpus 4.6とSonnet 4.6で1M contextをgeneral availabilityにし、long-context premiumなしで標準価格を適用すると発表した。Hacker Newsでは単なるspec更新より、実運用コストが変わる点に関心が集まった。

#anthropic #claude #long-context

LLM X/Twitter Mar 14, 2026 1 min read

Azure、Microsoft FoundryでClaude 4.6の長文脈を強化 1Mコンテキスト・600ページ入力・フラット価格を提示

Azureは2026-03-14のX投稿で、Claude Opus 4.6とSonnet 4.6の1M token context、flat pricing、600 image/PDF page入力対応を打ち出した。MicrosoftとAnthropicの公式文書は、その主要条件が実運用向けに整っていることを裏づけている。

#azure #anthropic #claude

AI Hacker News Mar 10, 2026 1 min read

LoGeR、1万9千フレーム級まで伸ばす長文脈3D再構成を提案

Hacker Newsで注目されたLoGeRは、Google DeepMindとUC Berkeleyによる長文脈3D再構成モデルで、hybrid memoryによって後処理最適化なしで非常に長い動画を扱うとする。

#computer-vision #3d-reconstruction #long-context

LLM Reddit Feb 25, 2026 1 min read

r/LocalLLaMAで話題、Hugging FaceにQwen3.5-35B-A3Bモデルカード

LocalLLaMAでQwen3.5-35B-A3Bのモデルカード共有が急拡大した。MoE構成、長いcontext、主要推論スタック対応が実運用観点で注目されている。

#qwen #open-weights #moe