Google DeepMindがGemini 3.1 Proをリリースした。前世代比で推論性能が2倍以上向上し、ARC-AGI-2で77.1%、SWE-bench Verifiedで80.6%を達成。18のベンチマーク中12で首位を獲得しながらAPIの価格は$2/$12のまま据え置きとなった。
#llm
RSS FeedスタートアップのTaalasが、Llama 3.1 8Bモデルのweightsをシリコンにエッチングした固定機能ASICチップを発表。毎秒17,000トークンを生成し、GPUベースのシステムより10倍高速で10倍安価、消費電力も10分の1です。
ByteDanceが旧正月前に「Doubao 2.0」を公開。AIME 2025で98.3点、Codeforces 3020レーティングを記録し、GPT-5.2と同等の性能を主張しながらも、コストは西側競合の約10分の1という。
AIリサーチャーのアンドレイ・カーパシー氏が、LLMがソフトウェア開発の制約環境を根本から変えると分析した。コード翻訳においてLLMが特に優れており、これまで書かれたソフトウェアの大部分が何度も書き直されると予測する。
Google DeepMindがGemini 3.1 Proを発表した。モデル全体の知性が大幅に向上し、より難しい問題を解決できるようになった。Google AI ProおよびUltraサブスクライバー向けにGeminiアプリとNotebookLMで展開される。
Hacker Newsで注目されたTaalasの発表は、モデル特化シリコンによる低遅延・低コスト推論を主張する内容。ハードワイヤードLlama 3.1 8Bで17K tokens/sec/ユーザーを掲げた。
Anthropicは2026年2月4日、Claudeの会話体験を広告非搭載で維持すると表明した。同社は、会話型AIでは収益インセンティブの透明性が信頼性に直結するとして、広告誘導ではなくユーザー主導の利用設計を重視する。
Hacker Newsで大きく議論されたGemini 3.1 Pro。GoogleはARC-AGI-2で77.1%を示し、開発者・企業・一般ユーザー向けにPreview展開を同時進行している。
Hacker Newsで高い反応を得たStep 3.5 Flashは、196B total parameterと約11B active parameterのMoE foundation modelとして公開され、256K contextとcoding/agent指標を前面に出した。
OpenAIは2026年2月12日、GPT-5.3 Codex Sparkを発表しました。コーディング用途での処理速度とコスト効率を重視し、GPT-5.2比での遅延・トークン費用改善と主要ベンチマークを提示しています。
r/LocalLLaMAのQwen3.5投稿は123ポイント・13コメントで拡散し、公開ウェイトの即時検証ニーズを再確認させました。リンク先モデルカードでは397B total、17B activated、262,144 native contextなどの主要仕様が明示されています。
r/LocalLLaMAの高反応投稿は、MiniMax-M2.5のHugging Face公開を契機に、量子化・推論基盤・コスト効率といった実装論点へ議論が集中していることを示した。