LLM Reddit Feb 17, 2026 1 min read
r/singularityの人気投稿は、GoogleのGemini 3 Deep Think大規模アップデートを共有した。公式発表ではHLE 48.4%(toolsなし)、ARC-AGI-2 84.6%、Codeforces Elo 3455などの指標と、Gemini APIのearly accessが示された。
r/singularityの人気投稿は、GoogleのGemini 3 Deep Think大規模アップデートを共有した。公式発表ではHLE 48.4%(toolsなし)、ARC-AGI-2 84.6%、Codeforces Elo 3455などの指標と、Gemini APIのearly accessが示された。
Hacker Newsで話題になったarXiv 2602.10177は、Aletheiaという数理研究エージェントを提示する。著者はIMO水準からPhD水準、公開未解決問題の半自律評価までを報告している。
r/singularityで拡散したArs Technica報道により、Geminiへの10万件超プロンプト試行が話題化し、distillationの正当利用と無断抽出の線引きが再び焦点となった。
Google DeepMindは2026年2月11日、Gemini Deep Thinkを用いた数理・科学研究支援の成果を公開した。2本の論文、検証ループ型エージェント設計、評価ベンチマークの結果を示している。
GoogleがGemini 3 Deep Thinkの大型アップデートを発表し、推論ベンチマークの強化と研究機関・企業向けAPI早期提供を示した。