LLM reasoning、問題分解だけでなく記憶を呼び出す仕組みか
Original: Thinking to recall: How reasoning unlocks parametric knowledge in LLMs View original →
LLMのreasoningは、難問を段階に分けるためだけの機能ではないかもしれない。Google Researchは、単純な事実質問でもreasoningがモデル内部の知識を引き出す助けになるという実験結果を示した。鍵は論理展開ではなく、追加計算時間と関連事実の呼び水だ。
2026年6月24日のGoogle Research記事は、論文Thinking to Recallを紹介している。研究チームはGemini-2.5 Flash、Gemini-2.5 Pro、Qwen3-32Bを、SimpleQA VerifiedやEntityQuestionsなどのclosed-book QAで評価した。多くはsingle-hopの事実質問であり、複雑な手順分解だけでは効果を説明しにくい。
1つ目の仕組みはcomputational bufferだ。研究者はモデルのreasoning traceを途中で差し替え、元の長さに合わせて意味のない“Let me think”の繰り返しを入れた。そのdummy traceでも、reasoningを完全にoffにした場合より正答想起が大きく改善した。追加tokenがforward passと内部処理の時間を与える、という見方である。
2つ目はfactual primingだ。自然なreasoning traceを調べると、モデルは論理証明を書くというより、質問に関連する事実を先に浮かべていた。研究チームはtraceから具体的な事実だけを抽出し、fillerや最終回答への明示的言及を取り除いて条件として与え直した。短い事実リストだけでもreasoningの利得の多くが戻った。
同時に、弱点もはっきりした。研究チームは数十万件の中間事実をsearch-enabled verifierで監査し、reasoning traceにhallucinationが1つでも入ると最終回答の正答率が有意に下がると報告した。reasoningは記憶へのアクセスを広げる一方、誤った中間事実は答えを違う方向へ押し出す。
実務上の含意は、長く考えさせるだけでは足りないという点だ。中間段階で事実に支えられた内容を出すよう、学習や推論時選択を設計する必要がある。Google Researchは、hallucination-freeなreasoning trajectoryを選ぶtest-time selectionやprocess rewardが、より信頼できる事実想起につながる可能性を示している。
Related Articles
注目を集めたのは手続きそのものではなく、高性能LLMへのアクセスが本人確認と結びつき始めた点だ。
Mistralは2026年3月16日、reasoning、multimodal入力、agentic codingを1つにまとめたMistral Small 4を公開した。119B total parameters、6B active parameters、256k context window、Apache 2.0、configurable reasoning_effortが主要ポイントだ。
Hacker Newsで注目を集めたのは、Sarvam AIがIndiaAI missionのcomputeでインド国内学習した reasoning重視のMoEモデル Sarvam 30Bと105B を公開した点だ。単なるweights公開ではなく、製品投入、inference最適化、Indian-language benchmarkまで含めた発表になっている。