LLM reasoning、問題分解だけでなく記憶を呼び出す仕組みか

LLMのreasoningは、難問を段階に分けるためだけの機能ではないかもしれない。Google Researchは、単純な事実質問でもreasoningがモデル内部の知識を引き出す助けになるという実験結果を示した。鍵は論理展開ではなく、追加計算時間と関連事実の呼び水だ。

2026年6月24日のGoogle Research記事は、論文Thinking to Recallを紹介している。研究チームはGemini-2.5 Flash、Gemini-2.5 Pro、Qwen3-32Bを、SimpleQA VerifiedやEntityQuestionsなどのclosed-book QAで評価した。多くはsingle-hopの事実質問であり、複雑な手順分解だけでは効果を説明しにくい。

1つ目の仕組みはcomputational bufferだ。研究者はモデルのreasoning traceを途中で差し替え、元の長さに合わせて意味のない“Let me think”の繰り返しを入れた。そのdummy traceでも、reasoningを完全にoffにした場合より正答想起が大きく改善した。追加tokenがforward passと内部処理の時間を与える、という見方である。

2つ目はfactual primingだ。自然なreasoning traceを調べると、モデルは論理証明を書くというより、質問に関連する事実を先に浮かべていた。研究チームはtraceから具体的な事実だけを抽出し、fillerや最終回答への明示的言及を取り除いて条件として与え直した。短い事実リストだけでもreasoningの利得の多くが戻った。

同時に、弱点もはっきりした。研究チームは数十万件の中間事実をsearch-enabled verifierで監査し、reasoning traceにhallucinationが1つでも入ると最終回答の正答率が有意に下がると報告した。reasoningは記憶へのアクセスを広げる一方、誤った中間事実は答えを違う方向へ押し出す。

実務上の含意は、長く考えさせるだけでは足りないという点だ。中間段階で事実に支えられた内容を出すよう、学習や推論時選択を設計する必要がある。Google Researchは、hallucination-freeなreasoning trajectoryを選ぶtest-time selectionやprocess rewardが、より信頼できる事実想起につながる可能性を示している。

LLM reasoning、問題分解だけでなく記憶を呼び出す仕組みか

Related Articles

Claudeの本人確認、論点は「誰が高性能モデルを使えるか」へ

Mistral、reasoning・coding・multimodalを統合したオープンソースモデルMistral Small 4を発表

HN注目: SarvamがIndiaAI主導のフルスタック戦略で30Bと105Bを公開

Related Articles

Claudeの本人確認、論点は「誰が高性能モデルを使えるか」へ

Mistral、reasoning・coding・multimodalを統合したオープンソースモデルMistral Small 4を発表
LLM Mar 29, 2026 1 min read

HN注目: SarvamがIndiaAI主導のフルスタック戦略で30Bと105Bを公開
LLM Hacker News Mar 7, 2026 1 min read