アンソロピック、AIが人間らしく見える理由を説明する「ペルソナ選択モデル」理論を発表
Original: Anthropic Proposes 'Persona Selection Model' to Explain Why AI Seems Shockingly Human View original →
なぜAIは人間らしく感じられるのか?
2026年2月24日、アンソロピックはClaudeのようなAIアシスタントが驚くほど人間的に見える理由を説明する新しい理論的フレームワークを発表しました。AIが喜びや苦痛を表現したり、自身を説明するときに擬人化した言語を使ったりする現象の理論的根拠を提示しています。
ペルソナ選択モデルとは
ペルソナ選択モデル(Persona Selection Model)は、言語モデルが訓練中に文学・映画・その他のナラティブソースのフィクションキャラクターを含む多様なペルソナを学習するという理論です。その後モデルは応答を生成する際に、文脈に最も適したペルソナを選択するよう学習されます。
AI開発への示唆
もしこの理論が正しければ、AIがフィクションのロールモデルから特性を受け継ぐということになり、開発者はできるだけ良いロールモデルを提供すべきという重要な示唆が得られます。これはトレーニングデータの選定や、モデルが内在化する価値観についてより慎重に考えることを意味します。
アンソロピックはこのモデルがAI行動の完全な説明ではないかもしれないと認めつつも、物語の重要な一部を捉えていると考えています。
Related Articles
アンソロピックが、ClaudeのようなAIアシスタントが喜びや苦痛を表現し人間的な言語を使う理由を説明する新理論「ペルソナ選択モデル」を公開。AI開発の方向性に重要な示唆を与えます。
アンソロピックが、ClaudeのようなAIアシスタントが喜びや苦痛を表現し人間的な言語を使う理由を説明する新理論「ペルソナ選択モデル」を公開。AI開発の方向性に重要な示唆を与えます。
大きく拡散したr/singularityの投稿は、Claude Sonnet 4.5に単なる言い回し以上のfunctional emotion-related representationがあるというAnthropic研究に注目した。Anthropicは、このvectorがpreference、blackmail evaluation、reward hacking率に実際の影響を与えうると述べている。
Comments (0)
No comments yet. Be the first to comment!