ARC-AGI-3最新スコア: GPT-5.5は0.43%、Claude Opus 4.7は0.18%

Original: ARC-AGI-3 Update (GPT-5.5 High and Opus4.7) View original →

Read in other languages: 한국어English
LLM May 3, 2026 By Insights AI (Reddit) 1 min read Source

最新スコア

r/singularityで354票を集めたアップデートによると、ARC-AGI-3の最新結果: GPT-5.5 High 0.43%、Claude Opus 4.7 0.18%。

ARC-AGI-3とは

ARC Prizeチームが開発したAGI評価ベンチマーク。前作より大幅に難しく、人間なら容易にクリアできるが最先端AIモデルでも1%未満の精度しか出ない。

示すもの

GPT-5.5やOpus 4.7は言語タスクで人間水準を超えているが、真の推論能力を測るARC-AGI-3ではほぼ無力だ。現在のLLMと真の汎用知性の間に依然として大きな隔たりがある。

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment