LLM Apr 17, 2026 1 min read
AIBuildAIはMLE-Benchで63.1%のmedal rateを報告し、AI model開発agentの評価軸を広げた。重要なのは、AutoMLの一部最適化ではなく設計、coding、debugging、training、tuningを一つのworkflowとして扱う点だ。
AIBuildAIはMLE-Benchで63.1%のmedal rateを報告し、AI model開発agentの評価軸を広げた。重要なのは、AutoMLの一部最適化ではなく設計、coding、debugging、training、tuningを一つのworkflowとして扱う点だ。