LLM Hacker News 1h ago 1 min read
HNはGPT-5.5を単なる新モデルとしてではなく、雑多なPC作業を本当に最後まで任せられるかの試金石として見た。話題の中心もベンチよりロールアウト、API時期、実運用でのコーディング性能だった。
HNはGPT-5.5を単なる新モデルとしてではなく、雑多なPC作業を本当に最後まで任せられるかの試金石として見た。話題の中心もベンチよりロールアウト、API時期、実運用でのコーディング性能だった。
OpenAIが今回お金をかけたのは、もっとも厄介な失敗形だ。GPT-5.5 Bio Bug Bountyは、Codex Desktop上のGPT-5.5でバイオ安全性の5問すべてを一度に破る万能プロンプトに$25,000を設定し、正式テストを4月28日に始める。