OpenAI、gpt-oss-safeguard 向け teen-safety policy prompt を公開
Original: Helping developers build safer AI experiences for teens View original →
何が起きたか
OpenAIはMarch 24, 2026、teen向けにより安全なAI体験を開発者が構築できるよう、prompt ベースの safety policy セットを公開した。これは同社の open-weight safety model である gpt-oss-safeguard でそのまま使えるよう設計されており、高レベルの safety 原則を実運用 가능한 classifier ルールへ落とし込むための実務的な材料として位置づけられている。
この発表が重要なのは、youth safety を抽象論から運用可能な workflow に変えている点にある。OpenAIは一般論だけを示すのではなく、real-time filtering や user-generated content の offline 分析で利用できる policy prompt を公開した。open-weight model が education、creator tool、social app、consumer assistant に広がる中で、こうした実装寄りの release は product team にとって直接的な意味を持つ。
何が含まれるか
OpenAIによれば、初期の policy セットは graphic violent content、graphic sexual content、harmful body ideals and behaviors、dangerous activities and challenges、romantic or violent roleplay、age-restricted goods and services の6分野を対象にする。さらに、これらの prompt は gpt-oss-safeguard だけでなく他の reasoning model にも応用できるとされており、単一機能というより再利用可能な safety infrastructure としての性格が強い。
ecosystem の観点でも意味がある。OpenAIは Common Sense Media と everyone.ai の input を受けて内容を整え、ROOST Model Community を通じて open source として公開すると説明した。つまり teen safety を一部の大規模 platform の内部実装だけに閉じず、open-model stack 全体で共有できる土台にしようとしている。
次に見るべき点
もっとも、OpenAI自身もこれを完全な解決策とは位置づけていない。モデルの外側には layered safeguard、product decision、monitoring、age-appropriate control が依然として必要だという。今後の焦点は、ほかの開発者や研究コミュニティがこの prompt を採用し、翻訳し、対象 category を広げるかどうかだ。そこまで進めば、今回の発表は documentation update ではなく、youth-facing AI product の共通 safety layer として定着する可能性がある。
Related Articles
Codexは開発支援から職種別workflowの表面へ広がっている。OpenAIは新pluginに62アプリと110スキルを束ね、Business・Enterprise向けSites previewも始めた。
OpenAIは6月3日、州レベルのfrontier AI法案を連邦標準へつなげる青写真を示した。CAISIの強化、独立監査、重大リスク評価、事故報告、モデル重みの保護が柱になる。
個人向けAIの価値は1回の回答から、長く残る文脈管理へ移っている。OpenAIは米国のPlus・Proから新memoryを展開し、Free提供に必要な計算量を約5分の1にしたと説明した。