#guardrails

LLM Hacker News May 20, 2026 1 min read

Forgeフレームワーク、構造化ガードレールで8BモデルをSoTA級精度に引き上げ

オープンソースPythonフレームワークForgeが、構造化ガードレールを適用することでMinistral-3 8BモデルのエージェントタスクにおけるACCを53%から99%に向上させた。ACM CAIS '26で発表された研究成果だ。

AI Reddit Apr 16, 2026 1 min read

Prompt guardrailだけでは足りない。LocalLLaMAが戻ってきたのは実行前に止める話だった

この投稿が刺さったのは、agent builder がすでに感じている違和感をそのまま言葉にしたからだ。model が API を呼び、file を変え、script を走らせ、browser や MCP tool に触れるなら、問題は output quality ではなく execution control になる。

#ai-agents #agent-safety #guardrails

AI Hacker News Feb 20, 2026 1 min read

HN注目: 多言語でLLM Guardrailの挙動が大きく変わる可能性

Hacker Newsで注目された投稿は、同じ意味のポリシーでも言語が変わるだけでguardrail評価が36-53%ずれる可能性を示し、多言語安全性評価の不足を指摘した。

#llm-safety #guardrails #multilingual