Safari MCP server, 브라우저 디버깅을 agent 작업대로 옮기는 Apple의 선택

Safari Technology Preview 247에 Safari MCP server가 들어갔다. WebKit이 설명한 목적은 명확하다. 코딩 agent가 Safari 창에 연결해 실제 렌더링 상태를 보고, DOM, 네트워크 요청, 콘솔 출력, 스크린샷 같은 정보를 가져오게 하는 것이다. 브라우저에서 문제를 보고 터미널로 돌아와 다시 설명하는 왕복을 줄이겠다는 접근이다.

MCP-compatible client라면 Safari MCP server에 연결할 수 있다. 사용 예시는 Safari에서 웹 개발하기, 브라우저 호환성 확인, 성능 분석, 접근성 점검, 폼이나 체크아웃 같은 사용자 상태 검증까지 이어진다. agent가 코드를 고치는 데서 멈추지 않고, 고친 결과가 Safari 안에서 어떻게 보이는지 확인하는 구조다.

개발자 입장에서는 Apple이 Safari 자동화를 agent 시대의 도구 체계로 끌어올렸다는 점이 중요하다. WebDriver나 safaridriver는 오래 있었지만, MCP는 LLM 클라이언트가 바로 이해할 수 있는 도구 목록과 응답 형식을 제공한다. HN 댓글에서도 Chrome DevTools MCP, Firefox 쪽 MCP, Playwright CLI와 비교하는 반응이 많았다. 브라우저별 agent 디버깅 인터페이스가 빠르게 표준 도구 경쟁으로 넘어가는 분위기다.

아직 핵심은 만능 자동화가 아니다. Safari에서만 보이는 레이아웃 문제, 접근성 누락, 콘솔 오류를 agent가 직접 확인할 수 있다는 점이 실용적이다. 웹 개발에서 “브라우저를 보고 판단하는 일”이 사람의 눈만 담당하던 영역에서, 점점 agent가 검증 가능한 작업으로 나뉘고 있다.

LLM X/Twitter Jun 27, 2026 1 min read

OpenAI 내부 Codex 사용, 부서 경계를 넘는 장시간 에이전트 업무로 확대

에이전트형 도구가 실험용 코딩 보조를 넘어 사내 업무 운영 방식으로 들어가고 있다. OpenAI는 전사적으로 Codex가 더 복잡하고 장시간 실행되는 교차 기능 업무에 쓰인다고 밝혔다.

#openai #codex #agents

LLM 3d ago 1 min read

Claude Sonnet 5, Opus급 agent 성능을 Free·Pro 기본 모델로

낮은 가격대의 Sonnet 모델이 agent 작업에서 Opus 4.8에 가까운 구간까지 올라섰다. Free·Pro 기본 모델과 API, Claude Code에 동시에 들어오며, 8월 31일까지 입력 100만 토큰당 $2·출력 100만 토큰당 $10의 도입 가격이 적용된다.

#anthropic #claude #agents

LLM 1d ago 1 min read

SkillOpt, 모델 가중치 그대로 agent 점수 23.5점 끌어올린 skill 학습법

agent 성능 개선이 항상 새 모델이나 fine-tuning을 뜻하지는 않는다. Microsoft Research의 SkillOpt는 GPT-5.5 direct chat 6개 benchmark 평균을 58.8에서 82.3으로 올렸고, 52개 평가 셀에서 최고 또는 공동 최고를 기록했다.

#microsoft-research #agents #skillopt

Related Articles

OpenAI 내부 Codex 사용, 부서 경계를 넘는 장시간 에이전트 업무로 확대

Claude Sonnet 5, Opus급 agent 성능을 Free·Pro 기본 모델로

SkillOpt, 모델 가중치 그대로 agent 점수 23.5점 끌어올린 skill 학습법