llama.cpp WebUI에 MCP agent loop가 들어왔다

Reddit 스레드: LocalLLaMA 토론
병합된 PR: llama.cpp PR #18655

이번 LocalLLaMA 글에서 추적할 만한 소식은 llama.cpp PR #18655의 병합이다. PR 제목은 “webui: Agentic Loop + MCP Client with support for Tools, Resources and Prompts”이며, 핵심은 Model Context Protocol 기능을 외부 wrapper에 맡기지 않고 llama.cpp WebUI와 server 흐름 안으로 직접 끌어왔다는 점이다.

병합된 PR이 추가한 것

MCP server 선택기와 server capability card.
processing stats를 포함한 tool calls와 agentic loop.
prompt picker, prompt attachment, resource browser, preview, template.
--webui-mcp-proxy 플래그를 통한 llama-server 백엔드 CORS proxy.

이 PR은 기능만 넣은 것이 아니라 UI 개선도 길게 묶고 있다. code block 표시 개선, reasoning과 tool-call의 접이식 표시, attachment 흐름 개선, message statistics 등이 함께 들어갔다. 즉 이것은 문서상으로만 “MCP 지원”을 적어 놓은 수준이 아니라, 브라우저 안에서 prompt, file, resource를 실제로 다루기 위한 사용성 계층까지 포함한다.

전략적 의미도 작지 않다. 로컬 추론 스택이 이제는 hosted product에서 보던 agent tooling과 비슷한 방향으로 수렴하고 있기 때문이다. 이 흐름이 성숙하면 llama.cpp 사용자는 별도 orchestration 제품을 먼저 붙이지 않아도 로컬 모델 서빙에서 tool-aware workflow, prompt composition, structured resource access까지 이어지는 더 완성도 높은 경로를 얻게 된다.

LLM X/Twitter Apr 3, 2026 2 min read

GitHub, Agentic Workflows 보안 아키텍처 공개

GitHub는 2026년 4월 1일 Agentic Workflows가 isolation, constrained outputs, comprehensive logging을 핵심 원칙으로 설계됐다고 밝혔다. 함께 링크한 GitHub 블로그는 GitHub Actions 안에서 coding agent를 더 안전하게 실행하기 위해 전용 container, firewalled egress, safe outputs, trust boundary logging을 사용한다고 설명한다.

#github #agentic-workflows #ai-security

LLM Reddit Mar 8, 2026 1 min read

llama.cpp 자동 parser generator 병합, 모델별 파서 유지 비용을 낮추다

LocalLLaMA에서는 모델 템플릿을 분석해 reasoning·tool-call 형식을 더 적은 커스텀 파서 코드로 지원하려는 llama.cpp autoparser 병합을 주목하고 있다.

#llama.cpp #structured-output #parser-generator

LLM X/Twitter Jun 4, 2026 1 min read

Gemma 4 12B, 별도 인코더 없이 노트북용 멀티모달 추론으로 Apache 2.0 공개

로컬 멀티모달 모델 경쟁이 12B급으로 좁혀졌다. Google Gemma는 Gemma 4 12B를 Apache 2.0으로 공개하며 이미지·오디오 입력을 별도 인코더 없이 처리한다고 밝혔다.

#gemma #google #open-models

병합된 PR이 추가한 것

Related Articles

GitHub, Agentic Workflows 보안 아키텍처 공개

llama.cpp 자동 parser generator 병합, 모델별 파서 유지 비용을 낮추다

Gemma 4 12B, 별도 인코더 없이 노트북용 멀티모달 추론으로 Apache 2.0 공개