LocalLLaMA는 이 릴리스에서 새 UI보다 “이제 Docker와 터미널부터 열지 않아도 된다”는 점에 먼저 반응했다. 동시에 상위 댓글은 곧바로 번들 inference engine 없는 더 가벼운 빌드를 요구했다.
#local-models
RSS FeedGitHub는 2026년 4월 7일 Copilot CLI가 own model provider와 fully local model을 직접 사용할 수 있게 됐다고 밝혔다. Azure OpenAI, Anthropic, offline mode, optional GitHub auth를 더하면서도 기존 agentic terminal workflow는 유지한다.
GitHub Changelog의 2026년 4월 7일 X 게시물은 Copilot CLI가 이제 GitHub-hosted routing 대신 Azure OpenAI, Anthropic, 기타 OpenAI-compatible endpoint나 완전 로컬 models를 사용할 수 있다고 밝혔다. GitHub changelog는 offline mode에서 telemetry가 비활성화되고, provider 자격 증명만으로 unauthenticated use가 가능하며, built-in sub-agents도 같은 provider 설정을 상속한다고 설명한다.
Gemma 4 31B, Gemma 4 26B-A4B, Qwen 3.5 27B를 30문항으로 비교한 LocalLLaMA 실험은 단일 우승자를 내지 않았다. Qwen은 더 많은 matchups를 이겼지만, Gemma는 더 안정적인 평균점수를 기록했고 reliability와 verbosity trade-off가 핵심 변수로 떠올랐다.
Ollama는 2026년 3월 26일 VS Code가 GitHub Copilot을 통해 Ollama와 통합되어 로컬 또는 cloud Ollama models를 editor 안에서 직접 선택할 수 있다고 밝혔다. Ollama docs는 VS Code 1.113+, GitHub Copilot Chat 0.41.0+, Ollama v0.18.3+에서 GitHub Copilot Free만으로도 custom model selection이 가능하다고 설명한다.
LocalLLaMA의 인기 글은 Open WebUI의 Open Terminal을 조명한다. Docker 또는 bare metal 실행 계층을 통해 로컬 모델이 명령 실행, 파일 편집, 결과물 반환을 채팅 안에서 수행하게 한다.