#local-models

LLM Reddit Apr 23, 2026 1 min read

Open WebUI Desktop 등장, LocalLLaMA가 반긴 건 설치 장벽 삭제

LocalLLaMA는 이 릴리스에서 새 UI보다 “이제 Docker와 터미널부터 열지 않아도 된다”는 점에 먼저 반응했다. 동시에 상위 댓글은 곧바로 번들 inference engine 없는 더 가벼운 빌드를 요구했다.

#open-webui #llama.cpp #local-models

LLM Apr 11, 2026 1 min read

GitHub, Copilot CLI에 BYOK·local model 지원 추가... agent terminal을 외부 provider와 내부망으로 확장

GitHub는 2026년 4월 7일 Copilot CLI가 own model provider와 fully local model을 직접 사용할 수 있게 됐다고 밝혔다. Azure OpenAI, Anthropic, offline mode, optional GitHub auth를 더하면서도 기존 agentic terminal workflow는 유지한다.

#github #copilot #cli

LLM X/Twitter Apr 7, 2026 1 min read

GitHub, Copilot CLI에 BYOK·완전 로컬 models 연결 허용… GitHub-hosted routing 없이 사용

GitHub Changelog의 2026년 4월 7일 X 게시물은 Copilot CLI가 이제 GitHub-hosted routing 대신 Azure OpenAI, Anthropic, 기타 OpenAI-compatible endpoint나 완전 로컬 models를 사용할 수 있다고 밝혔다. GitHub changelog는 offline mode에서 telemetry가 비활성화되고, provider 자격 증명만으로 unauthenticated use가 가능하며, built-in sub-agents도 같은 provider 설정을 상속한다고 설명한다.

#github #copilot-cli #byok

LLM Reddit Apr 5, 2026 1 min read

Gemma 4와 Qwen 3.5를 블라인드로 비교한 LocalLLaMA 실험, “승률과 평균점수가 갈렸다”

Gemma 4 31B, Gemma 4 26B-A4B, Qwen 3.5 27B를 30문항으로 비교한 LocalLLaMA 실험은 단일 우승자를 내지 않았다. Qwen은 더 많은 matchups를 이겼지만, Gemma는 더 안정적인 평균점수를 기록했고 reliability와 verbosity trade-off가 핵심 변수로 떠올랐다.

#gemma-4 #qwen3.5 #benchmarks

LLM X/Twitter Mar 27, 2026 1 min read

Ollama 모델, VS Code GitHub Copilot Chat 모델 선택기에서 직접 사용 가능

Ollama는 2026년 3월 26일 VS Code가 GitHub Copilot을 통해 Ollama와 통합되어 로컬 또는 cloud Ollama models를 editor 안에서 직접 선택할 수 있다고 밝혔다. Ollama docs는 VS Code 1.113+, GitHub Copilot Chat 0.41.0+, Ollama v0.18.3+에서 GitHub Copilot Free만으로도 custom model selection이 가능하다고 설명한다.

#ollama #github-copilot #vscode

LLM Reddit Mar 8, 2026 1 min read

Open WebUI의 Open Terminal, 로컬 모델에 ‘진짜 컴퓨터’를 붙이다

LocalLLaMA의 인기 글은 Open WebUI의 Open Terminal을 조명한다. Docker 또는 bare metal 실행 계층을 통해 로컬 모델이 명령 실행, 파일 편집, 결과물 반환을 채팅 안에서 수행하게 한다.

#open-webui #tool-calling #qwen