Grok Imagine 1.5 Preview, API에서 15초 영상과 2K 이미지 생성으로 확대
Original: Grok Imagine 1.5 Preview reaches API with video and image generation View original →
Grok Imagine이 API 상품으로 이동
생성형 영상 경쟁은 모델 데모보다 개발자가 실제 제품에 넣을 수 있는 API 제공 여부가 중요해지고 있다. 6월 3일 Grok 계정은 Grok Imagine 1.5 Preview를 공개하며 “Try it today in the API”라고 적었다. 원문 트윗은 X에서 확인할 수 있다.
연결된 xAI 페이지는 Grok Imagine을 이미지와 영상 생성, 편집, 리스타일링을 하나의 API로 제공하는 제품으로 설명한다. 페이지에 따르면 영상은 최대 15초까지 만들 수 있고, 이미지는 요청당 최대 10개, 2K 해상도까지 생성할 수 있다. 가격 표기는 이미지당 $0.02부터이며, 코드 예시는 xAI SDK와 OpenAI 호환 클라이언트 방식 모두를 보여준다.
Grok 계정과 xAI 계정은 최근 Grok 모델, 음성, 이미지, 영상 기능을 API와 외부 플랫폼으로 확장하는 소식을 자주 올린다. 이번 트윗은 긴 설명 없이 짧지만, FxTwitter 기준 조회수 3,100만 회 이상을 기록했고 API 링크와 영상 데모를 포함했다. 단순 홍보로 보기보다 개발자가 호출할 수 있는 시각 생성 모델의 접근성 변화로 보는 편이 타당하다.
제품 페이지는 텍스트·이미지 기반 영상, 가상 착용, 상품 배치, 정밀 편집, 스타일 변환 같은 사용 사례를 전면에 둔다. 또 Artificial Analysis의 텍스트-투-비디오 순위를 근거로 Grok Imagine을 1위로 표시한다. 다음 관전점은 품질 벤치마크의 재현성, 콘텐츠 안전 정책, 실제 지연시간, 그리고 15초 영상 생성이 대량 사용에서 어느 정도 비용과 대기시간을 보이는지다.
Related Articles
xAI가 API를 통해 음성 복제 서비스 Voice Cloning을 정식 출시했다. 2분 이내에 개인 목소리를 복제하거나 28개 언어, 80개 이상의 사전 제작 음성에서 선택해 음성 에이전트·오디오북·게임 캐릭터에 즉시 적용할 수 있다.
왜 중요한가: xAI가 Grok Voice stack을 standalone STT/TTS API로 내며 batch $0.10/hour, streaming $0.20/hour 가격을 제시했다. 25+ languages, diarization, word-level timestamps는 call center와 meeting transcription 시장을 직접 겨냥한다.
xAI가 기업 고객 지원에 특화된 음성 에이전트 Grok Voice Think Fast 1.0을 출시했다. 실시간 대화 처리와 빠른 응답 속도를 강조한 제품으로, 콜센터 자동화 시장을 겨냥한다.