Meta Llama 4、ネイティブマルチモーダルAI時代を開幕... 1000万トークンコンテキスト対応
ネイティブマルチモーダルの革新
MetaがLlama 4シリーズを発表し、AI業界に新たなマイルストーンを築いた。Llama 4 ScoutとLlama 4 Maverickは、初のオープンウェイト・ネイティブマルチモーダルモデルで、テキスト・画像・動画を最初から統合処理するように設計されている。
Llama 4 Maverick: 170億パラメータの強者
Llama 4 Maverickは、170億のアクティブパラメータと128のエキスパートを持つMixture-of-Experts(MoE)アーキテクチャを使用するMeta初のモデルだ。
広範なベンチマークでGPT-4oとGemini 2.0 Flashを上回り、同クラス最高のマルチモーダルモデルであることを証明した。
Llama 4 Scout: 1000万トークンコンテキスト
Llama 4 Scoutは、Llama 3の128Kトークンから業界最長の1000万トークンへとコンテキスト長を劇的に拡張した。これは数百ページの文書、数時間分の動画、または大規模コードベースを単一のコンテキストで処理できることを意味する。
オープンウェイト戦略の意義
MetaはLlama 4をオープンウェイトモデルとして公開し、研究者や開発者が自由に活用・改善できるようにした。これは商用クローズドモデル(GPT、Claude、Gemini)と比較して、透明性とアクセシビリティの面で大きな差別化要因となる。
AIエコシステムへの影響
Llama 4の登場は、マルチモーダルAIの民主化を意味する。以前はOpenAI、Google、Anthropicなど大手テック企業のみが提供していたマルチモーダル能力が、今では誰でも使用・カスタマイズできるようになった。
MoEアーキテクチャの導入は効率性の面でも重要だ。必要なエキスパートのみを活性化することで計算コストを削減しながら、性能は維持できる。
Related Articles
Meta가 최초의 오픈 웨이트 네이티브 멀티모달 모델인 Llama 4 Scout와 Maverick을 공개했습니다. MoE 아키텍처를 채택했으며 GPT-4.5를 능가하는 성능을 자랑합니다.
Meta가 Llama 파생 모델을 배포하던 오픈소스 프로젝트 Heretic에 법적 통보를 보냈습니다. Heretic은 갈릴레오 재판을 인용하는 풍자적 공개 성명을 발표하면서 독일 Codeberg에 미러를 설치했습니다.
로컬 멀티모달 모델 경쟁이 12B급으로 좁혀졌다. Google Gemma는 Gemma 4 12B를 Apache 2.0으로 공개하며 이미지·오디오 입력을 별도 인코더 없이 처리한다고 밝혔다.