オープンソースツール「llmfit」がHacker Newsで注目を集めている。ユーザーのRAM、CPU、GPUスペックを自動検出し、最適なLLMモデルとQuantizationレベルを推奨するCLIユーティリティで、ローカルAI実行の敷居を大幅に下げる。
#open-source
RSS Feed13ヶ月の驚くべき比較:2025年初頭にはDeepSeek R1をフロンティアレベルで約5 t/s実行するのに$6,000が必要だったが、今では$600のミニPCでさらに優れたモデルを同じ速度で、もしくは17-20 t/sで実行できる。
AlibabaのQwenチームがQwen 3.5 Smallをリリースした。r/LocalLLaMAで1,000以上のアップボートを記録したこの発表は、高性能小型モデルへのコミュニティの高い関心を反映している。
開発者がOSやカーネルなしにUEFIブートサービスモードで直接LLM推論を実行するUEFIアプリケーションを実装しました。トークナイザーから推論エンジンまで、依存ゼロの純粋なCで書かれています。
r/LocalLLaMAコミュニティで、Qwen 3.5-35B-A3BがGPT-OSS-120Bよりも優れた性能を示しながら、サイズは1/3に過ぎないとする投稿が高評価を得ています。
Hacker Newsで話題になったContext Modeは、Claude Codeのツール出力による文脈消費を315 KBから5.4 KBへ削減したと公表した。
GoogleはAlphabetのOther Bets部門に属するロボットソフトウェア子会社Intrinsicを本体に統合。GeminiとDeepMindを組み合わせ、産業用ロボット向け共通プラットフォームの構築を目指す。
r/LocalLLaMAの投稿では、144M規模のSpiking Neural Network言語モデルNordをFineWeb-Eduでfrom scratch学習した実験が共有された。投稿者は97-98% inference sparsityやSTDPによるonline learningを主張する一方、loss 4.5や限定的比較という制約も明示している。
NVIDIAが2026-02-24に公開した医療・ライフサイエンス調査では、AIの積極活用は70%で2024年の63%から上昇した。85%が売上増、80%がコスト削減効果を報告し、予算増加見込みは85%に達した。
Metaは2026年2月9日、Linux Foundationによるカナダ向け調査を公表し、AIが2035年までにGDPの最大9%、2030年に年1,800億ドルを押し上げる可能性を示した。生成AIによる生産性8%改善と5年で3万5,000件超の新規役割創出も提示された。
r/LocalLLaMAコミュニティで、AlibabのQwen公式チャットインターフェースにQwen3.5モデル名が表示されているとの報告が話題に。次世代オープンソースLLMシリーズのリリースが間近に迫っていることを示唆している。
Guide Labsが生成するすべてのトークンを入力コンテキスト、人間が理解できる概念、訓練データソースまで追跡できる初の「本質的に解釈可能な」言語モデルSteerling-8Bを公開しました。