Apple M4 Neural Engineをリバースエンジニアリング:38 TOPSの真実と隠されたAPI
Original: Inside the M4 Apple Neural Engine, Part 1: Reverse Engineering View original →
M4 Neural Engineの実態を解剖
Apple M4 Neural Engine(コードネームH16G)の詳細なリバースエンジニアリング調査がHacker Newsで大きな注目を集めました。AI業界がAppleのAIハードウェアへの理解を深めようとする関心の高さを示しています。
グラフ実行エンジンとしての本質
最も重要な発見は、M4 ANEが従来のGPUやCPUとは根本的に異なる「グラフ実行エンジン」であることです。個別の命令を処理するのではなく、事前コンパイルされたニューラルネットワークグラフを受け取りアトミックに実行します。16コア、127の同時評価リクエストをサポートするキュー深度、独立した動的電圧・周波数スケーリング、アイドル時に消費電力がゼロになるパワーゲーティングを特徴としています。
CoreMLを迂回する隠しAPI
CoreMLがANEへのアクセス手段として唯一ではないことも判明しました。AppleNeuralEngine.frameworkの非公開_ANEClientクラスにより、直接コンパイル・ロード・評価が可能です。研究チームは40以上の未文書化された非公開クラスを特定し、MIL(Machine Learning Intermediate Language)テキストをファイルシステムなしで直接処理するインメモリコンパイルも実装しました。
「38 TOPS」スペックの誤解
Appleが公表する38 TOPSの数値は誤解を招くものであることが判明しました。行列積を1x1畳み込みとして表現するとネイティブのmatmul演算よりも大幅に高いスループットが得られることが実証され、畳み込みがANEの基本演算単位であることが示唆されます。コンパイルされたE5バイナリ形式も従来のマシンコードではなくパラメータ化されたコンピュートプリミティブの設定を記述するものであることが確認されました。
未開拓の領域
発見されたクラスは複数モデルのチェーニング、GPU-ANE同期プリミティブ、ハードウェアパフォーマンスカウンターなど、まだ探索されていない機能の存在を示唆しており、今後の研究対象として注目されています。
Related Articles
研究者がApple M4チップのNeural Engineを逆エンジニアリングで分析した結果を公開。CoreMLベースのアーキテクチャ、6.6 FLOPS/Wのエネルギー効率、アイドル時の完全シャットダウン機能などが明らかになった。
AppleがM5 ProとM5 Maxチップ搭載の新型MacBook Proを発表しました。前世代比で最大4倍のAI性能向上を実現し、M5 Maxは614GB/sのメモリ帯域幅とすべてのGPUコアにNeural Acceleratorを内蔵しています。
Microsoft Threat Intelligenceは2026年3月6日、攻撃者が調査、phishing、malware開発、侵害後分析までAIを活用していると報告した。AIはまだ大規模な完全自律侵入を実現していないが、攻撃の速度・規模・持続性をすでに押し上げているという整理だ。
Comments (0)
No comments yet. Be the first to comment!