Apple M4 Neural Engineをリバースエンジニアリング:38 TOPSの真実と隠されたAPI

Original: Inside the M4 Apple Neural Engine, Part 1: Reverse Engineering View original →

Read in other languages: 한국어English
AI Mar 3, 2026 By Insights AI (HN) 1 min read Source

M4 Neural Engineの実態を解剖

Apple M4 Neural Engine(コードネームH16G)の詳細なリバースエンジニアリング調査がHacker Newsで大きな注目を集めました。AI業界がAppleのAIハードウェアへの理解を深めようとする関心の高さを示しています。

グラフ実行エンジンとしての本質

最も重要な発見は、M4 ANEが従来のGPUやCPUとは根本的に異なる「グラフ実行エンジン」であることです。個別の命令を処理するのではなく、事前コンパイルされたニューラルネットワークグラフを受け取りアトミックに実行します。16コア、127の同時評価リクエストをサポートするキュー深度、独立した動的電圧・周波数スケーリング、アイドル時に消費電力がゼロになるパワーゲーティングを特徴としています。

CoreMLを迂回する隠しAPI

CoreMLがANEへのアクセス手段として唯一ではないことも判明しました。AppleNeuralEngine.frameworkの非公開_ANEClientクラスにより、直接コンパイル・ロード・評価が可能です。研究チームは40以上の未文書化された非公開クラスを特定し、MIL(Machine Learning Intermediate Language)テキストをファイルシステムなしで直接処理するインメモリコンパイルも実装しました。

「38 TOPS」スペックの誤解

Appleが公表する38 TOPSの数値は誤解を招くものであることが判明しました。行列積を1x1畳み込みとして表現するとネイティブのmatmul演算よりも大幅に高いスループットが得られることが実証され、畳み込みがANEの基本演算単位であることが示唆されます。コンパイルされたE5バイナリ形式も従来のマシンコードではなくパラメータ化されたコンピュートプリミティブの設定を記述するものであることが確認されました。

未開拓の領域

発見されたクラスは複数モデルのチェーニング、GPU-ANE同期プリミティブ、ハードウェアパフォーマンスカウンターなど、まだ探索されていない機能の存在を示唆しており、今後の研究対象として注目されています。

Share:

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.