Gemini Robotics-ER 1.6、計器読取93%へ安全判定も底上げ

Google DeepMindの新しいXスレッドが重いのは、ロボット向けモデル更新をそのまま現場タスクへ結びつけているからだ。実運用で難しいのは、命令文を理解することだけではない。圧力計を読み取り、複数カメラの視点を統合し、作業が終わったかどうかを自分で判断する必要がある。元ツイートでDeepMindは、Gemini Robotics-ER 1.6がロボットの「physical world」理解を強めるアップグレードだと書き、その後のスレッドで具体例を並べた。

“help robots reason about the physical world”

最も強い材料は、リンク先の公式ブログにある。計器読取タスクでは、Gemini Robotics-ER 1.5が23%、Gemini 3.0 Flashが67%、Gemini Robotics-ER 1.6が86%、さらにagentic visionを有効にした1.6では93%まで伸びたという。スレッドではこれに加え、動画中のhuman injury risk検知が10%向上し、液体を扱わない、20kgを超える物体を持たないといった物理制約もより守れると説明している。つまり今回の更新は単なるロボット向け名称変更ではなく、counting、pointing、multi-view reasoning、instrument reading、success detectionを一段上の推論層でまとめようとするものだ。

GoogleDeepMindのXアカウントは、完成したブログ記事と開発者向け導線を短いスレッドでつなぐ役割を果たすことが多い。今回もブログ、Gemini API、Google AI Studio、サンプルColabが一式で示されている。特にブログはBoston Dynamicsとの関係を補強しており、Spotが産業施設を巡回して各種計器の画像を取得しているため、instrument readingが作られたベンチマークではなく実際のinspection workflowに近いことがわかる。DeepMindはまた、コード実行を含む「agentic vision」を使うと説明しており、複雑なゲージ画像を数値へ落とし込む手順もある程度見えてくる。

次に注目すべきは再現性だ。Googleの既存パートナー以外でも、異なるカメラ配置やロボット構成で93%の計器読取や安全性向上が再現できるのか。そこが確認できれば、Gemini Robotics-ER 1.6は派手なデモではなく、現場ロボットの個別調整コストを下げる実質的な前進として評価されるはずだ。元ツイート: GoogleDeepMind on X via Nitter.

Gemini Robotics-ER 1.6、計器読取93%へ安全判定も底上げ

Related Articles

DeepMindのロボットAI、産業用計器の読取精度を23%から93%まで一気に押し上げた

ボストン・ダイナミクスAtlasの新技術がRedditで4,000点超え

ロボット開発もagent workflowへ、NVIDIAがphysical AI skillを公開

Comments (0)

Leave a Comment

Related Articles

DeepMindのロボットAI、産業用計器の読取精度を23%から93%まで一気に押し上げた
Humanoid Robots Apr 15, 2026 1 min read

ボストン・ダイナミクスAtlasの新技術がRedditで4,000点超え
Humanoid Robots Reddit May 6, 2026 1 min read

ロボット開発もagent workflowへ、NVIDIAがphysical AI skillを公開