Skip to content

#computer-vision

RSS Feed
AI Hacker News May 18, 2026 1 min read

GenCADは画像入力からパラメトリックCADコマンドシーケンスを生成するAIシステム。メッシュやボクセルではなくCADプログラム全体を出力するため、設計の完全な編集が可能。Autoregressive Transformer・対照学習・潜在拡散モデルを組み合わせた4コンポーネント構成。

AI X/Twitter Mar 31, 2026 1 min read

Metaは2026年3月27日、SAM 3.1をSAM 3のdrop-in updateとして公開し、object multiplexingでvideo processing efficiencyを高めたと発表した。projectのrelease noteによれば、この更新はshared-memoryベースのjoint multi-object tracking、新checkpoint、そして2025年11月版SAM 3と比べてsingle H100で128 object時に約7倍の高速化を含む。

Humanoid Robots Reddit Mar 19, 2026 1 min read

2026年3月16日、Popular Science記事を共有したr/artificial投稿は590 points、62 commentsに達した。記事によれば、Niantic Spatialは300億枚超のPokémon Go imageでVisual Positioning Systemを訓練し、いまはCoco Roboticsと組んで、GPSが不安定な街路でもdelivery robotがcentimeter-level precisionで自己位置推定できるようにしようとしている。

AI Reddit Mar 7, 2026 1 min read

r/MachineLearningで支持を集めたVeridisQuoは、spatial signalとfrequency-domain signalを統合し、GradCAM heatmapを改変ビデオ上に重ねるオープンソースdeepfake detectorだ。単なるデモ映像ではなく、具体的なarchitectureとtraining detailsが共有されている点が特徴だ。