arXiv News

すべての人に一次情報を

法務

プライバシーポリシー利用規約

© 2026 arXiv News

arXiv News

英語日本語

言語を切り替え

英語日本語
アカウントを読み込み中…

すべての人に一次情報を

最新
カメラとレーダーを組み合わせて「素材」を見分ける。学習不要の新しい手法「VLMaterial」ThinkJEPA:視覚と言語の大規模モデルを使って潜在世界モデルの長期予測を強化する手法カメラとレーダーを組み合わせて「素材」を見分ける。学習不要の新しい手法「VLMaterial」ThinkJEPA:視覚と言語の大規模モデルを使って潜在世界モデルの長期予測を強化する手法

今日の記事

2026年5月1日金曜日
すべて人工知能機械学習自然言語処理コンピュータビジョンロボティクス暗号物理学数学
ロボティクス注目

カメラとレーダーを組み合わせて「素材」を見分ける。学習不要の新しい手法「VLMaterial」

研究の主題は日常物体の素材識別です。見た目が似ているガラスとプラスチックのような物は、光学カメラだけでは誤認されやすい問題があります。著者らは、視覚と言語を結び付けたAI(VLM: ビジョン・ランゲージ・モデル)とミリ波レーダーの物理情報を組み合わせる新しい枠組み「VLMater

2026年4月14日JA2分
記事全文を読む

最新の記事

人工知能
2026年3月24日

ThinkJEPA:視覚と言語の大規模モデルを使って潜在世界モデルの長期予測を強化する手法

この論文は、動画から将来の「潜在(ラテント)表現」を予測する世界モデルを、視覚と言語を結びつけた大規模モデル(Vision–Language Model、VLM)で補強する方法を示します。提案手法の名前はThinkJEPAです。短い観測窓で密にフレームを予測する従来の潜在世界モデ

JA
2分