すべての人に一次情報を
研究の核心は、物理系にある「局所的な」対称性をそのまま学習モデルに組み込むことです。著者らは、非可換(非アベリアン)なゲージ対称性をメッセージパッシング型のグラフニューラルネットワーク(GNN)に直接埋め込んだ「ゲージ同変(ゲージ=equivariant)GNN」を提案しました。
この論文は、格子上の局所ゲージ対称性を神経ネットワークの構造に直接組み込む新しい方法を示します。著者らは、非可換(非アーベル)ゲージ群の変換規則を満たすように設計した「ゲージ同変(equivariant)グラフニューラルネットワーク」を導入します。ネットワークは行列値の特徴量を使
研究者らはMathNetという大規模で多言語・マルチモーダルな数学データセットとベンチマークを公開しました。MathNetにはオリンピアード(競技数学)レベルの問題が30,676問収められており、17言語、47か国、約4十年分の大会から専門家が作成した解答が付いています。目的は「
この論文は、行列を使う繰り返し計算(一般一階法、GFOM と呼ぶ)が大きな問題でどのように振る舞うかを調べています。研究者たちは、これまで「非常にランダム」な行列でしかよく分かっていなかった振る舞いが、ある種の決定論的(規則的な)行列でも同じようになることを示しました。とくに W
大きな視覚言語モデルは、画像にない物を「いる」と書いてしまうことがあります。そうした誤り(オブジェクト・ハルシネーション)を見つけて減らすために、本論文はHaloProbeという新しいベイズ的(確率的)な検出・緩和枠組みを提案します。HaloProbeは、モデル内部の信号と生成さ
この論文は、固体や液体のような「凝縮系」で平衡状態の分布を効率よくサンプリングするための新しい機械学習法を示します。研究者たちは、周期境界条件(箱が端でつながるという扱い)を持つ系に合わせて連続正規化フロー(continuous normalizing flows、CNF)を拡張
この論文は、確率的なノイズのある観測だけから滑らかで強凸な母関数の最小化を行う問題を扱います。研究者たちは、昔から使われる「サンプル平均近似(SAA)」や「平均化された確率的近似(Ruppert–Polyak–Juditsky平均、以後SA)」が、有限の現実的なサンプル数では期待
この論文は、拡散モデルの生成に使う確率微分方程式(SDE)や常微分方程式(ODE)を、計算コストの異なる複数の近似器を組み合わせて解く新しい方法を示します。研究者たちは「Multilevel Euler–Maruyama(ML-EM)」と名付けた手法で、計算の重い大きなネットワー
この論文は、動画から将来の「潜在(ラテント)表現」を予測する世界モデルを、視覚と言語を結びつけた大規模モデル(Vision–Language Model、VLM)で補強する方法を示します。提案手法の名前はThinkJEPAです。短い観測窓で密にフレームを予測する従来の潜在世界モデ
この論文は、人工知能(AI)が材料の塑性、つまり材料が永続的に変形する振る舞いにどのように関わるかを広く整理した総合レビューです。著者は、AIを使った研究が材料科学で増えていることを踏まえ、塑性に特化したデータ駆動の手法と知見をまとめて提示しています。主題を一般向けに把握しやすく