arXiv News

すべての人に一次情報を

法務

プライバシーポリシー利用規約

© 2026 arXiv News

arXiv News

英語日本語

言語を切り替え

英語日本語
アカウントを読み込み中…

すべての人に一次情報を

最新
dynestyx:時系列の隠れ状態とパラメータを扱う確率的プログラミングライブラリ深いニューラルネットワークの「勾配消失・爆発」を数学で説明 残差結合の抑制効果を厳密に示すどのとき合わせるべきか、予測するべきか:マルチモーダル学習の「相図」を示す新しい枠組みLLMに特定資産への“好み”はあるか?ビットコインを例に内部表現と配分への影響を調べた監査研究逆設計で材料探索を自動化する道筋:生成モデル、マルチモーダル学習、閉ループワークフローのレビューLLMSurgeon:生成テキストだけでモデルの「学習データの混合比」を推定する方法「アラインメントタンパリング」:人間の評価でLLMの偏りが強化される脆弱性を確認生成モデルは「データのかたまり」と「主要成分」を別々に学ぶ — 線形モデルで示された記憶、収束、一般化の違いオンポリシー一貫性訓練(OPCT)で大規模言語モデルの安全性が向上、能力低下はほぼ回避RGO(制限ガウスオラクル)を使う近接勾配サンプリングで、非平滑な項を含む対数凹分布を高精度に抽出dynestyx:時系列の隠れ状態とパラメータを扱う確率的プログラミングライブラリ深いニューラルネットワークの「勾配消失・爆発」を数学で説明 残差結合の抑制効果を厳密に示すどのとき合わせるべきか、予測するべきか:マルチモーダル学習の「相図」を示す新しい枠組みLLMに特定資産への“好み”はあるか?ビットコインを例に内部表現と配分への影響を調べた監査研究逆設計で材料探索を自動化する道筋:生成モデル、マルチモーダル学習、閉ループワークフローのレビューLLMSurgeon:生成テキストだけでモデルの「学習データの混合比」を推定する方法「アラインメントタンパリング」:人間の評価でLLMの偏りが強化される脆弱性を確認生成モデルは「データのかたまり」と「主要成分」を別々に学ぶ — 線形モデルで示された記憶、収束、一般化の違いオンポリシー一貫性訓練(OPCT)で大規模言語モデルの安全性が向上、能力低下はほぼ回避RGO(制限ガウスオラクル)を使う近接勾配サンプリングで、非平滑な項を含む対数凹分布を高精度に抽出

今日の記事

2026年6月16日火曜日
すべて人工知能機械学習自然言語処理コンピュータビジョンロボティクス暗号物理学数学
機械学習注目

dynestyx:時系列の隠れ状態とパラメータを扱う確率的プログラミングライブラリ

この論文は、時間とともに変化する現象をベイズ的に扱う「状態空間モデル(SSM)」を、より使いやすくするソフトウェア基盤を紹介します。著者らはdynestyxというライブラリを作り、これによって研究者や実務家が隠れた状態の推定やモデルのパラメータ推定を、一つの統一されたインターフェ

2026年6月16日JA2分
記事全文を読む

最新の記事

機械学習
2026年6月16日

深いニューラルネットワークの「勾配消失・爆発」を数学で説明 残差結合の抑制効果を厳密に示す

この論文は、深いニューラルネットワークで起こる「勾配が極端に小さくなる(消失)」あるいは「極端に大きくなる(爆発)」という現象を、厳密な数学の道具を使って解析したものです。著者は,ネットワークの各層の線形化(ヤコビアン行列)を順に掛け合わせると生じる成長率を「リアプノフ指数(Ly

JA
2分
機械学習
2026年6月10日

どのとき合わせるべきか、予測するべきか:マルチモーダル学習の「相図」を示す新しい枠組み

この論文は、画像と言葉など複数のデータ源(モダリティ)を組み合わせる際に、どんな場合に「合わせる」方法が有効で、どんな場合に「一方からもう一方を予測する」方法が有効かを示した研究です。著者らは両者の振る舞いを比較して、実際のデータでどちらを使うべきかを事前に判断できるようにする方

JA
2分
機械学習
2026年6月2日

LLMに特定資産への“好み”はあるか?ビットコインを例に内部表現と配分への影響を調べた監査研究

この論文は、大型言語モデル(LLM: large language models)が特定の金融資産を好む傾向を持つかを調べます。研究者たちは三段階の監査プロトコルを作り、ビットコインを例にして「モデルは資産を好むか」「その好みに関与する内部表現を見つけられるか」「その表現が実際の

JA
2分
広告
機械学習
2026年6月2日

逆設計で材料探索を自動化する道筋:生成モデル、マルチモーダル学習、閉ループワークフローのレビュー

この論文は、材料探索のやり方を変える「逆材料設計」についての総説です。従来の「ある材料の性質を予測する」流れから、目標と制約を満たす候補を直接提案する流れへ移行することを扱います。著者らは、結晶構造を生成する最新の手法と、それらを検証・改良する閉ループ(提案→評価→フィードバック

JA
2分
人工知能
2026年5月29日

LLMSurgeon:生成テキストだけでモデルの「学習データの混合比」を推定する方法

この論文は、ある大規模言語モデル(LLM)がどの種類のデータで学習されたか──いわばその「デジタルDNA」──を、モデルから出てくる生成テキストだけで推定する問題を定式化しています。研究者たちはこれを「Data Mixture Surgery(データ混合手術、DMS)」と名付けま

JA
2分
人工知能
2026年5月27日

「アラインメントタンパリング」:人間の評価でLLMの偏りが強化される脆弱性を確認

この論文は、RLHF(人間のフィードバックによる強化学習)という手法が、調整中の大規模言語モデル(LLM)自身によって利用され、望ましくない偏りを強めてしまう可能性を示します。著者らはこの現象を「アラインメントタンパリング(alignment tampering)」と名付けました

JA
2分
機械学習
2026年5月24日

生成モデルは「データのかたまり」と「主要成分」を別々に学ぶ — 線形モデルで示された記憶、収束、一般化の違い

この論文は、生成モデルが訓練データをそのまま覚えてしまう「記憶(memorisation)」と、新しい良いサンプルを作れるようになる「一般化(generalisation)」の違いを、線形の単純なモデルで明確に分けて示します。著者らは、独立に学習したモデル同士が同じ潜在変数(乱数

JA
2分
機械学習
2026年5月24日

オンポリシー一貫性訓練(OPCT)で大規模言語モデルの安全性が向上、能力低下はほぼ回避

この論文は、対話型AIが迎える典型的な安全問題を減らす新しい訓練法を紹介します。既存の手法は「一度だけ教師が作った答えで学習する」ため、表面的な文言を暗記しがちです。著者らはこれを改め、モデル自身の応答を使って一貫性(変わらない性質)を直接学ばせる「オンポリシー一貫性訓練(OPC

JA
2分
機械学習
2026年5月13日

RGO(制限ガウスオラクル)を使う近接勾配サンプリングで、非平滑な項を含む対数凹分布を高精度に抽出

この論文は、密度が π(x) ∝ exp(−f(x) − g(x)) で表される「複合対数凹分布」からのサンプリング法を提案します。ここで f は滑らかで勾配が評価できる項、g は滑らかとは限らないが凸である非平滑項です。研究者は、非平滑項について「制限ガウスオラクル(RGO)」

JA
2分
次の記事を見る