arXiv News

すべての人に一次情報を

法務

プライバシーポリシー利用規約

© 2026 arXiv News

arXiv News

英語日本語

言語を切り替え

英語日本語
アカウントを読み込み中…

すべての人に一次情報を

最新
役割を与えて騒がしい会話で「いつ話すか」を制御する音声AI—ModeratorLMの提案EurekAgent:環境を設計することで自律的な科学発見を効率化 — 26サークルパッキングを$11未満で改善LLMSurgeon:生成テキストだけでモデルの「学習データの混合比」を推定する方法「アラインメントタンパリング」:人間の評価でLLMの偏りが強化される脆弱性を確認群衆の嗜好から暗黙の安全基準を学び、強化学習エージェントの危険行動を低減する方法PHAT‑JeT:局所構造を活かした効率的なジェット識別器でトリガー向け精度を改善商用ネットワークで収集した実測データで「移動中のAI」研究を後押し——ハンドオーバーとビーム管理、タイミング調整のデータセット公開Fast‑Slow Training:プロンプトを「速く」、重みを「ゆっくり」学ばせてLLMを継続適応臨床用大規模言語モデル(LLM)は「正確さ」と「安全さ」で別の振る舞いをする――ラジオロジー試験で示された新しい評価枠組みAIエージェントは価格で情報を集められるか? 取引実験で「複雑さ」が限界を作ることが判明役割を与えて騒がしい会話で「いつ話すか」を制御する音声AI—ModeratorLMの提案EurekAgent:環境を設計することで自律的な科学発見を効率化 — 26サークルパッキングを$11未満で改善LLMSurgeon:生成テキストだけでモデルの「学習データの混合比」を推定する方法「アラインメントタンパリング」:人間の評価でLLMの偏りが強化される脆弱性を確認群衆の嗜好から暗黙の安全基準を学び、強化学習エージェントの危険行動を低減する方法PHAT‑JeT:局所構造を活かした効率的なジェット識別器でトリガー向け精度を改善商用ネットワークで収集した実測データで「移動中のAI」研究を後押し——ハンドオーバーとビーム管理、タイミング調整のデータセット公開Fast‑Slow Training:プロンプトを「速く」、重みを「ゆっくり」学ばせてLLMを継続適応臨床用大規模言語モデル(LLM)は「正確さ」と「安全さ」で別の振る舞いをする――ラジオロジー試験で示された新しい評価枠組みAIエージェントは価格で情報を集められるか? 取引実験で「複雑さ」が限界を作ることが判明

今日の記事

2026年6月16日火曜日
すべて人工知能機械学習自然言語処理コンピュータビジョンロボティクス暗号物理学数学
人工知能注目

役割を与えて騒がしい会話で「いつ話すか」を制御する音声AI—ModeratorLMの提案

この論文は、多人数が同時に話す会話で音声エージェントが「いつ話すか」を決める問題に取り組みます。研究者たちはModeratorLMという「役割を割り当てられた」音声エージェントを作り、与えられた役割に応じて発話タイミングを決める仕組みを提案しました。実験では実際の会議データと合成

2026年6月12日JA2分
記事全文を読む

最新の記事

人工知能
2026年6月12日

EurekAgent:環境を設計することで自律的な科学発見を効率化 — 26サークルパッキングを$11未満で改善

この論文は、いま注目される「大規模言語モデル(Large Language Model, LLM)を使った自律エージェント」の能力を、エージェントをどう指示するかではなく、エージェントが動く環境をどう設計するかに置き換えるべきだと主張します。著者らはこの考え方を「環境エンジニアリ

JA
2分
人工知能
2026年5月29日

LLMSurgeon:生成テキストだけでモデルの「学習データの混合比」を推定する方法

この論文は、ある大規模言語モデル(LLM)がどの種類のデータで学習されたか──いわばその「デジタルDNA」──を、モデルから出てくる生成テキストだけで推定する問題を定式化しています。研究者たちはこれを「Data Mixture Surgery(データ混合手術、DMS)」と名付けま

JA
2分
人工知能
2026年5月27日

「アラインメントタンパリング」:人間の評価でLLMの偏りが強化される脆弱性を確認

この論文は、RLHF(人間のフィードバックによる強化学習)という手法が、調整中の大規模言語モデル(LLM)自身によって利用され、望ましくない偏りを強めてしまう可能性を示します。著者らはこの現象を「アラインメントタンパリング(alignment tampering)」と名付けました

JA
2分
広告
人工知能
2026年5月24日

群衆の嗜好から暗黙の安全基準を学び、強化学習エージェントの危険行動を低減する方法

この論文は、タスク達成だけでなく安全性のような暗黙の目的を、人間の選好データから見つけ出し、強化学習エージェントに適用する方法を示します。研究者は、異なるユーザーが異なる目標を持っていても共通して従う安全の原則が群衆の選好データの中に現れることに着目しました。目標は、その共通の安

JA
2分
人工知能
2026年5月24日

PHAT‑JeT:局所構造を活かした効率的なジェット識別器でトリガー向け精度を改善

この論文は、リアルタイムで粒子衝突イベントを選別するための「ジェット識別(ジェットタグ付け)」を、限られた計算予算内でより正確に行う新しいニューラルネットワーク設計を示します。提案モデルはPHAT‑JeT(Patch Hierarchical Attention Transfor

JA
2分
人工知能
2026年5月13日

商用ネットワークで収集した実測データで「移動中のAI」研究を後押し——ハンドオーバーとビーム管理、タイミング調整のデータセット公開

この論文は、移動中の端末(ユーザ機器、UE)の接続切替(ハンドオーバー)やビーム管理、送信タイミングの調整に使える実世界データセットを公開するものです。研究者は、特にハンドオーバー中の通信断や測定報告の負荷を減らすために、人工知能/機械学習(AI/ML)を使う手法が期待されると指

JA
2分
人工知能
2026年5月13日

Fast‑Slow Training:プロンプトを「速く」、重みを「ゆっくり」学ばせてLLMを継続適応

この論文は、大型言語モデル(LLM)が新しい仕事を学ぶときに、学習を二つの速さで分ける方法を提案します。モデルの内部の重みは「遅い」学習でゆっくり更新します。一方、プロンプトや与える文脈は「速い」学習として頻繁に変えられます。著者らはこのFast‑Slow Training(FS

JA
2分
人工知能
2026年5月7日

臨床用大規模言語モデル(LLM)は「正確さ」と「安全さ」で別の振る舞いをする――ラジオロジー試験で示された新しい評価枠組み

論文は、医学領域での大規模言語モデル(LLM)が大きくしていけば自動的に安全になる、という考えは不十分だと指摘します。研究者たちは「SaFE-Scale」という安全性に注目した評価の枠組みを提案し、放射線診断の200問からなる新しいベンチマーク RadSaFE-200 を使って実

JA
2分
人工知能
2026年4月24日

AIエージェントは価格で情報を集められるか? 取引実験で「複雑さ」が限界を作ることが判明

この論文は、複数の大規模言語モデル(AIエージェント)が、予測市場で売買を通じて分散した私的情報を集約できるかを調べています。研究者は、二者択一の結果に0か1を支払う金融的な「証券」を使い、最後の市場価格が真の値にどれだけ近いか(最後の価格の対数誤差で測定)を情報集約の指標にしま

JA
2分
次の記事を見る