すべての人に一次情報を
この論文は、多人数が同時に話す会話で音声エージェントが「いつ話すか」を決める問題に取り組みます。研究者たちはModeratorLMという「役割を割り当てられた」音声エージェントを作り、与えられた役割に応じて発話タイミングを決める仕組みを提案しました。実験では実際の会議データと合成
この論文は、いま注目される「大規模言語モデル(Large Language Model, LLM)を使った自律エージェント」の能力を、エージェントをどう指示するかではなく、エージェントが動く環境をどう設計するかに置き換えるべきだと主張します。著者らはこの考え方を「環境エンジニアリ
この論文は、ある大規模言語モデル(LLM)がどの種類のデータで学習されたか──いわばその「デジタルDNA」──を、モデルから出てくる生成テキストだけで推定する問題を定式化しています。研究者たちはこれを「Data Mixture Surgery(データ混合手術、DMS)」と名付けま
この論文は、RLHF(人間のフィードバックによる強化学習)という手法が、調整中の大規模言語モデル(LLM)自身によって利用され、望ましくない偏りを強めてしまう可能性を示します。著者らはこの現象を「アラインメントタンパリング(alignment tampering)」と名付けました
この論文は、タスク達成だけでなく安全性のような暗黙の目的を、人間の選好データから見つけ出し、強化学習エージェントに適用する方法を示します。研究者は、異なるユーザーが異なる目標を持っていても共通して従う安全の原則が群衆の選好データの中に現れることに着目しました。目標は、その共通の安
この論文は、リアルタイムで粒子衝突イベントを選別するための「ジェット識別(ジェットタグ付け)」を、限られた計算予算内でより正確に行う新しいニューラルネットワーク設計を示します。提案モデルはPHAT‑JeT(Patch Hierarchical Attention Transfor
この論文は、移動中の端末(ユーザ機器、UE)の接続切替(ハンドオーバー)やビーム管理、送信タイミングの調整に使える実世界データセットを公開するものです。研究者は、特にハンドオーバー中の通信断や測定報告の負荷を減らすために、人工知能/機械学習(AI/ML)を使う手法が期待されると指
この論文は、大型言語モデル(LLM)が新しい仕事を学ぶときに、学習を二つの速さで分ける方法を提案します。モデルの内部の重みは「遅い」学習でゆっくり更新します。一方、プロンプトや与える文脈は「速い」学習として頻繁に変えられます。著者らはこのFast‑Slow Training(FS
論文は、医学領域での大規模言語モデル(LLM)が大きくしていけば自動的に安全になる、という考えは不十分だと指摘します。研究者たちは「SaFE-Scale」という安全性に注目した評価の枠組みを提案し、放射線診断の200問からなる新しいベンチマーク RadSaFE-200 を使って実
この論文は、複数の大規模言語モデル(AIエージェント)が、予測市場で売買を通じて分散した私的情報を集約できるかを調べています。研究者は、二者択一の結果に0か1を支払う金融的な「証券」を使い、最後の市場価格が真の値にどれだけ近いか(最後の価格の対数誤差で測定)を情報集約の指標にしま