すべての人に一次情報を
この論文は、言語モデルが生成の途中で「今の方針が目標を達成しそうか」を内部で表す軸(“value(価値)軸”)を持っているかを調べたものです。著者らはQwen3‑8Bというモデルの中間層にそのような方向を見つけ、軸の値が高い時はモデルが自信を持ってその方針を続け、低い時は方針を変
この論文は、多人数が同時に話す会話で音声エージェントが「いつ話すか」を決める問題に取り組みます。研究者たちはModeratorLMという「役割を割り当てられた」音声エージェントを作り、与えられた役割に応じて発話タイミングを決める仕組みを提案しました。実験では実際の会議データと合成
この論文は、いま注目される「大規模言語モデル(Large Language Model, LLM)を使った自律エージェント」の能力を、エージェントをどう指示するかではなく、エージェントが動く環境をどう設計するかに置き換えるべきだと主張します。著者らはこの考え方を「環境エンジニアリ
この論文は、声を失った人のために「無声音声」を作る研究です。研究者たちは、皮膚上の筋活動を測る表面筋電図(sEMG)と、唇や口の動きを映す映像(リップリーディング)を同時に使い、声のないときでも連続した音声を合成する方法を提案しました。提案手法は訓練時に一部の入力を意図的に隠す「
この論文は、ある大規模言語モデル(LLM)がどの種類のデータで学習されたか──いわばその「デジタルDNA」──を、モデルから出てくる生成テキストだけで推定する問題を定式化しています。研究者たちはこれを「Data Mixture Surgery(データ混合手術、DMS)」と名付けま
この論文は、RLHF(人間のフィードバックによる強化学習)という手法が、調整中の大規模言語モデル(LLM)自身によって利用され、望ましくない偏りを強めてしまう可能性を示します。著者らはこの現象を「アラインメントタンパリング(alignment tampering)」と名付けました
この論文は、視覚と言語を同時に鍛えるのではなく、能力ごとに段階を分けて後訓練することで、視覚と言語モデル(VLM: Vision-Language Model)の性能が上がると報告します。著者らは多くの視覚推論の失敗が「見る力(視覚的知覚)」の誤りに起因することを示し、先に視覚能
論文は、医学領域での大規模言語モデル(LLM)が大きくしていけば自動的に安全になる、という考えは不十分だと指摘します。研究者たちは「SaFE-Scale」という安全性に注目した評価の枠組みを提案し、放射線診断の200問からなる新しいベンチマーク RadSaFE-200 を使って実
この論文は、大規模言語モデル(LLM)が見かけ上は正しい答えを出しても、与えられた手順を忠実に実行できているとは限らない点を調べています。研究者たちは、手順通りに実行する能力を厳密に測るために、段階的な算術アルゴリズムと二つの数値入力を与える診断ベンチマークを作りました。出力は決
この論文は、AIシステムのセキュリティ評価を自動化するための枠組み「AVISE(AI Vulnerability Identification and Security Evaluation)」を紹介します。著者たちは、特に言語モデルに対する「ジャイルブレイク」(モデルの安全制約