arXiv News

すべての人に一次情報を

法務

プライバシーポリシー利用規約

© 2026 arXiv News

arXiv News

英語日本語

言語を切り替え

英語日本語
アカウントを読み込み中…

すべての人に一次情報を

最新
言語モデルは自分が「正しい道」にいるかを内部で線形に表現している可能性—Qwen3‑8Bでの発見役割を与えて騒がしい会話で「いつ話すか」を制御する音声AI—ModeratorLMの提案EurekAgent:環境を設計することで自律的な科学発見を効率化 — 26サークルパッキングを$11未満で改善表面筋電図と口元映像を組み合わせて「無声音声」を合成する手法。マスク学習で堅牢性を向上LLMSurgeon:生成テキストだけでモデルの「学習データの混合比」を推定する方法「アラインメントタンパリング」:人間の評価でLLMの偏りが強化される脆弱性を確認「見る力」を先に鍛えると効果的:視覚と言語を分けた段階的後訓練でVLMの成績が向上臨床用大規模言語モデル(LLM)は「正確さ」と「安全さ」で別の振る舞いをする――ラジオロジー試験で示された新しい評価枠組み大規模言語モデルは手順通りに計算を続けられるか:段階的検査で見えた弱点AVISE:AIシステムの脆弱性を自動で見つけるモジュール式オープンソース枠組み言語モデルは自分が「正しい道」にいるかを内部で線形に表現している可能性—Qwen3‑8Bでの発見役割を与えて騒がしい会話で「いつ話すか」を制御する音声AI—ModeratorLMの提案EurekAgent:環境を設計することで自律的な科学発見を効率化 — 26サークルパッキングを$11未満で改善表面筋電図と口元映像を組み合わせて「無声音声」を合成する手法。マスク学習で堅牢性を向上LLMSurgeon:生成テキストだけでモデルの「学習データの混合比」を推定する方法「アラインメントタンパリング」:人間の評価でLLMの偏りが強化される脆弱性を確認「見る力」を先に鍛えると効果的:視覚と言語を分けた段階的後訓練でVLMの成績が向上臨床用大規模言語モデル(LLM)は「正確さ」と「安全さ」で別の振る舞いをする――ラジオロジー試験で示された新しい評価枠組み大規模言語モデルは手順通りに計算を続けられるか:段階的検査で見えた弱点AVISE:AIシステムの脆弱性を自動で見つけるモジュール式オープンソース枠組み

今日の記事

2026年6月16日火曜日
すべて人工知能機械学習自然言語処理コンピュータビジョンロボティクス暗号物理学数学
自然言語処理注目

言語モデルは自分が「正しい道」にいるかを内部で線形に表現している可能性—Qwen3‑8Bでの発見

この論文は、言語モデルが生成の途中で「今の方針が目標を達成しそうか」を内部で表す軸(“value(価値)軸”)を持っているかを調べたものです。著者らはQwen3‑8Bというモデルの中間層にそのような方向を見つけ、軸の値が高い時はモデルが自信を持ってその方針を続け、低い時は方針を変

2026年6月16日JA2分
記事全文を読む

最新の記事

人工知能
2026年6月12日

役割を与えて騒がしい会話で「いつ話すか」を制御する音声AI—ModeratorLMの提案

この論文は、多人数が同時に話す会話で音声エージェントが「いつ話すか」を決める問題に取り組みます。研究者たちはModeratorLMという「役割を割り当てられた」音声エージェントを作り、与えられた役割に応じて発話タイミングを決める仕組みを提案しました。実験では実際の会議データと合成

JA
2分
人工知能
2026年6月12日

EurekAgent:環境を設計することで自律的な科学発見を効率化 — 26サークルパッキングを$11未満で改善

この論文は、いま注目される「大規模言語モデル(Large Language Model, LLM)を使った自律エージェント」の能力を、エージェントをどう指示するかではなく、エージェントが動く環境をどう設計するかに置き換えるべきだと主張します。著者らはこの考え方を「環境エンジニアリ

JA
2分
自然言語処理
2026年6月9日

表面筋電図と口元映像を組み合わせて「無声音声」を合成する手法。マスク学習で堅牢性を向上

この論文は、声を失った人のために「無声音声」を作る研究です。研究者たちは、皮膚上の筋活動を測る表面筋電図(sEMG)と、唇や口の動きを映す映像(リップリーディング)を同時に使い、声のないときでも連続した音声を合成する方法を提案しました。提案手法は訓練時に一部の入力を意図的に隠す「

JA
2分
広告
人工知能
2026年5月29日

LLMSurgeon:生成テキストだけでモデルの「学習データの混合比」を推定する方法

この論文は、ある大規模言語モデル(LLM)がどの種類のデータで学習されたか──いわばその「デジタルDNA」──を、モデルから出てくる生成テキストだけで推定する問題を定式化しています。研究者たちはこれを「Data Mixture Surgery(データ混合手術、DMS)」と名付けま

JA
2分
人工知能
2026年5月27日

「アラインメントタンパリング」:人間の評価でLLMの偏りが強化される脆弱性を確認

この論文は、RLHF(人間のフィードバックによる強化学習)という手法が、調整中の大規模言語モデル(LLM)自身によって利用され、望ましくない偏りを強めてしまう可能性を示します。著者らはこの現象を「アラインメントタンパリング(alignment tampering)」と名付けました

JA
2分
自然言語処理
2026年5月20日

「見る力」を先に鍛えると効果的:視覚と言語を分けた段階的後訓練でVLMの成績が向上

この論文は、視覚と言語を同時に鍛えるのではなく、能力ごとに段階を分けて後訓練することで、視覚と言語モデル(VLM: Vision-Language Model)の性能が上がると報告します。著者らは多くの視覚推論の失敗が「見る力(視覚的知覚)」の誤りに起因することを示し、先に視覚能

JA
2分
人工知能
2026年5月7日

臨床用大規模言語モデル(LLM)は「正確さ」と「安全さ」で別の振る舞いをする――ラジオロジー試験で示された新しい評価枠組み

論文は、医学領域での大規模言語モデル(LLM)が大きくしていけば自動的に安全になる、という考えは不十分だと指摘します。研究者たちは「SaFE-Scale」という安全性に注目した評価の枠組みを提案し、放射線診断の200問からなる新しいベンチマーク RadSaFE-200 を使って実

JA
2分
自然言語処理
2026年5月5日

大規模言語モデルは手順通りに計算を続けられるか:段階的検査で見えた弱点

この論文は、大規模言語モデル(LLM)が見かけ上は正しい答えを出しても、与えられた手順を忠実に実行できているとは限らない点を調べています。研究者たちは、手順通りに実行する能力を厳密に測るために、段階的な算術アルゴリズムと二つの数値入力を与える診断ベンチマークを作りました。出力は決

JA
2分
人工知能
2026年4月24日

AVISE:AIシステムの脆弱性を自動で見つけるモジュール式オープンソース枠組み

この論文は、AIシステムのセキュリティ評価を自動化するための枠組み「AVISE(AI Vulnerability Identification and Security Evaluation)」を紹介します。著者たちは、特に言語モデルに対する「ジャイルブレイク」(モデルの安全制約

JA
2分
次の記事を見る