ライブ賭博データで見る「不自然な賭け」—イタリア・セリエBの事例を使った統計的検出の実証研究
この論文は、試合操作(マッチフィクシング)を示す可能性のある不自然な賭けの流れを、ライブ(試合中)賭博データから見つける方法を示したものです。スポーツ賭博市場は世界的に拡大しており、特にサッカーは賭博の取引高が大きいため操作のリスクが高いとされています。ライブ賭博は総賭博量の約半分を占めるため、そこで起きる異常を早期に見つけられれば、競技の信頼性を守る助けになります。
研究者たちは、イタリアのセリエB(2018/19〜2020/21シーズン)で得られた高頻度のライブ賭博データを使いました。データは欧州の大手ブックメーカーが提供し、試合ごとの賭け金の実際の流れを「秒単位」で記録したものと、同時刻のブックメーカーのライブオッズが含まれます。この詳細なデータを使って、通常の市場の動きと予想される賭け金の量を統計的にモデル化しました。
手法は大きく二段階です。まず「状態空間モデル」と呼ばれる手法で、時間とともに変わる市場の基礎的な活動レベルを捉えます。状態空間モデルは、観測される賭け量の背後にある目に見えない動きを滑らかに追う仕組みです。そのうえで、試合中のゴールやレッドカードなどの主要イベントや、ニュースを予期した賭けの変化といった説明変数を入れて、条件付きの期待値を予測します。次に、観測された賭け金がその期待値から大きく外れる場合に「外れ値検出」を使ってフラグを立てます。たとえば、試合終盤に起こりやすい「確率が低い結果に突然高額が集中する」ようなパターンが検出対象です。
このアプローチは実用例としての「概念実証(プルーフ・オブ・コンセプト)」を示しています。統計モデルを使えば、ライブ賭博市場の通常の動きと比べて不自然に大きな賭けの流れを早期にピックアップできます。こうした手法は、既存のインテグリティ(競技の公平性)レポートや業界の監視活動を補完する道具となり得ます。背景には、セリエBで過去に発覚した2011–12年や2015年の事例など、リーグ固有の不正の歴史と、2025年に報じられたトルコでのスキャンダルのような近年の事件があります。
ただし重要な注意点もあります。第一に、検出される「異常」は必ずしも試合操作を意味しません。真の不正を示す確定的な証拠(グラウンドトゥルース)は限られており、モデルは疑わしいパターンを旗上げするにとどまります。第二に、この研究はセリエBと一つのブックメーカーのデータに基づく概念実証です。別のリーグや複数の事業者のデータで同様に機能するかは追加検証が必要です。最後に、ライブ賭博分野自体の学術研究はまだ限られており、誤検知(偽陽性)や見逃し(偽陰性)を減らすためには、当局やブックメーカーとの連携によるさらなる試験と運用上の検討が欠かせません。