競馬予測で混合分布問題を解くその3です。

ネットで混合分布問題を検索するとEMアルゴリズムとかMCMCとか難しい単語が出て来て実際データを使って解いている人はなかなか見つかりませんね。EMアルゴリズムのプログラムを作って分布の分離を行ってみましたが、NaNエラーで失敗。

結局実際のオッズシェアを積算して単勝のシェアエリア別の成績を直近2か月分で出しました。2か月しかないのは虎穴指数が出来て2か月分しかAI予測が出来ていないからです。

AI予測(虎穴指数)を含めて展開新聞の各分野上位3位までの買い目が

シェアエリアに入ったら賭けるというモデルの成績では

10%から20%と

50%から80%の範囲で回収率が80%を超えました。

回収率100%超えはありません。

そこで展開新聞の各分野上位2位までの買い目が

シェアエリアに入ったら賭けるというモデルの成績を出してみると、

上の結果で回収率100%超えのエリアが出てきました。ここが赤エリアらしい。

新馬戦を含む結果でこれなら使えそうです。更なる検証を行っていきます。

例えば赤エリアで的中した時の馬主,調教師,騎手,牧場とかの頻度数をチェックするとかシェアの増加が極端だった部分をチェックするとか色々考えてます。

赤エリアの枠連、馬連、ワイドの成績も出さなきゃいけないし、時間がないなぁ..