第3章：ベイズの識別規則_02 - データサイエンスがやりたいSEの備忘録

識別クラスごとの境界が下記のように表される。

識別クラス	識別領域	正しく識別される確率	条件付きベイズ誤り率
C1	R1	P(C1\|x)	P(C2\|x)
C2	R2	P(C2\|x)	P(C1\|x)

表を図式化したもの。
f:id:fenruru:20190211222727j:plain

つまり条件付きベイズ誤り率は下記の式で表される。
f:id:fenruru:20190211222805p:plain

また、ベイズ誤り率は条件付きベイズ誤り率の期待値で表される。
f:id:fenruru:20190211222828p:plain

最小損失基準に基づくベイズの識別規則
誤りを起こすことによって生じる損失はクラス間で対称であるとは限らない。
真のクラスがCjのとき、Ciと判断することによって生じる損失を考えてみる。

No	数式	概要
1		真がjのときにiと判断することによって生じる損失。前者が判断値、後者が真値。
2		真がjのときにiと判断することによって生じる全体への損失(損失×事後確率)
3		iと判断することによって生じる全体への損失(真がiの場合の損失×事後確率+真がjの場合の損失×事後確率)
4		クラスijの識別の場合 iと判断することによって生じる全体への損失(真がiの場合の損失×事後確率+真がjの場合の損失×事後確率) jと判断することによって生じる全体への損失(真がiの場合の損失×事後確率+真がjの場合の損失×事後確率) これを損失行列と呼ぶ。