第1章:はじめに
パターン認識とは?
概念 | 意味 |
---|---|
識別 | 「何か」を判断すること |
特徴抽出 | 「有効な特徴」を抽出すること |
識別規則 | 「有効な特徴」と「何か」を結びつけること |
特徴ベクトル | 抽出された沢山の特徴を並べてベクトルの形にまとめたもの |
識別規則 | ある特定のクラスに分類するための識別規則 |
汎化能力 | 学習データでない未知のデータに対して正しくクラスを識別できる能力 |
特徴の型
No | 尺度名 | 定義 | 例 |
---|---|---|---|
1 | 名義尺度 | 分類のための単なる名前。クラスラベル | 名前、住所 |
2 | 順序尺度 | 順序関係を表す。比較はできるが加減算などの演算ができない | 大中小、優良可 |
3 | 間隔尺度 | 一定の単位で見積もられた量で等間隔性がある。原点があっても「無」ではない。加減算が意味をもつ | 試験の成績、年月 |
4 | 比例尺度 | 原点が定まっている量 | 身長、体重、年齢 |
符号化とダミー変数
符号化:クラスに対応する変数のみを1とし、他を0とする
ダミー変数:符号化に用いる2値変数
(例)大中小の符号化
β1 | β2 | β3 | |
---|---|---|---|
大 | 1 | 0 | 0 |
中 | 0 | 1 | 0 |
小 | 0 | 0 | 1 |
次元の呪い
・次元の呪い
未知の複雑な関数を学習するために必要なデータが、次元の増加と共に指数関数的に増加すること
特徴量ベクトルはその特徴量の数によってd次元線形空間を張るため、多いほどすさまじい計算量になる。