Klasyfikacja statystyczna
Klasyfikacja statystyczna – rodzaj algorytmu statystycznego, który przydziela obserwacje statystyczne do klas, bazując na atrybutach (cechach) tych obserwacji.
Definicja formalna |
Dla danego zbioru danych trenujących {(x1,y),…,(xn,y)}{displaystyle {(mathbf {x_{1}} ,y),dots ,(mathbf {x_{n}} ,y)}} znaleźć klasyfikator h:X→Y{displaystyle h:{mathcal {X}}rightarrow {mathcal {Y}}}, który przydziela obiektowi x∈X{displaystyle mathbf {x} in {mathcal {X}}} klasę y∈Y{displaystyle yin {mathcal {Y}}}. Przykładowo, jeśli problem dotyczy filtrowania spamu, wówczas xi{displaystyle mathbf {x_{i}} } to pewna reprezentacja wiadomości, a y{displaystyle y} to "spam" lub "nie spam".
Przykłady klasyfikatorów:
Klasyfikatory liniowe
- Naiwny klasyfikator bayesowski
- Perceptron
- K-najbliższych sąsiadów
- Drzewa decyzyjne
- Sieci bayesowskie
Zobacz też |
- uczenie maszynowe
- uczenie nadzorowane
- uczenie nienadzorowane