Klasyfikacja statystyczna




Klasyfikacja statystyczna – rodzaj algorytmu statystycznego, który przydziela obserwacje statystyczne do klas, bazując na atrybutach (cechach) tych obserwacji.



Definicja formalna |


Dla danego zbioru danych trenujących {(x1,y),…,(xn,y)}{displaystyle {(mathbf {x_{1}} ,y),dots ,(mathbf {x_{n}} ,y)}}{displaystyle {(mathbf {x_{1}} ,y),dots ,(mathbf {x_{n}} ,y)}} znaleźć klasyfikator h:X→Y{displaystyle h:{mathcal {X}}rightarrow {mathcal {Y}}}{displaystyle h:{mathcal {X}}rightarrow {mathcal {Y}}}, który przydziela obiektowi x∈X{displaystyle mathbf {x} in {mathcal {X}}}{displaystyle mathbf {x} in {mathcal {X}}} klasę y∈Y{displaystyle yin {mathcal {Y}}}{displaystyle yin {mathcal {Y}}}. Przykładowo, jeśli problem dotyczy filtrowania spamu, wówczas xi{displaystyle mathbf {x_{i}} }{displaystyle mathbf {x_{i}} } to pewna reprezentacja wiadomości, a y{displaystyle y}y to "spam" lub "nie spam".


Przykłady klasyfikatorów:




  • Klasyfikatory liniowe

    • Naiwny klasyfikator bayesowski

    • Perceptron



  • K-najbliższych sąsiadów

  • Drzewa decyzyjne

  • Sieci bayesowskie



Zobacz też |



  • uczenie maszynowe

  • uczenie nadzorowane

  • uczenie nienadzorowane




Popular posts from this blog

Morgemoulin

Scott Moir

Souastre