Variantes del algoritmo K-NN

Anuncio
Variantes del
algoritmo K-NN
DRA. LETICIA FLORES PULIDO
2
Variantes del algoritmo K-NN
›  Dentro
de los métodos de clasificación
basados en criterios de vecindad,
podemos encontrar varios clasificadores
diferentes.
›  Los
algoritmos basados en vecindad
basan su efectividad en la utilización de
una métrica adecuada para el problema
que se esté abordando
3
Variantes del algoritmo K-NN
›  En
sus primeras versiones, se consideraba
que para calcular la vecindad, cada
elemento debía ser tomado como igual
›  Las versiones subsecuentes, propusieron
que se agregara una especie de peso a
ciertos elementos para así elevar la
efectividad de la métrica empleada
4
Variantes del algoritmo K-NN
›  Otras
versiones asignan a cada caso de k
vecinos un peso diferente en la votación,
según diferentes criterios (cercanía,
información o características mutuas)
›  Otras
versiones tratan de reducir el
número de cálculos para encontrar los k
vecinos
5
Variantes del algoritmo K-NN
›  Otras
tratan de reducir el tamaño del modelo
tomando solo unos elementos prototipo en
base a los cuales se realizarán las
clasificaciones posteriores.
›  Todas
las técnicas anteriores se pueden
hibridar de muchas maneras, lo que nos da
una idea de lo complejo que puede llegar a
ser un sistema de clasificación por vecindad
6
Regla K-NN con rechazo
›  Esta
variante del K-NN descarta la
clasificación de aquellas muestras para las
que no se obtenga una cierta garantía de
que la clase asignada sea la correcta
›  La
clasificación solo será realizada en el caso
de que alguna de las clases reciba un
número de votos superior a un umbral
previamente fijado.
7
Regla K-NN con rechazo
›  Si
resulta por ejemplo que el número de votos
recibidos por la clase mas votada no rebasa
dicho umbral, el caso no será asignado a
ninguna de las clases del problema
›  Los
casos que se quedan sin clasificar son
aquellos dudosos, que probablemente se
encuentren próximos a las fronteras de
decisión
8
Regla K-NN con rechazo
›  El
umbral que se establece para esta regla
suele oscilar entre K/M y K,
›  Donde:
›  M
es el número de clases del problema de
clasificación que se desea abordar
›  K es valor de los k vecinos más próximos a
considerar para el proceso de clasificación
9
Regla K-NN con rechazo
›  Si
M=2 con 2 clases a clasificar
›  Si K=4 considerando a los 4 vecinos mas
próximos
›  Entonces el umbral esta en K/M y K, es
decir: 4/2 y 2
›  Es decir, el umbral está entre 2 y 2, para
este caso el umbral es = 2.
10
Regla K-NN con rechazo
›  Si
ninguna clase supera este umbral, el
caso a clasificar será asignado a la clase
de rechazo w.
11
Regla K-NN con rechazo con
k=2
Candidato
12
Regla K-NN con rechazo con
k=5
Candidato
13
REGLA K-NN por distancia
media
›  Nace
como una alternativa a la regla k-NN,
dándose, en este caso, mayor relevancia a la
distancia a la que se encuentran los k vecinos
más próximos que al voto individual de cada
vecino.
›  A
partir de los k vecinos mas próximos, a un
nuevo caso a clasificar le es asignada la
clase cuya distancia media es menor dentro
de las clases de los K vecinos más próximos.
14
Clasificador de la distancia
mínima
›  En
este caso, se eligen prototipos
representantes de cada clase
›  A partir de ellos depende la distancia que
contengan de cada nuevo elemento o
prototipo para su clasificación
›  El ejemplo de codificación se muestra a
continuación
›  La dificultad radica en la elección del
único representante de cada clase.
Descargar