k Analíti a Revista de Análisis Estadístico Journal of Statistical Analysis Rodrigo Cajamarca y Hermann Mena 2.3 Mínimos cuadrados recursivo (MCR) El método de mínimos cuadrados recursivo es, como su nombre lo indica, una versión recursiva del método de mínimos cuadrados por lotes. Este método utiliza en cada iteración una parte del conjunto de entrenamiento y no requiere el cálculo de la inversa de Φ⊤ Φ; de esta manera su desempeño es más eficiente que el MCL. El algoritmo calcula θ̂ (k) mediante θ̂ (k − 1), x k , y yk ; donde k representa un ciclo sobre el conjunto de entrenamiento G, la iteración se repite K veces; para más detalles ver [11]. Al igual que para el MCL, se utiliza la función de pertenencia Gaussiana para las entradas y una función Delta para las salidas. Los parámetros bl , clj y σjl > 0 se definen como en el método anterior. Sea P(k) la matriz n × n definida como ! −1 −1 k ⊤ i i ⊤ P(k) = Φ Φ = ∑ x (x ) , (8) 3 Al igual que en la sección anterior, se generalizó este método para el caso de entrada-salida múltiple; ver Algoritmo 2. 2.4 Aprendizaje desde el ejemplo modificado (AEM) Este método tiene un enfoque muy intuitivo para la construcción de un sistema difuso el cual se basa en técnicas de optimización para determinar los parámetros del sistema. En el AEM se generan automáticamente reglas y funciones de pertenencia; por esta razón, este método es una alternativa viable a problemas en los cuales se carece de información a priori del sistema. De manera análoga a la sección anterior, se consideran funciones de pertenencia Gaussiana y Delta; el método se describe de la siguiente manera: i =1 se obtiene P ( k ) = P ( k − 1) − P ( k − 1) x k y ( I + ( x k ) ⊤ P ( k − 1 ) x k ) −1 ( x k ) ⊤ P ( k − 1 ) , k k k ⊤ θ̂ (k) = θ̂ (k − 1) + P(k) x (y − ( x ) θ̂ (k − 1)). 1. Construcción de un sistema difuso inicial: dados el par de datos de entrada y salida ( x i , y j ) ∈ G, i = 1, . . . , M, se forma un sistema difuso inicial con ( x1 , y1 ) y se inicializa el número de reglas R = 1 (9) (10) f ( x i | θ ) = b1 (12) Si se aplica el lema de la matriz inversa, se evita la inpara c1j = x1j , σj1 = σ0 (parámetros de las funciones de versión de una matriz; y, en su lugar, únicamente se calcula pertenencia de las variables de entrada) y b1 = y1 (pael inverso del escalar ( I + ( x k )⊤ P(k − 1) x k )−1 . Las ecuaciorámetro de la función de pertenencia de la variable de nes (9) y (10) caracterizan P(k) y θ̂ (k) y permiten describir salida), para todo j = 1, . . . , n. el método de mínimos cuadrados recursivo. Para inicializar el algoritmo, se emplean generalmente 2. Evaluación de los datos de entrenamiento: se utiliza un θ̂ (0) = 0 y P(0) = P0 = αI para algún α > 0. Otra opción factor de tolerancia ε f que determina el error. Para cada es utilizar una aproximación heurística. ( x i , y j ) ∈ G se evalúa: Además se puede usar el método de mínimos cuadrados recursivo ponderado. En este caso se utiliza un factor • si | f ( x i | θ ) − yi | ≤ ε f , entonces el sistema difuso f 0 < λ ≤ 1 que se conoce como un “factor de pérdida de representa correctamente ( x i , yi ), y por lo tanto, no memoria” y sirve para dar mayor peso a la información es necesario añadir ninguna regla. Se repite este pamas reciente. Si λ = 1 se obtiene el método MCR original. so, con el siguiente par de datos de entrenamiento. En el método de mínimos cuadrados recursivo P(k) se define como: • si | f ( x i | θ ) − yi | > ε f , entonces se añade una regla 1 k k ⊤ P(k) = λ ( I − P(k − 1) x (λI + ( x ) para representar ( x i , yi ) modificando los parámetros (11) P ( k − 1 ) x k ) −1 ( x k ) ⊤ ) P ( k − 1 ) de las funciones de pertenencia; continuar al Paso 3 θ̂ (k) = θ̂ (k − 1) + P(k) x k (yk − ( x k )⊤ θ̂ (k − 1)) Si en el sistema difuso (3), se reemplaza x k con ξ ( x k ) en 3. Codificación de parámetros del sistema difuso: si no se cumple la condición del Paso 2, se añade una nueva re(11) se obtiene gla R = R + 1, bR = yi y cij = x ij , para todo j = 1, . . . , n. n 1 k P ( k ) = λ I − P ( k − 1) ξ ( x ) La modificación de los σji para i = R se realiza utilih i −1 zando los centros de las funciones de pertenencia de la λI + (ξ ( x k ))⊤ P(k − 1)ξ ( x k ) o forma; (ξ ( x k ))⊤ P(k − 1) h i ′ n∗j = arg mı́n{|cij − cij | : i ′ = 1, 2, . . . , R, i ′ 6= i }, θ̂ (k) = θ̂ (k − 1) + P(k)ξ ( x k ) yk − (ξ ( x k ))⊤ θ̂ (k − 1) 26 Analítika, Revista de análisis estadístico, 2 (2012), Vol. 3(1): 23-42