Programa de Formació Continuada Societat Catalana de Cirurgia Análisis Multivariante Introducción Tema 21 Joan J Sancho Análisis Multivariante ¿Qué es? Son todas aquellas técnicas estadísticas que simultáneamente analizan múltiples resultados en los individuos u objetos bajo investigación. Para que un análisis se considere multivariado todas las variables deben ser aleatorias y relacionadas de tal manera que el efecto que producen no pueda ser interpretado de manera individual. Análisis Multivariante ¿Para qué sirve? 1. Representar datos de forma inteligible. 2.Esclarecer la distribución real de “varias variables”. 3.Desarrollar un modelo de predicción basado en múltiples variables. 4.Hallar las relaciones de causa-efecto entre variables. Análisis Multivariante ¿Para qué sirve? 1. Representar datos de forma inteligible. 2.Esclarecer la distribución real de “varias variables”. 3.Desarrollar un modelo de predicción basado en múltiples variables. Probabilidad de muerte = F(Edad, ASA, APACHE II, alb) Probabilidad de supervivencia = F(T,N,M,BRAC, etc) Análisis Multivariante ¿Para qué sirve? 1. Representar datos de forma inteligible. 2.Esclarecer la distribución real de “varias variables”. 3.Desarrollar un modelo de predicción basado en múltiples variables. 4.Hallar las relaciones de causa-efecto entre variables. Análisis Multivariante Dos Medias H 0 : μ1 = μ 2 % % T-Squared Statistic Concepto (1) Más de dos medias H 0 : μ1 = μ 2 = ... μ g % % % F statistic Análisis Multivariante Bivariante H 0 : μ1 = μ 2 = ... μ g SSTreatment / df F= SSError / df Errores Hipotesis: suma los aciertos Concepto (2) Multivariante H 0 : μ1 = μ 2 = ... μ g % % % F = g ( H , E) Hipotesis sumas de los cuadrados y de la matriz de productos Errores sumas de los cuadrados y de la matriz de productos Análisis Multivariante ¿ Porqué? El propósito del análisis multivariante es medir, explicar y predecir el grado de relación que existe entre la variación (combinación lineal ponderada de las variables). El carácter multivariante del análisis descansa no sólo en el número de variables sino en las múltiples combinaciones existente entre las variables. Análisis Multivariante Conceptos básicos Variante: Combinación lineal ponderada de las variables bajo estudio. Escalas de medición: Partición, identificación y medida de un conjunto de variables. No métricas: cualitativas. Métricas: cuantitativas. Mediciones del error. Mediciones multivariantes. Nivel de significancia vs. Potencia de la prueba Análisis Multivariante Indicaciones ¿Cuándo es necesario el análisis multivariante?: Siempre que el diseño no controle la confusión ... ¿y eso cuándo ocurre? No se puede saber a priori: el mejor método para evitar confusión es la selección aleatoria, pero no lo garantiza. Análisis Multivariante Introducción al Análisis Multivariante Guía para el desarrollo e interpretación de un análisis multivariante: Establecer significancia práctica tanto como significancia estadística. El tamaño de la muestra afecta todos los resultados. Conozca sus datos. Use sólo las variables necesarias. Aprenda de sus errores. Valide sus resultados. Análisis Multivariante Escalas de medición Variable cuantitativa o métrica: es aquella que identifica al sujeto como diferente a los demás en cuanto a cantidad o grado. Variable cualitativa o no métrica: se va a identificar al objeto de estudio por características, propiedades, categorías o atributos que posee. Análisis Multivariante Escalas de medición Para variables métricas se utilizan intervalos y razones. Para variables no métricas se utilizan nominales y ordinales. Análisis Multivariante Escalas de medición Escala nominal: asigna un número a una característica o atributo. Escala ordinal: jerarquiza los datos en relación a la cantidad que poseen. Los intervalos y las razones son iguales sólo que las razones tienen sentido físico y los intervalos pueden tener un sentido arbitrario. Análisis Multivariante Una variable dependiente Técnicas funcionales Varias variables dependiente Información cuantitativa Técnicas estructurales Información cualitativa Tipos de Técnicas Cuantitativa Regresión múltiple Supervivencia Cualitativa Discriminante múltiple (certesa) PUNTUACIONS Regresión logística (probabiilitat) Cuantitativas Análisis de varianza MANOVA Cualitativas Correlación canónica Análisis Conjunto Análisis de factores Análisis de componenetes principales Análisis de agrupamientos. Cluster analisis Escalas multidimensionales Escalas multidimensionales Análisis Multivariante 1) Objetivos del análisis 2) Diseño del análisis 3) Hipótesis del análisis 4) Realización del análisis 5) Interpretar resultados 6) Validación del análisis ETAPAS Análisis Multivariante 1) Objetivos del análisis 2) Diseño del análisis 3) Hipótesis del análisis ETAPAS • • • Define el problema Especifica los objetivos Escoge las técnicas multivariantes • Establecer el problema en términos conceptuales definiendo: •los conceptos •las relaciones fundamentales • Establecer si dichas relaciones son: •de dependencia •de interdependencia • Se determinan las variables a observar. 4) Realización del análisis 5) Interpretar resultados 6) Validación del análisis Análisis Multivariante 1) Objetivos del análisis 2) Diseño del análisis 3) Hipótesis del análisis 4) Realización del análisis 5) Interpretar resultados ETAPAS Se determina •el tamaño muestral •las ecuaciones a estimar (si procede) •las distancias a calcular (si procede) •las técnicas de estimación a emplear 6) Validación del análisis •decidir qué hacer con los “datos perdidos” Análisis Multivariante 1) Objetivos del análisis 2) Diseño del análisis 3) Hipótesis del análisis 4) Realización del análisis 5) Interpretar resultados 6) Validación del análisis ETAPAS Escoger formulación de hipótesis subyacente a la técnica: •Normalidad •Linealidad •Independencia •Homocedasticidad Análisis Multivariante 1) Objetivos del análisis ETAPAS 2) Diseño del análisis 1) Se estima el modelo 2) Se evalúa el ajuste a los datos 3) Hipótesis del análisis Observaciones atípicas (outliers) 4) Realización del análisis 5) Interpretar resultados 6) Validación del análisis Análisis Multivariante 1) Objetivos del análisis ETAPAS Evitar la procrastinación 2) Diseño del análisis 3) Hipótesis del análisis 4) Realización del análisis 5) Interpretar resultados 6) Validación del análisis Reespecificaciones adicionales: • de las variables • del modelo >> volver a los pasos 3 y 4 Análisis Multivariante 1) Objetivos del análisis 2) Diseño del análisis 3) Hipótesis del análisis ETAPAS Establecer la validez de los resultados obtenidos analizando sí los resultados obtenidos con la muestra se generalizar a la población de la que procede. 4) Realización del análisis 5) Interpretar resultados 6) Validación del análisis Dividir la muestra en varias partes Técnicas de remuestreo •Jacknife •Bootstrap