01. INTRODUCCIÓN A LA ESTADÍSTICA DEFINICIONES Las Estadísticas. La estadística se ha dividido de acuerdo al problema a trabajar. Las principales divisiones son, a. Clásica. Todo manejo de datos con la tendencia a definir el comportamiento de los experimentos, procedimientos, controles, etc. que emplee información para obtener conocimiento, es estadística clásica y marca la diferencia entre decidir y evaluar fenómenos. La estadística es una ciencia que analiza series de datos y trata de extraer conclusiones sobre el comportamiento de estas variables, las cuales se pueden clasificar como: Algunas autoridades la han definido como una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales y que estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis. b. Descriptiva. Se fundamenta en la descripción y análisis de las características de un conjunto de datos, de donde se extrae información y conclusiones sobre el comportamiento de los datos y relaciones existentes con entre ellos o de ellos con otras poblaciones con las cuales se comparan. Se trata de estimar, pronosticar y definir comportamientos que se puedan reproducir bajos similares condiciones de experimentación. c. Estadística Inductiva, Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con el fin de inferir el comportamiento o característica de la población, de donde procede, por lo que recibe también el nombre de Inferencia estadística. El objetivo de la inferencia en investigación científica y tecnológica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por los mismos elementos. Problemas de la estadística y la Inferencia. Los problemas por los que se ocupa la estadística se relacionan con la estimación de parámetros tanto muéstrales como poblacionales y la definición de criterios para verificar si lo que se ha hecho u obtenido tiene la suficiencia en calidad estadística, y si se puede utilizar como elemento de pronostico o de representación del fenómeno estudiado, con los cual se pueda tomar una decisión objetiva y lo mas aproximada a la realidad. 1 En los cuadros siguientes se muestran los problemas y los factores y aplicaciones a considerar para obtener una excelente respuesta del experimento y estudio. PROBLEMAS DE LA ESTADÍSTICA SITUACIÓN ESTUDIO ESTIMACIÓN DE PARÁMETROS EN UNA DISTRIBUCIÓN Estimación de parámetros: valor medio, Valores Aproximados de Parámetros varianza, momentos, estimadores, Juzgamiento de la exactitud de dichas Intervalos de confianza y distribuciones aproximaciones Pruebas de si uno de los parámetros tiene . cierto valor CONTROL DE CALIDAD: ACEPTACIÓN Prueba de si un proceso de producción se Control de calidad, muestreo efectúa apropiadamente Prueba de si un lote reúne los requisitos Riesgo, análisis secuencial de calidad especificados INCLUSIÓN DE POBLACIONES DISTRIBUIDAS NORMALMENTE, PERO POSIBLEMENTE CON DIFERENTES PARÁMETROS Teoría de la comparación, análisis de Prueba de si las medias son iguales varianza Prueba de si las varianzas son iguales Teoría de la comparación Pruebas de medianas tienen cierto valor Métodos no paramétricos PRUEBAS DE FUNCIONES DE DISTRIBUCIÓN Prueba para ver si una población tiene Bondad de ajuste, métodos no determinada distribución paramétricos Prueba de si dos poblaciones tienen igual Bondad de ajuste, métodos no distribución paramétricos ALEATORIEDAD Prueba de aleatoriedad en valores de la Inferencia estadística muestra Métodos no paramétricos, teoría de la Selección de objetos al azar tendencia VARIABLES ALEATORIAS X INDEPENDIENTES Y DEPENDIENTES DE X Prueba de que Y depende linealmente de Análisis de regresión X Línea de regresión Análisis de regresión Exactitud de la línea de regresión: la Análisis de regresión Pendiente 2 Parábola de regresión Análisis de regresión Tipo de la curva de regresión Análisis de regresión Tendencias en los valores de Y Análisis de regresión RELACIÓN ENTRE VARIABLES ALEATORIAS Análisis de correlación, Teoría de la Coeficiente de correlación decisión, teoría de pruebas análisis de correlación, Teoría de la Exactitud del coeficiente de regresión decisión, teoría de pruebas Prueba de si una población tiene análisis de correlación, Teoría de la coeficiente de correlación 0 decisión, teoría de pruebas PROBLEMAS DE INFERENCIA SITUACIÓN Estimación de Parámetros DESARROLLO Estimación de parámetros: Valor medio; Varianza; método de los momentos; Cómo obtener valores aproximados de estimadores insesgados, eficientes, los parámetros? consistentes; y método de Máxima Verosimilitud Intervalos de confianza: media de Normal, suma de variables aleatorias Cómo juzgar la exactitud de dichas normales, media de Normal con varianza aproximaciones? conocida, para la varianza, para la Binomial; Distribución Normal Pruebas de Hipótesis: Errores tipo I y II, Cómo probar si uno de los parámetros comparaciones de medias y varianzas, tienen cierto valor numérico? prueba de Neyman - Pearson, Razón de Verosimilitud Aceptación Cómo probar si un proceso de Sistema de Control de Calidad producción se efectúa apropiadamente? Cómo probar si un lote reúne los Muestreo de aceptación, Análisis requisitos especificados? secuencial Varias Poblaciones Comparación medias de la distribución Normal; y Análisis de Varianza: Cómo probar si las medias son iguales? Arreglos experimentales y bloques aleatorizados Cómo probar si las varianzas son Comparación de Varianzas de iguales? distribuciones Normales Medianas 3 Estadística no Paramétrica: Prueba de Cómo probar si la mediana tienen cierto signo para la mediana, prueba la valor real? tendencia, e igualdad de funciones de distribución Pruebas de funciones de distribución Pruebas para funciones de distribución: Cómo probar si una población tiene Bondad de Ajuste: Kolmogorov cierto tipo de distribución? Smirnov, Chi cuadrado Como probar si dos poblaciones tienen la Prueba de igualdad de funciones de misma distribución? distribución Aleatoriedad Cómo probar la aleatoriedad de los Pruebas de aleatoriedad de muestras. valores de una muestra? Secuencias Cómo seleccionar objetos al azar? Interferencia. Muestreo Mediciones Físicas Cómo juzgar la exactitud de mediciones Errores de medición físicas? Variable aleatoria X y Variable aleatoria Y que depende de X Cómo probar la suposición de que Y Prueba de linealidad de una curva de depende linealmente de X? regresión Métodos de Mínimos Cuadrados, y Cómo determinar la línea de regresión? Método de Máxima Verosimilitud Cómo juzgar la exactitud de la Coeficientes de Regresión, intervalos pendiente? para el valor medio Prueba del coeficiente de regresión, Como probar si la pendiente tiene cierto Análisis de regresión y análisis de valor numérico? varianza Cómo determinar una parábola de Curvas de regresión no lineales. Métodos regresión? de Mínimos Cuadrados Como probar si la curva de regresión es Prueba para no linealidad de cierto tipo? Prueba del coeficiente de regresión, Cómo probar si los valores de Y Análisis de regresión y análisis de manifiestan tendencia? varianza. Prueba de aleatoriedad y secuencias Relación entre dos variables aleatorias Coeficiente de correlación de una Cómo calcular el coeficiente de muestra y una población. Distribuciones correlación? bidimensionales Cómo juzgar la exactitud del coeficiente Pruebas e intervalos de confianza para el de correlación? coeficiente de correlación 4 Cómo juzgar si una población dada tiene Pruebas e intervalos de confianza para el un coeficiente de correlación 0? coeficiente de correlación Aleatoriedad. La aleatoriedad es un campo de definición que, en matemáticas, se asocia a todo proceso cuyo resultado no es previsible más que en razón de la intervención del azar. La consecuencia de todo suceso aleatorio no puede determinarse en ningún caso antes de que este se produzca. Por consiguiente, los procesos aleatorios quedan englobados dentro del área del cálculo de probabilidad y, en un marco más amplio en el de la estadística. La palabra aleatorio se usa para expresar una aparente carencia de propósito, causa, u orden. El término aleatoriedad se usa a menudo como sinónimo con un número de propiedades estadísticas medibles, tales como la carencia de tendencias o correlación. La aleatoriedad ocupa un lugar importante en la ciencia y la filosofía. LAS VARIABLES La variable se ha definido en muchos casos como el atributo al cual se le puede asignar un carácter cuantitativo que expresa la medición realizada. Una variable es un símbolo, X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. En general se tienen dos clasificaciones de variables Variables Cualitativas, no se pueden medir numéricamente; y Cuantitativas que tienen valor numérico. Las cuales a su vez se dividen en Discretas y sólo pueden tomar valores enteros; y Continúas y pueden tomar cualquier valor real dentro de un intervalo. Así mismo, se puede hablar de Variables Unidimensionales, las que sólo recogen información sobre una característica; Bidimensionales, recogen información sobre 5 dos características de la población; y Multimensionales, recogen información sobre tres o más características. Las variables y su medición: Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable. Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura. Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: Individuo, cualquier elemento que porte información sobre el fenómeno que se estudia. Población, conjunto de todos los individuos que portan información sobre el fenómeno que se estudia. El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de elementos que presentan características comunes. El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística, y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita. Cuando el número de elementos que integra la población es muy grande, se puede considerar a esta como una población infinita Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra. Muestra, Se llama muestra a una parte de la población a estudiar que sirve para representarla. Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia. Subconjunto que seleccionamos de la población. Muestreo, Es el procedimiento empleado para obtener una o más población; el muestreo es una técnica que sirve para obtener una o población. Éste se realiza una vez que se ha establecido un representativo de la población, se procede a la selección de los muestra aunque hay muchos diseños de la muestra. muestras de una más muestras de marco muestral elementos de la Tipos de muestreo, Existen dos métodos para seleccionar muestras de poblaciones; el muestreo no aleatorio y el aleatorio. En este último todos los elementos de la población tienen la oportunidad de ser escogidos en la muestra. 6 Formas de Observar la Población, Atendiendo a la fuente se clasifican en directa o indirecta: Observación Directa. Cuando se trabaja directamente con los elementos que se pretende investigar, y los resultados obtenidos se consideran datos estadísticos originales. Y Observación Indirecta. Cuando se hace uso de datos estadísticos ya conocidos en una investigación anterior, o de datos observados por un tercero. Con el fin de deducir otros hechos o fenómenos. Atendiendo a la periodicidad, puede ser continua, periódica o circunstancial: Es observación continua cuando se lleva acabo de un modo permanente; es periódica cuando se lleva a cabo a través de partes de tiempo constantes, y es circunstancial, cuando se efectúa en forma ocasional o esporádica, esta observación hecha más por una necesidad momentánea, que de carácter regular o permanente. Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta: es exhaustiva cuando la observación es efectuada sobre la totalidad de los elementos de la población; es parcial cuando la observación de todos sus elementos se ve imposibilitada y se observa parte de la población; y es mixta, cuando las observaciones se combinan adecuadamente la observación exhaustiva con la observación parcial. Censo, Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población. Encuesta, Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. Datos Estadísticos, Son los resultados del experimento o mediciones de las observaciones realizadas, son el general, el producto de las observaciones efectuadas en los cuales se produce el fenómeno que queremos estudiar. Clasificación de los datos, Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos, cronológicos (series de tiempo) y geográficos (series de espacios), etc. Cuantitativos, cuando son representados por un número, Cualitativos, cuando señalan cualidades y no están representados numéricamente, Cronológicos, cuando los valores de los datos varían en diferentes instantes o períodos de tiempo, los datos son reconocidos como cronológicos; y son Espaciales cuando los datos están referidos a una localidad, espacio, área, Fuentes de datos Estadísticos, Los datos estadísticos necesarios para la comprensión de los hechos pueden obtenerse a través de fuentes primarias y fuentes secundarias: Primarias, cuando se va ala origen mismo de la información o experimento y se toman los datos directamente, y son Secundarias, cuando se obtienen sin el experimento u observación directa 7 Método para la recolección de datos, En estadística se emplean una variedad de métodos distintos para obtener información de los que se desea investigar. Entre ellos tenemos: Entrevista personal, encuestas, observación con o sin control de un experimento o de poblaciones, Cuestionarios, Mediciones, conteos, etc. 8