INTRODUCCIÓN A LA ESTADISTICA

Anuncio
01. INTRODUCCIÓN A LA ESTADÍSTICA
DEFINICIONES
Las Estadísticas. La estadística se ha dividido de acuerdo al problema a trabajar. Las
principales divisiones son,
a. Clásica. Todo manejo de datos con la tendencia a definir el comportamiento de
los experimentos, procedimientos, controles, etc. que emplee información para
obtener conocimiento, es estadística clásica y marca la diferencia entre decidir y
evaluar fenómenos. La estadística es una ciencia que analiza series de datos y
trata de extraer conclusiones sobre el comportamiento de estas variables, las
cuales se pueden clasificar como:
Algunas autoridades la han definido como una técnica especial apta para el
estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación
requiere una masa de observaciones de otros fenómenos más simples llamados
individuales y que estudia los métodos científicos para recoger, organizar, resumir
y analizar datos, así como para sacar conclusiones válidas y tomar decisiones
razonables basadas en tal análisis.
b. Descriptiva. Se fundamenta en la descripción y análisis de las características de
un conjunto de datos, de donde se extrae información y conclusiones sobre el
comportamiento de los datos y relaciones existentes con entre ellos o de ellos con
otras poblaciones con las cuales se comparan. Se trata de estimar, pronosticar y
definir comportamientos que se puedan reproducir bajos similares condiciones de
experimentación.
c. Estadística Inductiva, Está fundamentada en los resultados obtenidos del análisis
de una muestra de población, con el fin de inferir el comportamiento o
característica de la población, de donde procede, por lo que recibe también el
nombre de Inferencia estadística. El objetivo de la inferencia en investigación
científica y tecnológica radica en conocer clases numerosas de objetos, personas o
eventos a partir de otras relativamente pequeñas compuestas por los mismos
elementos.
Problemas de la estadística y la Inferencia. Los problemas por los que se ocupa la
estadística se relacionan con la estimación de parámetros tanto muéstrales como
poblacionales y la definición de criterios para verificar si lo que se ha hecho u
obtenido tiene la suficiencia en calidad estadística, y si se puede utilizar como
elemento de pronostico o de representación del fenómeno estudiado, con los cual se
pueda tomar una decisión objetiva y lo mas aproximada a la realidad.
1
En los cuadros siguientes se muestran los problemas y los factores y aplicaciones a
considerar para obtener una excelente respuesta del experimento y estudio.
PROBLEMAS DE LA ESTADÍSTICA
SITUACIÓN
ESTUDIO
ESTIMACIÓN DE PARÁMETROS EN UNA DISTRIBUCIÓN
Estimación de parámetros: valor medio,
Valores Aproximados de Parámetros
varianza, momentos, estimadores,
Juzgamiento de la exactitud de dichas
Intervalos de confianza y distribuciones
aproximaciones
Pruebas de si uno de los parámetros tiene
.
cierto valor
CONTROL DE CALIDAD: ACEPTACIÓN
Prueba de si un proceso de producción se
Control de calidad, muestreo
efectúa apropiadamente
Prueba de si un lote reúne los requisitos
Riesgo, análisis secuencial
de calidad especificados
INCLUSIÓN DE POBLACIONES DISTRIBUIDAS NORMALMENTE,
PERO POSIBLEMENTE CON DIFERENTES PARÁMETROS
Teoría de la comparación, análisis de
Prueba de si las medias son iguales
varianza
Prueba de si las varianzas son iguales
Teoría de la comparación
Pruebas de medianas tienen cierto valor Métodos no paramétricos
PRUEBAS DE FUNCIONES DE DISTRIBUCIÓN
Prueba para ver si una población tiene Bondad de ajuste, métodos no
determinada distribución
paramétricos
Prueba de si dos poblaciones tienen igual Bondad de ajuste, métodos no
distribución
paramétricos
ALEATORIEDAD
Prueba de aleatoriedad en valores de la
Inferencia estadística
muestra
Métodos no paramétricos, teoría de la
Selección de objetos al azar
tendencia
VARIABLES ALEATORIAS X INDEPENDIENTES Y DEPENDIENTES DE
X
Prueba de que Y depende linealmente de
Análisis de regresión
X
Línea de regresión
Análisis de regresión
Exactitud de la línea de regresión: la
Análisis de regresión
Pendiente
2
Parábola de regresión
Análisis de regresión
Tipo de la curva de regresión
Análisis de regresión
Tendencias en los valores de Y
Análisis de regresión
RELACIÓN ENTRE VARIABLES ALEATORIAS
Análisis de correlación, Teoría de la
Coeficiente de correlación
decisión, teoría de pruebas
análisis de correlación, Teoría de la
Exactitud del coeficiente de regresión
decisión, teoría de pruebas
Prueba de si una población tiene análisis de correlación, Teoría de la
coeficiente de correlación 0
decisión, teoría de pruebas
PROBLEMAS DE INFERENCIA
SITUACIÓN
Estimación de Parámetros
DESARROLLO
Estimación de parámetros: Valor medio;
Varianza; método de los momentos;
Cómo obtener valores aproximados de
estimadores
insesgados,
eficientes,
los parámetros?
consistentes; y método de Máxima
Verosimilitud
Intervalos de confianza: media de
Normal, suma de variables aleatorias
Cómo juzgar la exactitud de dichas
normales, media de Normal con varianza
aproximaciones?
conocida, para la varianza, para la
Binomial; Distribución Normal
Pruebas de Hipótesis: Errores tipo I y II,
Cómo probar si uno de los parámetros comparaciones de medias y varianzas,
tienen cierto valor numérico?
prueba de Neyman - Pearson, Razón de
Verosimilitud
Aceptación
Cómo probar si un proceso de
Sistema de Control de Calidad
producción se efectúa apropiadamente?
Cómo probar si un lote reúne los Muestreo de aceptación, Análisis
requisitos especificados?
secuencial
Varias Poblaciones
Comparación medias de la distribución
Normal; y Análisis de Varianza:
Cómo probar si las medias son iguales?
Arreglos experimentales y bloques
aleatorizados
Cómo probar si las varianzas son Comparación
de
Varianzas
de
iguales?
distribuciones Normales
Medianas
3
Estadística no Paramétrica: Prueba de
Cómo probar si la mediana tienen cierto signo para la mediana, prueba la
valor real?
tendencia, e igualdad de funciones de
distribución
Pruebas de funciones de distribución
Pruebas para funciones de distribución:
Cómo probar si una población tiene
Bondad de Ajuste: Kolmogorov cierto tipo de distribución?
Smirnov, Chi cuadrado
Como probar si dos poblaciones tienen la Prueba de igualdad de funciones de
misma distribución?
distribución
Aleatoriedad
Cómo probar la aleatoriedad de los Pruebas de aleatoriedad de muestras.
valores de una muestra?
Secuencias
Cómo seleccionar objetos al azar?
Interferencia. Muestreo
Mediciones Físicas
Cómo juzgar la exactitud de mediciones
Errores de medición
físicas?
Variable aleatoria X y Variable aleatoria Y que depende de X
Cómo probar la suposición de que Y Prueba de linealidad de una curva de
depende linealmente de X?
regresión
Métodos de Mínimos Cuadrados, y
Cómo determinar la línea de regresión?
Método de Máxima Verosimilitud
Cómo juzgar la exactitud de la Coeficientes de Regresión, intervalos
pendiente?
para el valor medio
Prueba del coeficiente de regresión,
Como probar si la pendiente tiene cierto
Análisis de regresión y análisis de
valor numérico?
varianza
Cómo determinar una parábola de Curvas de regresión no lineales. Métodos
regresión?
de Mínimos Cuadrados
Como probar si la curva de regresión es
Prueba para no linealidad
de cierto tipo?
Prueba del coeficiente de regresión,
Cómo probar si los valores de Y Análisis de regresión y análisis de
manifiestan tendencia?
varianza. Prueba de aleatoriedad y
secuencias
Relación entre dos variables aleatorias
Coeficiente de correlación de una
Cómo calcular el coeficiente de
muestra y una población. Distribuciones
correlación?
bidimensionales
Cómo juzgar la exactitud del coeficiente Pruebas e intervalos de confianza para el
de correlación?
coeficiente de correlación
4
Cómo juzgar si una población dada tiene Pruebas e intervalos de confianza para el
un coeficiente de correlación 0?
coeficiente de correlación
Aleatoriedad. La aleatoriedad es un campo de definición que, en matemáticas, se
asocia a todo proceso cuyo resultado no es previsible más que en razón de la
intervención del azar. La consecuencia de todo suceso aleatorio no puede
determinarse en ningún caso antes de que este se produzca. Por consiguiente, los
procesos aleatorios quedan englobados dentro del área del cálculo de probabilidad y,
en un marco más amplio en el de la estadística. La palabra aleatorio se usa para
expresar una aparente carencia de propósito, causa, u orden. El término aleatoriedad
se usa a menudo como sinónimo con un número de propiedades estadísticas medibles,
tales como la carencia de tendencias o correlación. La aleatoriedad ocupa un lugar
importante en la ciencia y la filosofía.
LAS VARIABLES
La variable se ha definido en muchos casos como el atributo al cual se le puede
asignar un carácter cuantitativo que expresa la medición realizada. Una variable es un
símbolo, X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado
de ellos, llamado dominio de la variable. En general se tienen dos clasificaciones de
variables
Variables Cualitativas, no se pueden medir numéricamente; y Cuantitativas que
tienen valor numérico. Las cuales a su vez se dividen en Discretas y sólo pueden
tomar valores enteros; y Continúas y pueden tomar cualquier valor real dentro de un
intervalo.
Así mismo, se puede hablar de Variables Unidimensionales, las que sólo recogen
información sobre una característica; Bidimensionales, recogen información sobre
5
dos características de la población; y Multimensionales, recogen información sobre
tres o más características.
Las variables y su medición: Una variable es un símbolo, tal como X, Y, H, x ó B,
que pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable.
Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de
dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura. Cuando se
estudia el comportamiento de una variable hay que distinguir los siguientes
conceptos:
Individuo, cualquier elemento que porte información sobre el fenómeno que se
estudia.
Población, conjunto de todos los individuos que portan información sobre el
fenómeno que se estudia. El concepto de población en estadística va más allá de lo
que comúnmente se conoce como tal. Una población se precisa como un conjunto
finito o infinito de elementos que presentan características comunes. El tamaño que
tiene una población es un factor de suma importancia en el proceso de investigación
estadística, y este tamaño vienen dado por el número de elementos que constituyen la
población, según el número de elementos la población puede ser finita o infinita.
Cuando el número de elementos que integra la población es muy grande, se puede
considerar a esta como una población infinita
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre
todos si estos son muchos. En lugar de examinar el grupo entero llamado población o
universo, se examina una pequeña parte del grupo llamada muestra.
Muestra, Se llama muestra a una parte de la población a estudiar que sirve para
representarla. Una muestra debe ser definida en base de la población determinada, y
las conclusiones que se obtengan de dicha muestra solo podrán referirse a la
población en referencia. Subconjunto que seleccionamos de la población.
Muestreo, Es el procedimiento empleado para obtener una o más
población; el muestreo es una técnica que sirve para obtener una o
población. Éste se realiza una vez que se ha establecido un
representativo de la población, se procede a la selección de los
muestra aunque hay muchos diseños de la muestra.
muestras de una
más muestras de
marco muestral
elementos de la
Tipos de muestreo, Existen dos métodos para seleccionar muestras de poblaciones;
el muestreo no aleatorio y el aleatorio. En este último todos los elementos de la
población tienen la oportunidad de ser escogidos en la muestra.
6
Formas de Observar la Población, Atendiendo a la fuente se clasifican en directa o
indirecta: Observación Directa. Cuando se trabaja directamente con los elementos
que se pretende investigar, y los resultados obtenidos se consideran datos estadísticos
originales. Y Observación Indirecta. Cuando se hace uso de datos estadísticos ya
conocidos en una investigación anterior, o de datos observados por un tercero. Con el
fin de deducir otros hechos o fenómenos.
Atendiendo a la periodicidad, puede ser continua, periódica o circunstancial: Es
observación continua cuando se lleva acabo de un modo permanente; es periódica
cuando se lleva a cabo a través de partes de tiempo constantes, y es circunstancial,
cuando se efectúa en forma ocasional o esporádica, esta observación hecha más por
una necesidad momentánea, que de carácter regular o permanente.
Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta: es exhaustiva
cuando la observación es efectuada sobre la totalidad de los elementos de la
población; es parcial cuando la observación de todos sus elementos se ve
imposibilitada y se observa parte de la población; y es mixta, cuando las
observaciones se combinan adecuadamente la observación exhaustiva con la
observación parcial.
Censo, Se entiende por censo aquella numeración que se efectúa a todos y cada uno
de los caracteres componentes de una población.
Encuesta, Se entiende por encuesta las observaciones realizadas por muestreo, es
decir son observaciones parciales.
Datos Estadísticos, Son los resultados del experimento o mediciones de las
observaciones realizadas, son el general, el producto de las observaciones efectuadas
en los cuales se produce el fenómeno que queremos estudiar.
Clasificación de los datos, Los datos estadísticos pueden ser clasificados en
cualitativos, cuantitativos, cronológicos (series de tiempo) y geográficos (series de
espacios), etc. Cuantitativos, cuando son representados por un número,
Cualitativos, cuando señalan cualidades y no están representados numéricamente,
Cronológicos, cuando los valores de los datos varían en diferentes instantes o
períodos de tiempo, los datos son reconocidos como cronológicos; y son Espaciales
cuando los datos están referidos a una localidad, espacio, área,
Fuentes de datos Estadísticos, Los datos estadísticos necesarios para la comprensión
de los hechos pueden obtenerse a través de fuentes primarias y fuentes secundarias:
Primarias, cuando se va ala origen mismo de la información o experimento y se
toman los datos directamente, y son Secundarias, cuando se obtienen sin el
experimento u observación directa
7
Método para la recolección de datos, En estadística se emplean una variedad de
métodos distintos para obtener información de los que se desea investigar. Entre ellos
tenemos: Entrevista personal, encuestas, observación con o sin control de un
experimento o de poblaciones, Cuestionarios, Mediciones, conteos, etc.
8
Descargar