ESTADISTICA Estudia los métodos científicos para recoger

Anuncio
ESTADISTICA
Estudia los métodos científicos para recoger, organizar, resumir y analizar datos así como
como para sacar conclusión validas y tomar decisiones razonables basadas en tal análisis.
TIPOS DE DATOS EMPLEADOS EN LA ESTADISTICA
Variables: Una variable es un símbolo como X, Y, H, x o B que puede tomar un
conjunto prefijado de valores
Variable discreta: Son todos esos datos que adquieren un valor entero, es decir que el
intervalo entre cada uno de ellos es bien definido (1, 2, 3, 4,5…).
Variable continua: Son todos aquellos que adquieren valores que consideran la parte
fraccionaria (1, 1.1, 1.2, 1.3, 1.4, 1.5…2).
REPRESENTACION DE LOS DATOS
Los datos obtenidos deberán de representarse de manera adecuada para que su
interpretación y análisis sea más sencilla.
La forma más apropiada desde el punto de vista de la estadística son las representaciones
Tabulares y las Graficas.
REPRESENTACIÓN TABULAR
El objetivo es generar una tabla que contenga la información de los datos obtenidos en la
muestra y poder determinar algunos valores de importancia para su procesamiento posterior.
Donde los renglones contengan la información del experimento, mientras que las columnas
contienen los diferentes procesos que se aplicaran a los datos
RENGLONES
COLUMNAS
COMO ELABORAR LA REPRESENTACION TABULAR
1.- Ya que se obtuvieron los datos el primer paso es ordenar de manera ascendente.
2.- La agrupación de los datos es en una TABLA DE FRECUENCIA.
Con los datos ordenados se determinara el intervalo total de datos de la siguiente manera
Valor mínimo menos Valor máximo = intervalo de datos
Todos los intervalos de clase de la tabla deberán de ser exactamente iguales en longitud. Esto
se lleva a cabo de la siguiente manera
Valor mínimo + intervalos = valor máximo de intervalos
Ya obtenidos los valores máximos y mínimos del primer intervalo se procede a calcular el
siguiente, para ello se considera que el valor máximo del intervalo anterior será considerado
como el valor mínimo del intervalo actual, la forma de calcular será exactamente igual al
anterior y así sucesivamente se calculara todos los intervalos de la muestra, a esto se le llama
intervalos de clase , los valores de esos intervalos forman una clase y el total de los valores de
una clase se llama frecuencia.
REPRESENTACIÓN GRAFICA
Permite al observador o al lector poder interpretar de manera más sencilla el significado o el
sentido que tiene los datos que se muestran se tienes las siguientes graficas:
Grafica de Barras
Grafica de sectores o pastel
Grafica de dispersión de puntos
Grafica de área bajo la curva
Grafica de líneas
Grafica de curvas
En la estadística las más usuales son las primeras tres
MEDIA: La forma de calcularse es de lo más simple, lo único que deberá hacerse es sumar
todos los datos de la muestra y al resultado final se le divide entre el total de datos de la
muestra.
MODA: Es el valor que permite visualizar cual o cuales datos son los de mayor número de
aperción, mayor frecuencia, que aparecen dentro de los datos muéstrales.
MEDIANA: Se debe de ubicar el dato que se encuentra colocado al centro de los datos
muéstrales y mide el valor que se encuentra al centro de los datos cuando estos están
ordenados.
Para ejemplificar estos datos tomaremos como referencia las edades de los alumnos
20 + 19 + 19 + 23 + 35 + 19 + 21 + 21 + 20 +25 + 19 = 241
Sumaremos las edades y los dividiremos entre el total de la muestra
241 / 11 = 21.9
Esta es nuestra media (x) 21.9
Para sacar la mediana acomodaremos nuestros datos de menor a mayor
19, 19, 19, 19, 20, 20, 21, 21, 23, 25, 35.
Mediana
Para saber la moda se debe de graficar.
alumnos
4.5
4
3.5
3
2.5
2
alumnos
1.5
1
0.5
0
19
20
21
23
25
35
Nuestra moda es 19 años ya que es la mayor frecuencia que se repite.
Cuando la moda existe, se puede tener diferentes formas de nombrar los datos en función de
ella, dependiendo de la cantidad de valores que presenten la mayor frecuencia.
Datos Bimodales: Es la muestra de datos cuando dos datos son los que tienen la misma
frecuencia.
1234554
En este ejemplo se puede observar que los datos de la muestra presentan dos modas el 4 y el
5.
Datos Trimodales: Son aquellos que presentan tres datos dentro de la muestra
12345543
En este ejemplo se puede observar que los valores 3, 4 y 5 son los que presentan mayor
frecuencia.
Datos Polimodales: En esa se tiene más de tres datos con igual frecuencia pero mayor al resto
122334455
En este ejemplo las modas son 2, 3, 4 y 5
Datos Amodales: Este es el término que se emplea a la serie de datos de la muestra cuando los
datos no tienen moda.
12345
En este ejemplo se puede observar que los datos tienen frecuencia 1, por lo cual esta muesta
es Amodal.
Bibliografía
UAM- X / TD – CBS, ESTADISTICA PARA ESTUDIANTES, México, 2000
Técnicas de probabilidad. Conceptos básicos.
Distribución: planteamiento de los posibles valores que pudiera adquirir un evento antes de que
este se haya realizado.
Variable: cualquier dato que puede ser sustituible en su valor.
Función: asociación entre un conjunto a y otro b, correspondiéndole un valor a cada uno.
Distribución discreta: probabilidad de que un evento sea diferente a 0. Es decir que pueda ocurrir.
Distribuciones continuas: hace referencia al número de eventos que se puede llegar a realizar
completos o enteros, es decir no pueden quedarse a la mitad.
Media: promedio de todos los datos de un evento.
Varianza: diferencia de resultados al ocurrir un evento.
Números aleatorios: tomar al azar datos de una muestra o experimento y se define un
procedimiento o sistema para esos números, es decir son organizados.
Intervalo de confianza: en toda investigación de muestreo hay errores en el promedio de los datos
obtenidos, para saber que tan incorrecto es esto se saca de los mismos datos del muestreo con
una formula.
Prueba de hipótesis: procedimiento mediante el cual se utilizan muestras aleatorias para decidir si
es aceptada o rechazada la hipótesis planteada.
III. MUESTREO
DEFINICIÓN DE POBLACIÓN Y MUESTRA
Dentro de los estudios estadísticos que se realizan, se tienen considerados dos principalmente, aquellos
donde se considera un censo para poder describir el comportamiento de los elementos que pertenecen
al área de estudio, la cual se conoce como Estadística Descriptiva, el otro caso es cuando el
investigador hace un estudio con una parte de los elementos pertenecientes al área de estudio y a partir
de los resultados efectúa una extrapolación del comportamiento a todos los elementos del espacio en
estudio, a esta se le llama Estadística Inferencial.
A partir de estos conceptos se pueden definir los espacios en los cuales se efectúa el estudio de cada
uno de los dos tipos de aplicación de la Estadística.
En la Estadística Descriptiva se puede observar que al trabajar con un censo se están considerando
todos los elementos que pertenecen al área de estudio para ser analizados o considerados para obtener
información, los cuales constituyen la Población de estudio o la Población del experimento.
En la Estadística Inferencial, (muestras de poblaciones infinitas), se considera que el trabajar con todos
los elementos resulta ser muy costoso por lo cuál no será necesario trabajar con todos ellos, lo que
significa que sólo será considerada una parte de la población. Al conjunto de elementos que forman
esta pequeña porción de la Población se le llama Muestra.
Poblacion
Todos los elementos que pertenecen a un conjunto universal, una colonia, una ciudad, un estado, un
país, un ecosistema, un hospital, un campo de cultivo, etc. se le llama Población.
La base de estudio de un proceso estadístico descriptivo.
Muestra
Todos los elementos que pertenecen a un subconjunto, una fracción de una colonia, una delegación de
una ciudad, una ciudad de un estado, un estado de un país, una fracción de un ecosistema, una sala de
un hospital, un zurco de un campo de cultivo, etc. se le llama Muestra de la Población.
La base de estudio de un proceso estadístico inferencial.
La Estadística se encarga básicamente del estudio de datos obtenidos de manera aleatoria o al azar, los
cuales son recopilados de experimentos que fueron diseñados cuidadosamente por los investigadores.
Estos datos forman las muestras obtenidas de un conjunto de datos mayor conocida como población.
Generalmente el término muestra se llega a confundir entre lo que el investigador considera de ella
comparada con el concepto que maneja el resto de la gente, para poder interpretar esto consideremos un
ejemplo sencillo.
Cuando el investigador desea llevar a cabo un estudio de comparación digamos que del peso entre dos
grupos de niños, a los cuales se les muestreará tomando los valores del peso entre los niños que fueron
seleccionados para el experimento.
Ya realizada la toma de los datos de peso de los niños de los dos grupos, la gente pensará que los niños
considerados es la muestra, mientras que el investigador realmente esta considerando los datos de los
pesos obtenidos de los dos grupos de niños como la muestra, ya que para los fines de su trabajo lo
importante es los pesos más que los niños, y estos son los valores de trabajo que son cuantitativos.
Otro de los conceptos que se manejan es cuando el investigador trabaja con una población, la cual
puede ser finitamente contable o infinitamente contable, (finita o infinita), estrictamente hablando las
poblaciones a trabajar son finitas, aunque cueste mucho trabajo o sea casi imposible el poder
cuantificarlas, por ejemplo los granitos de arena de la playa o del mar, realmente es una cantidad finita
de granitos los que existen, lo difícil es poder cuantificarlas, cuando se tienen este tipo de poblaciones
por fines prácticos se consideran como poblaciones infinitas.
Las técnicas de la Estadística Inferencial son las que se encargan del estudio de las muestras aleatorias
que fueron obtenidas de poblaciones consideradas como infinitas.
TÉCNICAS DE MUESTREO
En esta parte se explicarán algunas de las principales Técnicas de Muestreo que se emplean durante el
desarrollo de un trabajo de investigación, se debe entender que no son todas las que existen o están
disponibles para llevar a cabo un muestreo, también se deberá entender que estas se pueden combinar
entre si para poder formar una especial y acorde a las características necesarias para el trabajo y
hacerlas más eficientes.
Muestreo Aleatorio: Esta técnica de muestreo también es conocida como Muestreo al Azar, en éste se
aplican las leyes de la Probabilidad, en éste se considera que todos los elementos de la población tienen
la misma oportunidad (Probabilidad) de ser seleccionados para ser incluidos dentro de la muestra, las
formas de seleccionar la muestra puede variar, dependiendo de las reglas especificadas por el
investigador, una de las formas más comunes para seleccionar la muestra es emplear una tabla de
números aleatorios.
Muestreo Sistemático: este muestreo puede ser realizado de manera aleatoria o no aleatoria, lo
importante es que el recolector de muestras debe definir las reglas de manera exacta, y clara para la
obtención de la muestra, en este se deberá de seguir cada una de las reglas determinadas de manera
sistemática, es decir, como un sistema bien definido, sin salirse del esquema planteado como sistema de
recolección de datos.
El investigador define el sistema que se va a seguir durante el muestreo.
En este caso se considera que el investigador determinó que se tomaría la muestra en un cuadrante,
mientras que en el siguiente no durante el trayecto, de igual manera se estipuló que se recolectarían las
muestras en el trayecto de una línea, mientras que la línea contigua no sería considerada durante el
muestreo.
Muestreo Estratificado: En este tipo de muestreo lo importante es que el investigador conozca el lugar
o estrato donde se localiza o puede localizar la información o los datos que se requieren para emplearse
durante el desarrollo del proyecto. En este tipo de muestreo se determina que lugar es adecuado para
muestrear en función de las características del problema a resolver.
El investigador define el estrato donde se encuentra la información pertinente para realizar el muestreo.
En este caso el investigador en base a su experiencia determina en que lugar se encuentra la
información necesaria y pertinente para la realización del trabajo, es decir, ésta se encuentra en un lugar
específico del área donde se muestreará la población, esto es, se ubica en una posición o lugar en
particular y no en toda el área o espacio poblacional del sistema.
Muestreo por Cuadrantes: Para éste tipo de muestreo es necesario que el investigador utilice un plano
del área a muestrear, el plano es para poder dividirlo en cuadros (cuadrantes) los cuales serán
numerados en el orden deseado por el investigador, ya elaborada la división se procede a sortear los
cuadrantes que serán muestreados. En este caso se emplea el método aleatorio para la selección de los
cuadrantes.
Es empleado para obtener muestras de forma aleatoria tratando de cubrir el área a muestrear.
Este método es muy útil para poder trabajar dentro de una área relativamente homogénea, o en un lugar
donde el espacio a muestrear es muy grande, permite poder emplear el método aleatorio para que la
muestra recolectada sea más imparcial y permita obtener resultados que se puedan emplear para poder
inferir los resultados a la población.
Se debe tomar en cuenta que existen muchos métodos más, inclusive se puede generar un método
particular que se acomode a las características especiales de recolección de información para la
resolución del problema.
TAMAÑO DE LA MUESTRA
El Tamaño de la Muestra es un punto importante que se debe de cuidar al desarrollar cualquier trabajo
de investigación o experimentación Estadística Inferencial, ya que es el que permitirá que los
resultados obtenidos sean confiables para ser extrapolados a la población de estudio.
El tamaño de la muestra deberá de calcularse a partir de un muestreo piloto o si se conoce el tamaño
total de la población.
Para determinar el Tamaño de la Muestra es necesario que el investigador defina cual es el error que
quiere tener durante el desarrollo del trabajo o el nivel de confianza que desea obtener al extrapolar la
información.
IV. INTRODUCCION A LA PROBABILIDAD
PROBABILIDAD DEFINICION
En la estadística existen algunas técnicas para determinar el numero de resultados posibles en un
experimento a esto se le conoce como probabilidad.
EVENTOS EXCLUSIVOS
En el estudio de las probabilidades es muy frecuente el tratar de encontrar la oportunidad de que un
evento se lleve a cabo o suceda, por ejemplo cuando se lanza una moneda o cuando se selecciona una
carta de un mazo de 52 cartas, etc.
Se considera que un evento es exclusivo o excluyente o independiente cuando sólo uno puede suceder
sin estar sujeto al otro.
Si consideramos el ejemplo del lanzamiento de una moneda, esta al caer al piso solamente mostrará una
de las caras hacia arriba, mientras que la otra quedará colocada hacia abajo, en este caso al
experimentador le interesa la cara de la moneda que apunta hacia arriba y será única, aunque el valor
puede ser diferente - águila o sol, cara o cruz, etc. -. de tal forma que el resultado de la cara que muestre
la moneda al caer apuntando hacia arriba es independiente de la otra.
EVENTOS CON REEMPLAZO
Al realizar un estudio generalmente el investigador desea obtener información de una población,
cuando se aplica la selección del elemento a considerar todos los elementos que se encuentran dentro
de la población o la muestra de estudio tienen la misma oportunidad (probabilidad) de ser
seleccionados, al finalizar la primera colecta el individuo seleccionado es estudiado y reintegrado a la
población, de tal manera que este elemento puede volver a ser seleccionado, es decir, vuelve a
reintegrarse a la población y tendrá nuevamente la probabilidad de ser seleccionado.
A este procedimiento se le conoce como eventos con reemplazo.
EVENTOS SIN REEMPLAZO
Este tipo de eventos es similar al anterior, la única diferencia es que el elemento que se seleccionó
durante el procedimiento previo ya no puede ser seleccionado nuevamente, ya que no es reintegrado a
la población de estudio.
Descargar