ESTADISTICA Estudia los métodos científicos para recoger, organizar, resumir y analizar datos así como como para sacar conclusión validas y tomar decisiones razonables basadas en tal análisis. TIPOS DE DATOS EMPLEADOS EN LA ESTADISTICA Variables: Una variable es un símbolo como X, Y, H, x o B que puede tomar un conjunto prefijado de valores Variable discreta: Son todos esos datos que adquieren un valor entero, es decir que el intervalo entre cada uno de ellos es bien definido (1, 2, 3, 4,5…). Variable continua: Son todos aquellos que adquieren valores que consideran la parte fraccionaria (1, 1.1, 1.2, 1.3, 1.4, 1.5…2). REPRESENTACION DE LOS DATOS Los datos obtenidos deberán de representarse de manera adecuada para que su interpretación y análisis sea más sencilla. La forma más apropiada desde el punto de vista de la estadística son las representaciones Tabulares y las Graficas. REPRESENTACIÓN TABULAR El objetivo es generar una tabla que contenga la información de los datos obtenidos en la muestra y poder determinar algunos valores de importancia para su procesamiento posterior. Donde los renglones contengan la información del experimento, mientras que las columnas contienen los diferentes procesos que se aplicaran a los datos RENGLONES COLUMNAS COMO ELABORAR LA REPRESENTACION TABULAR 1.- Ya que se obtuvieron los datos el primer paso es ordenar de manera ascendente. 2.- La agrupación de los datos es en una TABLA DE FRECUENCIA. Con los datos ordenados se determinara el intervalo total de datos de la siguiente manera Valor mínimo menos Valor máximo = intervalo de datos Todos los intervalos de clase de la tabla deberán de ser exactamente iguales en longitud. Esto se lleva a cabo de la siguiente manera Valor mínimo + intervalos = valor máximo de intervalos Ya obtenidos los valores máximos y mínimos del primer intervalo se procede a calcular el siguiente, para ello se considera que el valor máximo del intervalo anterior será considerado como el valor mínimo del intervalo actual, la forma de calcular será exactamente igual al anterior y así sucesivamente se calculara todos los intervalos de la muestra, a esto se le llama intervalos de clase , los valores de esos intervalos forman una clase y el total de los valores de una clase se llama frecuencia. REPRESENTACIÓN GRAFICA Permite al observador o al lector poder interpretar de manera más sencilla el significado o el sentido que tiene los datos que se muestran se tienes las siguientes graficas: Grafica de Barras Grafica de sectores o pastel Grafica de dispersión de puntos Grafica de área bajo la curva Grafica de líneas Grafica de curvas En la estadística las más usuales son las primeras tres MEDIA: La forma de calcularse es de lo más simple, lo único que deberá hacerse es sumar todos los datos de la muestra y al resultado final se le divide entre el total de datos de la muestra. MODA: Es el valor que permite visualizar cual o cuales datos son los de mayor número de aperción, mayor frecuencia, que aparecen dentro de los datos muéstrales. MEDIANA: Se debe de ubicar el dato que se encuentra colocado al centro de los datos muéstrales y mide el valor que se encuentra al centro de los datos cuando estos están ordenados. Para ejemplificar estos datos tomaremos como referencia las edades de los alumnos 20 + 19 + 19 + 23 + 35 + 19 + 21 + 21 + 20 +25 + 19 = 241 Sumaremos las edades y los dividiremos entre el total de la muestra 241 / 11 = 21.9 Esta es nuestra media (x) 21.9 Para sacar la mediana acomodaremos nuestros datos de menor a mayor 19, 19, 19, 19, 20, 20, 21, 21, 23, 25, 35. Mediana Para saber la moda se debe de graficar. alumnos 4.5 4 3.5 3 2.5 2 alumnos 1.5 1 0.5 0 19 20 21 23 25 35 Nuestra moda es 19 años ya que es la mayor frecuencia que se repite. Cuando la moda existe, se puede tener diferentes formas de nombrar los datos en función de ella, dependiendo de la cantidad de valores que presenten la mayor frecuencia. Datos Bimodales: Es la muestra de datos cuando dos datos son los que tienen la misma frecuencia. 1234554 En este ejemplo se puede observar que los datos de la muestra presentan dos modas el 4 y el 5. Datos Trimodales: Son aquellos que presentan tres datos dentro de la muestra 12345543 En este ejemplo se puede observar que los valores 3, 4 y 5 son los que presentan mayor frecuencia. Datos Polimodales: En esa se tiene más de tres datos con igual frecuencia pero mayor al resto 122334455 En este ejemplo las modas son 2, 3, 4 y 5 Datos Amodales: Este es el término que se emplea a la serie de datos de la muestra cuando los datos no tienen moda. 12345 En este ejemplo se puede observar que los datos tienen frecuencia 1, por lo cual esta muesta es Amodal. Bibliografía UAM- X / TD – CBS, ESTADISTICA PARA ESTUDIANTES, México, 2000 Técnicas de probabilidad. Conceptos básicos. Distribución: planteamiento de los posibles valores que pudiera adquirir un evento antes de que este se haya realizado. Variable: cualquier dato que puede ser sustituible en su valor. Función: asociación entre un conjunto a y otro b, correspondiéndole un valor a cada uno. Distribución discreta: probabilidad de que un evento sea diferente a 0. Es decir que pueda ocurrir. Distribuciones continuas: hace referencia al número de eventos que se puede llegar a realizar completos o enteros, es decir no pueden quedarse a la mitad. Media: promedio de todos los datos de un evento. Varianza: diferencia de resultados al ocurrir un evento. Números aleatorios: tomar al azar datos de una muestra o experimento y se define un procedimiento o sistema para esos números, es decir son organizados. Intervalo de confianza: en toda investigación de muestreo hay errores en el promedio de los datos obtenidos, para saber que tan incorrecto es esto se saca de los mismos datos del muestreo con una formula. Prueba de hipótesis: procedimiento mediante el cual se utilizan muestras aleatorias para decidir si es aceptada o rechazada la hipótesis planteada. III. MUESTREO DEFINICIÓN DE POBLACIÓN Y MUESTRA Dentro de los estudios estadísticos que se realizan, se tienen considerados dos principalmente, aquellos donde se considera un censo para poder describir el comportamiento de los elementos que pertenecen al área de estudio, la cual se conoce como Estadística Descriptiva, el otro caso es cuando el investigador hace un estudio con una parte de los elementos pertenecientes al área de estudio y a partir de los resultados efectúa una extrapolación del comportamiento a todos los elementos del espacio en estudio, a esta se le llama Estadística Inferencial. A partir de estos conceptos se pueden definir los espacios en los cuales se efectúa el estudio de cada uno de los dos tipos de aplicación de la Estadística. En la Estadística Descriptiva se puede observar que al trabajar con un censo se están considerando todos los elementos que pertenecen al área de estudio para ser analizados o considerados para obtener información, los cuales constituyen la Población de estudio o la Población del experimento. En la Estadística Inferencial, (muestras de poblaciones infinitas), se considera que el trabajar con todos los elementos resulta ser muy costoso por lo cuál no será necesario trabajar con todos ellos, lo que significa que sólo será considerada una parte de la población. Al conjunto de elementos que forman esta pequeña porción de la Población se le llama Muestra. Poblacion Todos los elementos que pertenecen a un conjunto universal, una colonia, una ciudad, un estado, un país, un ecosistema, un hospital, un campo de cultivo, etc. se le llama Población. La base de estudio de un proceso estadístico descriptivo. Muestra Todos los elementos que pertenecen a un subconjunto, una fracción de una colonia, una delegación de una ciudad, una ciudad de un estado, un estado de un país, una fracción de un ecosistema, una sala de un hospital, un zurco de un campo de cultivo, etc. se le llama Muestra de la Población. La base de estudio de un proceso estadístico inferencial. La Estadística se encarga básicamente del estudio de datos obtenidos de manera aleatoria o al azar, los cuales son recopilados de experimentos que fueron diseñados cuidadosamente por los investigadores. Estos datos forman las muestras obtenidas de un conjunto de datos mayor conocida como población. Generalmente el término muestra se llega a confundir entre lo que el investigador considera de ella comparada con el concepto que maneja el resto de la gente, para poder interpretar esto consideremos un ejemplo sencillo. Cuando el investigador desea llevar a cabo un estudio de comparación digamos que del peso entre dos grupos de niños, a los cuales se les muestreará tomando los valores del peso entre los niños que fueron seleccionados para el experimento. Ya realizada la toma de los datos de peso de los niños de los dos grupos, la gente pensará que los niños considerados es la muestra, mientras que el investigador realmente esta considerando los datos de los pesos obtenidos de los dos grupos de niños como la muestra, ya que para los fines de su trabajo lo importante es los pesos más que los niños, y estos son los valores de trabajo que son cuantitativos. Otro de los conceptos que se manejan es cuando el investigador trabaja con una población, la cual puede ser finitamente contable o infinitamente contable, (finita o infinita), estrictamente hablando las poblaciones a trabajar son finitas, aunque cueste mucho trabajo o sea casi imposible el poder cuantificarlas, por ejemplo los granitos de arena de la playa o del mar, realmente es una cantidad finita de granitos los que existen, lo difícil es poder cuantificarlas, cuando se tienen este tipo de poblaciones por fines prácticos se consideran como poblaciones infinitas. Las técnicas de la Estadística Inferencial son las que se encargan del estudio de las muestras aleatorias que fueron obtenidas de poblaciones consideradas como infinitas. TÉCNICAS DE MUESTREO En esta parte se explicarán algunas de las principales Técnicas de Muestreo que se emplean durante el desarrollo de un trabajo de investigación, se debe entender que no son todas las que existen o están disponibles para llevar a cabo un muestreo, también se deberá entender que estas se pueden combinar entre si para poder formar una especial y acorde a las características necesarias para el trabajo y hacerlas más eficientes. Muestreo Aleatorio: Esta técnica de muestreo también es conocida como Muestreo al Azar, en éste se aplican las leyes de la Probabilidad, en éste se considera que todos los elementos de la población tienen la misma oportunidad (Probabilidad) de ser seleccionados para ser incluidos dentro de la muestra, las formas de seleccionar la muestra puede variar, dependiendo de las reglas especificadas por el investigador, una de las formas más comunes para seleccionar la muestra es emplear una tabla de números aleatorios. Muestreo Sistemático: este muestreo puede ser realizado de manera aleatoria o no aleatoria, lo importante es que el recolector de muestras debe definir las reglas de manera exacta, y clara para la obtención de la muestra, en este se deberá de seguir cada una de las reglas determinadas de manera sistemática, es decir, como un sistema bien definido, sin salirse del esquema planteado como sistema de recolección de datos. El investigador define el sistema que se va a seguir durante el muestreo. En este caso se considera que el investigador determinó que se tomaría la muestra en un cuadrante, mientras que en el siguiente no durante el trayecto, de igual manera se estipuló que se recolectarían las muestras en el trayecto de una línea, mientras que la línea contigua no sería considerada durante el muestreo. Muestreo Estratificado: En este tipo de muestreo lo importante es que el investigador conozca el lugar o estrato donde se localiza o puede localizar la información o los datos que se requieren para emplearse durante el desarrollo del proyecto. En este tipo de muestreo se determina que lugar es adecuado para muestrear en función de las características del problema a resolver. El investigador define el estrato donde se encuentra la información pertinente para realizar el muestreo. En este caso el investigador en base a su experiencia determina en que lugar se encuentra la información necesaria y pertinente para la realización del trabajo, es decir, ésta se encuentra en un lugar específico del área donde se muestreará la población, esto es, se ubica en una posición o lugar en particular y no en toda el área o espacio poblacional del sistema. Muestreo por Cuadrantes: Para éste tipo de muestreo es necesario que el investigador utilice un plano del área a muestrear, el plano es para poder dividirlo en cuadros (cuadrantes) los cuales serán numerados en el orden deseado por el investigador, ya elaborada la división se procede a sortear los cuadrantes que serán muestreados. En este caso se emplea el método aleatorio para la selección de los cuadrantes. Es empleado para obtener muestras de forma aleatoria tratando de cubrir el área a muestrear. Este método es muy útil para poder trabajar dentro de una área relativamente homogénea, o en un lugar donde el espacio a muestrear es muy grande, permite poder emplear el método aleatorio para que la muestra recolectada sea más imparcial y permita obtener resultados que se puedan emplear para poder inferir los resultados a la población. Se debe tomar en cuenta que existen muchos métodos más, inclusive se puede generar un método particular que se acomode a las características especiales de recolección de información para la resolución del problema. TAMAÑO DE LA MUESTRA El Tamaño de la Muestra es un punto importante que se debe de cuidar al desarrollar cualquier trabajo de investigación o experimentación Estadística Inferencial, ya que es el que permitirá que los resultados obtenidos sean confiables para ser extrapolados a la población de estudio. El tamaño de la muestra deberá de calcularse a partir de un muestreo piloto o si se conoce el tamaño total de la población. Para determinar el Tamaño de la Muestra es necesario que el investigador defina cual es el error que quiere tener durante el desarrollo del trabajo o el nivel de confianza que desea obtener al extrapolar la información. IV. INTRODUCCION A LA PROBABILIDAD PROBABILIDAD DEFINICION En la estadística existen algunas técnicas para determinar el numero de resultados posibles en un experimento a esto se le conoce como probabilidad. EVENTOS EXCLUSIVOS En el estudio de las probabilidades es muy frecuente el tratar de encontrar la oportunidad de que un evento se lleve a cabo o suceda, por ejemplo cuando se lanza una moneda o cuando se selecciona una carta de un mazo de 52 cartas, etc. Se considera que un evento es exclusivo o excluyente o independiente cuando sólo uno puede suceder sin estar sujeto al otro. Si consideramos el ejemplo del lanzamiento de una moneda, esta al caer al piso solamente mostrará una de las caras hacia arriba, mientras que la otra quedará colocada hacia abajo, en este caso al experimentador le interesa la cara de la moneda que apunta hacia arriba y será única, aunque el valor puede ser diferente - águila o sol, cara o cruz, etc. -. de tal forma que el resultado de la cara que muestre la moneda al caer apuntando hacia arriba es independiente de la otra. EVENTOS CON REEMPLAZO Al realizar un estudio generalmente el investigador desea obtener información de una población, cuando se aplica la selección del elemento a considerar todos los elementos que se encuentran dentro de la población o la muestra de estudio tienen la misma oportunidad (probabilidad) de ser seleccionados, al finalizar la primera colecta el individuo seleccionado es estudiado y reintegrado a la población, de tal manera que este elemento puede volver a ser seleccionado, es decir, vuelve a reintegrarse a la población y tendrá nuevamente la probabilidad de ser seleccionado. A este procedimiento se le conoce como eventos con reemplazo. EVENTOS SIN REEMPLAZO Este tipo de eventos es similar al anterior, la única diferencia es que el elemento que se seleccionó durante el procedimiento previo ya no puede ser seleccionado nuevamente, ya que no es reintegrado a la población de estudio.