Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. Estadística ¿ Qué es la estadística? La estadística es la parte de las matemáticas que se ocupa de los métodos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis. Importancia de la Estadística Lo interesante de la estadística como ciencia es que en muchos casos, la información cuantitativa que nos brinda nos permite conocer mucho mejor a una sociedad, por ejemplo cuántas personas viven en un país, cuál es la tasa de desempleo, cuál es la tasa de indigencia o pobreza, cuál es el nivel promedio de educación de esa sociedad, etc La estadística tiene una utilidad no sólo en aspectos sociales si no que también sirve para todo tipo de investigación científica si se tiene en cuenta que los datos estadísticos son el resultado de varios casos de entre los cuales se toma un promedio. Así, una estadística puede servir para una investigación científica al demostrar que un porcentaje determinado de los casos observados representó un resultado particular y no otro. Aplicaciones de la estadística La estadística es una ciencia de aplicación práctica casi universal en todos los campos científicos, aunque comúnmente se asocie a estudios demográficos, económicos y sociológicos, gran parte de los logros de la estadística se derivan del interés de los científicos por desarrollar modelos que expliquen el comportamiento de las propiedades de la materia y de los caracteres biológicos. La medicina, la biología, la física y, en definitiva, casi todos los campos de las ciencias emplean instrumentos estadísticos de importancia fundamental para el desarrollo de sus modelos de trabajo. Estadística Descriptiva: es la parte de la estadística que describe el comportamiento de los datos mediante las medidas de posición y dispersión 1 Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. Estadística Inferencial: es la parte de la estadística que se basa en los resultados obtenidos en la Estadística Descriptiva para establecer conclusiones de un experimento, tomar decisiones sobre él y poder predecir fenómenos. Fenómenos deterministicos y aleatorios Un experimento o fenómeno es determinista si se obtiene el mismo resultado cuando se repite el experimento en las mismas condiciones. Ejemplos Después de las 6:00 son las 7:00. Después del día sigue la noche. Un experimento o fenómeno es aleatorio (o estocástico) cuando al repetir el experimento en igualdad de condiciones los resultados varían, a pesar de mantener constantes las condiciones con las que se realiza el experimento. Ejemplos Al lanzar una moneda al aire, se ignora si saldrá cara o sello. Al lanzar un dado al aire, no se sabe qué número saldrá. Ejercicios. En el siguiente listado, escribe si corresponden a un suceso determinista o aleatorio. a. Ganar el premio de la lotería……………….. c. Bañarse todos los días………………………….. d. La semana tiene 7 días…………………………. e. Ganar la tómbola del carro…………………… f. Después de miércoles sigue jueves…….. g. Diciembre tiene 31 días…………………………. 2 Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. h. Alimentarse al medio día……………………….. i. Ganar la competencia de natación………… j. El año tiene 12 meses……………………………… Población y muestra Población: es un conjunto de objetos o personas que tienen características comunes y que son objeto de estudio. Existen poblaciones finitas e infinitas. Cuando la población se considera finita el estudio se hace caso a caso; si la población se considera infinita el estudio se hace mediante un plan de muestreo, esto es elegir una muestra de la población. Ejemplos de población finita: los alumnos de un curso; los pacientes de un hospital; los neumáticos producidos por una fábrica; los votantes de una comuna; las calculadoras; etc. Ejemplo de población infinita: la población que consta de todos los resultados posibles (cara o sello) en lanzamientos sucesivos de una moneda. Muestra: es un conjunto formado por una parte de la población, y por ende posee las mismas características de esta, como por ejemplo, los profesores del área de Matemática. Ejemplos de muestra: 1.820 televidentes escogidos al azar; los automovilistas que acceden a contestar una encuesta de opinión; las cajas de leche que se analizan cada hora en una fábrica; etc. Variables Variable: es una característica que se desea estudiar en una población (característica de interés de una población o muestra). Las variables se anotan con letras mayúsculas X, Y, Z, W, etc. Ejemplos: X = Edad de los estudiantes de un Instituto Profesional. Y = Sueldos de los empleados de la cadena DYS. Z = Nivel educacional del personal de la empresa DYS. W = Raza de la población de Sudamérica. 3 Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. Clasificación de las Variables. Las variables se clasifican según su recorrido en 2 grupos: 1) Cuantitativas: son aquellas cuyo recorrido es un conjunto de números. Este grupo se divide en dos tipos, discretas y continuas. a) Discretas: son aquellas variables que pueden tomar únicamente valores enteros dentro de una categoría o intervalo. Ejemplos; número de hijos de una familia, número de tiradas de un dado hasta obtener el primer uno, etc. b) Continuas: son aquellas variables que pueden tomar cualquier valor real dentro de un intervalo. Ejemplos; el agua caída en Santiago durante un año cualquiera, la temperatura, la estatura de las personas, el tiempo necesario para realizar una transacción bancaria de parte del cliente, etc. 2) Cualitativas o Atributos: son aquellas cuyo recorrido es un conjunto de conceptos (sexo, profesión, color de ojos, etc.). Este grupo se divide en dos tipos, ordinales y nominales. a) Ordinales: el recorrido puede ser ordenado. Ejemplos; nivel socioeconómico que puede ser alto, medio o bajo; los grados religiosos, etc. b) Nominales: el recorrido no se puede ordenar. Ejemplos; nacionalidad, religión, colores de vehículos, etc. Ejemplos para Clasificación de Variables: En las siguientes variables clasificar e identificar la población: a) X = Número de hijos de un grupo de 40 familias. Variable = número de hijos. Población = 40 familias. Clasificación = cuantitativa – discreta. b) Z = Cargos de los empleados de la empresa ALFA. Variable = cargos. Población = empleados de la empresa ALFA. Clasificación = cualitativa – ordinal. c) W = Sexo de los empleados del Supermercado Santa Isabel. Variable = sexo. 4 Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. Población = empleados del Supermercado Santa Isabel. Clasificación = cualitativa – nominal. 3. Variables dependiente e independiente. La definición para variable “dependiente” e “independiente” se utilizan para representar una relación de “causalidad” entre dos variables. La relación es la siguiente: el valor de la variable dependiente ‘depende’ del valor de la variable independiente. Utilizando otros términos, la variable independiente “causa” la variable dependiente. Ejemplo 1. La cantidad de dinero pagado por un kilo de pan Variable dependiente: La cantidad de dinero pagado. Variable independiente: El kilo de pan. 2. La nota que obtuve en el examen y lo que estudié Variable dependiente: La nota que obtuve en el examen. Variable independiente: Lo que estudié. 5 Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. Organización de los Datos. Existen dos maneras de organizar un conjunto de datos: 1. A través de Tablas de Frecuencias, que se dividen en las siguientes columnas: a) Frecuencia Absoluta f i : Representa el número de elementos de la población que toma el valor f i de la variable, es decir, el número de veces que se repite la variable. En una tabla N = tamaño de la población o muestra. Ejemplo: la siguiente tabla muestra el número de hijos de 25 familias. Interprete la tabla. Interpretación: interpretaremos las siguientes frecuencias absolutas de la tabla. f1= 10 familias tienen 0 hijo. f3 =7 familias tienen 2 hijos. Frecuencia Relativa y Relativa porcentual h i y h i (%): La frecuencia relativa representa el cociente entre la frecuencia absoluta de la variable y el número total de datos estudiados, mientras que la frecuencia relativa porcentual representa el tanto por ciento ciento (%) de los valores o datos que toman el valor h i de la variable. Observe que la frecuencia relativa toma valores entre 0 y 1 y su suma debe ser 1, mientras que la frecuencia relativa porcentual toma valores entre 0% y 100% y la suma de todos los porcentajes de los valores de la variable es 100%. Ejemplo: del ejemplo anterior calcule la Frecuencia Relativa y Frecuencia Relativa Porcentual interprete esa columna. 6 Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. Interpretación: interpretaremos las siguientes frecuencias relativas de la tabla. h2 (%) El 24% de las familias tienen 1 hijo. h4 (%) El 8% de las familias tienen 3 hijos. Frecuencia Absoluta Acumulada F i : Representa el número de elementos de la población que toma el valor F i acumulado de la variable. Ejemplo: del ejemplo anterior calcule la Frecuencia Absoluta Acumulada e interprete esa columna. Interpretación: interpretaremos las siguientes frecuencias absolutas acumuladas de la tabla. F2 16 familias tienen a lo más 1 hijo. F4 25 familias tienen a lo más 3 hijos. Frecuencia Relativa Acumulada y Relativa Porcentual Acumulada H i y H i (%) : La frecuencia relativa acumulada representa a la frecuencia relativa acumulada de los valores que toma el h i de la variable mientras que la frecuencia relativa porcentual acumulada representa el tanto por ciento (%) acumulado de los valores o datos que toman el valor hi de la variable. Ejemplo: del ejemplo anterior calcule la Frecuencia Relativa Porcentual Acumulada e interprete esa columna. 7 Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. Interpretación: interpretaremos las siguientes frecuencias relativas acumuladas de la tabla. H 2 El 64% de las familias tienen a lo más 1 hijo. H3 El 92% de las familias tienen a lo más 2 hijos. 2. A través de Gráficos: se usan para tener una idea inmediata y simple de la población. Aun cuando las tablas estadísticas contienen toda la información, muchas veces es necesario hacer la representación gráfica de ellas; en otros casos, a partir de un gráfico se construye la tabla estadística Existen gráficos de barras, gráficos circulares (el gráfico circular se usa para mostrar porcentajes, es decir, la proporción que cada parte es del total), gráfico lineal (el gráfico lineal se utiliza normalmente para mostrar la evolución de un dato a lo largo del tiempo), histograma, polígono de frecuencias, etc. Para construir un gráfico de barras se tendrá en cuenta. La longitud del eje vertical debe ser aproximadamente del 75% de la longitud del eje horizontal Todas las barras deben tener el mismo ancho Debe indicar el significado del eje horizontal y vertical Sobre el gráfico debe escribir el titulo de la información El gráfico debe ser atractivo a la vista Grafico de líneas Este grafico se construye uniendo puntos cuyas coordenadas son los valores de la variable y la frecuencia 8 Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. Grafico circular Consiste en dividir el círculo proporcionalmente a la frecuencia Donde N: Número total de datos Fi : frecuencia absoluta 9 Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. Ejemplo: Dada la siguiente tabla, expresar los datos en gráficos de barra y circular. 10 Curso: Estadística. Profesor: Gigliola Emilena L. Oyarzo Naranjo. Ejercicio Realicen una encuesta en el curso, construyan una tabla de frecuencias, grafico e identifique las variables y su tipo, luego interprete F2, h2, F1, h4, f2, f1, H1, H2, h3(%), h1(%), H3(%), H1(%). 11