FORO EVALUABLE - TAREA FINAL TITULO: Mi material educativo bilingüe. Consiste en la redacción completa y absolutamente detallada de una actividad en el aula que cubra 1 hora de clase. Contenido sobre estadística que se pueda incluir en Secundaria o Bachillerato. Puede ser teórico y/o práctico, pero en todo caso debe incluir explicaciones y ser lo mas parecido posible a una sección de clase normal. El objetivo que se persigue es que lo que se envíe cada uno pueda valer para cualquier profesor sin que tenga que hacer ningún trabajo adicional. La tarea se presentará en dos idiomas. AUTOR: JUAN VICENTE GONZÁLEZ OVANDO CLASE DIRIGIDO A: 3º - 4º ESO – INICIO DE CLASE. UNIDAD: ESTADÍSTICA UNIDIMENSIONAL INTRODUCCION: En esta unidad didáctica recordaremos alguno de los conceptos importantes de la estadística unidimensional (frecuencias, población, muestra, etc.) . Primeramente a través de un ejercicio práctico para luego pasar a ejercicios de captación de conceptos y definiciones basados en repeticiones constantes. La presente clase propuesta esta basado en mi experiencia, tanto en mi etapa de estudiante así como también docente. Como alumno, no lograba el entendimiento y por tanto el desinterés de la parte teórica hasta luego de realizar algunos ejercicios prácticos. Como profesor, lograr captar el interés, atención y retención de los estudiantes en las explicaciones teóricas para interpretación de los resultados numéricos. El desarrollo de la clase se realiza en 4 etapas: el profesor/a primeramente plantea un problema práctico y lo resuelven, posteriormente se realizan ejercicios de lecturas y continuas repeticiones, por lo cual el alumno logrará acostumbrarse a prestar interés a los conceptos; pueda así retener y entender durante la clase los términos estudiados. OBJETIVO: • • • • • Deducir, entender, retener algunos conceptos y definiciones estadísticas. Lograr el interés de los conceptos y definiciones a fin de interpretar los resultados numéricos. Realizar un ejercicio práctico de cálculo estadístico: calcular las media, moda y mediana. Calcular las medidas de dispersión. Lograr que los alumnos puedan realizar un ejercicio teórico y práctico de Estadística en una misma clase. Proveer al profesor/a el material completo para el desarrollo de la clase. PROCEDIMIENTO: La actividad será desarrollada en 4 etapas: 1º) Resolución de un ejercicio práctico desarrollado por el profesor con los alumnos: El profesor presenta a los alumnos un problema y los resuelve en una hoja preparada para completarlo directamente en la misma. El objetivo es que los alumnos primeramente realicen un ejercicio práctico de estadística con el conocimiento básico que ya poseen. 2º) Trabajo grupal competitivo para introducir algunos conceptos y definiciones de estadística: El profesor debe imprimir y cortar el listado de conceptos y definiciones para repartir a los alumnos. El objetivo es lograr el interés de los alumnos en la lectura y atención de los conceptos y definiciones. 3º) Ejercicio individual de repetición y lectura de conceptos y definiciones: El profesor debe llevar fotocopiado el ejercicio presentado para esta etapa. El objetivo es que el alumno preste atención en la lectura y logre recordar los conceptos y definiciones. 4º) Ejercicio final individual: práctico y teórico. El profesor debe imprimir y fotocopiar los ejercicios de esta unidad. Afianzar los conocimientos adquiridos en la presente clase. DESARROLLO DE LA CLASE 1ª ETAPA: La profesora expone lo siguiente: Una empresa de confección de uniformes ha sido contratada por un Instituto para preparar los uniformes de graduación de sus alumnos. Queremos saber cual es la talla media de los alumnos que están en el Bachillerato. Pero la población de todos los estudiantes (individuos, elementos, unidades estadísticas) son demasiados para medirlos a cada uno de ellos. Tomaron en observación entonces una muestra de los alumnos de un instituto en particular y se han anotado las tallas (variables) medidas en cm de 40 alumnos. Las tallas toman diferentes valores que son magnitudes numéricas (variables cuantitativas). Las tallas de los 40 individuos tomados como muestra son las siguientes: 166, 165, 167, 167, 181, 151, 177, 170, 171, 163, 171, 169, 158, 162, 165, 168, 156, 178, 172, 165, 167, 173, 168, 158, 163, 171, 169, 163, 170, 176, 161, 158, 164, 170, 178, 173, 171, 169, 166,158. Resolución: Pasemos entonces a realizar los cálculos. Hacemos primeramente el conteo de cada unidad utilizando el método de diagrama del árbol. 1º leyendo las variables en el orden en que están 15 16 17 18 1 6 7 1 8 5 0 6 7 1 8 7 1 8 3 8 8 9 2 2 3 5 1 8 0 5 6 7 0 8 8 3 3 9 1 3 1 4 9 6 2º ordenando las variables de menor a mayor para luego ingresarlo en la planilla No.1 desde el menor a mayor con sus frecuencias. 15 16 17 18 1 1 0 1 6 2 0 8 3 0 8 3 1 8 3 1 8 4 1 5 1 5 2 5 3 6 3 6 6 7 7 7 8 7 8 8 8 9 9 9 Presentamos entonces a los alumnos la planilla No.1 para completarlo directamente en el mismo. La tabla debe quedar completada como sigue: MARCA FRECUENCIA FRECUENCIA DE CLASE ABSOLUTA RELATIVA Xi fi fr fa fra fi * Xi 151 1 0,025 1 0,025 151 156 1 0,025 2 0,050 156 158 4 0,100 6 0,150 632 161 1 0,025 7 0,175 161 162 1 0,025 8 0,200 162 163 3 0,075 11 0,275 489 164 1 0,025 12 0,300 164 165 3 0,075 15 0,375 495 166 2 0,050 17 0,425 332 167 3 0,075 20 0,500 501 168 2 0,050 22 0,550 336 169 3 0,075 25 0,625 507 170 3 0,075 28 0,700 510 171 4 0,100 32 0,800 684 172 1 0,025 33 0,825 172 173 2 0,050 35 0,875 346 176 1 0,025 36 0,900 176 177 1 0,025 37 0,925 177 178 2 0,050 39 0,975 356 181 1 0,025 40 1,000 181 ∑ 40 1,000 (fi * Xi) / n = 6688/40 = 167,2 FRECUENCIA ABSOLUTA ACUMULADA FRECUENCIA RELATIVA ACUMULADA MEDIA ARITMETICA 6688,00 =X La mediana Me = (167 – 168) / 2 = 167,50 (MEDIA) La Moda Mo = 158 y 171 cm. (bimodal) Luego, el profesor/a propone a los alumnos: - Aprovechemos y vamos a calcular que porcentaje de individuos que se encuentran en un intervalo de valores, es decir vamos a analizar como están distribuidos y dispersos las tallas o valores de las variables. Para ello utilizaremos otro cálculo estadístico de Medidas de Dispersión como el ¨rango¨, la varianza y la desviación típica. El rango es: Xi Max – Xi min = 181 – 151 = 30 cms. Completemos las columnas de nuestra tabla de frecuencia para calcular otras medidas de dispersión. La tabla debe quedar como sigue: DESVIACION MEDIA Xi - X Xi - X∗ f i VARIANZA ( Xi - X ) ² ( Xi - X ) ² * f i 16,20 16,20 262,44 262,44 11,20 11,20 125,44 125,44 9,20 36,80 84,64 338,56 6,20 6,20 38,44 38,44 5,20 5,20 27,04 27,04 4,20 12,60 17,64 52,92 3,20 3,20 10,24 10,24 2,20 6,60 4,84 14,52 1,20 2,40 1,44 2,88 0,20 0,60 0,04 0,12 0,80 1,60 0,64 1,28 1,80 5,40 3,24 9,72 2,80 8,40 7,84 23,52 3,80 15,20 14,44 57,76 4,80 4,80 23,04 23,04 5,80 11,60 33,64 67,28 8,80 8,80 77,44 77,44 9,80 9,80 96,04 96,04 10,80 21,60 116,64 233,28 13,80 13,80 190,44 190,44 ∑ 202,00 1652,40 La desviación Media es: DM = ( ∑Xi - X∗ f i ) / n = 202 / 40 = 5,05 cm 2 La Variaza es: S = (∑ ( Xi - X ) ² * f i ) / n = 1652,40 / 40 = 41,31 La desviación típica es: δ = Ѵ S2 = Ѵ (41,31) = 6,42 Calculemos el porcentaje de alumnos que están en el siguiente intervalo I1 = ( X – S ; X + S ) = ( 167,2 – 6,42 ; 167,2 + 6,42 ) = (160,78 ; 173,62) Contamos cuantas variables se encuentran en este intervalo I1 Encontramos que hay 29 variables, calculemos el porcentaje: (29 / 40)*100 = 72 % de los datos están dentro del intervalo 1 Calculemos el porcentaje de alumnos que están en el siguiente intervalo I2 = ( X – 2S ; X + 2S ) = ( 167,2 – 2*6,42 ; 167,2 + 2*6,42 ) = = (154,34 ; 180,05) Contamos cuantas variables se encuentran en este intervalo I2 Encontramos que hay 38 variables, calculemos el porcentaje: (38 / 40)*100 = 95 % de los datos están dentro del intervalo 2. --------------------------------------------------------------------------------------------------2ª ETAPA: Una vez que el profesor/a haya terminado el ejercicio de cálculos numéricos con los alumnos, propone separar la clase en dos grupos iguales: A) El grupo de los ¨ conceptos ¨ B) El grupo de las ¨ definiciones ¨ En pequeñas hojas separadas entrega en forma aleatoria un concepto a cada uno de los alumnos del Grupo A. Análogamente, en hojas separadas entrega una definición en forma aleatoria a cada alumno del grupo B. El profesor/a elije al azar un alumno del grupo A y lee el concepto que tiene en su poder. Cada alumno del grupo B tiene que leer la definición que tiene y el que crea tener la definición correcta se levanta y lo lee. De ser correcto la definición, el grupo B logra 1 punto, de ser incorrecto logra - 0,5 punto. Análogamente, a continuación empieza el grupo B. La profesora elije al azar un alumno de este grupo, este alumno lee la definición que tiene. El alumno del Grupo A debe decir a que concepto corresponde la definición dada del grupo B. De ser correcto el concepto, el grupo A logra 1 punto, de ser incorrecto obtiene – 0,5 punto. NOTA: El listado de conceptos y definiciones esta copiado en la siguiente etapa. 3ª ETAPA Con los mismos conceptos y definiciones del ejercicio anterior (2ª etapa), la profesora entrega a los alumnos el listado de conceptos y definiciones. Cada alumno debe leer, recordar y analizar de tal forma a unir (con flecha) los conceptos de la primera columna con las definiciones de la segunda columna. Aunque pareciera este ejercicio de muy básico, obliga a cada alumno a leer, a razonar, prestar atención en lo que lee y a recordar. A continuación esta el listado correcto de conceptos y definiciones para guia del profesor en momento de corregir este ejercicio. CONCEPTOS POBLACION DEFINICIONES . CONJUNTO DE SERES U OBJETOS ACERCA DE LOS QUE SE DESEA OBTENER UNA INFORMACIÓN UNIDAD ESTADÍSTICA INDIVIDUO ELEMENTO CADA UNO DE LOS MIEMBROS DE UNA POBLACIÓN. ESTADÍSTICA ES LA CIENCIA QUE ESTUDIA, MEDIANTE MÉTODOS CUANTITATIVOS CARACTERÍSTICAS DE LAS POBLACIONES OBTENIDAS COMO SÍNTESIS DE LA OBSERVACIÓN DE UNIDADES ESTADÍSTICAS. CENSO CONSISTE EN ANOTAR DETERMINADAS CARACTERÍSTICAS DE TODOS LOS INDIVIDUOS DE UNA POBLACIÓN. ESTADÍSTICA DESCRITIVA ES LA PARTE DE LA ESTADÍSTICA QUE ESTUDIA LAS IDEAS, MÉTODOS Y TÉCNICAS PARA LA DESCRIPCIÓN GRÁFICA Y NUMÉRICA DE LOS CONJUNTOS NUMEROSOS. MUESTRA SUBCONJUNTO DE INDIVIDUOS QUE SON OBSERVADOS PARA OBTENER INFORMACIÓN SOBRE EL TOTAL DE LA POBLACIÓN A QUE PERTENECE. INFERENCIA ESTADÍSTICA ES LA PARTE DE LA ESTADÍSTICA QUE ESTUDIA LOS MÉTODOS PARA ESTABLECER CONCLUSIONES SOBRE UNA POBLACIÓN A PARTIR DE UNA MUESTRA DE LA MISMA. VARIABLES ESTADÍSTICAS, VARIABLES MODALIDADES UNA VARIABLE ATRIBUTOS, CUALIDADES O MAGNITUDES NUMÉRICAS QUE SE OBSERVAN EN LOS INDIVIDUOS DE LA POBLACIÓN DE VALORES DE UNA VARIABLE. MODALIDADES INCOMPATIBLES MODALIDADES EXHAUSTIVOS VALORES INCOMPATIBLES VALORES EXHAUSTIVOS ATRIBUTOS O CUALIDADES MAGNITUDES NUMÉRICAS. TODA UNIDAD ESTADISTICA, INDIVIDUO O ELEMENTO PUEDE PRESENTAR UNA Y SOLAMENTE UNA MODALIDAD OBSERVACIÓN CONJUNTO DE MODALIDADES O VALORES DE CADA VARIABLE MEDIDOS EN UN INDIVIDUO, ELEMENTO O UNIDAD ESTADÍSTICA. VARIABLES CUALITATIVAS CUANDO LA VARIABLE PRESENTA MODALIDADES, ES DECIR CUAN DO MIDE ATRIBUTOS Y SUS MODALIDADES NO SON NUMÉRICAS VARIABLES CUANTITATIVAS CUANDO LA VARIABLE PRESENTA VALORES NUMÉRICOS, VAR.CUANTITATIVAS DISCRETAS LA VARIABLE TOMA VALORES ENTEROS COMO 0, 1, 2, 3, ETC.. VAR.CUANTITATIVAS CONTÍNUAS VARIABLES NOMINALES SON LAS VARIABLES QUE REPRESENTAN ATRIBUTOS CUYAS MODALIDADES NO PUEDEN SER ORDENADAS NI OPERADAS CONFORME A LAS REGLAS ARITMÉTICAS. VARIABLES ORDINALES SON LAS VARIABLES QUE TIENEN MODALIDADES QUE PUEDEN SER ORDENADAS DE MAYOR A MENOR.. FRECUENCIA ABSOLUTA DE UNA MODALIDAD FRECUENCIA ABSOLUTA DE UN VALOR DE LA VARIABLE FRECUENCIA RELATIVA DE UNA MODALIDAD FRECUENCIA RELATIVA DE UN VALOR Xi PORCENTAJE DE UNA MODALIDAD DISTRIBUCIÓN FRECUENCIAS LA VARIABLE PUEDE TOMAR CUALQUIER VALOR INTERMEDIO ENTRE OTROS DOS. ES EL NÚMERO DE OBSERVACIONES QUE PRESENTA ESA MODALIDAD O VALOR. ES LA PROPORCIÓN DE OBSERVACIONES QUE PRESENTA LA VARIABLE Xi ES IGUAL A MULTIPLICAR POR 100 SU FRECUENCIA RELATIVA DE CONSISTE EN UNA PRESENTACIÓN EN FORMA DE TABLA DE LOS DISTINTOS VALORES O MODALIDADES, Xi, QUE TOMA LA VARIABLE JUNTO CON SUS RESPECTIVAS FRECUENCIAS ABSOLUTAS O RELATIVAS DIAGRAMA DE SECTORES ES LA GRAFICA DE UNA DISTRIBUCIÓN DE FRECUENCIA QUE CONSISTE EN UN CIRCULO DE RADIO DADO QUE REPRESENTA EL TOTAL DE OBSERVACIONES. EL CIRCULO SE DIVIDE EN SECTORES, UNO POR CADA MODALIDAD DE LA VARIABLE OBSERVADA PICTOGRAMAS ES UNA REPRESENTACIÓN DE LAS VARIABLES CUALITATIVAS MEDIANTE DIBUJOS, ICONOS, SIMBOLOS, MAPAS, ETC. EL TAMAÑO DE CADA SIMBOLO ES PROPORCIONAL A LA FRECUENCIA DE LAS VARIABLES. HISTOGRAMAS REPRESENTACION DE LAS DISTRIBUCIONES DE FRECUENCIAS DE VARIABLES CUANTITATIVAS. ES SIMILAR AL DIAGRAMA DE BARRAS MEDIDAS DE CENTRALIZACIÓN TAMBIEN LLAMADAS MEDIDAS DE TENDENCIA CENTRAL, MEDIDAS DE POSICIÓN O SIMPLEMENTE PROMEDIOS, SON LAS VARIABLES CENTRALES DE UNA DISTRIBUCIÓN DE FRECUENCIAS. LA MEDIA ARITMETICA, LA MEDIANA Y LA MODA MEDIA ARITMETICA ES LA SUMA DE TODAS LAS VARIABLES CUANTITATIVAS DIVIDIDO POR EL NUMERO DE VALORES. MEDIA PONDERADA SE CALCULA CUANDO LOS DATOS NO TIENEN EL MISMO PESO. SE OBTIENE SUMANDO TODOS LOS PRODUCTOS DE CADA VALOR POR SU PESO DIVIDIENDO EL RESULTADO POR LA SUMA DE LOS PESOS. Xp = ( ∑ Xi * Pi ) / ( ∑ Pi ) MEDIANA ES EL VALOR DE LA VARIABLE ESTADISTICA, SUPONIENDO QUE LOS DATOS ESTÉN ORDENADOS, QUE OCUPA LA POSICION CENTRAL. MODA ES EL VALOR DE UNA VARIABLE ESTADÍSTICA QUE TIENE MAYOR FRECUENCIA ABSOLUTA. CLASE MODAL ES LA CLASE DE MAYOR FRECUENCIA CUANDO LOS DATOS SE ENCUENTRAN AGRUPADOS EN INTERVALOS. CUARTILES SON LOS VALORES DE LAS VARIABLES QUE DIVIDEN AL CONJUNTO DE DATOS EN CUATRO PARTES IGUALES. EL PRIMERO SE SIMBOLIZA Q1 Y DEJA A SU IZQUIERDA EL 25 % DE LOS DATOS, Y A SU DERECHA EL 75 %. EL 2º. CUARTIL Q2 COINCIDE CON LA MEDIANA, Y EL 3ER. CUARTIL Q3 DEJA A SU IZQUIERDA EL 75 % Y A SU DERECHA EL 25% DE LOS DATOS. MEDIDAS DE DISPERSIÓN INDICAN EL GRADO DE VARIACIÓN, DISPERSIÓN, CONCENTRACIÓN O DISTRIBUCIÓN DE LOS DATOS EN RELACIÓN A LA MEDIA. RECORRIDO O RANGO, DESVIACIÓN MEDIA, VARIANZA Y DESVIACIÓN TÍPICA. RANGO O RECORRIDO ES LA DIFERENCIA ENTRE LA VARIABLE DE MAYOR VALOR Y EL DE MENOR VALOR. RANGO INTERCUARTÍLICO ES LA DIFERENCIA ENTRE EL CUARTIL Q3 Y Q1. COEFICIENTE DE VARIACIÓN ES EL COCIENTE ENTRE LA DESVIACÓN TÍPICA Y LA MEDIA. ES UNA MEDIDA INVARIANTE RESPECTO DE LA UNIDAD DE MEDIDA EMPLEADA DE LAS VARIABLES. SE EXPRES EN FORMA DE PORCENTAJE , MULTI PLICANDO PARA ELLO POR 100. POLIGONO DE FRECUENCIA ES LA GRAFICA QUE SE OBTIENE AL UNIR LOS PUNTOS MEDIOS DE LAS BASES SUPERIORES DE LOS RECTÁNGULOS QUE FORMAN EL HISTOGRAMA. MEDIDAS DE FORMA SON LAS CARACTERÍSTICAS DE FORMA DE UNA DISTRIBUCIÓN ESTA DÍSTICA: SIMETRÍA O SESGO, APUNTAMIENTO O CURTOSIS. 4ª ETAPA Con este último ejercicio lo que logramos es que el alumno lea y trate de recordar los conceptos aprendidos, así como también realizar algunos ejercicios prácticos. El profesor/a debe entregar a cada alumno las hojas para que completen los espacios en blanco . El ejercicio completo para el profesor/a es el siguiente: Estadística Descriptiva – Conceptos Básicos 1) Se denomina población al conjunto de seres u objetos acerca de los que se desea tener una información. 2) Se denomina unidad estadística, individuo o elemento a cada uno de los miembros de la población. 3) La Estadística es la ciencia que estudia, mediante métodos cuantitativos, características de las poblaciones obtenidas como síntesis de la observación de unidades estadísticas. 4) Un censo consiste en anotar determinadas características de todos lo individuos de una población. 5) La Estadística Descriptiva es la parte de la Estadística que estudia las ideas, métodos y técnicas para la descripción gráfica y numérica de los conjuntos numerosos. 6) Se denomina muestra al subconjunto de individuos que son observados para obtener información sobre el total de la población a que pertenecen. 7) La inferencia estadística es la parte de la Estadística que estudia los métodos para establecer conclusiones sobre una población a partir de una muestra de la misma. 8) Variables cualitativas son las que representan atributos cuyas modalidades no pueden ser ordenadas ni operadas conforme a las reglas aritméticas. 9) Variables cuantitativas son las que representan atributos numéricos. 10) Variables cuantitativas ordinales son las que tienen modalidades que pueden ser ordenadas de mayor a menor. 11) La frecuencia absoluta de una modalidad con variable cualitativa o cuantitativa es el número de observaciones que presentan esa modalidad o valor. 12) La suma de las frecuencias absolutas es igual al numero de observaciones. N = f1 + f2 + ………….fn 13) La frecuencia relativa de una modalidad o de un valor xi es la proporción de observaciones que presentan la variable xi. Fr = fi / N. 14) La suma de las frecuencias relativas de todas las modalidades o valores es igual a uno ( 1 ). 15) El porcentaje de una modalidad o valor xi es igual a multiplicar por 100 su frecuencia relativa. 16) La frecuencia acumulada (Fa) del valor o variable xi es la suma de las frecuencias absolutas (fi) menores o igual que la variable xi. 17) La frecuencia relativa acumuladas de la variable xi es la suma de las frecuencias relativas de todos los valores menores o igual a xi. 18) Una distribución de frecuencias absolutas o relativas de una variable estadística consiste en una presentación en forma de tabla de los distintos valores o modalidades xi que forma la variable junto con sus respectivas frecuencias absolutas y relativas. 19) El principio básico para la representación de variables cuantitativas continuas es la proporción entre áreas y frecuencias. 20) La representación más importante de las variables cualitativas son los diagramas de sectores y los pictogramas. 21) La representación de las distribuciones de frecuencias de variables cuantitativas puede hacerse de forma similar a las variables cualitativas mediante Diagramas de Barras que en este caso se suelen llamar Histogramas. 22) Las variables cuantitativas discretas tomas valores enteros. 23) Las variables cualitativas discretas toman todos los valores dados en un intervalo de clase. 24) La representante de un intervalo de clase se llama ¨ marca de clase ¨ y cuyo valor es igual a la semisuma de los extremos del intervalo de clase. 25) El diagrama de rectángulos se emplea para variables cualitativas y cuantitativas. 26) El diagrama de sectores también se emplea para variables cualitativas y cuantitativas discretas. 27) Cuando la variable es cuantitativa y los datos están agrupados en intervalos, se construye un diagrama llamado especial llamado ¨ Histograma ¨ cuya base de cada rectángulo de las variables es igual a la amplitud del intervalo de clase. 28) Al Histograma podemos añadir el Polígono de Frecuencia que aparece si unimos por trazos rectos los puntos medios de las bases superiores de los rectángulos del Histograma. 29) La gráfica nos informa de tres aspectos de una distribución de frecuencias: su centro, la dispersión de los valores alrededor de su centro y de su forma. 30) Las medidas de centralización, también llamadas medidas de tendencia central, medidas de posición o simplemente promedios; son: la media, la mediana y la moda. 31) La Media (X) de una serie de variables cuantitativas o valores numéricos es igual al cociente entre la suma de los valores y el número de observaciones o valores X = (fi * Xi) / n 32) Si se suma la misma cantidad a todos los valores de la variable, la media aumenta en esa misma cantidad. Ejemplo, si sumamos 3 a las variables 7, 9 10, 12 cuya media es: X = (7+9+10+12)/4= 9.5, las nuevas variables son: 10, 12, 13 y 15, y su media aritmética es X= (10+12+13+15)/4 = 12.5 = 9,5 + 3. 33) Si se multiplican todos los valores de la variable por un mismo numero, su mediara resulta multiplicada por ese numero. En el ejemplo anterior, multiplicando las variables por 2 tenemos: 14, 18, 20, 24, entonces las nueva media aritmética es X = (14+18+20+24)/4 = 19 = 9,5 x 2 34) La Mediana es el valor de la variable estadística, suponiendo que los datos están ordenados, que ocupa la posición central 35) En una distribución sencilla de variable discreta, la mediana corresponde al valor central si el numero de datos es impar, pero si el nuemro de datos es para, la mediana es la media de los valores centrales. Sean las variables xi = 0,0,1,1,1,1,2,2,2; entonces Me = 1, pero si las variables son: Xi = 1,2,3,4,5,6,7,8,, entonces Me = (4+5)/2 = 4,5 . 36) En una distribución con muchos datos, la mediana es el primer valor de la variable cuya frecuencia absoluta está por encima de la mitad de los datos. N = 27 N/2 = 27/2 = 13,5 El primer fa > n/2 es 20 corresponde a Xi = 2 Por tanto Me = 2 xi 0 1 2 3 4 ∑ fi 5 6 9 4 3 27 fa 5 11 20 24 27 En la distribución de la tabla de frecuencia: N = 24 N/2 = 24/2 = 12 El primer fa > o igual n/2 es 12 y 18 En este caso, la mediana es la semisuma entre los dos valores xi 0 1 2 3 4 ∑ fi 5 7 6 4 2 24 fa 5 12 18 22 24 Xi correspondiente a fa = 12 y 18. Por tanto Me = ( 1+ 2 ) / 2 = 1,5 37) Se conoce como Moda de una variable estadística al valor que tiene mayor frecuencia. Se simboliza Mo. Si los datos se encuentra agrupados en intervalos, la clase de mayor frecuencia se llama ¨ clase modal ¨ 38) Las medidas de dispersión nos indican como están distribuidos los datos en la población o en una muestra. 39) Las medidas de dispersión son: El recorrido o rango (R), la desviación media (DM), la varianza (S2), y la desviación típica ( δ ) 40) El recorrido o rango es la diferencia entre los valores máximos y minimos de las variables. NOTA: A continuación las tablas y ejercicios para los alumnos que el profesor/a debe fotocopiar para cada uno de sus alumnos. Nombre del Alumno: ___________________________________________ Fecha: ______________________________________________________ Curso: ______________________________________________________ Unidad: Estadística Ejercicio 1) Una empresa de confección de uniformes ha sido contratada por un Instituto para preparar los uniformes de graduación sus alumnos. Queremos saber cual es la talla media de los alumnos que están en el Bachillerato. Pero la población de todos los estudiantes (individuos, elementos, unidades estadísticas) son demasiados para medirlos a cada uno de ellos. Tomaron en observación entonces una muestra de los alumnos de un instituto en particular y se han anotado las tallas (variables) medidas en cm de 40 alumnos. Las tallas toman diferentes valores que son magnitudes numéricas (variables cuantitativas). Las tallas de los 40 individuos tomados como muestra son las siguientes: 166, 165, 167, 167, 181, 151, 177, 170, 171, 163, 171, 169, 158, 162, 165, 168, 156, 178, 172, 165, 167, 173, 168, 158, 163, 171, 169, 163, 170, 176, 161, 158, 164, 170, 178, 173, 171, 169, 166,158. Conteo de los datos: Diagrama de tallos y hojas. 1º leyendo las variables en el orden en que están. 2º ordenando las variables de menor a mayor para luego ingresarlo en la planilla No.1 desde el menor a mayor con sus frecuencias. 3º) Completar la tabla de frecuencia: VARIABLE Xi FRECUENCIA FRECUENCIA ABSOLUTA RELATIVA fi FRECUENCIA ABSOLUTA ACUMULADA fr FRECUENCIA RELATIVA ACUMULADA fa fra ∑ (fi * Xi) / n = =X (MEDIA) La mediana Me = (___________) / 2 = ____________ La Moda Mo = ___________________ El rango es: Xi Max – Xi min = ___________________ MEDIA ARITMETICA fi * Xi 4º) Completemos las columnas de nuestra tabla de frecuencia para calcular las Medidas de Dispersión: Desviación media, Varianza y Desviación Tipica. DESVIACION MEDIA Xi - X Xi - X∗ f i VARIANZA ( Xi - X ) ² ( Xi - X ) ² * f i ∑ La desviación Media es: DM = ( ∑Xi - X∗ f i ) / n = _______________ 2 La Variaza es: S = (∑ ( Xi - X ) ² * f i ) / n = ________________________ La desviación típica es: δ = Ѵ S2 = _________________ 5º) Calculemos el porcentaje de alumnos que están en el siguiente intervalo I1 = ( X – S ; X + S ) = ( _________________ ) = ( _________________) Contamos cuantas variables se encuentran en este intervalo I1 Encontramos que hay __________ variables, calculemos el porcentaje: ( _________)*100 = ________ % de los datos están dentro del intervalo ___ Calculemos el porcentaje de alumnos que están en el siguiente intervalo I2 = ( X – 2S ; X + 2S ) = ( _______________ ) = (________________) Contamos cuantas variables se encuentran en este intervalo I2 Encontramos que hay __________variables, calculemos el porcentaje: (___________) *100 = ______ % de los datos están dentro del intervalo ___ 6º) Recordemos algunos conceptos y sus definiciones. Une con flecha cada concepto con su definición CENSO ELEMENTO CONJUNTO DE SERES U OBJETOS ACERCA DE LOS QUE SE DESEA OBTENER UNA INFORMACIÓN CADA UNO DE LOS MIEMBROS DE UNA POBLACIÓN. ESTADÍSTICA ESTADÍSTICA DESCRITIVA VALORES INCOMPATIBLES INDIVIDUO INFERENCIA ESTADÍSTICA VALORES DE UNA VARIABLE. MODALIDADES DE UNA VARIABLE VARIABLES CUALITATIVAS MODALIDADES EXHAUSTIVOS MODALIDADES INCOMPATIBLES ES LA CIENCIA QUE ESTUDIA, MEDIANTE MÉTODOS CUANTITATIVOS CARACTERÍSTICAS DE LAS POBLACIONES OBTENIDAS COMO SÍNTESIS DE LA OBSERVACIÓN DE UNIDADES ESTADÍSTICAS. CONSISTE EN ANOTAR DETERMINADAS CARACTERÍSTICAS DE TODOS LOS INDIVIDUOS DE UNA POBLACIÓN. ES LA PARTE DE LA ESTADÍSTICA QUE ESTUDIA LAS IDEAS, MÉTODOS Y TÉCNICAS PARA LA DESCRIPCIÓN GRÁFICA Y NUMÉRICA DE LOS CONJUNTOS NUMEROSOS. SUBCONJUNTO DE INDIVIDUOS QUE SON OBSERVADOS PARA OBTENER INFORMACIÓN SOBRE EL TOTAL DE LA POBLACIÓN A QUE PERTENECE. ES LA PARTE DE LA ESTADÍSTICA QUE ESTUDIA LOS MÉTODOS PARA ESTABLECER CONCLUSIONES SOBRE UNA POBLACIÓN A PARTIR DE UNA MUESTRA DE LA MISMA. ATRIBUTOS, CUALIDADES O MAGNITUDES NUMÉRICAS QUE SE OBSERVAN EN LOS INDIVIDUOS DE LA POBLACIÓN MUESTRA ATRIBUTOS O CUALIDADES OBSERVACIÓN MAGNITUDES NUMÉRICAS. POBLACION TODA UNIDAD ESTADISTICA, INDIVIDUO O ELEMENTO PUEDE PRESENTAR UNA Y SOLAMENTE UNA MODALIDAD UNIDAD ESTADÍSTICA VALORES EXHAUSTIVOS VARIABLES VARIABLES ESTADÍSTICAS CONJUNTO DE MODALIDADES O VALORES DE CADA VARIABLE MEDIDOS EN UN INDIVIDUO, ELEMENTO O UNIDAD ESTADÍSTICA. CUANDO LA VARIABLE PRESENTA MODALIDADES, ES DECIR CUAN DO MIDE ATRIBUTOS Y SUS MODALIDADES NO SON NUMÉRICAS DIAGRAMA DE SECTORES CUANDO LA VARIABLE PRESENTA VALORES NUMÉRICOS, FRECUENCIA ABSOLUTA DE UN VALOR DE LA VARIABLE LA VARIABLE TOMA VALORES ENTEROS COMO 0, 1, 2, 3, ETC.. FRECUENCIA RELATIVA DE UN VALOR Xi HISTOGRAMAS LA VARIABLE PUEDE TOMAR CUALQUIER VALOR INTERMEDIO ENTRE OTROS DOS. SON LAS VARIABLES QUE REPRESENTAN ATRIBUTOS CUYAS MODALIDADES NO PUEDEN SER ORDENADAS NI OPERADAS PORCENTAJE DE UNA MODALIDAD VAR.CUANTITATIVAS DISCRETAS CONFORME A LAS REGLAS ARITMÉTICAS. SON LAS VARIABLES QUE TIENEN MODALIDADES QUE PUEDEN SER ORDENADAS DE MAYOR A MENOR.. VARIABLES NOMINALES ES EL NÚMERO DE OBSERVACIONES QUE PRESENTA ESA MODALIDAD O VALOR. DISTRIBUCIÓN DE FRECUENCIAS ES LA PROPORCIÓN DE OBSERVACIONES QUE PRESENTA LA VARIABLE Xi FRECUENCIA RELATIVA DE UNA MODALIDAD ES IGUAL A MULTIPLICAR POR 100 SU FRECUENCIA RELATIVA MEDIA ARITMETICA CONSISTE EN UNA PRESENTACIÓN EN FORMA DE TABLA DE LOS DISTINTOS VALORES O MODALIDADES, Xi, QUE TOMA LA VARIABLE JUNTO CON SUS RESPECTIVAS FRECUENCIAS ABSOLUTAS O RELATIVAS VAR.CUANTITATIVAS CONTÍNUAS ES LA GRAFICA DE UNA DISTRIBUCIÓN DE FRECUENCIA QUE CONSISTE EN UN CIRCULO DE RADIO DADO QUE REPRESENTA EL TOTAL DE OBSERVACIONES. EL CIRCULO SE DIVIDE EN SECTORES, UNO POR CADA MODALIDAD DE LA VARIABLE OBSERVADA VARIABLES ORDINALES ES UNA REPRESENTACIÓN DE LAS VARIABLES CUALITATIVAS MEDIANTE DIBUJOS, ICONOS, SIMBOLOS, MAPAS, ETC. EL TAMAÑO DE CADA SIMBOLO ES PROPORCIONAL A LA FRECUENCIA DE LAS VARIABLES. MEDIDAS DE CENTRALIZACIÓN PICTOGRAMAS FRECUENCIA ABSOLUTA DE UNA MODALIDAD VARIABLES CUANTITATIVAS REPRESENTACION DE LAS DISTRIBUCIONES DE FRECUENCIAS DE VARIABLES CUANTITATIVAS. ES SIMILAR AL DIAGRAMA DE BARRAS TAMBIEN LLAMADAS MEDIDAS DE TENDENCIA CENTRAL, MEDIDAS DE POSICIÓN O SIMPLEMENTE PROMEDIOS, SON LAS VARIABLES CENTRALES DE UNA DISTRIBUCIÓN DE FRECUENCIAS. LA MEDIA ARITMETICA, LA MEDIANA Y LA MODA ES LA SUMA DE TODAS LAS VARIABLES CUANTITATIVAS DIVIDIDO POR EL NUMERO DE VALORES. CLASE MODAL MEDIDAS DE DISPERSION POLIGONO DE FRECUENCIA CUARTILES COEFICIENTE DE VARIACION MEDIA PONDERADA MEDIANA MEDIDAS DE FORMA SE CALCULA CUANDO LOS DATOS NO TIENEN EL MISMO PESO. SE OBTIENE SUMANDO TODOS LOS PRODUCTOS DE CADA VALOR POR SU PESO DIVIDIENDO EL RESULTADO POR LA SUMA DE LOS PESOS. Xp = ( ∑ Xi * Pi ) / ( ∑ Pi ) ES EL VALOR DE LA VARIABLE ESTADISTICA, SUPONIENDO QUE LOS DATOS ESTÉN ORDENADOS QUE OCUPA LA POSICION CENTRAL. ES EL VALOR DE UNA VARIABLE ESTADÍSTICA QUE TIENE MAYOR FRECUENCIA ABSOLUTA. ES LA CLASE DE MAYOR FRECUENCIA CUANDO LOS DATOS SE ENCUENTRAN AGRUPADOS EN INTERVALOS. SON LOS VALORES DE LAS VARIABLES QUE DIVIDEN AL CONJUNTO DE DATOS EN CUATRO PARTES IGUALES. EL PRIMERO SE SIMBOLIZA Q1. Q1 DEJA A SU IZQUIERDA EL 25 % DE LOS DATOS, Y A SU DERECHA EL 75 %. EL 2º. CUARTIL Q2 COINCIDE CON LA MEDIANA, Y EL 3ER. CUARTIL Q3 DEJA A SU IZQUIERDA EL 75 % Y A SU DERECHA EL 25% DE LOS DATOS. INDICAN EL GRADO DE VARIACIÓN, DISPERSIÓN, CONCENTRACIÓN O DISTRIBUCIÓN DE LOS DATOS EN RELACIÓN A LA MEDIA. RECORRIDO O RANGO, DESVIACIÓN MEDIA, VARIANZA Y DESVIACIÓN TÍPICA. ES LA DIFERENCIA ENTRE LA VARIABLE DE MAYOR VALOR Y EL DE MENOR VALOR. ES LA DIFERENCIA ENTRE EL CUARTIL Q3 Y Q1. RANGO INTERCUARTÍLICO RANGO O RECORRIDO MODA ES EL COCIENTE ENTRE LA DESVIACÓN TÍPICA Y LA MEDIA. ES UNA MEDIDA INVARIANTE RESPECTO DE LA UNIDAD DE MEDIDA EMPLEADA DE LAS VARIABLES SE EXPRESA EN FORMA DE PORCENTAJE , MULTI PLICANDO PARA ELLO POR 100. ES LA GRAFICA QUE SE OBTIENE AL UNIR LOS PUNTOS MEDIOS DE LAS BASES SUPERIORES DE LOS RECTÁNGULOS QUE FORMAN EL HISTOGRAMA. SON LAS CARACTERÍSTICAS DE FORMA DE UNA DISTRIBUCIÓN ESTA DÍSTICA: SIMETRÍA O SESGO, APUNTAMIENTO O CURTOSIS. 7º) Recordemos, con la ayuda del profesor/a, lo aprendido completando los espacios en blancos. Estadística Descriptiva – Conceptos Básicos 1) Se denomina ______________ al conjunto de ________________ acerca de los que se desea tener una ______________. 2) Se denomina ____________ estadística, ____________ o elemento a cada uno de los miembros de la ________________. 3) La _______________ es la ciencia que estudia, mediante métodos ______________, características de las ______________ obtenidas como síntesis de la observación de unidades estadísticas. 4) Un ____________ consiste en anotar determinadas características de todos lo individuos de una _______________. 5) La _____________________ es la parte de la Estadística que estudia las ideas, ___________ y ____________ para la descripción _____________ y numérica de los conjuntos numerosos. 6) Se denomina ___________ al subconjunto de individuos que son observados para obtener información sobre el total de la______________ a que pertenecen. 7) La inferencia ________________ es la parte de la Estadística que estudia los métodos para establecer conclusiones sobre una población a partir de una _______________ de la misma. 8) Variables cualitativas son las que representan atributos cuyas modalidades no pueden ser ordenadas ni operadas conforme a las reglas aritméticas. 9) Variables ______________ son las que representan atributos numéricos. 10) Variables cuantitativas _______________ son las que tienen modalidades que pueden ser ordenadas de mayor a menor. 11) La __________________________ de una modalidad con variable ____________ o ______________ es el número de observaciones que presentan esa modalidad o valor. 12) La suma de las frecuencias absolutas es igual al numero de _______________. N = f1 + ______________ 13) La frecuencia ________________de una modalidad o de un valor xi es la proporción de observaciones que presentan la variable xi. Fr = _____ 14) La suma de las frecuencias relativas de todas las modalidades o valores es igual a _________ 15) El _________________de una modalidad o valor xi es igual a multiplicar por 100 su frecuencia relativa. 16) La frecuencia _______________ (Fa) del valor o variable xi es la suma de las frecuencias absolutas (fi) menores o igual que la variable xi. 17) La frecuencia ______________________ de la variable xi es la suma de las frecuencias relativas de todos los valores menores o igual a xi. 18) Una distribución de ________________ absolutas o relativas de una variable estadística consiste en una presentación en forma de tabla de los distintos valores o modalidades xi que forma la variable junto con sus respectivas frecuencias absolutas y relativas. 19) El principio básico para la representación de variables ______________ continuas es la proporción entre áreas y frecuencias. 20) La representación más importante de las variables cualitativas son los diagramas de ______________ y los ________________. 21) La representación de las distribuciones de frecuencias de variables cuantitativas puede hacerse de forma similar a las variables _____________ mediante Diagramas de ______________que en este caso se suelen llamar ______________. 22) Las variables cuantitativas _________________ tomas valores enteros. 23) Las variables ________________y ________________toman todos los valores dados en un intervalo de clase. 24) La representante de un intervalo de clase se llama ¨ _______________ ¨ y cuyo valor es igual a la semisuma de los extremos del _____________ de clase. 25) El diagrama de rectángulos se emplea para variables _______________ y _________________. 26) El diagrama de sectores también se emplea para variables _________________ y ________________ discretas. 27) Cuando la variable es cuantitativa y los datos están agrupados en intervalos, se construye un diagrama especial llamado ¨ Histograma ¨ cuya base de cada rectángulo de las variables es igual a la ____________ del intervalo de ___________. 28) Al Histograma podemos añadir el ________________ de ______________ que aparece si unimos por trazos rectos los puntos medios de las bases superiores de los rectángulos del ______________. 29) La gráfica nos informa de tres aspectos de una distribución de frecuencias: su ___________, la _______________ de los valores alrededor de su centro y de su ________________. 30) Las medidas de centralización, también llamadas medidas de tendencia _________________, medidas de posición o simplemente _____________; son: la _________, la _____________ y la _________. 31) La ___________ (X) de una serie de variables ______________ o valores numéricos es igual al cociente entre la suma de los valores y el número de observaciones o valores X = (fi * Xi) / n 32) Si se suma la misma cantidad a todos los valores de la variable, la media ________________ en esa misma cantidad. Ejemplo, si sumamos 3 a las variables 7, 9 10, 12 cuya media es: X = ___________________, las nuevas variables son: ______________, y su media aritmética es X= ___________________________ 33) Si se multiplican todos los valores de la variable por un mismo numero, su mediara resulta ________________ por ese numero. En el ejemplo anterior, multiplicando las variables por 2 tenemos: ________________, entonces las nueva media aritmética es X = ______________________ 34) La ___________________ es el valor de la variable estadística, suponiendo que los datos estan ordenados, que ocupa la posición central 35) En una distribución sencilla de variable discreta, la mediana corresponde al valor ____________ si el número de datos es impar, pero si el número de datos es para, la mediana es la media de los valores _____________ . Sean las variables xi = 0,0,1,1,1,1,2,2,2; entonces Me = _______, pero si las variables son: Xi = 1,2,3,4,5,6,7,8,, entonces Me = ___________________ 36) En una distribución con muchos datos, la mediana es el primer valor de la variable cuya frecuencia absoluta está por encima de la mitad de los datos. N= N/2 = ______ = _____ El primer fa > n/2 es 20 corresponde a Xi = ____ Por tanto Me = _________ xi 0 1 2 3 4 ∑ fi 5 6 9 4 3 fa xi 0 1 2 3 4 ∑ fi 5 7 6 4 2 En la distribución de la tabla de frecuencia: N= N/2 = ____________ El primer fa > o igual n/2 es __ y __ En este caso, la mediana es la semisuma entre los dos valores fa Xi correspondiente a fa = ____ y _____. Por tanto Me = ___________________ 37) Se conoce como _______________ de una variable estadística al valor que tiene mayor frecuencia. Se simboliza _____. Si los datos se encuentra agrupados en intervalos, la clase de mayor frecuencia se llama ___________________ 38) Las medidas de ________________ nos indican como están distribuidos los datos en la población o en una _______________. 39) Las ______________ de dispersión son: El recorrido o _________ (R), la desviación ___________ (DM), la _____________ (S2), y la _____________ típica ( δ ) 40) El recorrido o rango es la diferencia entre los valores __________ y ______________de las variables.