COLEGIO SALESIANO CONCEPCION.− ESTADISTICAS • ¿QUÉ ES LA ESTADÍSTICA? Estadística es una disciplina que sistematizado las técnicas de recolección y análisis de datos; nos permite inferir consecuencias a partir de estos. • ¿QUÉ ES UNA POBLACION? Una población es el conjunto total de todos los individuos u objetos que poseen una característica común observable, que sean de interés en un estudio. Son ejemplos de una población: • Los alumnos de un curso. • Los pacientes de un hospital. • Los votantes de una comuna. • ¿QUÉ ES UNA MUESTRA? Es un subconjunto de la población. Es de un tamaño menor al total de la población y la estadística pretende obtener conclusiones válidas que pueden aplicarse al total a partir de los resultados observados en la muestra. Son ejemplos de muestra: • 1.820 televidentes escogidos al azar. • Los automovilistas que acceden a contestar una encuesta de opinión. • Uno de cada diez sacos de maíz de un cargamento. • ¿A QUE SE LLAMA "MARCA DE CLASE"? Se le llama marca de clase a los valores representativos de todos los valores incluidos en el intervalo respectivo; equivale a la semisuma de los límites inferior y superior de un intervalo. • ¿QUÉ SON LOS LIMITES INFERIORES Y SUPERIORES? Los límites inferiores y superiores son los valores mínimo y máximo de una distribución. V.g: En un curso de 50 alumnos, se le pidió a un profesor que pesará a todos, los datos obtenidos son los siguientes: LIMITE SUPERIOR: 98 LIMITE INFERIOR: 38 • ¿QUÉ ES LA AMPLITUD? La amplitud es el tamaño numérico que existe entre los intervalos. Considerando el siguiente ejemplo, la amplitud es igual a 5. 1 intervalo 11 − 15 16 − 20 Frecuencia 5 8 • ¿QUÉ ES EL RECORRIDO? El recorrido o campo de variación de la variable, es la diferencia entre el mayor valor que toma la variable y el menor. Por ejemplo, si el mayor valor es 85 y el menor es 17, entonces el recorrido es: • CON UNA RECOLECCION DE DATOS CONSTRUYA UNA TABLA DE FRECUENCIAS. Situación: En un curso de 50 alumnos, se le pidió a un profesor que pesará a todos los alumnos, los datos obtenidos son los siguientes: Intervalos (peso en kg.) nº de alumnos 35 − 39 2 40 − 44 0 45 − 49 1 50 − 54 1 55 − 59 2 60 − 64 3 65 − 69 8 70 − 74 6 75 − 79 11 80 − 84 6 85 − 89 4 90 − 94 4 95 − 99 2 Porcentaje (%) 4 0 2 2 4 6 16 12 22 12 8 8 4 • Con los datos de esta tabla construir un histograma y un polígono de frecuencia. • ¿QUÉ ES LA MEDIA ARITMETICA, LA MODA, LA MEDIANA, LA DESVIACIÓN MEDIA Y LA DESVIACIÓN ESTANDÁR? Son valores que tipifican una muestra y en torno de los cuales se agrupan la mayoría de los datos, estos se denominan estadígrafos. A continuación definiremos cada uno de estos. • MEDIA ARITMETICA: Corresponde a la suma de todos los datos dividido por el numero total de ellos. Es lo que se conoce como "promedio". La media aritmética es uno de los estadígrafos más usados, por el hecho de ser de muy fácil cálculo. • MODA: Corresponde al valor que mas se repite, ésta sirve para describir una distribución si sólo se desea tener una idea aproximada y rápida de donde está la mayor concentración de observaciones. También se la utiliza para describir la forma de algunas distribuciones. Puede ocurrir que en un conjunto de datos no haya moda, como en: 3; 4; 7; 9; 10; 11; 13. O también que haya varios valores con la mayor frecuencia, en estos casos la moda queda indeterminada. 2 • MEDIANA: La mediana es aquel valor que ocupa el lugar central, de modo que la mitad de los casos queda por debajo de ese valor y la otra mitad por encima. Por ejemplo si consideramos: 2; 3; 5; 7; 11; 13; 16; 18; 25. La mediana es M = 11. Si el conjunto de valores es un número par, entonces se calcula la media aritmética a los dos valores del centro. • DESVIACION MEDIA: Corresponde a la diferencia numérica entre una medida individual o número y la media aritmética de una serie completa de tales medidas o números. Por ejemplo, si la media de alturas de todos los alumnos de un curso es 1,51 m y uno de ellos mide 1,63m, la desviación media de su altura con respecto a la media es de +0.12 metros. • DESVIACIÓN ESTANDAR: Es un dato que representa la variabilidad existente en un conjunto de datos, ya que por ejemplo dos conjuntos de datos pueden presentar la misma media aritmética, pero poseer distinta variabilidad, por eso este estadígrafo nos permite saber acerca de la variabilidad o dispersión de los datos. Matemáticamente se define como "la raíz cuadrada del promedio de los cuadrados de las desviaciones medias de cada valor de la variable con respecto de la media aritmética" • HACER UNA TABLA DE DONDE SE DETERMINE CADA UNO DE LOS ESTADIGRAFOS ANTERIORES. Intervalos 1−5 6 − 10 11 − 15 16 − 20 frecuencia 9 13 3 2 88 − 77 − 74 − 64 − 67 − 69 − 49 − 82 − 69 − 71 − 38 − 65 − 86 − 68 − 77 − 84 − 66 − 73 − 75 − 58 − 94 − 78 − 67 − 75 − 78 − 89 − 69 − 91 − 84 − 62 − 50 − 72 − 39 − 62 − 58 − 74 − 79 − 81 − 70 − 79 − 90 − 81 − 79 − 86 − 97 − 78 − 75 − 90 − 98 − 81. 88 − 77 − 74 − 64 − 67 − 69 − 49 − 82 − 69 − 71 − 38 − 65 − 86 − 68 − 77 − 84 − 66 − 73 − 75 − 58 − 94 − 78 − 67 − 75 − 78 − 89 − 69 − 91 − 84 − 62 − 50 − 72 − 39 − 62 − 58 − 74 − 79 − 81 − 70 − 79 − 90 − 81 − 79 − 86 − 97 − 78 − 75 − 90 − 98 − 81. 3 Al organizar los datos en una tabla de frecuencia, se obtiene: 1 − 2 − 2 − 2 − 3 − 3 − 4 − 4 − 5 − 6 − 7 − 7 − 8 − 8 − 8 − 8− 8− 8 − 8 − 9 − 9 − 10 − 12 − 13 − 15 − 16 − 19 Media Aritmética: • = 7.5 27 " 7.5 es el valor de la media aritmética para los datos dados." Moda: De los datos anteriores, la moda corresponde a "8". Mediana: En los datos anteriores, la mediana es el valor "8" ennegrecido. DESVIACIÓN ESTANDAR: • las desviaciones medias de cada valor, calculadas anteriormente se elevan al cuadrado = 42.25 , 30.25 , 30.25 , 30.25 , 20.25 , 20.25 , 12.25 , 12.25 , 6.25 , 2.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 0.25 , 2.25 , 2.25 , 6.25 , 20.25 , 30.25 , 56.25 , 72.25 , 132.25.− • la suma de los cuadrados se divide por el promedio menos 1 = • / 7.5 − 1 = 81.65 4 • calculamos la raíz cuadrada de 81.65 = " 81.65 = 9.04 • el valor de la desviación estándar es de 9.04 en el ejemplo señalado. DESVIACIÓN MEDIA: Datos = 1 − 2 − 2 − 2 − 3 − 3 − 4 − 4 − 5 − 6 − 7 − 7 − 8 − 8 − 8 − D. media = −6.5 , −5.5, −5.5 , −5.5 , −4.5 , −4.5 , −3.5 , −3.5 , −2.5 , −1.5 , −0.5 , −0.5 , 0.5 , 0.5 , 0.5 Datos = 8 − 8 − 8 − 8 − 9 − 9 − 10 − 12 − 13 − 15 − 16 − 19 D. media = 0.5 , 0.5 , 0.5 , 0.5 , 1.5 , 1.5 , 2.5 , 4.5 , 5.5 , 7.5 , 8.5 , 11.5.− 5