Cajón de Ciencias Estadística básica La estadística es la rama de las matemáticas que trabaja con grupos de datos. Nos sirve para responder a preguntas como: - ¿Qué número calza una persona? - ¿Cuánto suele durar una película? - ¿Qué nota se gana un alumno en una evaluación? - ¿Qué mascota es la que más tiene la gente? No podemos decir el número de pie de todas las personas, ni la duración de todas las películas. Y si un alumno ha sacado un 6, un 5 y un 9 en una evaluación, no podemos ponerle de nota final biensuficiente-sobresaliente. Y está claro que para contestar a la segunda habrá que hacer primero algún tipo de encuesta. Hay que trabajar en todos estos casos usando variables. ¿Qué es una variable? No quedaría muy bien decir que una variable es algo que varía, pero es que es así. “Número de pie”, “Duración de una película”, “Nota de un examen” o “Mascota preferida” son variables, pues en unos casos tendrán un valor y otros otro. Las variables pueden ser de dos tipos: - Las que no se miden con números, como “Mascota preferida” se llaman variables cualitativas. - Las que se miden con números se llaman variables cuantitativas. A su vez, pueden ser: - Discretas: si no existen valores intermedios. La variable “Número de pie” es cuantitativa discreta: una persona puede calzar el 40 o el 41, pero no el 40,37. - Continuas: si pueden existir valores intermedios. La variable “Duración de una película” es cuantitativa continua, porque una película puede durar una hora, hora y media, o incluso una hora, diecisiete minutos, 32 segundos y 45 décimas. ¿Cómo sería la variable “Nota de un examen”? Si has contestado cuantitativa continua, has acertado (entre el 6 y el 7 existen todas las posibilidades intermedias1). 1 Sorprendentemente, incluso hay profesores que califican usando tres decimales. www.cajondeciencias.com Cajón de Ciencias Qué se puede hacer con una variable Normalmente en estadística se trabaja con tablas de datos, en las que aparecen todas las posibilidades y la cantidad de veces que ocurre cada cosa. Es como si ordenáramos los resultados de una encuesta. Pongamos como ejemplo que hemos preguntado a 20 personas sobre su mascota favorita y los resultados han sido: Mascota Número Perro 8 Gato 6 Hámster 5 Pez 1 La suma de todos los datos nos tiene que dar el total de personas preguntadas (20, en este caso). Conviene que, cuando ordenes datos en una tabla, te asegures de esto, para comprobar que no se te haya olvidado ninguno. Pues bien, con esta pequeña tabla, vamos a definir el primer parámetro estadístico: la moda. Moda es aquel dato o datos que más se repiten en un conjunto de datos. En el ejemplo, la moda sería “Perros”. Si más de una mascota hubiese tenido el número más grande, todos ellos serían moda. Pero si todos los datos se repiten el mismo número de veces, no hay moda. Mascota Número Mascota Número Perro 6 Perro 5 Gato 6 Gato 5 Hámster 6 Hámster 5 Pez 2 Pez 5 Aquí la moda serían “perro”, “gato” y “hámster” www.cajondeciencias.com Aquí no hay moda Cajón de Ciencias Máximos, mínimos y rango Vamos a trabajar ahora con la siguiente tabla de datos: Número de pie Cantidad de personas 38 5 39 8 40 10 41 8 42 9 Se trata de una variable cuantitativa discreta (así repasamos). Cuando tenemos variables que se miden en números se pueden hacer algunas cosas más que con las discretas. Por supuesto, podemos sacar la moda. Para este grupo de datos, el que más se repite es el 40; por lo tanto esa es la moda. Llamamos máximo al dato más grande de todos (no al que esté en mayor cantidad). En este caso, el máximo sería 42. Y, claro está, llamamos mínimo al dato más pequeño de todos (38, en el ejemplo). Rango es la diferencia entre el máximo y el mínimo. O sea, 42 – 38 = 4. ¿Y qué es la media? Miremos ahora las notas que había sacado nuestro alumno del principio: un 6, un 5 y un 9. ¿Qué nota se le pondría al final? Para estos casos, usaremos un parámetro nuevo, al que llamamos media2. La media es fácil de calcular: sumamos todos los datos y dividimos el total entre el número de datos que hay: media = (6 + 5 + 9)/3 = 6,66 También podríamos calcular la media de la tabla de más arriba. En este caso tendríamos que sumar 5 veces 38 más 8 veces 39, más 10 veces 40, más 8 veces 41, más 9 veces 42. El total lo dividiríamos entre 20. 2 “Nuevo” aquí, pero seguro que ya has oído antes lo de la media final de las notas. De hecho, es posible que sepas incluso cómo se calcula. www.cajondeciencias.com Cajón de Ciencias Gráficas y diagramas de barras Podemos representar en un gráfico los datos de una tabla, para tener una impresión más general (y estética) de cómo se reparten. Las gráficas normalmente se usan cuando se representa algo que varía con el tiempo, por ejemplo, las notas de nuestro alumno. Simplemente colocamos en el eje vertical las notas y en el eje horizontal, los distintos exámenes: 10 9 8 7 6 5 4 3 2 1 0 Examen 1 Nota Examen 2 Examen 3 Esta gráfica nos permite ver que el alumno tuvo un bajón después del primer examen, pero que luego se puso las pilas y consiguió compensar de sobra en el tercero. Los diagramas de barras (o histogramas) se suelen utilizar cuando hay diversas categorías. Cojamos ahora los datos del número de pie: 12 10 8 6 Número de personas 4 2 0 38 39 40 41 42 Como ves, basta con dibujar cada columna hasta la altura correspondiente a su número. Hay más parámetros en estadística, pero de momento, no necesitas conocer más. www.cajondeciencias.com