Estadística básica - Cajón de Ciencias

Anuncio
Cajón de Ciencias
Estadística básica
La estadística es la rama de las matemáticas que trabaja con grupos de datos. Nos sirve para
responder a preguntas como:
- ¿Qué número calza una persona?
- ¿Cuánto suele durar una película?
- ¿Qué nota se gana un alumno en una evaluación?
- ¿Qué mascota es la que más tiene la gente?
No podemos decir el número de pie de todas las personas, ni la duración de todas las películas. Y si
un alumno ha sacado un 6, un 5 y un 9 en una evaluación, no podemos ponerle de nota final biensuficiente-sobresaliente. Y está claro que para contestar a la segunda habrá que hacer primero algún
tipo de encuesta. Hay que trabajar en todos estos casos usando variables.
¿Qué es una variable?
No quedaría muy bien decir que una variable es algo que varía, pero es que es así. “Número de pie”,
“Duración de una película”, “Nota de un examen” o “Mascota preferida” son variables, pues en
unos casos tendrán un valor y otros otro.
Las variables pueden ser de dos tipos:
- Las que no se miden con números, como “Mascota preferida” se llaman variables cualitativas.
- Las que se miden con números se llaman variables cuantitativas. A su vez, pueden ser:
- Discretas: si no existen valores intermedios. La variable “Número de pie” es cuantitativa
discreta: una persona puede calzar el 40 o el 41, pero no el 40,37.
- Continuas: si pueden existir valores intermedios. La variable “Duración de una película”
es cuantitativa continua, porque una película puede durar una hora, hora y media, o
incluso una hora, diecisiete minutos, 32 segundos y 45 décimas.
¿Cómo sería la variable “Nota de un examen”? Si has contestado cuantitativa continua, has acertado
(entre el 6 y el 7 existen todas las posibilidades intermedias1).
1
Sorprendentemente, incluso hay profesores que califican usando tres decimales.
www.cajondeciencias.com
Cajón de Ciencias
Qué se puede hacer con una variable
Normalmente en estadística se trabaja con tablas de datos, en las que aparecen todas las
posibilidades y la cantidad de veces que ocurre cada cosa. Es como si ordenáramos los resultados de
una encuesta. Pongamos como ejemplo que hemos preguntado a 20 personas sobre su mascota
favorita y los resultados han sido:
Mascota
Número
Perro
8
Gato
6
Hámster
5
Pez
1
La suma de todos los datos nos tiene que dar el total de personas preguntadas (20, en este caso).
Conviene que, cuando ordenes datos en una tabla, te asegures de esto, para comprobar que no se te
haya olvidado ninguno.
Pues bien, con esta pequeña tabla, vamos a definir el primer parámetro estadístico: la moda.
Moda es aquel dato o datos que más se repiten en un conjunto de datos.
En el ejemplo, la moda sería “Perros”. Si más de una mascota hubiese tenido el número más grande,
todos ellos serían moda. Pero si todos los datos se repiten el mismo número de veces, no hay moda.
Mascota
Número
Mascota
Número
Perro
6
Perro
5
Gato
6
Gato
5
Hámster
6
Hámster
5
Pez
2
Pez
5
Aquí la moda serían “perro”, “gato” y “hámster”
www.cajondeciencias.com
Aquí no hay moda
Cajón de Ciencias
Máximos, mínimos y rango
Vamos a trabajar ahora con la siguiente tabla de datos:
Número de pie
Cantidad de personas
38
5
39
8
40
10
41
8
42
9
Se trata de una variable cuantitativa discreta (así repasamos). Cuando tenemos variables que se
miden en números se pueden hacer algunas cosas más que con las discretas.
Por supuesto, podemos sacar la moda. Para este grupo de datos, el que más se repite es el 40; por lo
tanto esa es la moda.
Llamamos máximo al dato más grande de todos (no al que esté en mayor cantidad). En este caso, el
máximo sería 42.
Y, claro está, llamamos mínimo al dato más pequeño de todos (38, en el ejemplo).
Rango es la diferencia entre el máximo y el mínimo. O sea, 42 – 38 = 4.
¿Y qué es la media?
Miremos ahora las notas que había sacado nuestro alumno del principio: un 6, un 5 y un 9. ¿Qué
nota se le pondría al final? Para estos casos, usaremos un parámetro nuevo, al que llamamos
media2.
La media es fácil de calcular: sumamos todos los datos y dividimos el total entre el número de
datos que hay:
media = (6 + 5 + 9)/3 = 6,66
También podríamos calcular la media de la tabla de más arriba. En este caso tendríamos que sumar
5 veces 38 más 8 veces 39, más 10 veces 40, más 8 veces 41, más 9 veces 42. El total lo
dividiríamos entre 20.
2
“Nuevo” aquí, pero seguro que ya has oído antes lo de la media final de las notas. De hecho, es posible que sepas
incluso cómo se calcula.
www.cajondeciencias.com
Cajón de Ciencias
Gráficas y diagramas de barras
Podemos representar en un gráfico los datos de una tabla, para tener una impresión más general (y
estética) de cómo se reparten.
Las gráficas normalmente se usan cuando se representa algo que varía con el tiempo, por ejemplo,
las notas de nuestro alumno. Simplemente colocamos en el eje vertical las notas y en el eje
horizontal, los distintos exámenes:
10
9
8
7
6
5
4
3
2
1
0
Examen 1
Nota
Examen 2
Examen 3
Esta gráfica nos permite ver que el alumno tuvo un bajón después del primer examen, pero que
luego se puso las pilas y consiguió compensar de sobra en el tercero.
Los diagramas de barras (o histogramas) se suelen utilizar cuando hay diversas categorías.
Cojamos ahora los datos del número de pie:
12
10
8
6
Número de
personas
4
2
0
38
39
40
41
42
Como ves, basta con dibujar cada columna hasta la altura correspondiente a su número.
Hay más parámetros en estadística, pero de momento, no necesitas conocer más.
www.cajondeciencias.com
Descargar