MA : ESTADÍSTICA Y PROBABILIDAD. 9.1 ESTADÍSTICA: .- Conceptos: - Estadística: parte de las matemáticas dedicada al estudio y análisis de datos referidos a fenómenos colectivos. Por lo tanto, no es sólo un recuento de datos, sino también las conclusiones que se pueden extraer a partir de ellos. - Carácter estadístico: cualquier propiedad que se puede estudiar en una población y que permite clasificar a sus individuos. o Cualitativo: si no se puede medir. Ej: color de pelo. Se denomina modalidad. o Cuantitativo: si se puede medir y expresar con un número. Ej: número de veces que vas al cine. Se denomina variable estadística. - variable estadística: cualquier característica observable y cuantificable en un colectivo o grupo. Conjunto de todos los valores que puede tomar un carácter estadístico cuantitativo. o Discreta: cuando sólo toma valores aislados. Ej: nº entradas que compras (sólo pueden ser nº naturales) o Continua: cuando puede tomar todos los valores de un intervalo. Ej: altura, si medimos hasta milimitros. - dato estadístico: valor/valores que toma la variable al realizar un experimento (una medición, una encuesta, etc). - frecuencia absoluta: número de veces que se repite cada valor o dato de la variable estadística. La suma de todas las frecuencias absolutas tiene que ser igual al número total de datos recogidos. - Frecuencia absoluta acumulada: suma de la frecuencia absoluta de un dato en concreto y las de los datos menores que él. - frecuencia relativa: (de un dato estadístico) es el cociente/relación/razón entre su frecuencia absoluta y el nº total de datos recogidos. El resultado de dicho cociente (división) se encuentra siempre entre 0 y 1 (tanto por uno). Si se quiere expresar en tanto por ciento habrá que multiplicar el valor obtenido por 100(frecuencia porcentual). La suma de todas las frecuencias relativas es igual a 1 si está expresada en tanto por uno o igual a 100 si se expresa en tanto por ciento. Ejemplo: “he sacado un 7 en tres de los cinco exámenes de matemáticas que hemos hecho”. Variable: nota del examen Dato: un 7 Fabs: 3 Fr: 3/5= 0,6(60%) Los datos recogidos en un estudio estadístico se organizan en tablas estadísticas en las que aparecen: la variable con los datos/valores que toma; las frecuencias absolutas de dichos valores/datos; y las frecuencias relativas de los mismos. Puede aparecer una columna más con las frecuencias absolutas acumuladas. La frecuencia absoluta acumulada del último dato tiene el mismo valor que el número total de datos recogidos. Nota examen (xi) 5 7 9 F. absoluta (fi) F. relativa (hi) 1 3 1 5 0,2 0,6 0,2 1 F. absoluta acumulada (Fi) 1 4 5 Medidas de centralización de datos: - - - Moda: Es el valor o dato de la variable estadística que más veces se repite. (el valor más alto en la columna/fila de las Fabs) Mediana: es el valor central (el que ocupa el centro) cuando los datos están ordenados en orden creciente. Si el nº de datos es impar siempre queda uno en el centro que será la mediana. En caso de tener un nº de datos pares, habrá 2 datos centrales yt la mediana será la media de ambos. Media aritmética simple o media: valor medio de todos los datos. Se obtiene sumando todos los datos y dividiendo por el nº total de datos recogidos. O sumando los productos de cada dato por su frecuencia absoluta y dividiendo por el nº total de datos recogidos Media aritmética ponderada o media ponderada: Es la media que se obtiene cuando los datos no tienen igual peso o valor. Para calcularla se debe realizar el cociente entre la suma de los productos de cada dato por su peso y la suma total de los pesos. Las cuatro son medidas de centralización de los datos que nos ayudan en el análisis y estudio de los mismos en busca de relaciones y conclusiones sobre ellos. Además de las tablas estadísticas y las medidas de centralización, los gráficos estadísticos también nos sirven para el estudio y análisis estadísticos: - Diagrama de barras: gráfico en el que los datos se representan mediante rectángulos de igual base y altura proporcional a su frecuencia. - Polígono de frecuencias: es un diagrama de barras en el que se unen los puntos medios superiores de las barras con una línea poligonal. - Pictogramas: son diagramas de barras en los que se utilizan dibujos que hacen alusión a la variable, en vez de barras, para representar las frecuencias. - Diagrama de sectores: es un gráfico en forma de círculo en el que la amplitud de cada sector es proporcional a la frecuencia. Para calcular dicha amplitud, hay que dividir 360º entre el número total de datos recogidos y después multiplicar el resultado por cada una de las frecuencias absolutas de cada uno de los datos estadísticos. Los más utilizados en estadística son el diagrama de barras y el diagrama de sectores. Diagrama de barras Polígono de frecuencias Pictograma Diagrama de sectores Además de las medias de centralización de datos, también se pueden calcular las medias de dispersión, que miden la separación de los datos respecto de la media. Nos dan una idea de lo separados que están los datos respecto de la media y entre si, pudiendo saber si esta va a ser o no representativa. - Rango o recorrido: es la diferencia entre el mayor y el menor de los datos de un conjunto de datos. - Desviación media( D ) :es la media aritmética de los valores x absolutos de las desviaciones respecto a la media. ¿Cómo calcularla? 1º.- calcular las diferencias entre cada dato estadístico y la media aritmética ( x ) d i xi x 2º.- tomar dichas diferencias en valor absoluto. 3º.- calcular la media de esos valores absolutos. DATOS AGRUPADOS EN INTERVALOS: Cuando hay un nº elevado de datos se pueden agrupar en intervalos o clases, que siempre tendrán la misma amplitud. Para calcular las medidas de centralización de datos (mediana, media y moda) habrá que utilizar un valor que represente a toda la clase. Ese valor será el punto medio del intervalo y se conoce como marca de clase (xi), incluyéndose siempre en la tabla estadística. La marca de clase se utiliza para el cálculo de la mediana y la media aritmética simple y para determinar la moda. A la hora de calcular la moda, estaremos hablando de la clase modal, aquella que tiene la mayor frecuencia, y se tomara como moda la marca de clase correspondiente Además, a la hora de representar los diagramas de barras, la base de esas barras irá desde el extremo inferior al extremo superior de cada intervalo, quedando las barras contiguas unas a otras (pegadas). A este tipo de gráficos se les denomina histogramas. En el caso de las medidas de dispersión, para el cálculo de la desviación media también se utiliza la marca de clase y en el caso del rango se calcula a través de la diferencia entre el extremo superior del último intervalo y el extremo inferior del primer intervalo. 9.2 PROBABILIDAD: .- Conceptos: - Experimento o fenómeno aleatorio: aquel en el que no se puede predecir el resultado. - Espacio muestral: conjunto formado por todos los resultados posibles de un experimento. - Suceso: resultado en un experimento. Cualquier parte del espacio mustral - Suceso elemental: formado por un solo resultado. - Suceso seguro: es el que siempre se realiza, coincide con el espacio muestral. - Suceso imposible: el que nunca se realiza, coincide con el conjunto vacio. - Suceso contrario al suceso A ( A ): el que se realiza cuando no se realiza A. Sucesos incompatibles: que no se pueden realizar a la vez Sucesos compatibles: que se pueden realizar a la vez Probabilidad de un suceso: nº al que se aproxima la Fr cuando se repite un experimento muchas veces. Indica la facilidad con la que puede ocurrir dicho suceso. Cuando en un experimento aleatorio, todos los sucesos tienen las mismas posibilidades de ocurrir, la probabilidad del suceso se puede calcular a través de la regla de Laplace: P(A) = nº casosfavorablesalsucesoA nº casosposibles Propiedades: .- es un nº comprendido entre 0 y 1. .- P( suceso seguro)= 1 .- P(suceso imposible)= 0 .- P( A ) = 1 – P(A)