Esquemas de Matematicas ACCSS – 1º Bachillerato ESTADÍSTICA Definición. Ciencia que se ocupa de la recogida de datos, organización, análisis y predicciones que de los datos pueden hacerse Clases Descriptiva. Toma de datos, organización y cálculo de parámetros que dan información de manera global de los datos. Inferencial. Extracción de conclusiones y determinación de la fiabilidad de dichas conclusiones. Definiciones Población. Conjuntos sobre el que se realiza el estudio estadístico. Individuo u objeto. Cada elemento de la población. Muestra. Subconjunto representativo de la población. Variable estadística. Cualidad o propiedad que poseen los elementos de una población y que es objeto del estudio. Tipos Cualitativa Cuantitativa Discreta. Pueden tomar un número finito de valores. Continua. Pueden tomar cualquier valor en un intervalo dado. Tablas estadísticas. Forma de organizar los datos. Frecuencias Frecuencia absoluta. Número de veces que aparece un determinado valor de la variable. N n f i i 1 Frecuencia relativa. fi N hi 0 hi 1 n h i 1 i 1 Frecuencia porcentual pi h1 100 n p i 100 i 1 0 pi 100 i Frecuencia acumulada absoluta Fi f i j 1 i Frecuencia acumulada relativa H i h i j 1 Esquemas de Matematicas ACCSS – 1º Bachillerato i Frecuencia acumulada porcentual Pi p i j 1 Gráficos Para variables cualitativas: Diagramas de barras, de sectores, pictogramas, cartogramas. Para variables cuantitativas: Diagramas de barras, polígono de frecuencias. Histogramas para variables continuas o discretas con muchos valores. Tablas estadísticas para variables continuas o discretas con muchos valores Los datos se agrupan en clases. Marca de clase. Valor medio de cada clase. Se utiliza para calcular la media, desviación típica, etc. ¿Cómo se construyen las clases? Número de clases entre 5 y 10. Generalmente clases de igual amplitud. r= xmax – xmin si es necesario aproximar para un valor de c adecuado. Amplitud de clase c r num. clases Esquemas de Matematicas ACCSS – 1º Bachillerato PARÁMETROS Centralización Media aritmética x xi f i N xi hi xi pi pi Parámetro de centralización más utilizado Si se suma k a cada valor xi => x nueva k x antigua Si se multiplica por k cada valor de xi => x nueva k x antigua Si la distribución es continua o discreta con muchos valores la media se calcula con las marcas de clase. Moda Distribución discreta: xi con mayor frecuencia absoluta (puede haber varias) Distribución es continua o discreta con muchos valores: Primera aproximación: CLASE MODAL y Mo= marca de clase. Mayor precisión Mo Li f Mo f Mo 1 f Mo f Mo1 f Mo f Mo1 c Li: límite inferior de la clase modal c: amplitud de la clase modal Mediana Distribución discreta: Valor central de los datos colocados en orden. Distribución es continua o discreta con muchos valores: Primera aproximación: CLASE MEDIANA y Me= marca de clase Mayor precisión N FMe 1 Me Li 2 c f Me FMe-1: Frecuencia acumulada de la clase anterior a la clase mediana Percentiles Dividen la distribución en partes Cuartiles. Q1 deja por debajo el 25% de los datos. Q2 = Me deja por debajo el 50% de los datos. Q3 deja por debajo el 75% de los datos. Para distribuciones continuas o discretas con muchos valores N FQ1 1 Q1 Li 4 c f Q1 3N FQ3 1 Q3 Li 4 c f Q3 Esquemas de Matematicas ACCSS – 1º Bachillerato Deciles Dividen la distribución en 10 partes Para distribuciones continuas o discretas con muchos valores kN FDk 1 1 D k Li 10 c f Dk Percentiles Dividen la distribución en 100 partes Para distribuciones continuas o discretas con muchos valores kN FPk 1 1 Pk Li 100 c f Pk Dispesión Recorrido o rango: R = xmzx - xmin Recorrido intercuartílico: Ri = Q3 – Q1 Desviación media: Media de las desviaciones. desviación x x Desviación media: DM xi x f i N ( x i x) 2 f i xi 2 f i x 2 Varianza: v Desviación típica: v N N Es el parámetro de dispersión más utilizado Si se suma k a cada valor xi => nueva antigua Si se multiplica por k cada valor de xi => nueva k antigua Coeficiente de variación Para comparar poblaciones CV x Parámetros conjuntos x y Cuanto más pequeño es CV más representativa es la media de la distribución. El 95,45% de los datos están en el intervalo x 2 , x 2 El 99,73% de los datos están en el intervalo x 3 , x 3 El 68,27% de los datos están en el intervalo x , x Puntuaciones típicas o normalizadas Para comparar datos individuales de distintas distribuciones Z xx Esquemas de Matematicas ACCSS – 1º Bachillerato DISTRIBUCIONES BIDIMENSIONALES Variable estadística bidimensional (X,Y): Par de valores de dos variables estadísticas unidimensionales. Distribución bidimensional: Tabla formada por pares (xi,yi) y su correspondiente frecuencia Tablas simple entrada Tablas de doble entrada Distribuciones marginales Distribuciones unidimensionales de X e Y. Podemos calcular media y desviación típica marginales: x, y, x , y Diagramas De barras (tridimensional). Nube de puntos (bidimensional): La frecuencia correspondiente a (xi,yi) se representa con puntos. Dependencia o correlación Tipo Funcional: Nube se situa en la gráfica de una función Aleatoria: Nube de puntos se situa próxima a la gráfica de una función. Independencia Grado Lineal. Caso particular de funcional. La función es una recta Según aproximación Fuerte: Nube se aproxima mucho a la gráfica de una función Débil: Se aproxima poco. Según variación Positiva: X Y Negativa: X Y Coeficiente de Pearson Mide el grado de correlación lineal. r xy x , y : desviaciones típicas marginales -1 r 1 r = 1 ó r = -1 correlación funcional xy x y xi y i f i x y N covarianza Esquemas de Matematicas ACCSS – 1º Bachillerato r = 0 no existe correlación r > 0 correlación positiva r < 0 correlación negativa r 1 ó r -1 fuerte r 0 muy débil Recta de regresión xy De y sobre x: y y De x sobre y: x x Ambas pasan por P ( x, y ) centro de gravedad de la nube Si r 0 el ángulo que forman las rectas tiende a 90º Si r 1 ó r -1 el ángulo que forman las rectas tienden a 0º Permite hacer estimaciones x2 xy y2 ( x x) ( y y) Son fiables si r 1 ó r -1 Tienen sentido para valores de las variables próximos a los demás. Esquemas de Matematicas ACCSS – 1º Bachillerato PROBABILIDAD Experimento aleatorio. A priori no se conoce el resultado. Espacio muestral (E). Conjunto de resultados posibles. Suceso. Cualquier subconjunto del espacio muestral. Elemental. Formado por un único elemento del espacio muestral. Compuesto. Formado por varios sucesos elementales. Seguro = E. Imposible = Unión () Comunes y no comunes “O” Intersección () Comunes “Y” Suceso contrario ( A ). Suceso formado por los elementos de E que no están en A. Sucesos incompatibles: A B = Sucesos compatibles: A B Probabilidad Número que se asigna a un suceso para cuantificar la ocurrencia de un número. Probabilidad = Número al que tiende la frecuencia relativa cuando el número de pruebas tiende a infinito. Dos formas de asignar probabilidad Si los sucesos elementales son equiprobables se aplica la Regla de Laplace: P casos favorables casos posibles En cualquier otro caso P = frecuencia relativa. Propiedades 0 P(S) 1 P() = 0 P(E) = 1 Si A B = P(AB) = P(A) + P(B) Si A B P(AB) = P(A) + P(B) – P(A B) P(A) = 1 – P( A ) Probabilidad condicionada. Probabilidad de que ocurra B habiendo ocurrido A. Esquemas de Matematicas ACCSS – 1º Bachillerato P ( B / A) P(AB) = P(A)P(B/A) Sucesos independientes P( A B) P ( A) P(B) = P(B/A) La ocurrencia de uno de no modifica la probabilidad del otro. Sucesos dependientes P(B) P(B/A) La ocurrencia de uno de modifica la probabilidad del otro. Probabilidad total P(A) = P(B1) P(A/B1) + P(B2) P(A/B2) + …. + P(Bn) P(A/Bn) Condiciones A depende de un conjunto de sucesos B1, B2, …, Bn La unión de los sucesos Bi es E. Los sucesos Bi son incompatibles dos a dos. Método gráfico mediante un árbol Esquemas de Matematicas ACCSS – 1º Bachillerato DISTRIBUCIÓN BINOMIAL Distribución de frecuencias discreta. Relaciona una variable discreta con su frecuencia. Empírica. Parámetros x x h x i i 2 i hi x 2 Distribución de probabilidades discreta. Relaciona una variable discreta con su probabilidad. Teórica. Parámetros x p x i i 2 i (media, esperanza matemática o valor esperado). pi x 2 Juegos: si = 0 es justo, si > 0 favorable para el jugador y si < 0 desfavorable para el jugador. Distribución binomial Distribución discreta más utilizada. Se realizan n experiencias idénticas. Cada experiencia es independiente de las otras. Solo dos resultados posibles: ÉXITO (probabilidad = p) y FRACASO (q). p=1–q Se designa por B(n,p). Probabilidad de obtener r éxitos n P X r p r q n r r Donde: n! = n·(n-1)·(n-2)….3·2·1 0! = 1 1! = 1 Tabla de distribuciones binomiales Ej. B(3;0,15) para calcular P(X=2) tenemos que n= 3 , p= 0,15 y r= 2 luego P(X=2)= 0,0574 Parámetros np npq Esquemas de Matematicas ACCSS – 1º Bachillerato DISTRIBUCIÓN NORMAL Distribución de frecuencias continua. Relaciona una variable continua con su frecuencia. Gráfica: Histograma Frecuencia relativa = Área Área total = 1 Si el número de clases tiende a infinito el polígo de frecuencias se convierte en una línea continua. Distribución de probabilidades continua. Relaciona una variable continua con su probabilidad. Gráfica: Una línea continua La probabilidad = Área Prob. total = Área total = 1 No podemos calcular P(X=a) ya que el área sería 0. Distribución normal o de Gauss f(x) 1 x e 2 2 2 Gráfica en forma de campana. Se designa por N(,) El 68,26% de los datos están entre (-,+) El 95,44% de los datos están entre (-2,+2) El 99,73% de los datos están entre (-3,+3) Distribución normal estándar o tipificada N(0,1) x (tipificación de la variable) Z Utilización tabla (lo mejor es hacer un dibujo) Probabilidad de un valor positivo P(Z k) ver tabla P(Z k) = 1 - P(Z k) Probabilidad de un valor negativo P(Z -k) = P(Z k) = 1 - P(Z k) P(Z - k) = P(Z k) Probabilidad entre dos positivos P(h Z k) = P(Z k) - P(Z h) Probabilidad entre dos negativos P(-h Z -k) = P(Z h) - P(Z k) Probabilidad entre un negativo y un positivo 1 P(-h Z k) = P(Z k) + P(Z h) – 1 Aproximación de la normal a la binomial B(n,p) se aproxima por N(,) tomando: np npq La aproximación es mejor si np>5 y nq>5. Esquemas de Matematicas ACCSS – 1º Bachillerato Corrección de Yates P(X = k) = P(k-0,5 X’ k+0,5) P(X k) = P(X’ k+0,5) P(X < k) = P(X’ k-0,5) P(X k) = P(X’ k-0,5) P(X > k) = P(X’ k+0,5) Ajuste de datos a una normal Se calculan x y de los datos Se calculan las probabilidades de cada clase de la tabla Se comparan las pi calculadas con las hi empíricas, si son similares los datos siguen una distribución continua.