Métodos Estadı́sticos de la Ingenierı́a Tema 1: Distribución de Frecuencias Grupo B Área de Estadı́stica e Investigación Operativa Licesio J. Rodrı́guez-Aragón Enero 2010 Contenidos. . . . . . . . . . . . . . . . . . . . . . Introducción a la Estadı́stica . . . . . . . . . Población, Muestra y Carácter . . . . . . . Frecuencia Absoluta . . . . . . . . . . . . . . . Frecuencia Relativa . . . . . . . . . . . . . . . Frecuencias Absolutas y Relativas con R Frecuencias Absolutas y Relativas con R Frecuencias Acumuladas (Cumulative) . . Frecuencias Acumuladas con R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 3 4 5 6 7 8 9 10 Contenidos Introducción a la Estadı́stica. Introduction to Statistics. Población, Muestra y Carácter. Population, Sample and Character. Frecuencias Absolutas y Relativas. Absolute and Relative Frequencies. La Distribución de Frecuencias son el objeto de la Estadı́stica Descriptiva Licesio J. Rodrı́guez-Aragón Tema 1, M.E.I. – 2 / 10 Introducción a la Estadı́stica Fenómenos Determinı́sticos (Deterministic): Aquellos que llevados a cabo en las mismas condiciones, conducen siempre al mismo resultado. Fenómenos Aleatorios (Random): Sujetos al azar. Llevados a cabo en las mismas condiciones dan resultados diferentes. Estadı́stica, Descriptiva (Descriptive): Establece normas para obtener datos, ordenarlos en tablas, representarlos gráficamente y reducirlos. Inferencial (Inferential): Deduce o infiere a partir de los datos, leyes o propiedades para establecer un modelo teórico de probabilidad que sigue la población de la que proceden los datos. Licesio J. Rodrı́guez-Aragón Tema 1, M.E.I. – 3 / 10 2 Población, Muestra y Carácter Población (Population): Conjunto de Individuos, objetos o entes en general, sobre los que van a recaer observaciones de un número finito de caracterı́sticas. Unidad Estadı́stica: Cada uno de los elementos que componen la población estadı́stica. Muestra (Sample): Conjunto finito de unidades estadı́sticas, pudiendo estar repetidas o no. En muchos experimentos cientı́ficos la población estadı́stica es el conjunto imaginario de infinitas repeticiones del experimento. Carácter (Character, Class): Propiedad o cualidad inherente en las unidades estadı́sticas. Algunos medibles, cuantificables, otros no, cualidades. – Cuantitativos o Medibles (Quantitative): altura, peso, longitud, densidad, etc. – Cualitativos o Cualidades (Cualitative): Válido/Defectuoso, G/M/P, Soltero/Casado/Viudo, etc. Modalidades: Diferentes valores o situaciones que puede tomar un carácter. Variable Estadı́stica (Statistical Variable): El valor que adopta un carácter de entre sus distintas modalidades posibles. Cuantitativas. – Discretas (Discrete) (Cantidad finita o numerable): Pasos de vuelta completos en 1 m de barra roscada. – Continuas (Continuous): Gramos de barniz por recipiente, en una planta de envasado. Cualitativas. – Nominal (No admite orden): Control de calidad, Válido, Desechar, Reparar. – Ordinal (Admite orden): Clasificación en categorı́as, productos alimenticios (huevos). Licesio J. Rodrı́guez-Aragón Tema 1, M.E.I. – 4 / 10 3 Frecuencia Absoluta Consideremos una muestra de tamaño n, extraı́da de una población estadı́stica de la que observamos un carácter C que puede tomar las modalidades C1 , C2 , . . . , Cm . Se llama Frecuencia Absoluta de la modalidad Ci al número de veces ni que aparece repetida esa modalidad en el conjunto de observaciones realizadas. Es decir, número de unidades estadı́sticas de la muestra que presentan la modalidad Ci . Debido a que las modalidades constituyen una partición del espacio muestral, n1 + n2 + · · · + nm = m X ni = n i=1 0 ≤ ni ≤ n, para todo i = 1, 2, . . . , m Absolute Frequency: The number of data points which fall within a given class in a frequency distribution. Ejemplo: Fábrica de barras roscadas de 5 m. Población: Unidad Estadı́stica: Muestra: 120, 121, 120, 119, 121, 120, 120, 119, 120, 121, 120, 120, 122, 120, 121, 120, 119, 122, 120, 119 Carácter: Modalidad: Variable Estadı́stica: Licesio J. Rodrı́guez-Aragón Tema 1, M.E.I. – 5 / 10 4 Frecuencia Relativa La Frecuencia Relativa de la modalidad Ci se define como el cociente entre la Frecuencia Absoluta y el tamaño de la muestra, fi = ni /n para todo i = 1, . . . , m Es inmediato, por definición de Frecuencia Absoluta, f1 + f2 + · · · + fm = m X fi = 1 i=1 0 ≤ fi ≤ 1, para todo i = 1, . . . , m. Suele ser frecuente hablar en términos de porcentajes, multiplicando las frecuencias relativas por 100. Relative Frequency: The ratio of the absolute frequency to the total number of data points in a frequency distribution. Ejemplo: Carácter Ci C1 = 119 C2 = 120 C3 = 121 C4 = 122 Total ni P ni = 20 Licesio J. Rodrı́guez-Aragón fi P fi = 1 Tema 1, M.E.I. – 6 / 10 Frecuencias Absolutas y Relativas con R > x <- c(120, 121, 120, 119, 121, 120, 120, 119, 120, 121, 120, + 120, 122, 120, 121, 120, 119, 122, 120, 119) > table(x) x 119 120 121 122 4 10 4 2 > table(x)/length(x) x 119 120 121 122 0.2 0.5 0.2 0.1 Licesio J. Rodrı́guez-Aragón Tema 1, M.E.I. – 7 / 10 5 Frecuencias Absolutas y Relativas con R > addmargins(table(x)) x 119 120 121 122 Sum 4 10 4 2 20 > addmargins(table(x)/length(x)) x 119 120 121 122 Sum 0.2 0.5 0.2 0.1 1.0 Licesio J. Rodrı́guez-Aragón Tema 1, M.E.I. – 8 / 10 Frecuencias Acumuladas (Cumulative) Frecuencia Absoluta Acumulada: Tiene sentido para variables cuantitativas y cualitativas ordinales. i X Ni = n1 + n2 + · · · + ni = nk k=1 Verificándose Nm = n. Frecuencia Relativa Acumulada: Tiene sentido para variables cuantitativas y cualitativas ordinales. i X n1 + n2 + · · · + ni Fi = = f1 + f2 + · · · + fi = fk n k=1 Verificándose Fm = 1. Ejemplo: Carácter Ci C1 = 119 C2 = 120 C3 = 121 C4 = 122 Total ni P Ni fi =n ni = 12 P Fi 1 fi = 1 Ejercicio: Calcular la tabla de Frecuencias: Absolutas, Relativas y sus respectivas Acumuladas, usando algún tipo de herramienta informática: Excel, Matlab, R, etc. Licesio J. Rodrı́guez-Aragón Tema 1, M.E.I. – 9 / 10 6 Frecuencias Acumuladas con R > cumsum(table(x)) 119 120 121 122 4 14 18 20 > cumsum(table(x)/length(x)) 119 120 121 122 0.2 0.7 0.9 1.0 Licesio J. Rodrı́guez-Aragón Tema 1, M.E.I. – 10 / 10 7