COLEGIO FRANCISCANO AGUSTIN GEMELLI AREA MATEMATICAS “Las matemáticas son el lenguaje con el cual Dios a escrito el universo”. Galileo Galilei ESTADISTICA GRADO UNDECIMO 2012 PGF03-R03 Contenido UNIDAD 1 ................................................................................................................................. 5 TENDENCIAS Y PRONOSTICOS ............................................................................................ 5 CLASIFICACION DE LOS PRONOSTICOS .......................................................................... 7 METODOS CON SERIES DE TIEMPO ............................................................................... 10 UNIDAD 2 ............................................................................................................................... 16 REGRESION LINEAL SIMPLE Y MULTIPLE ........................................................................ 16 METODOS CAUSALES....................................................................................................... 17 UNIDAD 3 ............................................................................................................................... 24 NORMALIDAD Y TECNICAS DE CONTEO ........................................................................... 24 ERROR DE PRONÓSTICO ................................................................................................. 26 DISTRIBUCION NORMAL ................................................................................................... 34 LA DISTRIBUCION NORMAL ESTANDARIZADA O TIPIFICADA ...................................... 36 UNIDAD 4 ............................................................................................................................... 41 PROCESO DE INVESTIGACION ........................................................................................... 41 PROCESO DE INVESTIGACIÓN ........................................................................................ 43 PLANTEAMIENTO Y PREPARACION DE UNA INVESTIGACION ESTADISTICA ............ 44 RECOLECCION DE LOS DATOS ....................................................................................... 47 CRÍTICA Y CODIFICACION ................................................................................................ 48 TABULACION Y PROCESAMIENTO .................................................................................. 48 ANALISIS E INTERPRETACION. ........................................................................................ 49 BIBLIOGRAFIA ....................................................................................................................... 51 MATEMATICAS - Estadística 11 2 PGF03-R03 PRESENTACION Este módulo de estadística conserva la filosofía y la metodología sobre las cuales se concibió y desarrollo la primera edición de esta obra, en él se cubren los conceptos básicos y métodos estadísticos en forma clara y concisa, las explicaciones se han reducido al mínimo a favor de la exposición de ejemplos concretos, pretendiendo que el estudiante tome parte activa en la clase, lo cual ayuda muchísimo en el análisis de situaciones propuestas. El módulo aborda un conocimiento matemático que desde los comienzos de la civilización ha existido en forma sencilla. En la estadísticas ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año 3000 A.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 A.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el año 594 A.C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la iglesia en los años 758 y 762 respectivamente. MATEMATICAS - Estadística 11 3 PGF03-R03 Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico. Comité Área de Matemáticas MATEMATICAS - Estadística 11 4 PGF03-R03 UNIDAD 1 TENDENCIAS Y PRONOSTICOS PROPOSITO Reconocer el concepto y clasifica el pronóstico cualitativo e interpretar los métodos causales en pronósticos mediante la solución de problemas de Series de Tiempo. MATEMATICAS - Estadística 11 5 PGF03-R03 EL CASO HENREDON Antes de la recesión de 1930, el tiempo promedio necesario para fabricar y embarcar un pedido era de 11 semanas. A fin de satisfacer la exigencia de rapidez en la entrega, Tomas Henredon tuvo que reducir el tiempo necesario para fabricar y embarcar los pedidos. De esta manera, la precisión de los pronósticos de demanda se convirtió en un factor fundamental para llegar a satisfacer esa prioridad competitiva. En el sistema de pronósticos anterior a la recesión, los programas de producción e inventarios se basaban en el promedio de la demanda que cada producto había tenido durante los últimos 4 meses anteriores. Sin embargo, ese método no resulto eficaz por que más del 10% de los productos comercializados por Henredon cada año eran nuevos y por consiguiente no tenían historial de pedidos. En el nuevo sistema de pronósticos, los productos nuevos se consideran en forma diferente a los productos con historia. Los pronósticos productos nuevos se basan en una curva creada a partir de los pedidos generados durante las exposiciones semestrales de muebles y por la experiencia de Henredon con productos similares en el pasado. Gracias a la eficacia de los pronósticos ha sido posible reducir el tiempo necesario para fabricar y embarcar un pedido a solo 5 semanas. Esta mejora favoreció el servicio al cliente y redujo los inventarios. Durante la recesión, los pedidos de Henredon aumentaron un 5% con respecto a al periodo anterior a pesar de una disminución de las ventas en toda la industria. PRONÓSTICOS Un pronóstico es una predicción de eventos futuros que se utiliza con propósitos de planificación, y en la cual se utilizan variables cualitativas y cuantitativas que permitan corroborarlos. En el mundo de los negocios donde el rápido cambio tecnológico y las crecientes preocupaciones por el medio ambiente han ejercido presiones para mejorar su competitividad, los pronósticos se convierten en un elemento auxiliar planear la producción y/o comercialización de los productos. Las observaciones de la demanda de un producto o servicio tomando como base el orden en que se presentan, forman un patrón que se conoce como SERIE DE TIEMPO. MATEMATICAS - Estadística 11 6 PGF03-R03 CLASIFICACION DE LOS PRONOSTICOS Para pronosticar la demanda de productos y/o servicios se utilizan dos tipos generales de métodos, los cualitativos y los cuantitativos: cada uno es apropiado dependiendo del entorno en que se encuentre, el plazo que se quiera pronosticar y los datos históricos con los que se cuente. Pronósticos cualitativos: Este método es apropiado cuando los datos confiables son escasos o difíciles de emplear. Por ejemplo: cuando se introduce un nuevo producto o tecnología, no se cuenta con datos históricos adecuados y cuando la experiencia pasada no constituye un criterio seguro para estimar cuáles serán los efectos a corto plazo. Este pronóstico implica el uso de juicios subjetivos y esquemas de clasificación para transformar la información cualitativa en estimaciones cuantitativas. Los elementos de juicio del pronóstico cualitativo son sobre todo, resultado del pensamiento intuitivo, el juicio y la acumulación de conocimientos y experiencia. Dentro de los métodos cualitativos de pronósticos encontramos: Estimación de la fuerza de ventas: A veces la mejor información sobre la demanda futura proviene de las personas que están más cerca de los clientes. Las estimaciones de la fuerza de ventas son pronósticos compilados a partir de conjeturas acerca de la demanda futura, elaboradas periódicamente por miembros del equipo de ventas de las compañías. Opinión ejecutiva: Cuando se lanza un nuevo producto servicio, la fuerza de ventas no siempre es capaz de hacer estimaciones precisas de la demanda. La opinión ejecutiva, es un método de pronóstico en el cual se hace un resumen de las opiniones, la experiencia, y los conocimientos técnicos de uno o varios gerentes, con el fin de llegar a un solo pronóstico. Investigación de mercados: Consiste en un enfoque sistemático para determinar el grado de interés del consumidor por un producto o servicio, mediante la creación y puesta a prueba de diversas hipótesis por medio de encuestas encaminadas a la recopilación de datos. Método Delphi: Es un proceso para obtener el consenso de un grupo de expertos al tiempo que se respeta el anonimato de sus integrantes. Esta forma de pronostico es útil cuando no existen datos históricos sobre los cuales puedan desarrollarse modelos MATEMATICAS - Estadística 11 7 PGF03-R03 estadísticos y cuando los gerentes de la compañía no tienen experiencia en la cual fundamentar sus proyecciones. Pronósticos cuantitativos: Este hace una extrapolación del pasado o se utiliza cuando se cuenta con suficientes datos estadísticos o confiables para especificar las relaciones existentes entre variables fundamentales. El pronóstico basado en la extrapolación, como un análisis de series de tiempo, recurre a las tendencias pasadas o presentes a fin de proyectar los acontecimientos futuros. Así, los registros de ventas en los últimos años podrían servir para proyectar el patrón de ventas para el próximo año. El pronóstico cualitativo no exige datos numéricos ni estadísticos en la misma forma que el cuantitativo. Este último puede aplicarse si se cuenta con información sobre el pasado, si se le puede especificar numéricamente y si es posible suponer que continuará el patrón del pasado. Los pronósticos cuantitativos se clasifican en: Métodos causales: Se emplean cuando se dispone de datos históricos y la relación entre el factor que se intente pronosticar y otros factores externos o internos puede identificarse. Estos métodos proveen instrumentos de pronóstico más refinados y exactos, son excelentes para la pronosticar la demanda a largo plazo y utilizan datos históricos de variables independientes, como campañas de promoción, condiciones económicas y actividades de los competidores. Métodos con series de tiempo: En lugar de emplear variables independientes para el pronóstico, como en los modelos de regresión lineal, los métodos con series de tiempo usan información histórica que solo proviene de la variable dependiente. Estos métodos están basados en la suposición de que el patrón de la variable dependiente en el pasado habrá de continuar en el futuro. MATEMATICAS - Estadística 11 8 PGF03-R03 Responde en tu cuaderno las siguientes preguntas: 1. Investiga las causas y consecuencias de la crisis económica de los años 30, conocida como “La gran depresión”. 2. ¿Cómo cree usted que un sistema de pronósticos ayudaría a una empresa o industria? 3. Aun sin conocer a fondo los métodos o sistemas de pronóstico, ¿cuales consideraría usted que se deben aplicar para obtener mejores resultados? ¿Los cualitativos, los cuantitativos? ¿Por qué? 4. De los métodos cualitativos expuestos en la lectura, cual consideraría usted conveniente para su empresa. Si usted fuera un empresario ¿Por qué? 5. Según lo expuesto en el caso Henredon, ¿cuál cree que hubiese sido el impacto en la economía durante la recesión de 1930, si más industrias hubiesen aplicado algún sistema de pronóstico adecuado? MATEMATICAS - Estadística 11 9 PGF03-R03 METODOS CON SERIES DE TIEMPO PROMEDIO MOVIL SIMPLE: S e usa para estimar el promedio de una serie de tiempo de demanda y, por lo tanto, para suprimir los efectos de las fluctuaciones al azar. Este método resulta más útil cuando la demanda no tiene tendencias pronunciadas ni influencias estacionales. El método consiste en calcular la demanda promedio de los n periodos más recientes, con el fin de usarla como pronostico para el siguiente periodo. Para el periodo siguiente, una vez se conoce la demanda real, la demanda más antigua del promedio anterior se sustituye por la demanda mas reciente y luego se vuelve a calcular el promedio. De esta manera se usan las n demandas más recientes, por los cuales promedio se “mueve” de un periodo a otro. En términos específicos, el pronóstico correspondiente al periodo t+1 se puede calcular en la siguiente forma: Ft 1 Sum ade las ultim asn dem andas Dt Dt 1 Dt 2 ...... Dtn 2 n n Donde: t = Periodo de tiempo. Dt = Demanda real en el periodo t n =Numero de periodos incluidos en el promedio. Ft+1 =Pronostico para el periodo t+1 MATEMATICAS - Estadística 11 10 PGF03-R03 EJERCICIO DE SIMULACIÓN Elabore un pronóstico de promedio móvil de 3 semanas para estimar la llegada de pacientes a la clínica médica durante la semana 4. Los números correspondientes a las llegadas de pacientes durante las 3 últimas semanas fueron: Semana 1 2 3 No Pacientes 400 380 411 El promedio móvil al final de la semana 3 es: 411 380 400 F4 397 Pacientes 3 Si el número real de pacientes durante la semana 4 fue de 415 ¿Cuál será el pronóstico para la semana 5? F5 415 411 380 402 Pacientes 3 PROMEDIO MOVIL PONDERADO: En el promedio móvil simple, todas las demandas tienen la misma ponderación (Valen igual). En el promedio móvil ponderado, cada una de las demandas históricas que intervienen en el promedio puede tener su propio valor o ponderación. El resultado de la suma de las ponderaciones es igual a 1.0 por ejemplo, en un modelo de promedio móvil ponderado de 3 periodos; al periodo más reciente se le puede asignar un ponderación de 0.50; al segundo más reciente, un ponderación de 0.3 y el tercero más reciente, una ponderación de 0.20. El promedio se obtiene multiplicando la ponderación de cada periodo por el valor correspondiente a dicho periodo y sumando finalmente los productos. Ft 1 0.50Dt 0.30Dt 1 0.20Dt 2 MATEMATICAS - Estadística 11 11 PGF03-R03 EJERCICIO DE MODELACIÓN Semana 1 2 3 4 No Pacientes 400 380 411 415 El analista que está a cargo de la clínica médica ha asignado ponderaciones de 0.70 a la demanda de la semana más reciente; 0.20 a la demanda de hace una semana y 0.10 a la demanda de hace 2 semanas. Use los datos correspondientes a las 3 primeras semanas del ejemplo anterior para calcular el pronóstico para las semanas 4 y 5. F4 = 0.70 (411) + 0.20 (380) + 0.10 (400) F4 = 403.7 ≈ 404 Pacientes F5 = 0.70 (415) + 0.20 (411) + 0.10 (380) F5 = 410.7 ≈ 411 Pacientes. EJERCICIO DE MODELACIÓN Katty’s Pizza es un pequeño restaurante. Una de sus especialidades es la pizza Premium. El gerente de la empresa debe pronosticar la demanda semanal de pizzas, para saber que cantidad de ingredientes pedir cada semana. A últimas fechas la demanda ha sido la siguiente: Semana del 2 de junio 9 de junio 16 de junio 23 de junio 30 de junio 7 de julio No Pizzas 50 65 52 56 55 60 a. Pronostique la demanda de pizzas para el periodo comprendido entre el 23 de junio y el 14 de julio, usando el promedio móvil simple con n 0 3. b. Pronostique los mismos periodos, utilizando el promedio móvil ponderado con n=3 y ponderaciones de 0.50, 0.30 y 0.20. MATEMATICAS - Estadística 11 12 PGF03-R03 Solución: Podemos sintetizar los resultados en el siguiente cuadro: Semana del 23 de junio Pronostico con promedio móvil ponderado 0.50 (52) + 0.30 (65) + 0.20 (50) =55.5 ≈ 52 65 50 55 .7 56 56 3 30 de junio 0.50 (56) + 0.30 (52) + 0.20 (65) =56.6 ≈ 56 52 65 57 .7 58 57 3 7 de julio 0.50 (55) + 0.30 (56) + 0.20 (52) =54.7 ≈ 55 56 52 54 .3 54 55 3 14 de julio Pronostico con promedio móvil simple 60 55 56 57 3 0.50 (60) + 0.30 (55) + 0.20 (56) =57.7 ≈ 58 1. Las temperaturas máximas diarias en la ciudad de Ibagué la semana pasada fueron así: 26º, 32º, 20º, 22º, 19º, 35º, 24º (Ayer). a. Pronostique la temperatura máxima a partir del cuarto día, utilizando el promedio móvil de tres días. b. Pronostique la temperatura máxima para los mismos días, utilizando un promedio móvil de dos días. 2. Para los datos que están a continuación, desarrollar un pronóstico de promedio móvil a partir del mes de abril. Mes 1(Enero) 2(Febrero) Ventas de autos 20 21 MATEMATICAS - Estadística 11 13 PGF03-R03 3 (Marzo) 4 (Abril) 5 (Mayo) 6 (Junio) 7 (Julio) 8 (Agosto) 9(Septiembre) 10(Octubre) 11(Noviembre) 12(Diciembre) 15 14 13 16 17 18 20 20 21 23 a. De tres meses. b. Luego pronostique los mismos meses con un promedio móvil ponderado con ponderaciones de 0.4 el más reciente, 0.35 el segundo más reciente y 0.25 para el tercero más reciente. 3. La demanda para cirugías de trasplante de corazón en el hospital militar ha crecido constantemente en los últimos años, como se aprecia en la siguiente tabla: Año 1 2 3 4 5 6 7 8 9 10 No de cirugías 45 50 52 56 58 61 55 63 63 59 El médico de servicios desea saber cuáles serian los pronósticos de cirugías desde el año cuatro si se utilizara el método del promedio móvil simple de cuatro periodos. Y luego compararlos con los resultados que mostraría un pronóstico calculado con el promedio móvil ponderado donde el año más reciente vale 0.35, el segundo vale 0.30, el tercero 0.25 y el cuarto 0.20 MATEMATICAS - Estadística 11 14 PGF03-R03 4. Un nadador profesional realiza entrenamientos semanales de preparación para competencia internacional, arrojando los siguientes datos. Semana # Piscinas 1 150 6 11 16 21 2 3 4 90 110 95 7 8 9 12 13 14 17 18 19 22 23 24 10 15 20 25 5 a. Hallar el valor de la semana 5 a 25 b. Graficar. 5. Las temperaturas máximas diarias en la ciudad de Ibagué la semana pasada fueron así: Día Temperatura 1 26º 6 11 16 2 3 4 32º 20º 19º 7 8 9 12 13 14 17 18 19 5 35º 10 15 20 a. Realizar promedio móvil ponderado para el primer día 0.1, segundo día 0.3, tercer día 0.15, cuarto día 0.25, quinto día 0.2 hallar el valor de las temperaturas hasta la semana 20 b. Graficar MATEMATICAS - Estadística 11 15 PGF03-R03 UNIDAD 2 REGRESION LINEAL SIMPLE Y MULTIPLE MATEMATICAS - Estadística 11 16 PGF03-R03 PROPOSITO Reconocer el concepto y clasifica el pronóstico cualitativo e interpretar los métodos causales en pronósticos mediante la solución de problemas de regresión lineal simple. METODOS CAUSALES REGRESIÓN LINEAL SIMPLE. En este método una variable, conocida como dependiente, está relacionada con una o más variables independientes por medio de una ecuación lineal, la variable dependiente es la que se desea pronosticar. En el modelo de regresión lineal simple, la variable dependiente es función de una sola variable independiente y, por lo tanto la relación teórica es una línea recta. Formula: Y a bx donde: Y = Variable dependiente x = Variable independiente a = intersección de la recta con el eje Y MATEMATICAS - Estadística 11 17 PGF03-R03 b = pendiente de la recta El objetivo del análisis de regresión lineal consiste en encontrar los valores de a y b que minimicen la suma de las desviaciones al cuadrado de los puntos de la línea de regresión, y que corresponden a datos reales, es decir que los datos que se pretende pronosticar no estén alejados de los datos históricos y reales que se han venido presentando. Formulas necesarias en un modelo de regresión lineal simple: b XY n( X )(Y ) X n( X ) 2 a Y bX 2 Coeficiente de correlación lineal (r): Es un valor entre -1 y 1 y dice que tan bien se relacionan las variables dependiente e independiente en el modelo de regresión lineal. Si r tiende a 1 significa que hay mucha relación entre las variables (En forma directa y proporcional); Si r tiende a -1 hay una relación inversamente proporcional entre las variables (Si la una aumenta, la otra disminuye); y si r tiende a 0 significa que no hay ningún tipo de relación entre las variables. r n xy x y (n x 2 x ) * (n y 2 y ) 2 Error de estimación estándar ( de regresión. S xy 2 S xy ): mide la dispersión de los datos con relación a la recta y 2 a( y) b( xy) n2 COEFICIENTE DE DETERMINACIÓN: Mide la cantidad de variación que presenta la variable dependiente con respecto al valor medio ( Y ). Es igual a r2. Si tiende a 1.0, significa que las variables están estrechamente relacionadas EJERCICIO DE SIMULACIÓN MATEMATICAS - Estadística 11 18 PGF03-R03 La siguiente es la informaron de las ventas de los últimos 3 años de una empresa productora de carros a nivel nacional expresados en trimestres. Trim. (X) 1 2 3 4 5 6 7 8 9 10 11 12 ∑= 78 X b X n Dda.(Y) 4800 3500 4300 3000 3500 2700 3500 2400 3200 2100 2700 1700 37.400 78 6.5 12 XY 4800 700 12900 12000 17500 16200 24500 19200 28800 21000 29700 20400 214000 Y X2 1 4 9 16 25 36 49 64 81 100 121 144 650 Y2 23.040.000 12.250.000 18.490.000 9.000.000 12.250.000 7.290.000 12.250.000 5.760.000 10.240.000 4.410.000 7.290.000 2.890.000 125.160.000 Y n 37400 3116.66 12 214000 12(6.5)(3116.66) 214000 243099.48 29099.48 203.49 650 507 143 650 12(6.5) 2 a = 3116,66 – (-203,49) (6,5) = 4439,34 La ecuación de pronóstico es la siguiente: Y = 4439,34 + (-203,49) (X) Pronosticar la demanda para los trimestres 13 y 14 Y13 = 4439,34 + (-203,49) (13) Y13 = 4439,34 – 2645,37 = 1793,97 ≈ 1794 Carros (Pronostico Para el trimestre 13) Y14 = 4439,34 + (-203,49) (14) Y14 = 4439,34 – 2848,86 = 1590,48 ≈1590 Carros (Pronostico Para el trimestre 14) Hallar los coeficientes de correlación y determinación y el error de estimación estándar, e interpretar los resultados: MATEMATICAS - Estadística 11 19 PGF03-R03 12(214000) (78)(37400) r ((12)(650) (78) 2 ) * ((12)(125.160.000) (37400) 2 ) 2.568.000 2.917.000 r r (7800 6084) * ((1501.920.000 1398.760.000) ) 349 .200 0,82 420 .740 (Tiende a -1 lo que indica que las variables son inversamente proporcionales) r2 = (-0.82)2 = 0.67 (Indica que las variables están medianamente relacionadas). S xy 125.160.000 (4439,34)(37400) (203,49)(214000) 517.25 12 2 1. La demanda de cambios de aceite registrada en el autoservicio. El Canguro ha sido la siguiente: Mes (X) Dda.(Y) 1(Enero) 41 2 (Febrero) 46 3 (Marzo) 57 4 (Abril) 52 5 (Mayo) 59 6 (Junio) 51 7 (Julio) 60 8 (Agosto) 62 a. Aplicar un análisis de Regresión lineal simple. MATEMATICAS - Estadística 11 20 PGF03-R03 b. Pronostique la demanda de los meses faltantes del año. c. Calcule los coeficientes de correlación y determinación, y el error de estimación estándar. d. Interprete los resultados obtenidos Mes (X) 1(Enero) 2(Febrero) 3 (Marzo) 4 (Abril) 5 (Mayo) 6 (Junio) 7 (Julio) 8 (Agosto) 9(Septiemb.) 10(Octubre) 11(Noviemb.) 12(Diciemb.) 13(Enero) 14(Febrero) 15(Marzo) Ventas(Y1) Alquiler(Y2) 80 32 102 19 105 15 59 40 95 53 78 12 63 24 100 32 45 58 81 34 70 28 66 50 97 22 101 12 88 18 2. Una compañía vende equipos industriales, y además ofrece el servicio de alquiler, a bajos costos y bajo depósito. El reporte de ventas y alquileres en los últimos 15 meses es el siguiente: a. Aplicar un análisis de Regresión lineal simple, para las dos variables dependientes (Y1 y Y2). b. Pronostique la demanda de ventas y alquileres de los meses Abril a Julio del año siguiente. c. Calcule los coeficientes de correlación y determinación, y el error de estimación estándar, de las dos variables dependientes. d. Interprete los resultados obtenidos, en ambos casos. MATEMATICAS - Estadística 11 21 PGF03-R03 1. El palacio del pollo ofrece almuerzos que incluyen cinco piezas de pollo para llevar a casa, a precios especiales. Sea Y el numero de almuerzos vendidos y X el precio. A partir de las observaciones históricas y los cálculos que se presentan en la siguiente tabla, determine la ecuación de regresión, el coeficiente de correlación, y de determinación y el error de estimación estándar. ¿Cuántos almuerzos piensa el gerente que lograra vender a $2500, $3000, $3500, y $4000 cada uno? Observación 1 2 3 4 5 6 7 8 9 0 Precio Almuerzos (X) (Y) 2700 760 3500 510 2000 980 4200 250 3100 320 4200 480 2700 370 3800 210 3000 550 2700 490 2. Con los siguientes datos utilice el método de regresión lineal para desarrollar la relación entre el número de días con lluvia en verano y el número de juegos perdidos por el Deportes Tolima Año 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 Días de lluvia en verano (X) 15 25 10 10 30 20 20 15 10 25 Juegos perdidos por el Dep. Tolima(Y) 25 20 10 15 20 15 20 10 5 20 MATEMATICAS - Estadística 11 22 PGF03-R03 a. Aplicar un análisis de Regresión lineal simple, para la variable dependiente. b. Pronostique la cantidad de partidos que podría perder el Deportes Tolima en los años 2007 a 2010.Si se cree que lo días de lluvia serán 22, 14, 18, y 25 c. Calcule los coeficientes de correlación y determinación, y el error de estimación estándar, de la variable dependiente. d. Interprete los resultados obtenidos. INVESTIGAR: INVESTIGACION: CUALITATIVO: CUANTITATIVO: PROCESO: DATOS: MATEMATICAS - Estadística 11 23 PGF03-R03 ENCUESTA: TABULACION: GRAFICACION: ANALISIS: UNIDAD 3 NORMALIDAD Y TECNICAS DE CONTEO MATEMATICAS - Estadística 11 24 PGF03-R03 PROPOSITO Establece matemática y gráficamente las áreas correspondientes baja la curva normal con o sin ayuda de la tabla de distribución normal, Despejando así adecuadamente el coeficiente Z en los límites inferior y superior en la probabilidad uno o varios sucesos. MATEMATICAS - Estadística 11 25 PGF03-R03 ERROR DE PRONÓSTICO Los pronósticos casi siempre tienen errores. Los errores de pronóstico se clasifican en dos formas: ya sea como errores de sesgo o como errores aleatorios. Los errores de sesgo son el resultado de equivocaciones sistemáticas, por lo cual se observa que el pronóstico siempre es demasiado alto o siempre es demasiado bajo. Con frecuencia esos errores son el resultado de ignorar o no estimar correctamente ciertos patrones de demanda, como los de tendencia, los estacionales o cíclicos. Por ejemplo si la demanda de tiempo para jugar en las canchas de tenis de un club aumenta continuamente y el gerente de la institución aplica el método de promedio móvil simple, tomando simplemente las últimas semanas como componentes del pronóstico, entonces el pronóstico siempre será bajo porque el gerente no tomo en cuenta la tendencia. El otro tipo de error de pronóstico, es el error aleatorio, es el resultado de factores imprevisibles que obligan al pronóstico a desviarse de la demanda real. Los analistas de pronósticos intentan minimizar los efectos de los errores de sesgo y los errores aleatorios, seleccionando modelos de pronóstico apropiados, pero en realidad es imposible suprimir los errores en todas sus formas. MEDICIONES DEL ERROR DE PRONÓSTICO: Antes de pensar en minimizar el error de pronóstico, es necesario que los gerentes dispongan de algún medio adecuado para medirlo. El error de pronóstico es simplemente la diferencia entre el pronóstico para un periodo determinado y la demanda real registrada durante el mismo, es decir: Et = Dt - Ft, donde: Et = Error de pronóstico para el periodo t Dt = Demanda real para el periodo t Ft = Pronostico para el periodo t. Sin embargo, los gerentes están más interesados en medir el error de pronóstico durante un periodo de tiempo relativamente largo. La suma acumulativa de errores de pronostico CFE (del inglés cumulative sum of forecast errors) mide el error total de un pronóstico. CFE = ∑Et Los grandes errores positivos tienden a compensarse con grandes errores negativos en la CFE de una medición. Sin embargo la CFE resulta útil para evaluar el sesgo de un pronóstico. Por ejemplo, si un pronóstico siempre resulta mas bajo que la demanda real, el valor de la CFE será cada vez más grande. Este error de magnitud creciente indica que MATEMATICAS - Estadística 11 26 PGF03-R03 existe una deficiencia sistemática en el enfoque del pronóstico. Es posible que el analista haya omitido un elemento de tendencia o un patrón cíclico. ERROR DE PRONÓSTICO PROMEDIO: Es simplemente el cociente entre la suma de todos los errores de pronóstico y el número de periodos estudiados. E CFE n CUADRADO DE ERROR MEDIO MSE (del inglés mean squared error): es la sumatoria de los cuadrados de los errores de pronóstico dividido en el número de periodos pronosticados. E MSE 2 t n DESVIACION ESTANDAR (S): Es la raíz cuadrada de la sumatoria de las desviaciones entre el error de pronóstico y el error de pronóstico promedio elevadas al cuadrado sobre el total de periodos de pronóstico menos uno. S ( Et E ) 2 n 1 DESVIACION MEDIA ABSOLUTA DMA: Consiste en la sumatoria de los valores absolutos de los errores de pronóstico divididos entre el número de periodos de pronóstico. MAD E t n MATEMATICAS - Estadística 11 27 PGF03-R03 El símbolo I I se usa para indicar el valor absoluto; es decir, indica que no se deben considerar los signos negativos. Si el valor de MSE, la S o la MAD es pequeño, indica que el pronostico se aproxima generalmente a la demanda real; un valor grande anuncia la posibilidad de errores de pronostico considerables. Los errores grandes reciben una ponderación mucho mayor en el MSE y la S porque en estos casos los errores se elevan al cuadrado. La MAD es una medición muy común del error de pronóstico porque se comprende muy fácilmente, se trata simplemente de la media de los errores de pronóstico en una serie de periodos de tiempo, sin considerar si dichos errores consistieron en estimaciones excesivas o en subestimaciones. La MAD también se usa en señales de rastreo y control de inventarios. ERROR PORCENTUAL MEDIO ABSOLUTO MAPE: Del inglés (Mean absolute percent error), relaciona el error de pronóstico con el nivel de la demanda, y es útil para colocar el rendimiento del pronóstico en su correcta perspectiva: MAPE E t (100)/ DT n EJERCICIO DE SIMULACIÓN La siguiente tabla muestra las ventas reales de sillas tapizadas que realizo un fabricante de muebles y los pronostico correspondientes a cada uno de los últimos ocho meses. Calcule la CFE, el MSE, la S, la MAD y el MAPE para este producto. Mes t Dda. Dt Pronostico Ft Error Et Cuadrado Del error Et2 1 2 3 4 5 6 7 8 TOTAL 200 240 300 270 230 260 210 275 XXX 225 220 285 290 250 240 250 240 XXXXXX -25 20 15 -20 -20 20 40 35 -15 625 400 225 400 400 400 1600 1225 5275 Error Absoluto │Et│ 25 20 15 20 20 20 40 35 195 Error porcentual Absoluto (│Et│/Dt) (100) 12.5% 8.3% 5.0% 7.4% 8.7% 7.7% 19.0% 12.7% 81.3% Usando las formulas correspondientes a cada una de las mediciones tenemos: Error de pronostico acumulativo: CFE = -15 MATEMATICAS - Estadística 11 28 PGF03-R03 Error de pronóstico media: E Cuadrado del error medio: MSE = 15 8 -1,875 5275 8 659,4 Desviación Estándar: S E Desviación Media Absoluta: ( 1,875 ) 2 t 8 1 MAD Error Porcentual Medio Absoluto: 27,4 195 24,4 8 MAPE 81,3% 8 10,2% ANALISIS: Una CFE con valor de -15 indica que el pronóstico tiene la tendencia de sobreestimar la demanda. Las estadísticas del MSE, la S y la MAD proporcionan mediciones de la variabilidad del error de pronóstico. Una MAD de 24,4 significa que el error de pronóstico fue de 24,4 unidades en valor absoluto. El valor de S de 27, 4, indica que la distribución de los errores de pronostico dentro de la muestra tiene una desviación estándar de 27,4 unidades, un MAPE de 10,2% implica que, en promedio, el error de pronostico fue de mas o menos el 10% de la demanda real observada. Estas mediciones se vuelven más dignas de confianza a medida que aumenta el número de periodos observados. MATEMATICAS - Estadística 11 29 PGF03-R03 1. Explique con sus propias palabras que importancia tienen los sistemas de pronóstico dentro de la economía o el sector industrial de un país.______________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________ 2. De los métodos vistos en clase. ¿Cuál cree usted que es el método más eficiente para determinar pronósticos? Explique su respuesta. __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ _________________________________ 3. De los métodos cualitativos de pronóstico, ¿Cuál considera usted que es el más eficiente y confiable?, ¿Por qué? __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________ 4. ¿Qué importancia cree usted que tienen las medidas de error de pronósticos? Explique. __________________________________________________________________________ __________________________________________________________________________ __________________________________________________ 5. Elabore las tablas de las mediciones de error, calcule las medidas de error e intérprete los resultados de los ejercicios del método de regresión lineal simple si se supone que los pronósticos fueron: MATEMATICAS - Estadística 11 30 PGF03-R03 A. Observación 1 2 3 4 5 6 7 8 9 10 Precio (X) 2700 3500 2000 4200 3100 4200 2700 3800 3000 2700 Almuerzos Pronostic (Y) o 760 823 510 485 980 894 250 250 320 306 480 465 370 250 210 311 550 495 490 500 B. Mes (X) 1(Enero) 2(Febrero) 3 (Marzo) 4 (Abril) 5 (Mayo) 6 (Junio) 7 (Julio) 8 (Agosto) 9(Septiembre) 10(Octubre) 11(Noviembre) 12(Diciembre) 13(Enero) 14(Febrero) 15(Marzo) Venta (Y1) 80 102 105 59 95 78 63 100 45 81 70 66 97 101 88 Pronostico 75 96 108 63 95 88 52 111 56 81 79 63 87 99 100 Alquiler (Y2) 32 19 15 40 53 12 24 32 58 34 28 50 22 12 18 Pronostico 35 24 12 33 52 10 30 29 50 38 28 55 25 11 15 C. MATEMATICAS - Estadística 11 31 PGF03-R03 Mes (X) 1(Enero) 2 (Febrero) 3 (Marzo) 4 (Abril) 5 (Mayo) 6 (Junio) 7 (Julio) 8 (Agosto) Dda.(Y) 41 46 57 52 59 51 60 62 Pronostico 46 55 52 47 64 60 58 53 6. Completar el siguiente mentefacto conceptual MENTEFACTO CONCEPTUAL MATEMATICAS - Estadística 11 32 PGF03-R03 PRONOSTICO: SERIES DE TIEMPO: METODOS CAUSALES: INVESTIGACION DE MERCADOS: REGRESION LINEAL: PROMEDIO MOVIL SIMPLE: PROMEDIO MOVIL PONDERADO: MEDIDAS DE ERROR: DESVIACION MEDIA ABSOLUTA: DESVIACION ESTANDAR: MATEMATICAS - Estadística 11 33 PGF03-R03 DISTRIBUCION NORMAL Es una distribución de probabilidad de variable continua, la cual se define como aquella que puede asumir cualquier valor dentro de un intervalo de valores por ejemplo valores que se pueden medir en unidades de altura, peso, tiempo o temperatura. En las distribuciones de probabilidad discretas, se determina la probabilidad de que la variable aleatoria asuma un valor particular X. En la variable continua deseamos saber determinar la probabilidad de que X asuma valores dentro de algún intervalo comprendido entre un valor Xa y un valor Xb. Es el modelo de distribución más utilizado en la práctica, ya que multitud de fenómenos se comportan según una distribución normal. La formula de esta aplicación fue descubierta por Abraham Demoivre en 1733 como forma limite de la Distribución Binomial. Otros matemáticos que figuran en la historia inicial de la distribución normal son Pierre Simón Laplace (1749 – 1827) y Carl Friederich Gauss (1777 – 1855). Es por eso que se le suele denominar: Gaussiana, Laplaciana, Distribución de Laplace – Gauss o de Gauss – Laplace o bien la segunda ley de Laplace. Algunas características o propiedades de la distribución normal son: 1. El área total comprendida bajo la curva normal o campana de Gauss y por encima del eje horizontal es igual a 1 ó 100%. 2. La distribución es simétrica con respecto a su media. Es decir el 50% del área está a la derecha y el 50% está a la izquierda. MATEMATICAS - Estadística 11 34 PGF03-R03 3. La media, mediana y moda son iguales. 4. La distribución normal es una “familia de distribuciones”, puesto que existe una distribución diferente para cada valor de la media (μ) y la desviación estándar (σ). 5. La curva de una distribución normal se extiende desde ,hasta 6. Si trazamos líneas perpendiculares a una distancia de una σ de la media μ en cada uno de los dos lados, el área comprendida entre estas dos líneas es igual a 0.68 (68%) aproximadamente. De igual manera podemos encerrar el 95% aproximadamente del área total, trazando líneas perpendiculares a una distancia de 2σ de la media μ en cada uno de los lados. Y podemos encerrar el 99.7% del área total si trazamos las líneas perpendiculares a una distancia de 3 σ de la media en cada uno de los lados. Las siguientes figuras nos ilustra mejor la situación: MATEMATICAS - Estadística 11 35 PGF03-R03 Si una variable aleatoria X está normalmente distribuida, podemos calcular la probabilidad de que X asuma valores entre Xa y Xb es decir P (Xa < X < Xb ) Como lo indica la figura: LA DISTRIBUCION NORMAL ESTANDARIZADA O TIPIFICADA Para determinar probabilidades en la distribución normal, es necesario acudir a una aplicación especial de esta: “LA DISTRIBUCION NORMAL ESTANDARIZADA”, la cual tiene por regla que la media μ = 0 y la desviación estándar σ = 1. Las áreas de la distribución normal estandarizada se encuentran tabuladas. El cuerpo de esta tabla da las áreas bajo la curva normalmente distribuida con media 0 y varianza 1. MODELACIÓN 1: Hallar el área bajo la curva normal estandarizada entre 0 y Z = 2.05 Solución: El área que se busca es el área sombreada en la figura. Para hallar el valor numérico del área, localizamos el número 2.0 en la columna izquierda de la tabla y el número 0.05 en la fila superior. El numero que aparece en la intersección de la columna y la fila, es el área que se está buscando. MATEMATICAS - Estadística 11 36 PGF03-R03 0 2.05 Lo cual indica que la probabilidad de encontrar un valor de Z entre 0 y 2.05 es del 47,98%. MODELACIÓN 2: ¿Cuál es la probabilidad de que un valor de Z sacado al azar este entre 0 y -2.05? Solución: En virtud de la simetría de la distribución normal, el área entre 0 y -2.05 es exactamente igual al área entre 0 y 2.05, es decir de 0.4798 que es igual a 47.98%. La diferencia radica en que el área sombreada no se ubica a la derecha sino a la izquierda de la campana. MODELACIÓN 3: Cual es la probabilidad de encontrar un valor de Z entre -1.78 y 1.52, es decir P (-1.78 < Z < 1.52) Solución: Es posible determinar el área que en este caso consta dos partes una a la izquierda y otra a la derecha de la campana de Gauss. Primero se debe determinar el área de la izquierda, buscando en la tabla el valor 1.78 (0.4625) y luego se hace lo mismo con el lado derecho con el valor 1.52 (0.4357). Finalmente se unen las dos áreas sumando los valores encontrados en la tabla: P (-1.78 < Z < 1.52) = 0.4357 + 0.4625 = 0.8982 lo que equivale al 89.82%. MATEMATICAS - Estadística 11 37 PGF03-R03 MODELACIÓN 4: Hallar P (Z > 1.67) Solución: En la figura se muestra el área a encontrar, esta no está directamente implícita en la tabla ya que no se trata de un valor exacto sino de mucho de ellos, ya que pide ser mayor que 1.67. Recordemos que el área a la derecha de la campana es 0.5000. Para el área a la derecha de 1.67 se busca el área entre 0 y 1.67 (0.4525) y lo restamos de 0.5000, obtenemos 0.5000 – 0.4525 = 0.0475. Tabla: Áreas bajo la curva normal estándar. La cifra entera y el primer decimal de z se buscan en la primera columna, y el segundo decimal en la cabecera de la tabla. MATEMATICAS - Estadística 11 38 PGF03-R03 z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 0.00 0.0000 0.0398 0.0793 0.1179 0.1554 0.1915 0.2257 0.2580 0.2881 0.3159 0.3413 0.3643 0.3849 0.4032 0.4192 0.4332 0.4452 0.4554 0.4641 0.4713 0.4772 0.4821 0.4861 0.4893 0.4918 0.4938 0.4953 0.4965 0.4974 0.4981 0.4987 .01 0.0040 0.0438 0.0832 0.1217 0.1591 0.1950 0.2291 0.2611 0.2910 0.3186 0.3438 0.3665 0.3869 0.4049 0.4207 0.4345 0.4463 0.4564 0.4649 0.4719 0.4778 0.4826 0.4864 0.4896 0.4920 0.4940 0.4955 0.4966 0.4975 0.4982 0.4987 Segunda cifra decimal del valor de z .02 .03 .04 .05 .06 0.0080 0.0120 0.0160 0.0199 0.0239 0.0478 0.0517 0.0557 0.0596 0.0636 0.0871 0.0910 0.0948 0.0987 0.1026 0.1255 0.1293 0.1331 0.1368 0.1406 0.1628 0.1664 0.1700 0.1736 0.1772 0.1985 0.2019 0.2054 0.2088 0.2123 0.2324 0.2357 0.2389 0.2422 0.2454 0.2642 0.2673 0.2704 0.2734 0.2764 0.2939 0.2967 0.2995 0.3023 0.3051 0.3212 0.3238 0.3264 0.3289 0.2315 0.3461 0.3485 0.3508 0.3531 0.2554 0.3686 0.3708 0.3729 0.3749 0.2770 0.3888 0.3907 0.3925 0.3944 0.2962 0.4066 0.4082 0.4099 0.4115 0.4131 0.4222 0.4236 0.4251 0.4265 0.4279 0.4357 0.4370 0.4382 0.4394 0.4406 0.4474 0.4484 0.4495 0.4505 0.4515 0.4573 0.4582 0.4591 0.4599 0.4608 0.4656 0.4664 0.4671 0.4678 0.4686 0.4726 0.4732 0.4738 0.4744 0.4750 0.4783 0.4788 0.4793 0.4798 0.4803 0.4830 0.4834 0.4838 0.4842 0.4846 0.4868 0.4871 0.4875 0.4878 0.4881 0.4898 0.4901 0.4904 0.4906 0.4909 0.4922 0.4925 0.4927 0.4929 0.4931 0.4941 0.4943 0.4945 0.4946 0.4948 0.4956 0.4957 0.4959 0.4960 0.4961 0.4967 0.4968 0.4969 0.4970 0.4971 0.4976 0.4977 0.4977 0.4978 0.4979 0.4982 0.4983 0.4984 0.4984 0.4985 0.4987 0.4988 0.4988 0.4989 0.4989 .07 0.0279 0.0675 0.1064 0.1443 0.1808 0.2157 0.2486 0.2794 0.3078 0.3340 0.3577 0.3790 0.3980 0.4147 0.4292 0.4418 0.4525 0.4616 0.4693 0.4756 0.4808 0.4850 0.4884 0.4911 0.4932 0.4949 0.4962 0.4972 0.4979 0.4985 0.4989 .08 0.0319 0.0714 0.1103 0.1480 0.1844 0.2190 0.2517 0.2823 0.3106 0.3365 0.3599 0.3810 0.3997 0.4162 0.4306 0.4429 0.4535 0.4625 0.4699 0.4761 0.4812 0.4854 0.4887 0.4913 0.4934 0.4951 0.4963 0.4973 0.4980 0.4986 0.4990 .09 0.0359 0.0753 0.1141 0.1517 0.1879 0.2224 0.2549 0.2852 0.3133 0.3389 0.3621 0.3830 0.4015 0.4177 0.4319 0.4441 0.4545 0.4633 0.4706 0.4767 0.4817 0.4857 0.4890 0.4916 0.4936 0.4952 0.4964 0.4974 0.4981 0.4986 0.4990 MATEMATICAS - Estadística 11 39 PGF03-R03 1. Determinar el área bajo la curva normal, y graficar. a) a la izquierda de Z = -1,78 b) a la izquierda de Z = 0,56 c) correspondiente a Z < 2,16 d) correspondiente a – 0,80 < Z < 1,53 2. Encontrar el valor de Z: a) El área a la derecha de Z es igual a 0,2266 b) El área a la izquierda de Z es 0,0314 c) El área entre –0,23 y Z es igual a 0,5722 d) El área entre 1,15 y Z es 0,0730 3. Hallar Z si el área bajo la curva normal: a) entre 0 y Z es 0,4515 b) a la derecha de Z es 0,3121 c) a la derecha de Z es 0,8023 d) a la izquierda de Z es 0,4562 4. Hallar el área bajo la curva normal: a) A la derecha de Z = 2,68 b) a la derecha de Z = -0,66 c) a la izquierda de Z = -1,88 d) entre Z = 1,25 y Z = 1,67 e) entre Z = 0,90 y Z = -1,85 f) entre Z = -1,45 y Z = 1,45 5. Completa el siguiente mentefacto conceptual . MENTEFACTO CONCEPTUAL MATEMATICAS - Estadística 11 40 PGF03-R03 UNIDAD 4 PROCESO DE INVESTIGACION MATEMATICAS - Estadística 11 41 PGF03-R03 PROPOSITO Tabular, graficar, analizar críticamente los datos provenientes de las encuestas realizadas, plantear soluciones al problema inicial y proponer planes de acción para ponerlos en práctica. MATEMATICAS - Estadística 11 42 PGF03-R03 PROCESO DE INVESTIGACIÓN ¿Qué es investigar? Es el proceso, organizado y objetivo destinado a responder una pregunta. En otras palabras es preguntar, cuestionar, ejercer el pensamiento especulativo, dar respuestas en forma rigurosa y metódica para esclarecer interrogantes y resolver problemas es el cometido de las diversas ciencias y de las instituciones en las que se generan y transmiten los nuevos conocimientos. Investigar es seguir un proceso para obtener una información, no conocida hasta el momento, sobre un asunto determinado. Para realizar una investigación es muy importante tener bien definido el proceso a seguir. Esto ayudará a no perder de vista el objeto, y a elegir los métodos más eficaces. Nos centraremos ahora en la preparación y ejecución de una investigación de tipo estadístico, en la que se realzara una especie de investigación de mercados en la que se deberán seguir una serie de pasos los cuales nos permitirán darle solución a un problema que se planteara dentro de un marco empresarial. Para realizar una investigación estadística se debe tener en cuenta los siguientes pasos: 1. 2. 3. 4. 5. 6. 7. Planeamiento y preparación. Recolección de datos. Crítica y codificación. Tabulación y procesamiento. Análisis e interpretación. Publicación de resultados. Planeamiento y preparación. 8. Recolección de datos. 9. Crítica y codificación. 10. Tabulación y procesamiento. 11. Análisis e interpretación. 12. Publicación de resultados. A continuación veremos cada uno de los pasos que se deben seguir en un proceso de investigación de tipo estadístico. MATEMATICAS - Estadística 11 43 PGF03-R03 PLANTEAMIENTO Y PREPARACION DE UNA INVESTIGACION ESTADISTICA Toda recolección de datos estadísticos, requiere el establecimiento precio de un plan que detalle los aspectos que la investigación va a abarcar, que fije los procedimientos que se van a seguir. En general, un proyecto o plan de investigación estadística debe contemplar los siguientes aspectos: 1. El objeto de la investigación: nos referimos al hecho o fenómeno que vamos a observar y registrar numéricamente. En una investigación de salarios, el salario; en un censo de población, los habitantes; en una estadística industrial, la empresa; en una investigación de mercados, el cliente. En el proyecto, al analizar qué es lo que vamos a investigar, nos proponemos: 1.1 Definir el objeto o unidad de investigación: Vamos a emprender un censo de edificios: ¿Qué es un edificio para efectos de la recolección de los datos?. En una investigación de salarios: ¿a qué salarios nos referimos?. En una investigación industrial: ¿Qué hemos de entender como industria ó empresa ó fábrica? La primera cuestión por tanto, al tratar el objeto de la investigación es la fijación precisa del concepto de lo que se aspira a indagar. Decir con claridad y exactitud qué es lo que la estadística va a investigar. 1.2 Determinar la naturaleza cualitativa y cuantitativa del objeto de investigación: Es decir, advertir que aspectos del fenómeno que se va a investigar son cuantitativos y consecuentemente pueden registrarse por medio de números y cuales otros por ser cualitativos, se han de recoger mediante anotaciones literarias. 1.3 Determinar la posibilidad de la investigación: De los aspectos establecidos en el punto anterior, no basta con saber cuál es el objeto a investigar, y cuales sus modalidades cuantitativas y cualitativas; se necesita examinar si una y otras pueden ser reconocidas con precisión. 1.4 Limitar el objeto investigable: Conocemos lo que vamos a investigar, sus modalidades cuantitativas y cualitativas, y la posibilidad de registrarlas. A continuación el proyecto tiene que delimitar la investigación. Todo objeto a investigar en si, en el tiempo y en el espacio, y a veces en el número. La estadística reduce sus trabajos a un doble aspecto: a. Limitando el objeto mismo de la investigación. b. limitando el campo de acción de la investigación. 2. La finalidad de la investigación: El proyecto de investigación estadística tiene que atender, los fines que se persiguen con la investigación, porque así como sean estos, habitan de ser los demás puntos del proyecto: la fuente de información, los procedimientos, el material, y en consecuencia el presupuesto. MATEMATICAS - Estadística 11 44 PGF03-R03 MODELACIÓN: se organiza una estadística de natalidad. Se puede aspirar a muy diferentes fines; por ejemplo se trata de conocer la proporción de los sexos con un propósito biológico, o si no (y este es otro fin), con un propósito demográfico de la población que entra a la vida. En el primer caso, el fin nos obliga a preguntar por el sexo de los hijos nacidos, muertos o vivos; en el segundo caso, nos bastara con indagar los nacidos vivos. 3. Las fuentes de información: Hasta ahora se ha analizado lo que se desea investigar y el por qué de la investigación. Lo siguiente es preguntarse: ¿Dónde es posible recoger alguna información sobre el fenómeno a estudiar?, ¿en donde podremos registrar los datos que obtenemos?. Las fuentes de información se clasifican en: 3.1 Fuentes primarias: son aquellos datos obtenidos ya sea por encuesta directa o mediante la utilización de cuestionarios, o como resultado de la observación directa; es una técnica muy utilizada en estudios de carácter científico o de investigación de mercados. Se puede decir también que son datos publicados por quien recoge directamente de la fuente de información primaria. Son fuentes primarias: Personales; (entrevistas, correo, llamadas telefónicas), Unipersonales (auditoria, análisis de rastreo, simulación); Simulaciones. 3.2 Fuentes secundarias: En estas, los datos se obtienen de publicaciones, las cuales pueden ser reproducciones totales o parciales. Son valiosas para cualquier tipo e investigación. Son fuentes secundarias: bibliotecas, centros de documentación, folletos, revistas archivos etc. 3.3 Series temporales: Denominadas como series de tiempo o series cronológicas. Son las obtenidas y ordenadas en forma cronológica, siendo el resultado de investigaciones y observaciones periódicas: días, meses, años. Cuando las investigaciones son aisladas, es decir, no presentan periodicidad continuada, las estadísticas se llaman atemporales o aisladas. 4. Los procedimientos de la investigación: ¿Qué características debe reunir una investigación? ¿Bajo qué formas haremos la recolección del os datos? En este aspecto del proyecto, comúnmente los autores incluyen varias consideraciones, que se ajusten a estos interrogantes: ¿Cómo investigaremos?, ¿Quién debe hacer la investigación y porque sistema?, es decir ¿Cuáles deben ser las normas generales y particulares de la estadística que proyectamos? 4.1 Claridad y publicidad: Toda investigación, en sus pormenores, debe ser clara y conocida por todos los que en ella vayan a intervenir: observadores y observados. 4.2 Sencillez: En todo. En los formularios, en las instrucciones, en proyecto, en la finalidad, en los tablas y graficas, en los comentarios y/o el análisis, en las operaciones de calculo. MATEMATICAS - Estadística 11 45 PGF03-R03 4.3 Utilidad: Todo proyecto estadístico que se inicie debe tener alguna aplicación práctica de interés. De otro modo nos hallaremos ante una acumulación de datos que perjudicaran, por muchos motivos, a la información realmente aprovechable, a los negocios y al política económica de un país. ¿Cuándo deberá efectuarse la recopilación de los datos estadísticos? En el denominado momento estadístico. Las investigaciones pueden ser: a. Ocasional: Cuando se realiza en circunstancias extraordinarias, cuando eventualmente se presenta un problema, o se agita su solución. Ej. Una investigación sobre el consto de vida cuando se plantea una huelga general. b. Continua: Es decir, que se produce sin interrupción. Ej. Las informaciones demográficas (La natalidad, la mortalidad, la nupcialidad); las de criminalidad, etc. 5. El material estadístico: Está constituido por todos los útiles, documentos o instrumentos necesarios para llevar a buen fin la investigación. El proyecto tiene que enumerarlo en sus clases y en su número. Podemos dividirlo en: material impreso e instrumental. 5.1 Material impreso: Se refiere a los formularios o cuestionarios, boletines, hojas de inscripción, registros, circulares, pliegos de instrucciones. 5.2 Material instrumental: son todos los útiles o herramientas que se utilizan tanto para la recolección de los datos como de la sistematización y posterior impresión de los mismos. Ej. Lápices, computador, impresora, etc. 6. El presupuesto de la investigación: comprende el cálculo del costo y la financiación de la investigación; ya que hacer una investigación algunas veces es un procedimiento costoso, por eso es necesario hacer un plan de gastos (Presupuesto) que permita prever lo que se gastará durante el proceso las partidas del costo, en general suelen ser las siguientes: a. ORGANIZACIÓN Estudios preliminares Asesorías Trabajos geográficos Formulación del plan Plan de propaganda MATEMATICAS - Estadística 11 46 PGF03-R03 Impresión del formulario Adiestramiento de personal Contratación de servicios auxiliares Materiales y equipos b. TRABAJOS DE CAMPO c. SISTEMATIZACION d. PUBLICACION Los seis aspectos anteriormente mencionados, constituyen parte esencial en la planeación de un proyecto estadístico. RECOLECCION DE LOS DATOS Cuando se tiene planeada la investigación, comienza la recolección definitiva de los datos. La recolección de los datos consiste en un conjunto de operaciones de observación y anotación o registro de los hechos en formularios para este efecto. La traducción de los fenómenos aislados a expresiones numéricas. De la tarea de recolección depende todo el resultado posterior de la estadística. Si está mal hecha, la elaboración resultará incorrecta e incluso imposible de efectuar, y si se realiza, dará origen a un análisis erróneo y a interpretaciones con muy distintos fines. Su valor como medio de control, porque los datos previstos, su distribución y su peculiaridades indican la calidad del material (Formularios), el personal indispensable, la propaganda conveniente, la duración, los sistemas de datos. La etapa de recolección comprende varios aspectos: a. Distribución del material b. La recolección propiamente dicha. c. Control del número de formularios recolectados. d. Control sobre la calidad de las informaciones recogidas. MATEMATICAS - Estadística 11 47 PGF03-R03 CRÍTICA Y CODIFICACION De la investigación se obtienen los datos individuales, colectivos o aislados. Cada cifra presenta la intensidad de un hecho particular; el salario de un obrero, la producción de una fabrica o los préstamos otorgados por una entidad crediticia. Todo ese conjunto de información recogido en los formularios antes de ser totalizado y utilizado, requiere de un examen crítico, severo, con el objeto de comprobar si cumple con estas condiciones indispensables; ¿son exactos o erróneos, completos o incompletos, precisos o imprecisos, representativos o no representativos? El objeto de la crítica, es clasificar el material primario que procede de la misma investigación, en tres grupos: material bueno, material incorrecto pero corregible, y material incorregible o desechable. La clase y la importancia del error cometido, determinan la admisión o no del dato primitivo resultante de la observación. Además se critican los datos numéricos directos, para establecer las causas de los errores y modificar o perfeccionar las fuentes y los métodos de observación. Difícilmente se consigue, por primera vez, que las informaciones sean prefectas, en cuanto a la exactitud, al a extensión y consecuencialmente en cuento a la responsabilidad de las investigaciones parciales. TABULACION Y PROCESAMIENTO Se puede hacer manual o sistematizadamente y la elección del método dependerá: a. De la cantidad de formularios que se van a utilizar. b. Del número de preguntas que tenga el formulario. c. Del tiempo y de los recursos, ya sea financieros o de equipo disponibles. La tabulación consiste en introducir los datos obtenidos de las encuestas o formularios dentro de tablas de frecuencias que permitan un entendimiento más fácil de los datos, y su posterior graficación consiste en traducir los datos de las tablas graficas de frecuencias, como los de barras o circular, permitiendo un impacto visual que ayude a interpretar los datos con mayor facilidad. MATEMATICAS - Estadística 11 48 PGF03-R03 ANALISIS E INTERPRETACION. Esta etapa se puede considerar como la más importante que tiene el informe, ya que el análisis de los datos tendrá que ver con la formulación del objetivo mismo de la investigación; sin embargo, este proceso de análisis tendrá menos dificultad, si el investigador tiene pleno conocimiento de los problemas que son inherentes al planeamiento de una investigación Dentro del análisis esta el interpretar críticamente los datos extraídos de las tablas y graficas de frecuencias, conectar las preguntas, relacionar y comparar resultados, determinar causas y consecuencias. Además es en esta etapa donde se formulan soluciones al o los problemas planteados y se dan sugerencias para su solución. De esta última fase de la metodología se puede decir que encierra dos aspectos: a. Análisis y evaluación estadística de los resultados. b. Análisis y evaluación técnica de acuerdo con la naturaleza de la investigación. PUBLICACIÓN Corresponde a la fase final de la investigación, y con ella se propone hacer llegar a las personas interesadas el resultado total del estudio, teniendo en cuenta todos los aspectos considerados en el proceso, de tal forma que los datos sean comprensibles, con la correspondiente validez que merezcan las conclusiones. El informe (Trabajo final de la investigación), además de presentarse cumpliendo los requerimientos de las normas ICONTEC, debe contener lo siguiente: 1. ANTECEDENTES. 1.1 Reseña histórica. 1.2 Sector económico. 2. OBJETIVOS 2.1 Objetivo general. 2.2 Objetivos específicos. 3. JUSTIFICACION 4. PROBLEMA 4.1 Planteamiento del problema. 5. DESCRIPCION DEL PRODUCTO O SERVICIO 5.1 Características del producto o servicio. 5.2 Tipología de la demanda. MATEMATICAS - Estadística 11 49 PGF03-R03 5.2.1 Según criterio de la oportunidad 5.2.2 Según criterio de la temporalidad. 5.2.3 Según criterio de la necesidad. 5.2.4 Según criterio del destino. 6. ESTUDIO DEL MERCADO CONSUMIDOR 6.1 Mezcla de mercadeo. 6.1.1 Producto. 6.1.2 Precio. 6.1.3 Promoción. 6.1.4 Plaza. 6.2 Análisis de la población (N) 6.2.1 Análisis cualitativo de la población. 6.2.2 Análisis cuantitativo de la población. 6.3 Muestra. 6.4 Encuestas 6.4.1 Diseño del formulario. 6.4.2 Aplicación. 7. RESULTADOS 7.1 Tabulación y graficas 7.2 Análisis e interpretación. 7.3 Planteamiento de soluciones. 8. PRESUPUESTO 9. ANEXOS 10. BIBLIOGRAFIA La publicación del informe se hará en una exposición de los resultados en la que intervendrá además del docente de la asignatura, dos jurados quienes emitirán un concepto que hará parte de la nota final de estadística. MATEMATICAS - Estadística 11 50 PGF03-R03 BIBLIOGRAFIA Estadística Y Muestreo. Martínez, Bencardino Ciro. Editorial. MC Graw Hill. Estadística aplicada a las ciencias sociales y a la educación. Editorial Mc Graw Hill. Estadística y probabilidad para ingenieros. Editorial Shawm. www. Wikipedia.com www.uaq.com www.hyru.com “El poder se nutre de la información y el conocimiento” MATEMATICAS - Estadística 11 51