¿Qué es proceso estadístico? El proceso estadístico está parado para el control de proceso estadístico El proceso estadístico no refiere a una técnica, a un algoritmo o a un procedimiento particular. El proceso estadístico es una filosofía de la optimización referida a mejoras de proceso continuas , usando una colección de las herramientas (estadísticas) para datos y análisis del proceso fabricación de inferencias sobre comportamiento de proceso toma de decisión El proceso estadístico es un componente dominante de las iniciativas totales de la calidad En última instancia, búsquedas del proceso estadístico para maximizar beneficio cerca mejorar calidad del producto mejorar productividad aerodinamizar proceso reducción de despilfarro reducción de emisiones mejorar servicio de cliente, etc. Herramientas para el proceso estadístico Las herramientas comúnmente usadas en el proceso estadístico incluyen Organigramas Gráficas de funcionamiento Gráfica y análisis de pareto Diagramas de causa-efecto Histogramas de la frecuencia Gráficas de Control Estudios de la capacidad de proceso Planes de muestreo de aceptación Diagramas de dispersión Cada herramienta es simple poner en ejecución Estas herramientas se utilizan generalmente para complementarse, más bien que se emplean como técnicas independientes. PROCESAMIENTO DE DATOS La recolección de datos es de suma importancia en el desarrollo de una investigación. Se debe considerar que un dato constituye una unidad de información sobre una determinada característica que se quiere estudiar. Una vez elaborados los datos, estos de deben resumir en cuadro o tablas y gráficos estadísticos. El método de recolección de datos está constituido por la secuencia de pasos o etapas que se realizan en función de la búsqueda, adquisición y recopilación de los datos necesarios para alcanzar los objetivos planteados en el estudio, los cuales se pueden dividir en las siguientes etapas: 1. Revisión 2. Ordenación y Clasificación 3. Computación 4. Presentación 1.- REVISIÓN Se realiza para comprobar la validez y confiabilidad de la información, a fin de garantizar que esta sea lo más objetiva y precisa posible, o sea, que se corresponde con los hechos reales. Se debe verificar que la información recopilada en la tabla maestra sea de buena calidad, lo cual implica cerciorarse que la misma sea: fidedigna, es decir, cierta, real, apegada a la verdad de los hechos; completa, esto es, que aporte información sobre todas las variables de interés; oportuna: esto es, que sea una información actualizada, vigente; pertinente, esto es, los datos deben guardar relación con las variables en estudio. La razón principal de la revisión es garantizar que los dados recopilados con que se trabajarán, den respuesta a los objetivos propuestos en la investigación. 2.- ORDENACIÓN Y CLASIFICACIÓN Esta etapa consiste en categorizar las variables y ordenar los datos en función a los que objetivos que persigue el estudio, a fin de obtener grupos más homogéneos, creando estratos o clases estadísticos. Cuando son manejadas magnitudes, estas pueden ordenarse de forma creciente o decreciente. 3.- COMPUTACIÓN Esta sub-etapa tiene por finalidad el procesamiento de los datos a través de formulas estadísticas. Para ello podemos hacer uso de dichas fórmulas o de software estadísticos, por ejemplo, el SPSS (Statistical Package for the Social Sciences / Paquete Estadístico para las Ciencias Sociales), EPIDATA entre otros. (Statistical Package for the Social Sciences / Paquete Estadístico para las Ciencias Sociales) Como programa estadístico es muy popular su uso debido a la capacidad de trabajar con bases de datos de gran tamaño. En la versión 12 es de 2 millones de registros y 250.000 variables. Además, de permitir la recodificación de las variables y registros según las necesidades del usuario. El programa consiste en un módulo base y módulos anexos que se han ido actualizando constantemente con nuevos procedimientos estadísticos. Actualmente, compite no solo con softwares licenciados como lo son SAS, MatLab, Statistica, Stata, sino también con software de código abierto y libre, de los cuales el más destacado es el Lenguaje R. El principio de Pareto indica eso: “no todas las causas de un fenómeno particular ocurren con la misma frecuencia o con el mismo impacto " Tales características se pueden destacar usando las Gráficas de Pareto Cartas y análisis de Pareto Las gráficas de Pareto demuestran los factores con la más frecuencia posible que ocurren El análisis de las gráficas de Pareto ayuda a hacer el mejor uso de recursos limitados apuntando los problemas más importantes para abordar Los diagramas del Causar-y-efecto: También se llaman: Diagramas de Ishikawa ( Dr. Kaoru Ishikawa, 1943) diagramas del fishbone Los diagramas de causa - efecto no tienen una base estadística, sino son ayudas excelentes para solucionar de problema y el troubleshooting. los diagramas del Causar-y-efecto pueden revelar las relaciones importantes entre varias variables y causas posibles proporcionar la penetración adicional en comportamiento de proceso Ejemplo de un diagrama del Causa-efecto Histograma de la frecuencia El histograma de la frecuencia es un método gráfico y fácilmente interpretado muy eficaz para resumir datos El histograma de la frecuencia es una herramienta estadística fundamental del proceso estadístico Proporciona la información alrededor: el promedio (medio) de los datos la variación presente en los datos el patrón de la variación si el proceso está dentro de lo especificado Histogramas De Dibujo De la Frecuencia En histogramas de dibujo de la frecuencia, considere las reglas siguientes: Los intervalos deben ser espaciados igualmente Seleccione los intervalos para tener valores convenientes El número de intervalos está generalmente entre 6 a 20 Las cantidades pequeñas de datos requieren pocos intervalos 10 intervalos son suficientes para 50 a 200 lecturas Procesos que no están en un estado del control estadístico: demuestra las variaciones excesivas exhiba las variaciones que cambian con tiempo Frecuencias Absolutas: Se refiere a la cantidad de sujetos que posen una característica específica y que pertenece a una misma clase o categoría. El orden de la frecuencia se realiza de forma decreciente cuando la variable es nominal, y en base a la jerarquía de la variable cuando esta es ordinal. Cuando la variable es nominal: SEXO FRECUENCIA Masculino 56 Femenino 3 Total 59 Cuando la variable es ordinal: GRAVEDAD DE LA LESION FRECUENCIA Leve 52 Moderado 15 Grave 2 Total 59 3.1 Rango: Se refiere al recorrido de una variable cuantitativa, desde su valor máximo hasta su valor mínimo, en consecuencia, se obtiene entre la diferencia de estos valores extremos. Rango = X max – X min Como ejemplo para el cálculo del rango consideramos la variable antigüedad, identificando los valores máximos y mínimos X max = 30 años, X min = 1 año, quedando Rango = 30 años – 1 año Rango = 29 años 3.2 Intervalo de Clase: Se refiere al número de unidades de medida a incluir en cada clase, el mismo se obtiene a través de la siguiente fórmula: Ic = Rango/N° Clases El número de clases es fijado por el investigador a conveniencia, regularmente este varía entre 5 y 20 clases. En base al rango calculado en el punto anterior, se tiene que el Intervalo de clase es: Ic = 29 años/5 = 5.8 años, debido a que la serie solo contiene valores enteros, se procede a aproximar quedando Ic = 6 años. Tomando en consideración la Tabla Maestra N° 1, los intervalos de clase de la variable antigüedad queda como sigue. ANTIGÜEDAD NO. DE (AÑOS) TRABAJADORES 1a6 34 7 a 12 15 13 a 18 7 19 a 24 1 25 a 30 2 3.3 Límite inferior y Límite superior de una clase estadística: El límite inferior se refiere al valor menor valor de cada clase, en contraposición el límite superior se refiere al valor mayor incluido en una clase estadística. 3.4 Centro de Clases: Se refiere al valor promedio de cada clase, lo cual refleja su característica principal. ANTIGÜEDAD NO. DE CENTRO (AÑOS) TRABAJADORES DE CLASE 1a6 34 4 7 a 12 15 10 13 a 18 7 16 19 a 24 1 22 25 a 30 2 33 Para interpretar los valores de los Centros de Clase podemos expresar lo siguiente: Los siete (7) trabajadores de la tercera clase tienen una antigüedad promedio de dieciséis (16) años. 4.- PRESENTACIÓN Esta etapa tiene por finalidad resumir la información y ofrecerla de manera completa para facilitar su análisis y comprensión, esto se realiza a través de los cuadros y gráficos estadísticos. 4.1 Cuadros Estadísticos: Es una representación gráfica donde se realiza el resumen de los datos en estudio, distribuidos según las variables que se tienen. Es importante resaltar la diferencia entre un cuadro y una tabla. La tabla contiene datos primarios los cuales son la base para la realización de un cuadro. Partes de un cuadro: * Encabezamiento * Matríz o Molde * Cuerpo * Pie Tipos de Cuadros: * Distribución de Frecuencias * Asociación * Series Cronológicas 4.2 Gráficos: Se refiere a la representación en el plano, de la información estadística, con el fin de obtener una impresión visual global del material presentado, que facilite su rápida comprensión. Los gráficos son una alternativa a los cuadros para representar las distribuciones de frecuencias. Existen algunas consideraciones importantes que se deben tener en cuenta al desarrollar gráficos, estas son: * Todo gráfico debe contener: encabezamiento, gráfico propiamente dicho y la fuente. * Encabezamiento: está ubicado en la parte superior del gráfico, contiene Número y Título del gráfico. * Grafico: generalmente sobre un eje de coordenadas, por lo general en el eje de las abscisas se colocan las clases en que se ha dividido la variable y en el eje de las ordenadas la frecuencia, generalmente relativas. * Fuente: al pie de la página se indica donde se obtuvo la información y algún dato adicional si es necesario. * En cuanto a la proporcionalidad de los ejes, se recomienda por cada centímetro de longitud de la ordenada (eje vertical), colocar entre uno y dos centímetros en el eje de las abscisas (eje horizontal). * El eje de las abscisas debe dividirse en tantas partes como clases se deban presentar, esta división se realiza a criterio de quien desarrolla el gráfico, teniendo en cuenta que dichas divisiones sean de igual proporción, el valor menor de la ordenada siempre será cero. * Cuando se tienen frecuencias que inician el valores muy alejados de cero y estas quedan fuera de proporcionalidad, se recomienda realizar un corte al inicio de la ordena por encima de cero y colocar allí el inicio con el valor de la frecuencia. * La selección del grafico dependerá del tipo de cuadro que lo origina y del propósito que se tenga. Para ello se puede tomar como guía el siguiente esquema: TIPO DE CUADRO Distribución de frecuencias ESCALA DE MEDICIÓN DE LA VARIABLE TIPO DE GRAFICO Barras Simples y Diagrama Sectoriales o Gráfico de Torta, Numéricas Continuas, Histogramas y Polígonos de Nominal, ordinal y frecuencias. Numéricas Además Curva Discretas Integral Cuadros de asociación Series cronológicas Polígono de Frecuencias, Ambas Nominales o Ambas Ordinales o Nominal y Ordinal, Barras múltiples y Barras Proporcionadas, Numérica y Ambas Numéricas nominal o y Diagrama de numérica y ordinal puntos Línea de Tiempo (años, tendencia, meses, semanas, Números Índices y días, etc.) Barras 4.2.3 Tipos de Gráficos: A continuación se detallan los gráficos más comúnmente utilizados para presentar información de una manera clara y entendible. a. Barras simples: b. Diagrama circular c. Histograma d. Polígono de frecuencia e. Curva integral f. Barras múltiples g. Barras proporcionadas h. Líneas de tendencias i. Números índices Ejemple de tabla, cuadro y gráfico: Bibliografía http://www.buenastareas.com/ensayos/Procesamiento-De-Datos-YGraficos-Estadisticos/180847.html http://www.monografias.com/trabajos28/control-estadistico/controlestadistico.shtml http://es.wikipedia.org/wiki/SPSS http://www.r-project.org/