Taller 1 1 Preguntas Universidad Metropolitana en Bayamón Escuela de Estudios Profesionales STAT 555 Jennifer Vélez Claudio S00153158 Prof. Sylvia Y Cosme Montalvo 18 de junio de 2015 Taller 1 2 Preguntas: 1. ¿Cuál es la diferencia entre muestra y población? La población es una gran grupo o parte infinita en cambio la muestra es una parte de esa población donde se destacan ciertas características. 2. ¿Cuál es la diferencia entre estadístico y parámetro? Estadístico es una cantidad en números calculado sobre la muestra que resume información sobre algún aspecto. Parámetro es una cantidad numérica calculada sobre una población y resume los valores que esta toma en algún atributo. 3. ¿Cuál es la diferencia entre estadística descriptiva e inferencia estadística? La estadística descriptiva organiza, recopila y presenta datos de una muestra de una población. La estadística inferencial, en cambio, trabaja con muestras formadas por algunos individuos de la población. 4. Contraste variable aleatoria categórica con variable aleatoria numérica. La variable categórica se presenta en información no numérica y la numérica o cuantitativa son aquellos que resultan de mediciones o conteo. 5. Compare datos discretos de datos continuos. Los datos discretos solo pueden tener ciertos valores como por ejemplo la cantidad de estudiantes en un salón. Los datos continuos pueden tomar cualquier valor como por ejemplo la cantidad de temperatura o la altura de una persona. 6. Detalle la diferencia entre escala nominal y ordinal. Los datos nominales se utilizan para identificar y clasificar en categorías. Los datos ordinales describen el orden de los mismos a través de una escala. En la escala, no hay manera de distinguir la diferencia relativa entre los grupos. 7. Detalle la diferencia entre escala de intervalo y de razón. La escala de intervalo contiene variables numéricas cuyos valores representan magnitudes y la distancia entre los números de su escala es igual. Con este tipo de variables se pueden realizar comparaciones de igualdad y desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las variables de razón poseen las Taller 1 3 mismas características de las variables de intervalo, con la diferencia que cuentan con un cero: El valor cero (0) representa la ausencia total de medida. 8. Explique las razones principales para obtener datos. Para obtener información que será útil para alguna investigación, ayuda en la toma de decisiones y a transmitir una información a otros. 9. ¿Cuál es la diferencia entre muestreo probabilístico y no probabilístico? Los métodos de muestreo probabilísticos son en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra. En los no probabilísticos no se tiene certeza de que la muestra extraída sea representativa, ya que se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. 10. ¿Cuáles son algunos riesgos potenciales al utilizar métodos de pecera para seleccionar una muestra aleatoria simple? Si se utiliza una muestra que no es pequeña el muestreo no será muy eficaz. 11. Mencione la diferencia entre muestreo con reemplazo y muestreo sin reemplazo El muestreo con remplazo es aquel en que un elemento puede ser seleccionado más de una vez en la muestra para ello se extrae un elemento de la población se observa y se devuelve a la población. En el muestreo sin reemplazo no se devuelve los elementos extraídos a la población hasta que no se hallan extraídos todos los elementos de la población que conforman la muestra. 12. Contraste muestreo aleatorio simple con muestreo sistemático. El contraste seria que el muestreo aleatorio simple se da un número a cada persona de la población y se utiliza una tabla de dígitos aleatorios, para elegir tantos sujetos como sea necesario para completar el tamaño de la muestra requerida, mientras que en el muestreo sistemático se elige a la primera persona al azar y el restante viene asociado a el mismo. 13. Compare muestreo estratificado y muestreo sistemático. El muestreo estratificado y el muestreo sistemático se asemejan en que los dos se aseguran que todos las partes de interés estarán debidamente representados en la muestra solicitada. Taller 1 4 14. Determine la diferencia entre muestreo estratificado y muestreo por conglomerados (“cluster”) En el muestreo estratificado se divide la población en grupos en función de una característica determinada y después se muestrea cada grupo aleatoriamente, para obtener la parte proporcional de la muestra, mientras que en el muestreo por conglomerados, la muestra es un grupo de elementos de la población que forman una unidad, a la que se llama conglomerado. 15. ¿Qué distingue a las cuatro fuentes potenciales de error cuando se manejan encuestas diseñadas utilizando muestreo probabilístico? Los errores de cobertura ocurren cuando se excluyen ciertos grupos de elementos, de manera que no pueden ser incluidos en la muestra. El error por falta de repuesta ocurre cuando no se reúnen datos sobre todos los elementos de la muestra. El error de muestreo expresa la variación o diferencias al azar que suceden de una muestra a otra con base en la probabilidad de que ciertos individuos en particular sean elegidos en las muestras específicas y el error por medición puede proceder de la ambigüedad en la redacción de las preguntas, del efecto Hawthorne y el error del encuestado. 16. ¿Por qué es necesario organizar un conjunto de datos numéricos recopilados? Es necesario porque facilita la lectura de los datos, se puede observar mejor las relaciones entre ellos y realizar graficas estadísticas. 17. Detalle y explique los principios de excelencia gráfica. Edward Tufte indica que la excelencia en las gráficas estadísticas consiste de: Comunicar ideas complejas con claridad Precisión Eficiencia 18. Menciones las diferencias principales entre un arreglo ordenado y un diagrama de tallo y hoja. Las diferencias entre ellos es que el arreglo ordenado se acomodan los datos de una variable numérica del más pequeño al más grande, sirve para conocer mejor el rango de los valores delos datos y es útil cuando hay muchos valores, y en el diagrama detallo y hoja permite ver como se distribuyen los datos y donde hay concentraciones de los mismos. 19. ¿Cómo difieren el histograma y el polígono de frecuencias en cuanto a su construcción, desarrollo y utilización? El histograma es una gráfica de barras para datos numéricos agrupados en la que se utilizan barras verticales para representar las frecuencias o Taller 1 5 porcentajes de cada grupo. En el histograma no existen huecos entre las barreras adyacentes. La variable de interés se coloca sobre el eje horizontal (x). El eje vertical (y) representa la frecuencia o el porcentaje de los datos por cada intervalo de clase. En el polígono de frecuencia se utilizan las marcas de clase de cada intervalo para representar los datos de cada clase y luego graficar las marcas de cada clase en frecuencias en su respectiva clase, como puntos sobre una línea. 20. ¿Para qué es útil el polígono de frecuencias acumuladas? Es útil ya que ayuda a representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas. 21. Detalle la importancia de construir una tabla resumen de frecuencias y por cientos. Su importancia es que nos indica la cantidad de datos que están comprendidos en un intervalo de clase. Es el número de datos o elementos de la muestra, que caen en un mismo intervalo de clase. 22. Mencione las ventajas y desventajas de utilizar un diagrama de barras, diagrama circular (“pie chart”) o diagrama Pareto? Las ventajas de utilizar una gráfica de barra es que se logra comparar diferentes categorías utilizando barras individuales para representar los conteos por categorías. El diagrama circular utiliza las partes de un círculo para representar los valores de cada categoría. El tamaño de cada parte o porción del circulo varía de acuerdo con el porcentaje en cada categoría, mientras que en la gráfica de Pareto los valores de cada categoría se grafican como barras verticales en orden descendente, de acuerdo con sus frecuencias, y se combinan con una línea porcentual acumulada en la misma gráfica. 23. Contraste el diagrama de barras para datos categóricos con el histograma para datos numéricos. En una gráfica de barras de datos categóricos se comparan diferentes categorías utilizando barras individuales para identificar los conteos, mientras que en el histograma para datos numéricos se utiliza una gráfica con datos numéricos agrupados en las que se utilizan barras verticales para representar frecuencias y no existe espacio entre las barras adyacentes. 24. Explique por qué uno de los atributos sobresalientes del diagrama Pareto es su habilidad de separar los pocos datos esenciales de los muchos datos triviales. El principio de Pareto se presenta cuando la mayoría de los elementos en un conjunto de datos ocurre en un número pequeño de categorías, mientras que Taller 1 6 los pocos elementos restantes se distribuyen en una gran cantidad de categorías. A estos dos grupos a menudo se les denomina los pocos vitales y los muchos triviales. 25. ¿Qué tipos de por cientos pueden ayudar a interpretar los resultados obtenidos en una tabla de contingencias a base de 2 variables categóricas? Los tipos de por cientos que ayudan a interpretar estos resultados son los porcentajes de cuotas, riesgo y media de las tasas de rendimiento. 26. ¿Cuáles son algunos aspectos éticos que deben estar presentes al presentar datos en tablas y gráficas? a. La escala en el eje principal debe comenzar en cero. b. La gráfica bidimensional debe contener una escala parea cada eje. c. Una gráfica no debe distorsionar los datos y debe incluir un título. d. No debe tener información innecesaria que no transmita información útil. e. Los ejes deben estar correctamente rotulados. f. Se debe utilizar la gráfica más sencilla posible para un conjunto de datos. Obtenga y presente una gráfica de un periódico o revista, que a su entender contenga una representación gráfica inadecuada de alguna variable (puede ser numérica o categórica). Explique por qué entiende que no es apropiada. Es una gráfica de datos la cual está muy cargada y se dificulta el analizar la misma MAPA CONCEPTUAL MUESTRA PLOBLACIÓN Parte de la población utilizada para la investigación ESTADISCIA DESCRIPTIVA MUESTRA Estudios, métodos o información que brindan datos. OBTENCION DE DATOS Resultado final útil para una investigación o la ayuda de toma de decisiones. Jennifer Vélez Claudio S00153158 Taller 1 Es utilizada para métodos investigativos VARIABLES ALEATORIAS CATEGÓRICAS O NUMÉRICAS Escuela de Estudios Profesionales Programa Ahora Universidad Metropolitana Anejo H Diario Reflexivo Nombre Jennifer Vélez Claudio Taller 1 Fecha 18 de junio de 2015 Firma Facilitador___________________ Los conceptos que más entendí fueron… (Elabore las razones) En el comienzo del repaso de términos estadísticos realizado en el día de hoy los conceptos más entendidos fueron los de población, muestra, variable aleatoria categórica, variable aleatoria numérica, escala de intervalo y de razón. Pienso que necesito repasar o reforzar los siguientes conceptos… (Elabore las razones) Cada uno de los conceptos relacionados a la estadística en mi caso es meritorio repasarlos y reforzarlos, ya que nunca he tomado un curso relacionado ni similar. Jennifer Vélez Claudio S00153158 Taller 1