Subido por ERNESTO ALONSO COBA VÁZQUEZ

Estadística Inferencial - Conceptos Basicos (2)

Anuncio
Estadística Inferencial
CONCEPTOS ELEMENTALES
21 de septiembre de 2021
Población
• Es un conjunto de personas, objetos o eventos, de los
cuales nos interesa estudiar algunas de sus características.
En un estudio estadístico, la población debe especificarse lo más
completamente posible.
Esto depende de lo que se desee o se pueda estudiar u
observar, y de la forma en la que sea posible medir las
características de nuestro interés.
Ejemplos
• Los siguientes conjuntos pueden ser considerados como poblaciones para algún
estudio estadístico.






El conjunto de personas afectadas por una cierta enfermedad.
El conjunto de personas extranjeras que llegan al país en un día.
El conjunto de artículos defectuosos producidos en una fabrica.
El conjunto de infracciones de transito que se cometen en una ciudad.
El conjunto de goles que anota un equipo de futbol.
El conjunto de boletas invalidas en un proceso de electoral.
El alcance del concepto de población es muy amplio. Para un estudio estadístico, además de
tener definida una población, a veces es conveniente establecer también una unidad de
observación.
Unidad de Observación
• Una UNIDAD DE OBSERVACIÓN es un grupo de elementos de una población del cual se
tiene, o es posible obtener, su información de manera conjunta..
• La determinación de una unidad de observación depende del problema a
estudiar y de la manera en la que la información pueda ser obtenida o que este
disponible.
• Por ejemplo, en un análisis cuantitativo sobre los resultados de un proceso
electoral, la información puede estar disponible por casillas electorales, y en
este caso las casillas electorales (grupos de votantes) pueden ser consideradas
como unidades de observación.
Muestra
• Una MUESTRA es cualquier subconjunto de una población.
• Al numero de elementos de la muestra, que denotaremos por la letra
n, se le llama tamaño de la muestra.
En un estudio estadístico, la población debe especificarse lo más
completamente posible.
Esto depende de lo que se desee o se pueda estudiar u observar, y
de la forma en la que sea posible medir las características de
nuestro interés.
Ejercicios
Proponga una posible población en el caso de que se desee llevar a cabo un estudio estadístico
sobre los siguientes temas.
• a) La eficacia de un nuevo medicamento.
• b) El nivel de consumo de un determinado producto.
• c) La situación económica de las personas de edad avanzada.
• d) Las fallas de un programa de computo.
• e) Los defectos en artículos producidos por una maquinaria.
Variables y Datos
A lo que nos interesa medir y registrar en cada elemento de una población le
llamaremos variable. Esto es así pues supondremos que una variable es una
característica que varia de un elemento a otro de la población.
Una VARIABLE es una característica de interés que posee cada
elemento de una población y que podemos medir.
Variables y Datos
Mediante el término DATOS se entiende al conjunto de observaciones de
una o varias variables de interés para todos los elementos de una muestra.
Generalmente, un conjunto de datos se organiza y almacena en una computadora en la forma de un arreglo
como el que se muestra en la Tabla 1.1. En esta tabla cada renglón representa una observación. En este caso
tenemos a 5 personas para quienes se han registrado cuatro variables: edad, sexo, peso en kilogramos y
estatura en centímetros.
Ejercicios
Proponga una posible población en el caso de que se desee llevar a cabo un estudio estadístico
sobre los siguientes temas.
1. Defina una posible variable o pregunta que podría ser de interés para cada una de las
poblaciones propuestas en el ejercicio anterior.
2. Determine una posible variable o pregunta que tenga como uno de sus valores el indicado en
cada inciso.
a) 10 años.
b) 1, 265 veces.
c) Pequeño.
d) Blanco.
e) 23˝C.
f ) María.
g) Aprobado.
h) 1, 200 hrs.
Clasificación de Variables
Una primera clasificación de variables establece que ´estas pueden ser CUANTITATIVAS O CUALITATIVAS.
Como estos nombres lo indican, la primera se refiere a una cantidad, mientras que la segunda se refiere
a una cualidad. Veamos las definiciones.
Una variable es CUANTITATIVA si sus valores son números y
representan una cantidad.
Por ejemplo, el numero de hijos en una familia, la longitud de un tornillo, la cantidad de desperfectos de un
articulo o el numero de anos cumplidos de una persona son variables cuantitativas.
Una VARIABLE ES CUALITATIVA si sus valores representan una cualidad,
un atributo o una categoría. Se les llama también variables categóricas.
Por ejemplo, la religión de una persona, su sexo, o su preferencia por algún candidato en un proceso de
elección son variables cualitativas pues sus valores son atributos de las personas.
El lugar de nacimiento de una persona es otro ejemplo de variable cualitativa o categórica.
Estadística Inferencial
CONCEPTOS ELEMENTALES 2DA PARTE
21 de septiembre de 2021
Parte 2
Clasificación de Variables
Cuantitativas
Variables Cuantitativas
Regresemos a las variables cuantitativas, estas pueden clasificarse,
además, en dos categorías de acuerdo al tipo de valores que toman:
pueden ser discretas o continuas..
Variable Cuantitativa Discreta
Una variable cuantitativa es discreta si el conjunto de todos sus posibles valores tiene
un número finito de elementos, o bien es infinito, pero se pueden numerar uno por uno
de acuerdo al conjunto de números naturales.
Por ejemplo, la colección {0,1, 2,..., 120} puede ser el conjunto de valores de una variable
cuantitativa discreta, pues este conjunto tiene un número finito de elementos.
Puede corresponder al numero de hijos de una persona o el número de años promedio que
le quedan por vivir a una persona.
Como otro ejemplo tenemos el conjunto {0, 1, 2,...}, que aunque es infinito, es discreto, ya
que sus elementos se pueden numerar uno por uno de acuerdo al conjunto de números
naturales.
Variable Cuantitativa Contínua
Una variable cuantitativa es continua si puede tomar todos los valores dentro de un
intervalo (a,b) de números reales y no toma valores aislados.
Por ejemplo, sin considerar la precisión limitada de los aparatos de medición, el tiempo
que le toma a una persona llegar a su lugar de trabajo o escuela puede tomar valores
continuos en el intervalo (0, ∞). Más generalmente, el tiempo que le toma a una persona
completar una cierta actividad puede tomar este conjunto de valores.
Ejercicio
• Clasifique las siguientes variables en cualitativas o cuantitativas. En caso de ser
cuantitativas, diga si son discretas o continuas.
• a) El nivel de producción de una empresa en un año.
• b) La demanda de taxis en un determinado sitio de una ciudad.
• c) El nivel de felicidad de una persona.
• d) El tiempo de vida útil de un foco.
• e) El número de hijos en las familias
Niveles de Medición
• De acuerdo al tipo de valores que pueden tomar las variables, se pueden clasificar ´estas de
la siguiente manera. Para las variables cualitativas, las escalas de medición pueden ser de
dos tipos:
1. Nominal
2. Ordinal
Mientras que las variables cuantitativas pueden medirse usando dos tipos de escalas:
1. Intervalo
2. De razón.
Escala Nominal
Se dice que una variable cualitativa se mide mediante una escala nominal, o que es de
tipo nominal, si sus valores son etiquetas o atributos y no existe un orden entre ellos
• Por ejemplo, si nos interesa estudiar la variable cualitativa “sexo” en una población
humana, sus dos posibles valores son: masculino y femenino.
• Estos dos valores son etiquetas, no existe un orden entre ellos y por lo tanto se trata
de una variable de tipo nominal
Escala Ordinal
Se dice que una variable cualitativa se mide mediante una escala ordinal, o que es de
tipo ordinal, si sus valores son etiquetas o atributos pero existe un cierto orden entre
ellos.
• Por ejemplo, podemos considerar que la variable cualitativa “estado en el que se
encuentra un articulo” tiene como posibles valores:
• Malo, Regular y Bueno. Es claro que estos valores son atributos de un articulo y que
existe un cierto orden entre estos valores, por lo tanto, se trata de una variable de
tipo ordinal.
Escala de Intervalo
Una variable cuantitativa se mide mediante una escala de intervalo si existe una noción de
distancia entre los valores de la variable, aunque no se pueden realizar operaciones numéricas y
no existe necesariamente el valor natural cero.
• De esta manera no solo tenemos la relación de orden entre los valores de una
variable cuantitativa, sino que dados cualesquiera dos de sus valores podemos saber
la distancia entre ellos.
• Por ejemplo, la escala Celsius (o Fahrenheit) para medir la temperatura es de tipo
intervalo, pues existe una noción de distancia entre dos temperaturas, pero
claramente no existe el valor cero natural o absoluto (el cero depende de la escala
que se use, la temperatura 0˝C no es la misma que 0˝F).
Escala de razón
Una variable cuantitativa se mide mediante una escala de razón si sus valores tienen un sentido
físico y existe el cero absoluto.
• Por ejemplo, la variable cuantitativa discreta “edad en años cumplidos de una
persona” tiene como posibles valores: 0,1,. . . ,150. Por cuestiones de finitud hemos
considerado una edad máxima posible de 150 años.
• Es claro que puede considerarse que esta variable puede medirse mediante una
escala de razón pues la variable puede tomar el valor cero absoluto y existe la
noción física del lapso de 1 año entre un valor y el siguiente en esta escala de
medición.
Ejercicios
• Los siguientes son ejemplos de variables cualitativas. Diga si su escala de medición
puede ser nominal u ordinal.
• a) Día de la semana con mayor trafico en una ciudad.
• b) Estado de uso de un articulo.
• c) Preferencia sexual de una persona.
• d) Calificación crediticia de un país.
• e) Nivel de actividad (bajo, medio, alto) en una bolsa de valores durante una
jornada.
• f ) Opinión de una persona sobre una decisión del gobierno.
Resumen
Tipo de variable
Cualitativa
Cuantitativa
Nivel de Medición
Descripción
Tipo de Operación
Nominal
Nombran
Igualdad
Ordinal
Ordena
= , <, >,
Intervalo
Igual magnitud
+, -
De Razón
Hay cero absoluto
X,/
Parte 3
Muestreo
Muestreo
Proceso de medición de la información en solo una parte de la población estadística.
Se define como el proceso de seleccionar un número de observaciones.
Se utiliza cuando no es posible
contar o medir todos los elementos
de la población objeto de estudio.
Tipos de Muestreo
Existen dos métodos para seleccionar muestras de poblaciones.
Muestreo no aleatorio: es práctica común seleccionar una muestra en
forma intencional, de acuerdo a opiniones o criterios personales,
fundamentalmente con el objeto de obtener información sin mucho costo.
Son ejemplos de muestreos no probabilísticos:
a. La muestra es restringida a la parte de la población que es fácilmente accesible.
b. La muestra consiste de los elementos que estén más a la mano.
c. Se selecciona un grupo de unidades tipo.
d. La muestra está compuesta por voluntarios.
Muestreo aleatorio o probabilístico: en el cual todos los elementos de la
población tienen la oportunidad de ser escogidos para la muestra.
Este procedimiento da a cada elemento de la población una probabilidad de ser seleccionado.
Dentro de este tipo de muestreo se encuentran:
Muestreo aleatorio simple: el cual es un método de selección de muestras que permite que
cada muestra posible pueda ser elegida con la misma probabilidad. Por su parte cada elemento
de la población tiene la misma oportunidad de ser incluido en la muestra.
Muestreo sistemático: método en el cual los elementos que se seleccionan de la población en
un intervalo uniforme que se mide con respecto al tiempo, al orden o al espacio.
Muestreo estratificado: método en el que la población se divide en grupos homogéneos, o
estratos, y después se toma una muestra aleatoria simple de cada estrato.
Aquí la variabilidad dentro de cada grupo es pequeña y entre los grupos es grande.
Muestreo por conglomerados: método en el que la población se divide en grupos o racimos
de elementos, y luego se selecciona una muestra aleatoria de estos racimos.
La variabilidad dentro de cada grupo es grande y entre los grupos es pequeña; es como si
cada conglomerado fuese una pequeña representación de la población en sí misma.
Métodos para seleccionar
una muestra aleatoria
Al seleccionar una muestra aleatoria se debe tomar en cuenta si la extracción se va
realizar con reemplazo o sin reemplazo, en el primer caso, una vez extraída el elemento de
la población este puede ser devuelto a la misma, en el segundo caso esto no es posible.
Existen varios métodos para seleccionar una muestra, entre los cuales se pueden mencionar:
• Método del bingo,
• Tabla de Números aleatorios
• Generación de números pseudoaletorios.
Método del Bingo
Existen dos métodos para seleccionar muestras de poblaciones.
Consiste en etiquetar N papeles, bolas o cualquier otro objeto del 1 al N e
introducirlas en una urna o bolsa y agitarla hasta que queden bien mezcladas, luego
extraer una a la vez hasta que se hayan seleccionado n artículos donde n es el
tamaño deseado de la muestra.
Las características de estas unidades se miden u observan
Si la población es bastante grande, este método mecánico de selección aleatoria
puede ser difícil o prácticamente imposible de implementar.
Tabla de números aleatorios
Las tablas de números aleatorios
contienen los dígitos 0; 1; 2; :::; 7; 8; 9.
Tales dígitos se pueden leer
individualmente o en grupos y en
cualquier orden, en columnas hacia
abajo, columnas hacia arriba, en fila,
diagonalmente, etc., y es posible
considerarlos como aleatorios
Generación de
Números Pseudoaleatorios
Existen métodos más eficaces para generar
números aleatorios, en muchos de los cuales se
utilizan calculadoras o computadoras.
La mayoría de los paquetes estadísticos generan
números pseudoaleatorios y en Excel usando la
función aleatoria se pueden generar dichos
números.
Error de Muestreo
Es el error que se comete debido al hecho de dar conclusiones sobre cierta
realidad, a partir de la observación de sólo una parte de ella, es decir, es la
diferencia entre el parámetro de la población y el estadístico de la muestra
utilizado para estimar el parámetro.
Ejemplo
• En una fábrica que consta de 600 trabajadores queremos tomar una
muestra de 20. Sabemos que hay 200 trabajadores en la sección A,
150 en la B, 150 en la C y 100 en la D.
Denotemos como
al tamaño de la población y
al tamaño de la muestra. Similarmente, denotamos
como
al tamaño del estrato y
al tamaño de muestra que tomamos de
cuando tenemos asignación proporcional, se cumple
. De este modo,
El problema se trata únicamente de encontrar los valores
para cada estrato. Observemos que ya
conocemos el tamaño de la población
; los tamaños de cada estrato
,
.
,
y
Además, sabemos que , por lo que ya tenemos todos los datos para calcular el tamaño de muestra para
cada estrato. Primero despejamos
:
Así, para la sección A debemos tomar:
Para la sección B:
Para la sección C:
Por último, para la sección D:
Por último, verificamos que
Parte 4
Muestreo
ALEATORIO ESTRATIFICADO
Ejercicio 1
•
En cierta cadena de centros comerciales trabajan 150 personas en el departamento de
personal, 450 en el departamento de ventas, 200 en el departamento de contabilidad y 100 en
el departamento de atención al cliente.
• Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra de 180
trabajadores.
1- ¿Qué tipo de muestreo deberíamos utilizar
para la selección de la muestra si queremos
que incluya a trabajadores de los cuatro
departamentos mencionados?
2- ¿Qué número de trabajadores tendríamos
que seleccionar en cada departamento si
utilizamos asignación proporcional?
• ¿Cual es el tamaño de nuestra Población?
• Fórmula para obtener la muestra del estrato.
nh – Muestra del Estrato (Depto)?
150 Nh1 – Población del estrato (Personal Dpto. )
450 Nh2200 Nh3100 Nh4180 n – Muestra
900 N - Población
Ejercicio 2
• En una comunidad viven 140 adultos, 91 jóvenes y 84 niños. Se quiere
entrevistar a 45 personas de la aldea mediante muestreo estratificado.
¿De Cuántos adultos, jóvenes y niños estaría compuesta la muestra?
Ejercicio 3
• En un pueblo habitan 700 hombres adultos, 800 mujeres adultas y 500 menores.
De él se quiere seleccionar una muestra de 80 personas, utilizando, para ello,
muestreo estratificado con afijación proporcional. ¿Cuál será la composición que
debe tener dicha muestra?
Descargar