1.1.6. Parámetros aleatorios

Anuncio
1.1.6. Parámetros aleatorios
Parámetros y estadísticos. Existen medidas para realizar descripciones cuantitativas de
los conjuntos de datos, o poblaciones, y de sus muestras, diferenciándose entre ellas
las que se refieren a las mismas poblaciones y a las muestras.
Para el caso de las poblaciones, las medidas que las describen se denominan
parámetros, y suelen estar representadas con letras griegas (por ejemplo Y Por
otro lado, para el caso de aquellas medidas que describen a una muestra se les llama
estadísticos o estimadores, y son representados por letras de nuestro alfabeto (por
ejemplo, x o s).
Parámetro: Una parámetro es una medida usada para describir alguna característica
de una población, tal como una media aritmética, una mediana o una desviación
estándar de una población. Cuando los dos nuevos términos de arriba son usados, por
ejemplo, el proceso de estimación en inferencia estadística puede ser descrito como le
proceso de estimar un parámetro a partir del estadístico correspondiente, tal como
usar una media muestral (un estadístico para estimar la media de la población (un
parámetro). Los símbolos usados para representar los estadísticos y los parámetros,
en éste y los siguientes capítulos, son resumidos en la tabla siguiente:
CONCEPTO
PARAMETRO (POBLACIÓN)
ESTADÍSTICO (MUESTRA)

MEDIA
x
DESVIACIÓN ESTÁNDAR
VARIANZA

2
S
S2
Distribución en el muestreo
Muestras y Poblaciones (parámetros).
Es muy interesante conocer las características de las muestras. El cálculo de los
estadísticos o índices que las definen y describen son netos y muy rentable. Pero en
ocasiones nos preguntamos por las características de la población de origen de donde
proceden las muestras. El objetivo parece ambicioso: se trata de conocer lo que por
definición es inalcanzable. Normalmente las poblaciones son inabarcables puesto que
son infinitas, o en el mejor de los casos cuasi-infinitas, lo cual nos deja como
estábamos.
Los parámetros poblacionales caracterizan y describen las poblaciones. Son
equivalentes a los estadísticos en las muestras. Un estadístico es una función de la
muestra, esto es, depende sola y exclusivamente de nuestra muestra. Varía y está
sometido al error (variabilidad) del muestreo. Los parámetros no varían, son
constantes y además desconocidos. Contienen las características de la población.
Estimación de parámetros
Las técnicas estadísticas de estimación intentan conocer el valor de estos parámetros.
La media de la edad de un conjunto de personas es fácilmente calculable y no está
sometido a ninguna clase de imprecisión. La media de edad de la población de donde
proviene esa muestra es desconocida. Si la muestra cumple la condición de ser
aleatoria, es posible intentar calcular la media poblacional. El cálculo de los parámetros
se basa en la información suministrada por la muestra.
En el proceso de ir de la información de la muestra (estadísticos) al estimado de los
parámetros poblacionales ocurren dos cosas, una buena y otra mala:
a.- Ganamos en generalización. Esto es, pasamos de la parte al todo. De las muestras
a las poblaciones
b.- Perdemos precisión o lo que es lo mismo, ganamos en imprecisión. La estimación
de parámetros poblacionales se realiza construyendo intervalos (segmentos) que
suponemos cubren o contienen el parámetro buscado.
Confianza e Intervalos de confianza
La estimación de parámetros mediante un solo valor se conoce como estimación
puntual. Es bastante arriesgada puesto que no conocemos ni la imprecisión ni se
establece el grado de confianza que nos merece el resultado. Estos dos inconvenientes
se obvian con la estimación por intervalos confidenciales. Por un lado proporcionan un
valor de la imprecisión dado por la longitud del intervalo de confianza. Por otro
proporcionan un valor de la fiabilidad que nos debería merecer nuestra estimación, o
nivel de confianza.
Afortunadamente algo tan sutil como la confianza se puede cuantificar, y no sólo eso
sino que se mueve en unos límites tan cómodos para el pensamiento como son entre
el cero y el cien por ciento. Por convenio, y nadie parece en desacuerdo, para la
mayoría de las ocasiones una confianza del 95% parece suficiente. Este es el valor que
gobierna la longitud del intervalo de confianza.
¿Como se interpreta una confianza del 95%?. Si llevamos a cabo un experimento 100
veces obtendríamos 100 distribuciones muestrales de datos y 100 intervalos de
confianza. De estos 100 intervalos, 95 de ellos cubrirían el valor del verdadero
parámetro poblacional. Desgraciada o afortunadamente, nosotros solo realizamos el
experimento una sola vez. Con lo que nunca sabremos si nuestro intervalo es uno de
esos 95 que contienen el parámetro de estudio.
Técnicamente, aunque esto suene a una sofisticación innecesaria, no podemos asociar
el concepto de nivel de confianza con el concepto de probabilidad. Así no se puede
establecer que tenemos una probabilidad del 95% de que el parámetro buscado este
dentro de nuestro intervalo.
Las técnicas de estimación de parámetros poblacionales se incluyen dentro de la
estadística inferencial.
. Todos los parámetros poblacionales pueden ser estimados a partir de técnicas de
estimación. La mayoría de los estimadores se basan en la distribución de los
estadísticos en el muestreo y toman como base algunas propiedades deseables del
teorema del límite central. Este teorema tiene unas propiedades tan deseables que es
la base de la estadística analítica. Viene a decir fundamentalmente dos cosas:
1.- Que las muestras individualmente son diferentes de las poblaciones pero en
conjunto son muy parecidas
2. Que las muestras no son gobernadas por el azar, sino que en conjunto siguen, no
importa de lo que estemos tratando, las leyes universales de las funciones teóricas de
probabilidad. La función de probabilidad normal rige, en la mayoría de las ocasiones
cuando las muestras son mayores de 30, estas distribuciones muéstrales.
Otro tipo de enfoque. Para la estimación de los estadísticos de posición se toma como
base el cálculo combinatorio y permutacional. Se utilizan fundamentalmente las
técnicas de remuestreo, Bootstrap y Jackknife. Estas técnicas no han sido
suficientemente desarrolladas y utilizadas porque históricamente los economistas
(padres de los estadistas) empleaban los sumatorios y la medias y nunca las medidas
de posición, medianas o cuartiles. Esto es lógico cuando hablamos de dinero.
Descargar