1.1.6. Parámetros aleatorios Parámetros y estadísticos. Existen medidas para realizar descripciones cuantitativas de los conjuntos de datos, o poblaciones, y de sus muestras, diferenciándose entre ellas las que se refieren a las mismas poblaciones y a las muestras. Para el caso de las poblaciones, las medidas que las describen se denominan parámetros, y suelen estar representadas con letras griegas (por ejemplo Y Por otro lado, para el caso de aquellas medidas que describen a una muestra se les llama estadísticos o estimadores, y son representados por letras de nuestro alfabeto (por ejemplo, x o s). Parámetro: Una parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana o una desviación estándar de una población. Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso de estimación en inferencia estadística puede ser descrito como le proceso de estimar un parámetro a partir del estadístico correspondiente, tal como usar una media muestral (un estadístico para estimar la media de la población (un parámetro). Los símbolos usados para representar los estadísticos y los parámetros, en éste y los siguientes capítulos, son resumidos en la tabla siguiente: CONCEPTO PARAMETRO (POBLACIÓN) ESTADÍSTICO (MUESTRA) MEDIA x DESVIACIÓN ESTÁNDAR VARIANZA 2 S S2 Distribución en el muestreo Muestras y Poblaciones (parámetros). Es muy interesante conocer las características de las muestras. El cálculo de los estadísticos o índices que las definen y describen son netos y muy rentable. Pero en ocasiones nos preguntamos por las características de la población de origen de donde proceden las muestras. El objetivo parece ambicioso: se trata de conocer lo que por definición es inalcanzable. Normalmente las poblaciones son inabarcables puesto que son infinitas, o en el mejor de los casos cuasi-infinitas, lo cual nos deja como estábamos. Los parámetros poblacionales caracterizan y describen las poblaciones. Son equivalentes a los estadísticos en las muestras. Un estadístico es una función de la muestra, esto es, depende sola y exclusivamente de nuestra muestra. Varía y está sometido al error (variabilidad) del muestreo. Los parámetros no varían, son constantes y además desconocidos. Contienen las características de la población. Estimación de parámetros Las técnicas estadísticas de estimación intentan conocer el valor de estos parámetros. La media de la edad de un conjunto de personas es fácilmente calculable y no está sometido a ninguna clase de imprecisión. La media de edad de la población de donde proviene esa muestra es desconocida. Si la muestra cumple la condición de ser aleatoria, es posible intentar calcular la media poblacional. El cálculo de los parámetros se basa en la información suministrada por la muestra. En el proceso de ir de la información de la muestra (estadísticos) al estimado de los parámetros poblacionales ocurren dos cosas, una buena y otra mala: a.- Ganamos en generalización. Esto es, pasamos de la parte al todo. De las muestras a las poblaciones b.- Perdemos precisión o lo que es lo mismo, ganamos en imprecisión. La estimación de parámetros poblacionales se realiza construyendo intervalos (segmentos) que suponemos cubren o contienen el parámetro buscado. Confianza e Intervalos de confianza La estimación de parámetros mediante un solo valor se conoce como estimación puntual. Es bastante arriesgada puesto que no conocemos ni la imprecisión ni se establece el grado de confianza que nos merece el resultado. Estos dos inconvenientes se obvian con la estimación por intervalos confidenciales. Por un lado proporcionan un valor de la imprecisión dado por la longitud del intervalo de confianza. Por otro proporcionan un valor de la fiabilidad que nos debería merecer nuestra estimación, o nivel de confianza. Afortunadamente algo tan sutil como la confianza se puede cuantificar, y no sólo eso sino que se mueve en unos límites tan cómodos para el pensamiento como son entre el cero y el cien por ciento. Por convenio, y nadie parece en desacuerdo, para la mayoría de las ocasiones una confianza del 95% parece suficiente. Este es el valor que gobierna la longitud del intervalo de confianza. ¿Como se interpreta una confianza del 95%?. Si llevamos a cabo un experimento 100 veces obtendríamos 100 distribuciones muestrales de datos y 100 intervalos de confianza. De estos 100 intervalos, 95 de ellos cubrirían el valor del verdadero parámetro poblacional. Desgraciada o afortunadamente, nosotros solo realizamos el experimento una sola vez. Con lo que nunca sabremos si nuestro intervalo es uno de esos 95 que contienen el parámetro de estudio. Técnicamente, aunque esto suene a una sofisticación innecesaria, no podemos asociar el concepto de nivel de confianza con el concepto de probabilidad. Así no se puede establecer que tenemos una probabilidad del 95% de que el parámetro buscado este dentro de nuestro intervalo. Las técnicas de estimación de parámetros poblacionales se incluyen dentro de la estadística inferencial. . Todos los parámetros poblacionales pueden ser estimados a partir de técnicas de estimación. La mayoría de los estimadores se basan en la distribución de los estadísticos en el muestreo y toman como base algunas propiedades deseables del teorema del límite central. Este teorema tiene unas propiedades tan deseables que es la base de la estadística analítica. Viene a decir fundamentalmente dos cosas: 1.- Que las muestras individualmente son diferentes de las poblaciones pero en conjunto son muy parecidas 2. Que las muestras no son gobernadas por el azar, sino que en conjunto siguen, no importa de lo que estemos tratando, las leyes universales de las funciones teóricas de probabilidad. La función de probabilidad normal rige, en la mayoría de las ocasiones cuando las muestras son mayores de 30, estas distribuciones muéstrales. Otro tipo de enfoque. Para la estimación de los estadísticos de posición se toma como base el cálculo combinatorio y permutacional. Se utilizan fundamentalmente las técnicas de remuestreo, Bootstrap y Jackknife. Estas técnicas no han sido suficientemente desarrolladas y utilizadas porque históricamente los economistas (padres de los estadistas) empleaban los sumatorios y la medias y nunca las medidas de posición, medianas o cuartiles. Esto es lógico cuando hablamos de dinero.