Estadística Introducción Para la mayoría de la gente la estadística significa números. En forma cotidiana se encuentran en los medios de comunicación, estadísticas de delitos en la ciudad, o las estadísticas de desempleo; o los ultimas estadísticas de nacimientos y muertes; o estadísticas de triunfos de un equipo de fútbol. La estadística como una rama de las matemáticas aplicadas no es un ciencia, es un conjunto de técnicas que a lo sumo pueden construir un método de estudio. Estas técnicas tienen aplicación en las más diversas disciplinas científicas, es por esto que la aplicación en cada una de estas, requiere por parte del Estadístico, un cierto conocimiento de la disciplina a la que sirve, y una cierta asimilación al científico que la practica. Concepto de Estadística Pueden existir diferentes definiciones para el concepto de estadística. Pero cada definición implica una recopilación de datos teniendo como objetivo la inferencia. Entonces, la estadística puede definirse como una teoría de la información que tiene como objetivo hacer inferencias. La estadística se relaciona con el método científico, el cual puede definirse como el conjunto de reglas que señalan el procedimiento para llevar acabo una investigación. Las reglas más importantes desde el punto de vista estadístico son: Formulación de la hipótesis, obtención de datos y confrontación de la información obtenida con las hipótesis postuladas. Terminología Entidad. Estará definido por el conjunto de personas, lugares o cosas, en la que se enfoca el análisis estadístico. Variable. Características que describen a las entidades, y en las cuales se esta interesado para una investigación científica. Variable aleatoria. Si la cantidad numérica que toma una variable proviene de factores aleatorios (al azar) y no es posible predecirlo con anticipación, se dice que la variable es aleatoria. Población. En el caso estadístico la población no es un conjunto conformado por personas, como la población de una ciudad. El termino será utilizado con mayor frecuencia para referirnos a un conjunto de valores de alguna variable aleatoria relacionada con una entidad. Es decir, la población puede representar el conjunto mas grande de valores de una variable en la cual se tiene cierto interés. Muestra. Una muestra es una parte de una población, es decir es un conjunto de valores mas pequeño proveniente de una población. Estadística Descriptiva Medidas de Tendencia Central Supongamos que se tiene un conjunto de observaciones que se obtienen al medir una característica relevante. Estas mediciones constituyen el conjunto de datos de que disponemos. Dados dichos datos, tenemos una inclinación natural a buscar una representación de ellos que, de manera condensada, nos permita tener una idea global de ese conjunto. De aquí surge el concepto de”Promedio” y, más generalmente el de”Tendencia Central”. Hay desde luego, una multitud de posibilidades de definir un cierto número que tenga validez como”representante” de todos los datos. Media Aritmética. Esta medida es la más común de las utilizadas para describir una distribución X de _ frecuencia. La media aritmética de n observaciones de la variable X se denotará por el símbolo X , y se define coma la suma de ellas dividida por n. Simbólicamente: n X x i 1 i n Por ejemplo, supongamos que una muestra consta de de las observaciones 7,4,3,2. La media de la muestra se calcula de la siguiente manera: 4 X x i 1 n i 7 43 2 4 4 Medidas de Dispersión La media de un conjunto de mediciones solamente localiza el centro de la distribución de los datos; por si misma, no ofrece una descripción adecuada de un conjunto de mediciones. Dos conjuntos de mediciones podrían tener sus distribuciones de frecuencias muy diferentes pero con la misma media, obsérvese la figura siguiente. La diferencia entre las dos distribuciones de la figura, se presenta en la variación o dispersión de las mediciones a ambos lados de la media. Una descripción adecuada de un conjunto de datos requiere de la definición de unas medidas de variabilidad ( o dispersión) de los datos. Varianza La varianza de un conjunto de mediciones y1 , y2 ,..., y n es la media del cuadrado de las desviaciones de las mediciones con respecto a su media. Simbólicamente la varianza de la muestra esta dada por n s2 donde y es la media de la muestra. y i 1 i y n 2 Probabilidad En el capítulo 1, al discutir el papel de la estadística en la investigación científica, se dijo que una de sus partes fundamentales, la estadística inductiva, tiene entre sus objetivos el de cuantificar la incertidumbre que caracteriza a todo proceso de razonamiento en el que se avanza de lo particular a lo general. Se dijo también que esta cuantificación se realiza mediante la aplicación de principios probabilísticos. En los capítulos 2,3 y 4 se presentan las técnicas más usadas de la estadística descriptiva, por medio de las cuales tratamos de encontrar patrones que caractericen a un fenómeno (tabla de frecuencias y sus presentaciones gráficas) ó cantidades que sinteticen la información contenida en los datos (medidas de tendencia central y de dispersión). En estas condiciones, las técnicas de la estadística descriptiva se vuelven de utilidad limitada, puesto que disponiendo de información sólo sobre una parte del todo queremos extrapolar nuestras conclusiones hacia un conjunto mayor que es objeto de nuestro interés, por lo que para poder contestar preguntas con respecto al conjunto llamado población, se hace uso de herramientas que nos proporciona la estadística, las cuales nos permiten cuantificar al grado de incertidumbre en nuestra respuesta. La cuantificación se lleva a cabo usando principios probabilísticos. Por esta razón dedicaremos este capítulo a estudiar las nociones de probabilidad que son indispensables para comprender los técnicas que presentaremos en los capítulos siguientes. Inferencia Estadistica En el capítulo uno se menciono que el objetivo de la estadística es hacer inferencias con respecto a la población basándose en la información contenida en una muestra. Debido a que las poblaciones se describen mediante medias numéricas a las que se denominan parámetros, el objetivo de la mayoría de las investigaciones estadísticas es hacer una inferencia con respecto a uno o mas parámetros de la población. Generalmente los procedimientos de la inferencia estadística involucran ya sea la estimación o bien la prueba de hipótesis. En éste capitulo se tratará la estimación. El procedimiento de estimación se puede presentar de dos manera distintas: La estimación puntual, la cual utiliza la información de las muestras para obtener un solo numero o punto que estima el parámetro de interés. El procedimiento de estimación por intervalo hace uso de la información de la muestra para obtener dos números que se supone van a incluir el parámetro de estudio. En cada caso la estimación real se hace mediante un estimador, que es un regla que establece como utilizar los datos de la muestra para determinar el valor (o valores) que utilizamos como la estimación puntual (o por intervalo). Definición. Un estimador es un regla que establece como calcular una estimación basada en las mediciones contenidas en una muestra. Comúnmente el estimador se expresa mediante una formula. Por ejemplo, la media de la muestra Y 1 n Yi n i 1 es un posible estimador puntual para la media de la población .