Conceptos básicos estadísticos Población Población, en estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes. “Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones”. Levin y Rubin (1996). “Una población es un conjunto de elementos que presentan una característica común”. Cadenas (1974). La población o Universo es el total del conjunto de elementos u objetos de los cuales se quiere obtener información. Aquí el término población tiene un significado mucho más amplio que el usual, ya que puede referirse a personas, cosas, actos, áreas geográficas e incluso al tiempo. La población debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede perfectamente delimitado. El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística, y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita. Cuando el número de elementos que integra la población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella que está formada por un limitado número de elementos, por ejemplo; el número de estudiantes de la Escuela Rafael Cordero en Santurce. |1| Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística. Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra. Población: Es el conjunto de todos los elementos que cumplen ciertas propiedades y entre los cuales se desea estudiar un determinado fenómeno (pueden ser hogares, número de tornillos producidos por una fábrica en un año, lanzamientos de una moneda, etc.). Llamamos población estadística o universo al conjunto de referencia sobre el cual van a recaer las observaciones. Censo: consiste en el estudio completo de las características de una población. Muestra En estadística una muestra estadística (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población. Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor costo. Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados. El número de sujetos que componen la muestra suele ser inferior que el de la población, pero suficiente para que la estimación de los parámetros determinados tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo. Una muestra es el subconjunto de la población que es estudiado y a partir de la cual se sacan conclusiones sobre las características de la población. La muestra debe ser representativa, en el sentido de que las conclusiones obtenidas deben servir para el total de la población. Las muestras pueden ser probabilísticas o no probabilísticas. |2| Una muestra probabilística se elige mediante reglas matemáticas, por lo que la probabilidad de selección de cada unidad es conocida de antemano. Por el contrario una muestra no probabilística no ser rige por las reglas matemáticas de la probabilidad. De ahí que, mientras en las muestras probabilísticas es posible calcular el tamaño del error muestral, no es factible hacerlo en el caso de las muestras no probabilísticas. Ejemplos de éstas últimas son la muestra accesible (que está conformada por personas de fácil acceso para el investigador como ser colegas o alumnos de su clase.) y la muestra voluntaria (donde los sujetos de la muestra no han sido seleccionados matemáticamente). Población y muestra Cuando se realiza un estudio de investigación, se pretende generalmente inferir o generalizar resultados de una muestra a una población. Se estudia en particular a un reducido número de individuos a los que tenemos acceso con la idea de poder generalizar los hallazgos a la población de la cual esa muestra procede. Este proceso de inferencia se efectúa por medio de métodos estadísticos basados en la probabilidad. La población representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogéneo que reúne unas características determinadas. La muestra es el conjunto menor de individuos (subconjunto de la población accesible y limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la población). El individuo es cada uno de los componentes de la población y la muestra. La muestra debe ser representativa de la población y con ello queremos decir que cualquier individuo de la población en estudio debe haber tenido la misma probabilidad de ser elegido. Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos señalar: 1) Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo. 2) Como consecuencia del punto anterior ahorraremos costos. 3) Estudiar la totalidad de los pacientes o personas con una característica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar. |3| 4) Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, las observaciones y mediciones realizadas a un reducido número de individuos pueden ser más exactas y plurales que si las tuviésemos que realizar a una población. 5) La selección de muestras específicas nos permitirá reducir la heterogeneidad de una población al indicar los criterios de inclusión y/o exclusión. Variable En un proceso de observación o en un cuestionario se observan o se hacen preguntas sobre ciertas características de los sujetos o sobre ciertos fenómenos. Estas características que se tratan de medir en la investigación se llaman variables. Una variable es una característica de los sujetos que puede asumir más de un valor. Los valores que asumen las variables en cada uno de los sujetos son los datos. Por ejemplo, en un estudio en que se trata de determinar el aprovechamiento de los estudiantes en una escuela, una de las variables puede ser la nota obtenida en el curso de estadísticas. Los datos son, en este caso, las notas obtenidas en estadísticas por cada uno de los estudiantes que han tomado el curso. Datos Los datos pueden definirse como la información recogida, organizada y analizada por los estadísticos. Existen diferentes métodos para recoger los datos en un estudio o investigación. Se pueden utilizar datos publicados previamente que el investigador no tiene que recoger. Las bibliotecas están equipadas con computadoras y a través de éstas se pueden localizar bancos de datos que otras personas o instituciones han recogido y almacenado. Otra forma de recolección de datos es la experimentación. Esto ocurre principalmente en las investigaciones de medicina y de ciencias naturales. La investigación consiste en el montaje de un experimento en que se controlan todas las variables que pueden influir en los resultados y entonces se maneja la variable independiente y se observan los cambios en la variable dependiente. Cuando esto ocurre se puede hablar de una relación de "causa y efecto". La investigación es un verdadero experimento. En las ciencias sociales es más difícil puesto que se dificulta imponer controles sobre el medio social. En el momento de la recolección de datos debe haber control sobre todas las variables que pueden afectar variaciones en el experimento. Para hablar de un "experimento" y de una relación de causa y efecto es necesario que se den tres condiciones: |4| 1) La variable dependiente es el objetivo de la investigación. Se trata de determinar cómo se modifica esta variable dependiente cuando se ha modificado la variable independiente. 2) La modificación en la variable independiente ocurre antes que la modificación en la variable dependiente. 3) La variable independiente ejerce una influencia directa o indirecta en la variable dependiente. También se pueden obtener datos a través de cuestionarios o pruebas. La forma más común de llevar a cabo una investigación en las ciencias sociales es utilizando datos obtenidos a través de cuestionarios. En estos casos no se ejerce control sobre el comportamiento de las personas. Sólo se hacen preguntas y se observan las dos variables (independiente y dependiente) al mismo tiempo. En los cuestionarios no se busca una relación de causa y efecto, sino de correlación entre dos variables. Se busca determinar si la magnitud una variable se relaciona con la magnitud de la otra. Por lo general no se habla de variables independientes y dependientes, sino de predictores y criterios. El cambio en el predictor no es la causa del cambio en el criterio aunque un cambio implique el otro. Otra forma de obtener datos es mediante la observación directa. Se utilizan mucho en antropología y en investigaciones sobre animales. Este método de recoger datos tiene problemas debido a la subjetividad del observador y al hecho de que la presencia del observador puede modificar la situación. Estadístico Es una medida que se utiliza para describir una característica numérica de la muestra, no de la población como en el caso del parámetro. La estadística inferencial sirve para determinar cómo una estadística y un parámetro se relacionan. Parámetro Es la medida de una característica numérica de la población. (Media, mediana, varianza, etc.). Es un elemento descriptivo de la población. |5|