Trabajo Práctico Estadística Guía de estudio: 1) Concepto de Estadística.

Anuncio
Trabajo Práctico
Estadística
Guía de estudio:
1) Concepto de Estadística.
2) El método estadístico:
a) Recuento, relevamiento o compilación de datos.
b) Tabulación y agrupamiento de datos. Gráficos.
c) Medición de datos
d) Inferencia estadística. Predicción.
3) Para la parte a) del item 2, analizar los siguientes conceptos:
a) Universo o población
b) Atributos (cualitativos, cuantitativos), carácter, variable (discreta, contínua)
4) Para la parte b) dsel item 2, analizar los siguientes conceptos:
a) Serie simple
b) Amplitud de la variable
c) Agrupamiento de datos: Frecuencia, serie de frecuencias, intervalo de clase, frecuencia de un intervalo de
clase, frecuencia relativa.
d) Gráficos: barra, sectores, histograma, polígono de frecuencia, curvas, mapas.
5) Para la parte c) del item 2, analizar:
a) Parámetros de posición: media aritmértica o promedio, mediana y moda.
b) Parámetro de dispersión: desviación o dispersión, desviación media o desviación promedio, desviación
estándar y varianza.
c) Curva de Gauss.
6) Todo lo teorizado en los puntos anteriores deben aplicarse a un proyecto que vamos a resolver este año. Es
a libre elección su temática. Elaborar encuestas, buscar datos en revistas, libros, periódicos, etc. que aporten
noticias sobre el tema elegido.
1) La Estadística es el campo de la matemática que trata de encontrar las leyes que rigen el mundo del azar a
fin de tomar las decisiones oportunas en aquellos aspectos de nuestro entorno que parecen estar dominados
1
por lo aleatorio.
El nombre de Estadística alude al enorme interés de esta rama de la matemática para los asuntos del Estado, y
su introducción en el mundo científico se debe a su importancia indiscutible para el desarrollo de las ciencias
sociales y humanas.
La estadística trata, en primer lugar, de acumular la masa de datos numéricos provenientes de la observación
de multitud de fenómenos, procesándolos de forma razonable. Mediante la teoría de la probabilidad analiza y
explora la estructura matemática subyacente al fenómeno del que estos datos provienen y, mediante el
conocimiento de tal estructura, trata de sacar conclusiones y predicciones que ayuden al mejor
aprovechamiento del fenómeno para los fines que de él se pueden pretender.
2) A) La materia prima de la estadística consiste en conjuntos de números obtenidos al contar o medir
elementos. Al recopilar datos estadísticos se ha de tener especial cuidado para garantizar que la información
sea completa y correcta. El primer problema para los estadísticos reside en determinar qué información y en
qué cantidad se ha de reunir. En realidad, la dificultad al compilar un censo está en obtener el número de
habitantes de forma completa y exacta; de la misma manera que un físico que requiere contar el número de
colisiones por segundo entre las moléculas de un gas debe empezar determinando con precisión la naturaleza
de los objetos a contar. Los estadísticos se enfrentan a un complejo problema cuando, por ejemplo, toman una
muestra para un sondeo de opinión o una encuesta electoral. El seleccionar una muestra capaz de representar
con exactitud las preferencias del total de la población no es tarea fácil.
b) Los datos recogidos deben ser organizados, tabulados, y presentados para que su análisis e interpretación
sean rápidos y útiles. Por ejemplo, para estudiar e interpretar la distribución de las notas de un examen en una
clase con treinta alumnos, primero se ordenan las notas en orden creciente.
c) Una vez que los datos han sido reunidos y tabulados, comienza el análisis con el objeto de calcular un
número único, que represente o resuma todos los datos.
d) Para establecer una ley física, biológica o social, el estadístico debe comenzar con un conjunto de datos y
modificándolo basándose en la experiencia. Por ejemplo, en los primeros estudios sobre el crecimiento de la
población, los cambios en el número de habitantes se predecían calculando la diferencia entre el número de
nacimientos y el de fallecimientos en un determinado lapso. Los expertos en estudio de la población
comprobaron que la tasa de crecimiento depende sólo de números de nacimiento sin que el número de
defunciones tenga importancia. Por tanto, el futuro crecimiento de la poblaciones empezó a calcular
basándose en el número anual de nacimientos por cada mil habitantes. Sin embargo, pronto se dieron cuenta
que las predicciones obtenidas utilizándosete método no daban resultados correctos. Los estadísticos
comprobaron que hay otros factores que limitan el crecimiento de la población. Dado que el número de
posibles nacimientos depende del número de mujeres, y no del total de la población, y dado que las mujeres
sólo tienen hijos durante parte de su vida, el dato más importante que se ha de utilizar para predecir la
población es el número de niños nacidos vivos por cada mil mujeres en edad de procrear. El valor obtenido
utilizando este dato mejora al combinarlo con el dato de porcentaje de mujeres sin descendencia. Por tanto, la
diferencia entre nacimientos y fallecimientos sólo es útil para indicar el crecimiento de población en un
determinado período de tiempo del pasado, el número de nacimientos por cada mil habitantes sólo expresa la
tasa de crecimiento en el mismo período, y sólo el número de nacimientos por cada mil mujeres en edad de
procrear sirve para predecir el número de habitantes en el futuro.
3) a) Universo o Población:
Es un conjunto de datos referentes a determinadas características de un grupo de individuos u objetos, tales
como la edad y el sexo de los estudiantes de una Universidad o el número de bolígrafos defectuosos y no
defectuosos producidos por una fábrica en un día determinado, a veces resulta imposible o nada práctico
2
observar al total de los individuos, especialmente si son muy numerosos. Este inconveniente s soluciona
tomando una muestra representativa de la población.
Población es el conjunto de todos los individuos y objetos en estudio. En nuestro caso la población esta
formada por el total de los estudiantes y el total de bolígrafos, respectivamente
Ejemplo:
La pirámide de población española se ajusta al modelo regresivo.
Dibujo cortado pegar
b)
Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse numéricamente. Las
variables cuantitativas pueden ser de dos tipos:
Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango numérico determinado
(edad, peso, talla).
Variables cuantitativas discretas, si no admiten todos los valores intermedios en un rango. Suelen tomar
solamente valores enteros (número de hijos, número de partos, número de hermanos, etc).
Variables cualitativas. Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en
una de varias categorías. La situación más sencilla es aquella en la que se clasifica cada caso en uno de dos
grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotómicos o binarios. Como resulta
obvio, en muchas ocasiones este tipo de clasificación no es suficiente y se requiere de un mayor número de
categorías (color de los ojos, grupo sanguíneo, profesión, etcétera).
Carácter:
Para el conocimiento de una población estadística se debe analizar cada uno de sus individuos (o a cada
individuo de una muestra). Pero ese análisis no puede ser exhaustivo: se debe seleccionar uno o varios detalles
(caracteres) y ver como se manifiesta ese carácter en cada uno de los individuos. Por ejemplo, de una
población de mazorcas de maíz, los caracteres dignos de estudio pueden ser: color, número de granos,
longitud, peso, etc.
Pueden ser:
cualitativos: que se presentan bajo varias cualidades no medibles. Ejemplo: color.
cuantitativos: cuando son medibles. Ejemplo: longitud de una mazorca, su peso, número de granos, etc.
4) c) La frecuencia de un valor de una variable estadística es el número de veces que se observa dicho valor, o
el número de casos clasificados en la clase definida por él.
Para agrupar los datos por su frecuencia:
− se ordenan los datos en orden creciente
− se cuenta la frecuencia absoluta de cada valor
3
Cuando un conjunto de datos estadísticos corresponde a muchas observaciones de los valores de una variable,
el manejo de todos ellos puede resultar engorroso; por eso se recurre a menudo a agrupar los datos en clases o
categorías, cada una de ellas correspondiente a un grupo de valores de la variable; se determina entonces la
frecuencia con la que se presentan datos incluidos en cada una de las clases y se habla de frecuencia de clase.
Intervalos de clase: para las variables cuantitativas, la agrupación de frecuencias se hace dividiendo el rango
de la variable en intervalos consecutivos que se acostumbran tomar de la misma amplitud
Frecuencia de un intervalo de clase: cuando la variable es continua, o es discreta pero toma una gran cantidad
de valores, conviene dividir el rango de la variable en unos pocos intervalos (entre 6 y 12) y repartir los
valores en ellos. El resultado será una tabla de frecuencias en la cual la variable, en lugar de tomar valores
numéricos concretos, varía dentro de intervalos.
Cuando se necesita (por ejemplo para el cálculo de parámetros) que cada intervalo quede representado por un
único número, se toma su punto medio, a que se llama marca de clase.
Frecuencias relativas: en un valor observado es el cociente entre la frecuencia con se presenta dicho valor y el
total de observaciones.
En el diagrama de barras que representa la distribución de los valores en términos de frecuencias relativas,
éstas acostumbran expresarse en términos de porcentajes del total de observaciones.
d− Gráficos:
Barras:
Los diagramas de barras pueden ser de diferentes tipos: de barras simples, de barras múltiples, o de barras
compuestas
Las barras pueden representarse horizontalmente. La ventaja de la horizontalidad estriba en que es más fácil
añadir leyendas.
Recibe el nombre de diagrama de barras el gráfico que asocia a cada valor de la variable una barra,
generalmente vertical, proporcional a la frecuencia (o a la cantidad) con que se presenta.
Requisitos para realizar un diagrama de barras:
1− texto visible
2− separación de las barras menor que su ancho
3− escala presente
4− se comparan longitudes de rectángulos.
Sectores:
En los gráficos de diagramas de sectores cada suceso viene representado por un sector circular de una
amplitud proporcional a su frecuencia.
La amplitud de cada sector circular se obtiene mediante una simple regla de tres.
4
Cuando estos diagramas se utilizan para comparar magnitudes en distintos períodos o para diferentes lugares
(por ejemplo países), a cada circulo hay que asignarle una superficie proporcional a la magnitud que
representa.
Observación:
Los diagramas circulares son útiles para representar las distintas partes de un todo, los distintos componentes
de un carácter.
Histograma: un histograma, o histograma de frecuencias, esta formado por una serie de rectángulos que tienen
sus bases sobre un eje horizontal ( eje x), siendo cada una de ellas igual a un segmento de longitud
correspondiente a la amplitud de la clase que representa. El principio de representación que rige la
construcción del histograma es que la superficie de cada rectángulo sea proporcional a la frecuencia de la
clase que representa, según una constante de proporcionalidad fija e igual para todas las clases; cuando, como
es habitual, las clases son todas ellas de la misma amplitud, este principio se traduce en que la altura de cada
rectángulo representa directamente la frecuencia de la clase correspondiente.
Polígono de frecuencia: si se unen entre si consecutivamente los puntos medios de las bases superiores de los
rectángulos de un histograma, se obtiene una línea poligonal denominada polígono de frecuencias. Esta línea
acostumbra prolongarse por sus extremos hasta cortar el eje de abscisas. Para ello, se toman dos intervalos de
clase que no contienen valores de la variable, uno situado por debajo del extremo inferior del rango de
variable y a continuación de él, y el otro, a continuación del extremo superior del rango y por encima de el,
ambos de igual amplitud que las restantes clases; la línea poligonal se cierra entonces prolongándola por cada
lado hasta unirla con los puntos medios de estos dos intervalos. De esta manera se consigue que el área de la
superficie encerrada por el polígono de frecuencias y el eje de abscisas sea igual a la suma de las áreas de los
rectángulos que integran el histograma correspondiente, de modo que ambas representaciones resultan ser
equivalentes.
Curvas: una curva es una representación gráfica de las relaciones entre variables.
En estadística se emplean muchos tipos de curvas, dependiendo de la naturaleza de los datos y del propósito
para el que la curva ha sido proyectada.
5) Se representa bajo el símbolo equis barrada, y viene a ser el cociente de dividir la sumatoria de los
elementos entre el número de ellos.
Es decir que la media aritmetica es igual a la suma de todos los elementos o datos que componen la muestra,
dividida entre el número de ellos.
Ejemplo:
Dados los datos:
X1= 2
X2= 3
X3= 5
5
X4= 8
X5= 10
X6= 12
X7= 14
X8= 16
X9= 18
X10= 20
Es decir, un total de 10 elementos, luego se entiende que N = 10. La medida aritmética sería entonces:
Mediana: es el valor para el cual el número de observaciones mayores que él es igual al número de
observaciones menores que él.
Cuando el número de observaciones es impar, la mediana queda definida como el valor correspondiente a la
observación que ocupa la posición central. Si el número de observaciones es par, el valor de la mediana se
determina como promedio de las dos observaciones centrales.
Moda: la moda de una serie de números es aquel valor que se presenta con la mayor frecuencia. Puede decirse
que es el valor más común. La moda puede no existir e incluso, si existe, puede no ser única.
b) Parámetros de dispersión:
Las medidas de dispersión vienen a abundar más en el estudio estadístico, al proporcionar los medios de
averiguar el grado en que dichos datos se separan o varían, esto con respecto al valor central, el cual es
obtenido por medio de las medidas de tendencia central, es decir que nos dicen el grado de variación o de
dispersión de los datos de la muestra, y configuran toda una disciplina que es conocida por el nombre de
Teoría de la dispersión
La desviación o dispersión de un elemento del conjunto es su diferencia con respecto a la media .
Usos de las medidas de dispersión:
Tanto las unas como las otras, son medidas que se toman para tener la posibilidad de establecer
comparaciones de diferentes muestras, para las cuales son conocidas ya medidas que se tienen como típicas en
su clase.
Por ejemplo: Si se conoce el valor promedio de los aprobados en las universidades venezolanas, y al estudiar
una muestra de los resultados de los exámenes de alguna Universidad en particular, se encuentra un promedio
mayor, o menor, del ya establecido; se podrá juzgar el rendimiento de dicha institución.
Desviación media:
6
Es el promedio en valor absoluto de todas las diferencias entre cada valor de la variable y su media aritmética.
Su cálculo difiere si los datos están o no agrupados en intervalor de clase.
Si no lo están se calcula
Si estan agrupados
Xi: es un valor cualquiera de la variable.
X: es la media aritmética de la variable medida en la muestra.
ni: es la frecuencia absoluta simple del intervalo.
n: es el número total de individuos estudiados en la muestra.
(Xi − X): es la sumatoria (en valor absoluto) de todas las distancias entrer cada valor de la variable y su media
aritmética.
Para la determinación de la desviación media se utilizan los valores absolutos, para que las diferencias en un
sentido no se contrarrestren con la del sentido contrario.
Desviación estándar: número que representa el alejamiento de una serie de números de su valor medio. Se
calcula a partir de todas las desviaciones individuales con respecto de la media. Es un concepto importante en
la mayoría de los cálculos estadísticos porque es una indicación precisa de la variabilidad entre un grupo de
números.
Un ejemplo sencillo es considerar las alturas de un grupo de cinco niños: 1,41, 1,45, 1,50, 1,59 y 1,60 m. La
media de las alturas es 1,51 m. Las desviaciones son las diferencias con respecto a la media. No se puede
utilizar una media simple de las desviaciones, porque automáticamente se obtendría un valor de cero (los
valores positivos y negativos se cancelan entre sí), y ésta es la razón por la que se recurre a un método más
complejo. En la práctica, se promedian los cuadrados de las desviaciones (los cuadrados son siempre
positivos), y luego se toma la raíz cuadrada. La media de las desviaciones al cuadrado es 0,00564, y su raíz
cuadrada es 0,075. Ésta es la desviación típica, que se representa normalmente por el símbolo s (sigma).
Muchos ordenadores y calculadoras de bolsillo poseen procedimientos para calcularla directamente, una vez
que se han introducido las series de números.
Otro grupo de niños podría tener alturas de 1,46, 1,48, 1,51, 1,53 y 1,57 m. La altura promedio es de nuevo
1,51 m, pero esta vez la desviación típica es 0,038. El segundo grupo está más agrupado en torno a la media, y
el valor menor de la desviación típica lo muestra con claridad.
Varianza: es la medida cuadrática de todas las desviaciones de cada valor de la variable con respecto a su
media aritmética.
De esta manera no se utilizan los valores absolutos sino que se evita que se contrarresten las diferencias
elevando al cuadrado el valor de cada una de ellas.
Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la dispersión de
los mismos. Existen distintas formas de cuantificar esa variabilidad. De todas ellas, la varianza (S2) de los
datos es la más utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la
media aritmética de la distribución.
Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como
7
unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada.
En el ejemplo anterior la varianza sería:
Sx2=
c) Uno de los métodos más importantes de ordenación de datos son la tabulación y la clasificación. Este
procedimiento conduce a una o más distribuciones de frecuencia.
Existen distribuciones de distintas formas. Muchas de ellas se caracterizan por ser simétricas y con un solo
pico, y muestran una forma de campana con un máximo en el medio, disminuyendo gradualmente hacia los
extremos de la escala de valores. Este tipo de distribución se conoce como Distribución normal o Curva de
Gauss. Se llama normal porque el valor central es el que se repite con mayor frecuencia. Otras distribuciones
son asimétricas, ya sea a la derecha o a la izquierda, según si el segmento más largo de la distribución se sitúe
en el lado de la escala correspondiente a los valores más altos o más bajos.
6)
Tema:
Mejora en el rendimiento de los chicos desde el período de 1998 al 2001
Encuesta: Docentes de tercer Grado
1) ¿ Qué materia les cuesta más , lengua o matemática? ¿ Por qué?
2) ¿ En qué ponen más entusiasmo, en leer o hacer cuentas?
3) ¿ Cree que no entienden matemática o lengua por falta de fijación de temas de años anteriores?
4) ¿ Cree que debido a el método actual de enseñanza los alumnos mejoraron su rendimiento?
5) ¿ Hubo incorporaciones al grupo de estudio? ¿Cuántos?
6) ¿ Hay muchos chicos que ya hicieron tercer grado más de una vez?
¿Sabe cuántos?
7) ¿ Tienen muchas dificultades para leer?
8) ¿ Cree que enseñandoles a los chicos de una forma más didáctica aprenderían más rápido o mejor? (Como
por ejemplo juegos, etc.), ¿ por que?
9) ¿ Cual sería un promedio de las calificaciones obtenidas por los alumnos?
Respuestas:
Cristina Otero Laura Del Cerro
1) Matemática. Porque al no practicar les 1) Matemática. Porque no
es mas dificultoso aprobar. encuentran interes en la materia.
8
2) Leer 2) Hacer cuentas
3) Si 3) Puede ser por otras razones.
4) Si, en la mayoría de los casos 4) Si.
5) Si, dos. 5) Si, uno.
6) Si, uno 6) No este año.
7) Si, pero no son grandes errores. 7) Si, pero son equivocaciones mínimas.
8) Si, porque el juego los motivaría 8) Si, porque a partir de haber
a aprender. implementado esta nueva técnica los alumnos ponen más entusiasmo.
9) En Lengua muy bueno y en 9) En lengua entre muy bueno y
matematicas bueno excelente, y en matemáticas bueno.
Conclusión:
Una vez de haber observado y comparado dos de las encuestas realizadas por nosotros llegamos a las
siguientes conclusiones:
Observamos que en estos tres años el rendimiento de los alumnos de tercer grado mejoró notablemente,
debido al gran esfuerzo demostrado por parte de los docentes, quienes han aplicado un nuevo método de
estudio, el cual incentivaba a los niños a que aprendan con más entusiasmo.
De acuerdo a los datos obtenidos mediante el diario Clarin del día Sábado 6 de Julio del 2002, al realizarse
una evaluación promedio a alumnos de tercer grado en escuelas públicas y privadas de la capital (6.336
alumnos de 170 escuelas). Estos mismos fueron comparados con los exámenes realizados en 1998. Los
primeros demostraron un notable progreso en el nivel educativo.
Bibliografía:
− Encarta 2000
− Encarta 1998
− Introduccion a la Estadística .
Autores: Dra. M. de L. Figuerola y Dr. C. R. Ricci
− Enciclopedia temática Océano.
− Enciclopedia temática Interactiva
− Diccionario Enciclopedico Larausse
− Diario Clarin
9
− Revista Unica
− Revista Viva
− Internet (buscadores varios)
10
Descargar