FACULTAD DE CIENCIAS EXACTAS Y NATURALES SEMILLERO

Anuncio
FACULTAD DE CIENCIAS EXACTAS
Y NATURALES
SEMILLERO DE MATEMÁTICAS
Grado 9
Taller # 5
Nivel II
Análisis de Datos
Reseña histórica (Karl Pearson 1857-1936)
Graduado por la Universidad de Cambridge en 1879. Cursó estudios de
derecho poco después de su graduación, aunque dedicó la mayor parte de su
vida a enseñar matemáticas aplicadas, mecánica y genética en el University
College de Londres. Muy pronto se sintió interesado por la aplicación de las
matemáticas al estudio de la evolución de las especies y la herencia. En 1901
funda la revista Biometrika, en la que publica una monumental biografía sobre
Francis Galton, del que fue alumno. Muy interesado por el trabajo de Galton,
que intentaba encontrar relaciones estadísticas para explicar cómo las características
biológicas iban pasando a través de sucesivas generaciones. Su investigación colocó en
gran medida las bases de la estadística del siglo XX, definiendo los significados de
correlación, análisis de la regresión y desviación típica. En el año 1911 fue profesor de
eugenesia en el University College, examinando la recopilación y análisis de la información
en el sentido que las características como inteligencia, criminalidad, pobreza y creatividad se
transmiten a través de generaciones. Autor de La gramática de las ciencias (1892). A
Pearson se deben aportaciones tan importantes en estadística como el coeficiente de
correlación lineal, la distribución
o el test de Pearson para el estudio de la bondad del
ajuste de una distribución empírica mediante una teórica. A Galton y a Pearson se les
considera hoy día los padres de la Estadística moderna
 OBJETIVO GENERAL
Reconocer los conceptos básicos relacionados con estadística y sus diferentes usos.
 OBJETIVOS ESPECIFICOS
 Identificar las diversas herramientas de estadística descriptiva y sus representaciones
gráficas.
 Extraer información de un conjunto de datos usando análisis estadísticos y las gráficas
asociadas.
 GLOSARIO
Estadística, diagramas de barras, medidas de tendencia central, media, mediana, moda.
 ELEMENTOS TEÓRICOS Y EJEMPLOS.
Definición: (Estadística) Es la ciencia encargada de la recolección, organización, análisis,
interpretación y representación de datos para, a partir de ésto, sacar conclusiones y
establecer previsiones.
1
En el estudio de la estadística es fundamental distinguir población, muestra y variables
estadísticas:
La población, es el conjunto de individuos, objetos o fenómenos de los cuales se desea
estudiar una o varias características.
La muestra, es un subconjunto de la población que se escoge para obtener información
sobre la variable a estudiar.
La variable estadística es la característica que se estudia en cada elemento de la población
o muestra.
Dichas variables pueden ser cuantitativas, o cualitativas o sea, cuando la característica se
puede medir numéricamente;, o sea, cuando la característica no se puede medir
numéricamente.
Medidas de Tendencia central: Medidas en torno a las se disponen los elementos de las
distribuciones. Las más importantes son la media, la mediana y la moda.
Moda: Es la Media Aritmética o promedio de los datos.
Mediana: Es el valor que ocupa el lugar central cuando los datos están ordenados de menor
a mayor. Si el número de términos de la distribución es impar, la mediana es el valor del
medio. Si el número de términos de la distribución es par, la mediana es el valor promedio
de los dos datos del centro.
Moda: Es el valor que más se repite. Una distribución puede tener más de una moda o no
tener ninguna
Distribución de frecuencias: Es una tabla donde aparecen los datos con sus respectivas
frecuencias.
En la tabla de frecuenta se deben tabular:
a) la frecuencia absoluta: el número de observaciones por cada categoría
b) la frecuencia relativa: la proporción de observaciones por cada categoría, donde la
n
proporción es P  i con n i el número de individuos en una categoría, y N el número
N
total de observaciones
 Ejemplo.
En una encuesta sobre estudios realizados por 300 personas se obtuvieron los siguientes
datos:
Posgrado: 6 personas; pregrado: 45 personas; secundarios: 63 personas; primarios: 120
personas; sin estudio pero saben leer: 60; sin estudio y no saben leer: 6 personas.
Construya una tabla de frecuencias para los datos y realice las gráficas descriptivas
correspondientes e interprete lo que observa.
 Solución:
La tabla de frecuencias queda de la siguiente forma:
2
Tabla de Frecuencias (Estudios realizados)
Estudios
Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
absoluta
absoluta
relativa
relativa
porcentual porcentual
acumulada
acumulada
acumulada
Posgrado
6
6
6/300=0.02
0.02
2
2
Pregrado
45
51
45/300=0.15
0.17
15
17
Secundarios
63
14
63/300=0.21
0.38
21
38
Primarios
120
234
120/300=0.4
0.78
40
78
Sin estudio
y saben leer
60
294
60/300=0.2
0.98
20
98
Sin estudio
y no saben
6
300
6/300=0.02
1.00
2
100
leer
Total
300
1.00
100
Las gráficas correspondientes son:
GRAFICO DE BARRAS.
140
120
100
80
60
40
20
0
Posgrado
Pregrado
Secundarios
Primarios
Sin estudio y saben
leer
Sin estudio y no saben
leer
3
GRAFICO CIRCULAR
Sin estudio y no saben leer
2%
Sin estudio y saben leer
20%
Posgrado
2%
Pregrado
15%
Secundarios
21%
Primarios
40%
De ambas gráficas es claro que:
 La mayoría que los que estudiaron solamente hasta la primaria forman la mayoría de
los encuestados.
 Los que tienen posgrado, así como los que son completamente analfabetas son una
minoría.
 El porcentaje de las personas encuestadas que no estudiaron pero saben leer.
 EJERCICIOS
1.
Si la media muestral o media aritmética se calcula con la fórmula X 
1 n
 X i , siendo
n i 1
X i las observaciones y n la cantidad de observaciones, Halle:
a) La media muestral para los siguientes datos: 8; 2; 8; 6; 2; 2; 6; 8; 2; 4
b) Identifique la mediana y la moda para los datos anteriores.
2.
A un grupo de familias, se les pregunto por el número de hijos y los resultados fueron
los siguientes: 2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7.
Construya una tabla de frecuencias con los datos anteriores y luego grafique el
diagrama de barras que muestre la frecuencia porcentual.
3.
Una fábrica de gaseosa proyecta lanzar al mercado un nuevo sabor. Se realiza un test
de aceptación de dicho sabor en una muestra de 30 niños, utilizando una escala de 1 a
10 puntos, para medir el grado de aceptación. El puntaje dado por cada uno de los 30
niños fue el siguiente:
2 6 8 7 4 5 10 6 6 7 6 7 3 8 7 6 8 6 5 4 7 8 5 7 6 7 2 7 2 7
4
a)
b)
c)
d)
e)
f)
¿Cuál es la población?
¿Cuál es la muestra?
¿Cuál es la variable?
¿Es la variable cualitativa o cuantitativa?
¿Qué escala se ha utilizado en la medición de la variable?
Construya una tabla de frecuencias y luego grafique el diagrama de Barras con las
frecuencias absolutas.
1 n
g) Calcule la media muestral definida por X   X i , siendo X i las observaciones y n
n i 1
la cantidad de observaciones.
h) Calcule la mediana y la moda para estos datos.
i) Según la gráfica anterior, ¿Qué puede concluir acerca de la aceptación del producto?
Explique.
4.
Un test de inteligencia aplicado a un grupo de estudiantes arrojó los siguientes
resultados:
Puntaje obtenido
Número de
estudiantes
En cada puntaje
85
90
95
100
105
110
115
3
7
5
4
12
4
2
Responda las preguntas de la (a) hasta la (h) del problema (4) para este caso.
5.
Los siguientes datos corresponden al tiempo, en minutos, que han necesitado 30
clientes de un banco para llevar a cabo una transacción bancaria.
20 42 62 32 28 20 38 26 30 18 42 54 16 32 42 36 18 56 41 16 14
42 34 14 24 51 49 24 18 56
Se pide elaborar:
a) Una tabla de frecuencias
b) Un diagrama de barras con las frecuencias porcentuales.
c) Calcule el tiempo promedio para realizar una transacción. (media muestral)
d) Calcule la mediana y la media muestral.
5
 EJERCICIOS SOBRE ANÁLISIS DE GRAFICAS.
De acuerdo a la siguiente información, conteste las preguntas de 1 al 8.
14
12
10
8
6
4
2
0
MATEMÁTICAS
CINCO
CUATRO
TRES
DOS
UNO
ESPAÑOL
CERO
No. Estudiantes
La gráfica muestra los resultados de todos los estudiantes que se matricularon en dos grupos
en jornadas distintas, uno de español y otro de matemáticas.
Se aprueba (se gana) una materia con una nota mayor a dos y no se puede habilitar
(reforzar) una materia con una nota inferior a dos.
Nota Final
1. Del curso de matemáticas, el porcentaje de estudiantes con una nota menor a cuatro es:
a. 55%
b. 65%
c. 45%
d. 26%
2. Del curso de español la fracción de estudiantes que obtuvo una nota de uno es:
a. 1/7
b. 6/40
c. 6/5
d. 1/6
3. Del curso de matemáticas el número de estudiantes con una nota menor a cuatro es:
a. 26
b. 34
c. 12
d. 40
4. El número de estudiantes de matemáticas relacionados en el gráfico es:
a. 40
b. 12
c. 42
d. 10
5. El número de estudiantes que puede habilitar matemáticas es:
a. 14
b. 8
c. 6
d. 7
6
6. El número de estudiantes de español relacionados en el gráfico es:
a. 12
b. 42
c. 52
d. 32
7. De la gráfica podemos deducir que:
a. El porcentaje de los que ganan matemáticas es igual al porcentaje de los que ganan
español.
b. El porcentaje de los que ganan matemáticas es mayor que el porcentaje de los que
ganan español.
c. El porcentaje de los que ganan matemáticas es menor que el porcentaje de los que
ganan español.
d. El 50% de los estudiantes ganan matemáticas.
8. El porcentaje de estudiantes que puede habilitar matemáticas es:
a. 21%
b. 20%
c. 15%
d. 16%
Responde las preguntas DEL 9 Al 12 con base en la siguiente información:
En la televisión se están presentando cuatro clases de programas: novelas, dibujos
animados, noticieros y películas de acción.
En una encuesta realizada acerca de cuál es la clase de programa que prefieren los jóvenes
televidentes, se encontró que los 3/5 de los encuestados prefieren novelas, 1/6 películas de
acción, 2/15 dibujos animados y 1/10 noticias.
9. A partir de los datos presentados sobre el número de encuestados que prefieren cada
programa se puede concluir.
a. Los televidentes tienen mayor preferencia por los noticieros que por las novelas
b. El programa que menos prefieren son las novelas
c. Los televidentes prefieren las novelas que los dibujos animados
d. El programa preferido es los dibujos animados.
10. El gráfico que representa las preferencias de los televidentes es:
A
B
7
C
D
11. Si se elige al azar una persona de las encuestadas, hay mayor posibilidad de que esta
persona prefiera un programa de:
a. Dibujos animados
b. Películas de acción
c. Noticias
d. Novelas
12. Si el total de encuestados es de 100 personas, el porcentaje de personas que prefiere las
novelas es:
a. 20%
b. 50%
c. 60%
d. 5%
Resuelva los problemas 13 al 15 de acuerdo con la siguiente información:
El siguiente cuadro muestra parte de la factura de un teléfono celular, donde se muestran
marcaciones, tiempo y valor de cada una de ellas.
AREA
932
933
933
912
932
912
933
932
932
933
932
912
TELEFONO
428040
537190
432083
287090
428040
287090
537190
428040
428040
432083
293316
287090
MINUTOS
1.0
1.27
2.35
5.0
4.7
3.6
2.1
2.0
1.5
1.7
3.1
4.2
VALOR
770
1540
2310
3850
3850
3080
2310
1540
1540
1540
3080
3850
8
13. Al observar la tabla ¿podemos afirmar que el promedio de tiempo de las llamadas de
este usuario es 2.71 minutos?
A.
No, pues al realizar la operación no se tuvo en cuenta el número total de datos.
B.
Sí, pues es el valor que corresponde al cociente entre la suma de los minutos de todas
las llamadas y el número de llamadas.
C.
No, porque no corresponde a un mayor porcentaje de llamadas.
D
Sí, pues corresponde al valor medio de tiempo gastado en las llamadas.
14. Para averiguar cuál teléfono corresponde a la moda en esta tabla de datos, se debe:
A
Realizar una nueva tabla donde se especifique la frecuencia absoluta de cada número
telefónico y tomar el de mayor frecuencia.
B
Contar el total de veces que se marcó cada número y tomar el de más marcaciones.
C
Sumar el valor de las llamadas en cada número y tomar el resultado mayor.
D
Tomar aquel que haya sido marcado la menor cantidad de veces.
15. La frecuencia relativa del teléfono 428040 es 0.333..., porque
A
Corresponde al cociente entre el valor total de llamadas a este número y el número de
llamadas.
B
Al sumar ésta a las demás frecuencias relativas el resultado aproximado es uno.
C
Corresponde al cociente entre la frecuencia absoluta de este teléfono y el número total
de datos.
D
Coincide con el promedio de llamadas hechas a este número.
 Pruebas saber
1. Si
el
producto
de
dos
números
entonces su suma podría ser:
(A) divisible por 16
(B) divisible por 8
(C) divisible por 49
(D) divisible por 5
(E) divisible por 3
enteros
es
igual
a
9
2. ¿Cuál es la menor cantidad de cuadros blancos que habría que pintar de gris
en la figura para que esta tenga u eje de simetria?
(A) 4 (B) 6 (C) 5 (D) (E) 3
3. Si se eligen tres números del tablero de manera que todos pertenezcan
A filas y columnas diferentes y se suman los tres números, ¿Cuál es la mayor
suma que se puede obtener?
(A) 24
(B) 18
(C)15
(D) 12
(E) 21
10
Descargar