estadística

Anuncio
DIRECCIÓN DE EDUCACIÓN ABIERTA Y A DISTANCIA Y VIRTUALIDAD
LICENCIATURA EN EDUCACIÓN BÁSICA CON ÉNFASIS EN CIENCIAS NATURALES Y EDUCACIÓN AMBIENTAL
ESTADÍSTICA
MÓDULO EN REVISIÓN
CORPORACION U N IVERSITARIA
DEL CARIBE-CECAR
DIVISION DE EDUCACIÓN ABIERTA Y A DISTANCIA
'g-'"3,
.t -
t
*l'
**úd
;r='j
':
i.-n..**
,'',
-
-€"
t..
-'
¡r.
MODULO
ESTADISTICA
PROGRAMA A DISTANCIA DE LICENCIATURA EN
EDUCACIÓN BÁSICA CON ÉNFASIS EN CIENCIAS
NATURALES Y EDUCACIÓN AMBIENTAL
SINCELEJO
-
SUCRE
CORPORACION U N IVERSITARIA
DEL CARIBE-CECAR
DIVISION DE EDUCACION ABIERTA Y A DISTANCIA
t
iñ
"'f ' ':
:=:
...-
''r'I
,i
li
.="*,.;
::;
t.,,
'.
o:
.:.
MODULO
ESTADISTICA
CESAR TULIO MARTINEZ SANCHEZ
Licenciado en Matemáticas
Especialista en Educación Matemática
PROGRAMA A DISTANCIA DE LICENCIATURA EN
EDUCACIÓN BÁSICA CON ÉNFASIS EN CIENCIAS
NATURALES Y EDUCAGIÓN AMBIENTAL
SINCELEJO _ SUCRE
CONTENIDO
pá9,
INTRODUCCIÓN
ORIENTACIONES GENERALES PARA
A
EL
DESARROLLO
DEL
6
MODULO.
OBJETIVOS DEL MODULO
7
OBJETIVO GENERAL.
7
OBJETIVOS ESPECiFICOS
7
UNIDAD
1
CONCEPTOS BÁSICOS DE ESTADíSTICA
ó
PRESENTACION
I
OBJETIVOS ESPECIFICOS
11
REQUISITOS PARA EL ESTUDIO DE LA UNIDAD
12
ATREVETE A OPINAR
13
DINÁMICA PARA CONSTRUIR EL CONOCIMIENTO
14
1.
1.1.
.1 .1
CONCEPTOS BÁSICOS DE ESTADíSTICA
15
TERMINOLOGIAESTADISTICA
4q
1
Definición de Estadística
lq
1.1.2.
Población.
16
Muestra.
16
'1.1.4.
Dato.
17
1.1.5.
Variables
19
1.2.
1.2.1 .
.2.2.
DISTRIBUCIONESDEFRECUENCIAS
21
Frecuencia:
¿¿
Distribución de frecuencias no agrupadas.
22
1
1
.1
.3.
1.2.3.
.2.4.
I.2.5.
12
9.
1
Tablas de frecuencia agrupadas
¿5
Distribución de frecuencias acumuladas.
29
Distribucionesporcentuales
30
Interpretación de tabla
32
1.2.7: Representación gráfica de frecuencias
1.2.7.1
1
.2.7
.
.2.
Gráficos de barras
óJ
Diagrama circulares
34
1.2.7.3. Histogramas
12.7
.4.
33
Polígonos de frecuencia
35
e,7
1,.'2.7.5. Ojivas
38
RESUMEN
41
EJERCICIOS
42
LECTURAS COMPLEMENTARIA
45
MÉToDoS ESTADísTIcos
45
UNIDAD 2
47
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN
47
PRESENTACION
48
OBJETIVOS ESPECIFICOS
49
REQUISITOS PARA EL ESTUDIO DE LA UNIDAD
50
ATREVETEA OPINAR
51
DINÁMICA PARA CONSTRUIR EL CONOCIMIENTO
52
2.
2.1.
2.1 .1.
2.1.2.
2.1.3.
2.1.4.
2.1.5.
2.1.6.
s¡
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN
EQ
MEDIDAS DE TENDENCIA CENTRAL
53
Media Aritmética
c?
Media en una Distribución de Frecuencias Agrupada.
54
Med¡ana
co
Mediana para datos agrupados.
La moda
59
Moda para datos agrupados
59
2.2.
MEDIDAS DE DISPERSIÓN
61
2.2.1.
2.2.2.
2.2.3.
Desviaciónmedia
ol
Yarianza
63
Desviación Típica o Estándar
65
RESUMEN
67
EJERCICIOS
69
LECTURAS COMPLEMENTARIAS.
TZ
EL ENGAÑOSO TERMINO MEDIO
72
Unidad 3
Probabilidad
75
PRESENTACIÓN
76
OBJETIVOS ESPECIFICOS
77
REQUISITOS PREVIOS
78
ATREVETE A OPINAR
79
DINÁMICA PARA CONSTRUIR EL CONOCIMIENTO
80
J.
TEORIA DE LA PROBABILIDAD
81
3.1.
3.2.
3.3.
3.4.
3,5.
ESPACIO MUESTRAL
81
EVENTOS
84
PROBABILIDAD DE UN EVENTO
88
ESPERANZA MATEMÁTICA
92
RELACION ENTRE POBLACIÓN, MEDIA MUESTRAL Y
93
VARIANZA
3.6.
ANÁLISIS COMBINATORIO
RESUMEN
102
EJERCICOS
104
LECTURAS COMPLEMENTARIAS
107
ORIGENES DEL CONSEPTO DE PROBABILIDAD
107
BIBLIOGRAFIA
109
INTRODUCCION
En nuestros días, la estadística se ha convert¡do en un método efectivo oara
describir con exactitud los valores de datos económicos, políticos, sociales,
ps¡cológicos, biológicos
o fÍsicos, y sirve como herramienta para relacionar
y
analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en
reunir y tabular los datos, sino sobre todo en el proceso de "interpretación" de esa
información1.
Por tal razón, este modulo esta diseñado para el estudio de los temas básicos de
la estadística, que le permitan al estudiante de la licenciatura de básica con
énfasis en ciencias naturales a mejorar su nivel crítico como su capacidad para
tomar decisiones. Por tanto, el modulo esta diseñado en tres unidades: la primera
estudia las definiciones
y términos más frecuentes usados en estadísticas, la
distribución, organización, e interpretación de datos; en Ia segunda analizaremos
las medidas de tendencia central y dispersión la tercera comprende los conceptos
fundamentales oara introducirnos al mundo de la orobabilidad.
' Biblioteca encarta 2005
ORIENTACIONES GENERALES PARA EL DESARROLLO
DEL MODULO.
Como futuro licenciado de la educación básica con énfasis en ciencias naturales,
requerirás de formar un pensamiento matemático que
te permita no sólo la
interpretación de los fenómenos naturales, sino también tazonat con lógica ante
de la vida cotidiana. Es por ello que te presentamos el Módulo
Estadística, en el cual encontrarás una serie de conceptos básicos sobre
diskibuciones de frecuencia, medidas de tendencia central, probabilidad, y
aspectos fundamentales estadística. El aprendizaje del modulo y su aplicación
dependen exclusivamente de ti, de tu interés, entusiasmo y disciplina para
emprender el estudio del mismo. Por lo tanto, te sugerimos tengas en cuenta:
situaciones
1. Leer
y
entender detenidamente los conceptos
e
ilustraciones que allí
encuentres. No avanzar a otros conceptos sin antes entender muy bien el que
estud¡as, recuerda que éstos son secuenciales
y
prerrequisito para los
oosteriores.
2. Cada vez que estud¡es un concepto y asimiles
su
ilustración realiza las
actividades y ejercicios que encuentres en el respectivo taller.
3. En lo posible lleva un cuaderno de ejercicios
resueltos, no sólo te servirá de
material de apoyo sino que notarás tus avances.
4.
No te desanimes cuando no ent¡endas algo, a todos nos ha pasado, consulta
en otro texto o acláralo con tu grupo de estudio o con el tutor.
OBJETIVOS DEL MODULO
OBJETIVO GENERAL.
Desarrollar competencias en el estudiante en el manejo de los conceptos básicos
de estadística para que los utilice como herramienta esencial en situaciones de las
ciencias naturales y el que hacer pedagógico.
OBJETIVOS ESPECíFICOS
1. Aplicar los conceptos necesarios para
la
realización
de tablas de
distribución de frecuencias y graficas.
2.
Aplicar los conceptos de medidas de tendencia central
3.
Aplicar los conceptos de probabilidad
4.
Despertar en los estud¡antes la curiosidad y el interés hacia la búsqueda del
conocim¡ento que
le sirva de apoyo para su
actitudes innovadoras
algebraicos.
e
investigativas
a
aprendizaje, asumiendo
partir de los conoc¡m¡entos
UNIDAD
1
CONCEPTOS BÁSICOS DE ESTADíSTICA
,&
fr
I
PRESENTACION
Tradicionalmente la estadística se utilizo por los gobiernos de los estados para
establecer registros de población, nacimiento, defunciones, cosechas, impuestos,
etc.
Incluso hoy día gran parte de la población ent¡ende por estadística los conjuntos
de datos distribuidos en tablas, gráficos, publicados en diarios, etc.
La estadística se debe entender como un método para la toma de decisiones, de
ahí que se empleé en multitud de estudios científicos de todas las ramas del
saber. Así, por ejemplo:
¿Cómo decidir si un nuevo producto comercial tendrá éxito?
¿Qué podrá pronost¡car un sociólogo a partir de una encuesta sobe voluntad de
votos?
¿Cómo podrá un experto en geografia humana calcular la composición de la
población en el año 3008?
¿Cuáles serán las necesidades de puestos escolares para los próximos c¡nco
años?
La estadística no es que conteste con total exactitud a estas preguntas, pero si es
cierto que mediante procedimientos estadíst¡cos podremos responder
a
las
cuestiones planteadas con un margen de error prefijado.
El mal uso de la estadística permite hacer todo tipo de falsas interpretaciones y
equívocos, que puedan confundir a las personas con informaciones tendenciosas.
Cuenta una anécdota ocurrida en una guerra entre mandarines chinos. Había que
cruzar un río, y un mandarin recordó haber leído que la profundidad media del
agua en esa época del año era aproximadamente de un metro, por lo que dio
orden de pasarlo a pie.
Una vez cruzado el río el mandarín observo asombrado que se había ahogado
varios centenares de sus soldados. ¿Qué paso?
Pues que aunque
el río tenÍa una profundidad media de un metro, en
determinados lugares eran mucho más profundos, por lo que los soldados más
bajos no pudieron ni asomar la cabeza.
l0
-
OBJETIVOS ESPECIFICOS
1. Aplicar
los
conceptos básicos fundamentales para
el
análisis e
interpretación de datos.
2.
Organizar un conjunto de datos mediante tablas de frecuencia y gráficas.
3. Analizar, interpretar
y
extraer conclusiones
de cualquier información
presentada en tablas de frecuencias o cualquier tipo de gráfica.
4.
Fomentar el interés hacia el estud¡o de la estadística dada su aplicación a
situaciones propias de la ciencia.
ll
REQUISITOS PARA EL ESTUDIO DE LA UNIDAD
Para cumplir con los logros, propuesto de esta unidad se requiere que el
estudiante:
-
l2
Efectúe correctamente operaciones con número reales.
ATREVETE A OPINAR
Tome su cuaderno de notas y responda las siguientes preguntas, a medida que
avances en sus estudios verificando sus ac¡ertos, corrigiendo los desaciertos que
se hayan tenido y respondiendo las preguntas que dejaste de responder, podrás
darte cuenta de la cantidad de conocimiento que tenías sobre el tema al comenzar
el estudio o lo que adquirió en el proceso.
1.
Que aplicabilidad le encuentra a la estadística en su que hacer diario.
2.
cual es la diferencia entre población y muestra.
3.
Determina el rango de los siguientes dato: 16, 46,6,
4.
realiza una tabla de frecuencia y un diagrama de barra con los siguientes
datos:
T.'
2,5,
10 3, 5
,4,3,3,2.7
20,75,45y 24
DINAMICA PARA CONSTRUIR EL CONOCIMIENTO
ACTIVIDAD PREVIA: (Trabajo independiente)
1. Responda de manera escrita la sección Atrévete a responder.
2. Lea analíticamente la unidad y haga un resumen sobre los conceptos básicos
de la unidad
3. Anote las dudas y dificultades presentadas durante la lectura de la unidad y los
ejercicioi que se encuentran al final de la unidad
4.
Tome un recibo de servicios y convierta el diagrama de barras en una tabla oe
frecuencias
ACT|VTDAD EN GRUPO (C|PAS)
'::::
l.
Reunidos en CIPAS, socialicen los resúmenes elaborados de manera individual
e independiente
2. . Socialicen las respuestas de la sección Atrévéte a opinar, que desarrollaron
de manera individual.
3. Desarrollen los ejercicios que se encuentra al final de la Unidad y discútanlos
en el grupo de estudios. Estos ejercicios deben ser socializados en la sesión
junto con todos los compañeros de grupo y entregados al tutor.
4.
Elabore con sus compañeros una encuesta, aplÍquela , tabule e interprete los
resultados
5. Aclare las dudas con el tutor.
t4
1. CONCEPTOS BÁSICOS DE ESTADíSflCA
1.i rERMrNoLoc¡A EsrADísnct
1.1.1 Definición de Estadística
La Estadística' estudia los métodos científicos para recoger, organizar, resumir y
analizar datos, así como para sacar conclusiones válidas
y tomar decisiones
razonables basadas en tal análisis.
Pero, para comprender su estado actual y su campo de actividades, necesitamos
conocer algo de su historia. Godofredo Achenwall (1719-1772), profesor y
economista alemán, quien es considerado
el
fundador
de la
Estadística,
ejerciendo la docencia en la Universidad de Leipzig realizó unos apuntes acerca
de una nueva ciencia a la que llamó Estadística, la cual la definió como e/
conocimiento profundo de la situación respectiva y comparativa de cada estado.
Estadística se deriva de la palabra sfaaf que significa gobierno.
Las primeras aplicaciones de la Estadística fueron los asuntos de gobierno y
fuego fas utilizaron las compañías de seguros y los empresarios de juego y azal a
las anteriores siguieron los comerciantes, los industriales, los educadores, etc.
Hoy en día, la Estadística puede definirse como un método científico de operar
con los datos e interpretarlos. Los procedimientos y análisis que aparecen en la
t
lf
Martínez, Ciro. Estadíst¡ca. Eco Ediciones. Eogotá 1992. Pá9.
I
estadística caen
en dos categorías generales,
descriptiva
e
inferencial
dependiendo del propósito del estudio.
Estadística descriptiva: comprende aquellos métodos usados para organizar y
describir la información.
Estadística inferencial: comprende aquellos métodos y técnicas usadas para hacer
generalizaciones, predicciones o estimaciones sobre poblaciones a partir de una
muestra.
1.1.2 Población.
Es el conjunto de todos los elementos que cumple una determ¡nada característica.
Por ejemplo si un biólogo esta interesado en una investigación para determinar
características comunes en las diversas especies vivientes, su población de
interés será los elementos que conforman los sistemas naturales
1.1.3.
Muestra,
Es cualquier subconjunto de la población.
A la muestra se le considera una representación de la población, por ello se ha de
cuidar su elección.
La muestra puede ser probabilística o intencional, es probabilística cuando todos
los elementos de la población tiene la misma posibilidad de ser elegida, la
intencional es cuando el investigador selecciona bajo su criterio la muestra.
16
1.1.4. Dato.
Son medidas valores o características susceptibles de ser observado y contado,
es decir es asignar numerales a personas, animales o acontecimientos de acuerdo
con ciertas reglas, los datos pueden ser:
Datos nominales.
Consiste en clasif¡car objetos reales según ciertas características
o
nombres
dándole un símbolo o código sin que implique una reacción de orden, distancia o
proporción entre estos objetos. En esta escala las variables son cualitat¡vas y
para medirlas se asigna códigos a diferentes atributos o categorías.
Estos son números que solo nombran, marcan diferencia de clase y por lo tanto,
pueden servir para clasificar observaciones sobre variables cual¡tativas
mutuamente exclusivos, donde los números de cada grupo pueden entonces
contarse. Por ejemplo si la variable en estudio es sexo, entonces macho puede
codificarse con cero (0) y hembra con uno (1), pero las marcas alternativas macho
= 50 y hembra = 15 también servirán como se puede ver con este ejemplo, en este
tipo de escala no tiene sentido sumar, restar, multiplicar, dividir, promediar
ni
manipular de otra forma datos nominales. solo se ouede contar.
Datos Ordinales
En esta escala se establecen posiciones relativas de objetos o individuos con
relaciones a una característica sin que se reflejen distancia entre ellos. Entre los
objetos ordinales existen la relación, mayor, ¡gual
o menor que y las
relaciones
lógicas de transitividad y asimetría. La ordenación implica diferentes niveles de
pos¡ción de atributos. Sin embargo, Ias d¡ferencias entre números o razones de
dicho número permanecen sin ningún sentido. Por ejemplo, la clasificación de
17
cachamas como grandes, medianas
códigos:
3,2, 1,0 o 250, 150, 50,
o
pequeñas podían registrase con los
lo ¡mportante es que los números mayores
denotan una clasificación más favorable
a un tamaño mayor, en tanto que
las
menores indican lo opuesto. Pero, estos datos no indican cuantos más o menos
favorable es una evaluación comprobada con otra. Un dos se considera más que
un uno, pero no necesariamente el doble del tamaño, un 2,b0 se considera una
cachama de mayor tamaño que la referencia con un 50 pero no necesariamente 5
veces mayór. En cualquier caso, las operaciones aritméticas con estos datos
están fuera de lugar
Datos De Intervalos
Las variables en una escala de intervalos se miden por valores numéricos y, como
los datos ord¡nales inherente una jerarquía u ordenación, además están
relacionados entre si por intervalos o distancias significativas por que todos los
datos están referidos
a un punto cero arbitrario. Dadas esas
arbitrariedad, las
razones de dicho número no tienen sentido. La suma y la resta son permisibles
pero no la multiplicación ni la división la escalas de tiempo calendario, tiempo
horario y temperatura dan buenos ejemplos de mediciones que empiezan desde
un punto cero local¡zando desde un punto arbihario y luego utilizan una distancia
unitaria, igualmente arbitraria pero consistente, para expresar intervalos entre
números.
Datos de razón
El nivel más alto de medición, que produce la información más útil, proporcionan
datos de razón, esto es, además de distribución, orden
y
distancia, permite
establecer en que proporción es mayor una categoría que otra, es decir contienen
razones con sentido porque están referidas a un punto cero absoluto o natural
que denota la ausencia total de la característica que mide. Todos los tipos de
l8
operac¡ones aritméticas, incluso la multiplicación y la división se pueden efectuar
con estos datos.
1.1.5.
Variables
Es una característ¡ca que puede tener diferentes valores en los distintos
elementos o individuos de un conjunto
Ejemplo:
Característica de cachamas de un exoerimento:
Cachama
C1
C2
C3
C4
CS
CO
C7
C8
Cg
C10
Variable Cualitativa
Variable Cuantitativa
Sexo Especi+
Edad talia
Macho
Cachama negra
Hembra
Hembra
Cachama blanca
Híbrido
Cachama blanca
Híbrido
Cachama negra
Hibrido
Híbrido
Cachama blanca
Cachama neora
Macho
Macho
Hembra
Hembra
Hembra
Macho
Hembra
¡
Las variables se pueden clasificar en cualitativas y cuantitativas
l9
Discretas
./
Cuantitativa
\
Variables
Continuas
Binomial
Cualitativa
Multinomial
Variables cualitativas
Una variable que se describe normalmente en palabra y no en forma numérica,
porque difiere
en clase y no en cantidad entre unidades
elementales se
denominan variable cualitativa, la tabla anterior contiene dos variables cualitativas,
sexo y especie
Estas variables cual¡tativas pueden ser Binomial o Multinomial
Las Binomiales son las que en ella se observan únicamente dos categorías por
ejemplo Sexo (Macho y Hembra), Clases de energía (Cinética, Potencial). Sobre
una variable cualitativa multinomial se pueden hacer' observaciones en más de
dos categorías, por ejemplo: especie de cachamas (blanca, Negra, híbrido),
sistemas naturales (marino, terrestre, estuarios, de agua dulce) transformaciones
de la energía (calorífica, radiante, eléctrica, nuclear).
20
Variable cuantitativa:
Las variables cuantitativas son aquellas que se pueden expresar numéricamente,
porque difieren en cantidad y no en clase entre las unidades eleméntales bajo
estudio.
En un sentido amplio, es asignar numerales a personas animales objetos
acontecimiento de acuerdo con ciertas reqlas.
1.2 DISTRIBUCIONES DE FRECUENCIAS
El aspecto fundamental de la estadística es la información que contiene.
srn
información que seleccionar, organizar, analizar e interpretar, no habrá razón para
usar o estudiar estadística; a la información usada en estadística se llaman datos;
para que sea út¡l dicha información en la toma de desiciones, debe organizarse y
mostrarse apropiadamente. El objetivo de la organización de datos es acomooar
un conjunto de datos en forma útil para revelar sus características esenciales y
simplificar ciertos análisis
Una distribución de frecuencia es una tabla en que un conjunto de datos se divide
en un número adecuado de clases, al tiempo que se muestra también el número
de unidades pertenecientes a cada clase.
En esta tabla se sacrifica parte de la información contenida en los datos; en
conocer el valor exacto de cada un¡dad, se sabe únicamente que pertenece a
cierta clase- En cambio
el tipo de
agrupación suele destacar importantes
características de los datos y por consiguiente, la ganancia en legibilidad suele
más que compensar la perdida de la información.
2l
1.2.1 Frecuencia:
La frecuencia de una medida o de una categoría es el número de veces que
aparecen en una colección de datos, lo denotaremos con el símbolo n v se lee
frecuencia absoluta.
Una distr¡bución de frecuencias es una tabla en a que un conjunto de datos se
divide en un numero adecuado de clase (categorías), al tiempo que se
muestra tamb¡én el numero de unidades pertenecientes a cada clase.
Existen dos topos generales de tabla para reportar datos usando frecuencias
Estas son: Distribución de frecuencias no agrupadas y distribución de frecuencias
agrupadas.
L2.2. Distríbución de frecuencias no agrupadas.
Continuación se presentan las horas dejadas de trabajar en un mes, por los
empleados
de
un laboratorio de investigación animal
Número De Horas Dejadas De Trabajar
9-8-7-8-4-3 -2-1 -1-5-3-2- 1 -1 -7 -3-2-8-7-6-6_4_3_2
2-1 -9-4-6-9-6-9-4-3-5-7 -3-21 -4-4-2
Solución
Para hacer
la
representación
de estos datos en una tabla de
frecuencla
procedemos de la siguiente forma:
Pr¡mero usamos marcas de clase para ayudar a determinar la frecuencia absoluta
22
ni de cada observac¡ón, donde X representa el número de horas dejadas de
trabaiar.
Número de horas
dejadas de trabaiar
Tabulacion
Frecuencia
¿
ilililt
o
7
J
4
ililil
1
il
5
o
7
8
o
6
z
4
4
4
42
total
Por cada observación, hacemos una marca (1) en la columna denotada con
tabulación correspondiente a cada marca de clase, cuando se han hecho todas las
observaciones se cuentan las de cada clase X para determinar dicha frecuencias.
Note que la suma de todas las frecuencias absolutas es igual al número de datos
de la población o muestra según sea el caso. por ejemplo la suma de la frecuenc¡a
(42) representa 42 empleados
de
un laboratorio de investigación animal.
1.2.3.Tablas De Frecuencia Agrupadas
Estas tablas presentan las frecuencias de acuerdo con grupo o clase de medidas.
Se usan comúnmente para resumir grandes cantidades de datos que contienen
relativamente pocas repeticiones; tales resúmenes facilitan ciertos cálculos
estadísticos. Para usar una tabla de frecuencias agrupadas, los datos deben
medirse al menos con una escala de intervalos.
Si se quiere construir una tabla de frecuencias agrupadas para una cierta
colección de datos, es necesario responder tres preguntas relativas a las clases.
I . Cuántas clases deben usarse
2. Cuál debe ser la amplitud de cada clase
3. En qué valor debe empezar la primera clase.
Escoger el número de clases requiere varias consideraciones. si todos los datos
se agrupan en un número pequeño de clases, las caracteristicas de los datos
originales se ocultan y puede perderse información relevante; por otra parte si se
utilizan demasiadas clases se pierde el propósito del agrupamiento que es
condensar los datos. Presentándose además la posibilidad que muchas clases
queden vacías quitándole sentido al agrupamiento de los datos.
El
número de clases, denotado por
c
depende de la situación y del número oe
datos obtenidos. No existe ningún'acuerdo general acerca del número de clases
que deban
usarse
dada que la elección es arbitraria se recomienda que se utilicen
entre (5 y 15) clases.
una sugerencia útil para encontrar el número de clases está dada por la regla de
STURGEES3
C = 1 + 3,3 Log n donde n es el número de datos.
La amplitud de cada clase o intervalo se encuentra usando el rango (R) que es la
diferencia entre el valor máximo (Xr"J y el valor mínimo (X-¡n) en la muestra
R=Xr"r-X,n¡n
Como G clases debe cubrir
el rango, dividimos entre el número de clases para
encontrar la amplitud de clases A
rMartínez, Ciro. Estadística. Eco Ediciones.
Bogotá 1992. pág. 39
24
Amplitud de clase
^R
C
Generalmente el cociente
E
C
no
".
de la misma exact¡tud de los datas en el caso
de que esto ocurra debemos aproximar A al número más próximo (valga
la
redundancia) por encima que tenga la misma exactitud de los datos.
Para determinar en que valor empieza la primera clase se tiene en cuenta, si al
escoger la amplitud conveniente de cada intervalo el rango se amplía o no. Si el
rango no se amplía la primera clase empieza en el valor mÍnimo de la muestra.
El rango se amplia, determinamos en cuantas unidades lo hace y se reparte
conveniente este valor, al valor máximo se le suma la cantidad especif¡ca y al valor
mÍnimo se le resta la otra cantidad la diferencia corresponde al inicio de la primera
clase.
Ejemplo
Para mostrar la construcc¡ón de una distribución de frecuencias, se consideran las
siguientes 80 determinaciones de emisión diaria (en toneladas) de óxidos de
azufre de una planta industrial.
25
15.8 26.4 17.4 11.2 23.9 24.8 18.7 13.9 9.0 18.1
22.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 14.5
26.8 22.7 18.0 20.5 11.1 20.9 15.5 19.4 16.7 19.0
19.1 15.2 22.9 26.6 20.4 21 .4 19.2 21 .6 16.9 10.7
18.5 23.0 24.6 20.1 16.2 l8
7 .7
13.5
23.5 23.7
14.4 28.6 '19.4 17.0 20.8 24.3 22.5 24.6 18.4 13..2
8.3 21.9 12.3 22.3 13.3 1 .8 19.3 20.0 25.7 23.8
25.9 10.5 15.9 27.5 18.'l 17.9 9.4 24.1 20.1 28.5
1
1. Primero se
determina el valor máximo y el valor mínimo del conjunto de datos.
Xmáx = 28.6
2. Se calcula el Rango.
R=X.¿¡-X¡¡¡
R = 28.6 - 6.2 =22.4
3. Se determina el número de intervalos o clases.
C=1+3,3Logn
C=
I
+ 3,3 Log 80
C=1+S,311,993¡
C:= 1 + 6,28
C:= 8
4 Amplitud de clase
^R
C
26
Xmín = 6.2
A
=22'4
8
A=2.8
entonces
5. Límite de los intervalos
Como C =
8YA
= 2,8, entonces R
=AxC = 8 X2,B=22,4
En este casoel rango
no se amplio, por lo tanto la primera clase empieza en el valor mí nimo 6,2;
quedando así:
CLASE
1
¿
4
7
8
INTERVALO
6.2-
I
9- 11.8
11.8 14.6
14.6 17.4
17.4 -20.2
20.2 - 23
23 -25.8
25.8 - 28.6
-
Nota: Si el rango se amplia, determinamos en cuantas unidades lo hace y se
reparte convenientemente este valor, al máximo se le suma la cantidad esoecifica
y al otro valor minimo se le resta la otro cantidad la diferencia correspondiente al
inicio de la primera clase.
Como se observa en la tabla se presenta el inconveniente que las clases se
traslapan, es decir, existen datos, por ejemplo 17,4 (tercer dato de la primera fila)
que no se sabe si pertenecen a la cuarta o quinta clase; una forma de evitar esto,
es utilizando una cifra decimal para el limite inferior de cada clase. Al realizar la
tabulación la tabla queda de la siguiente manera.
27
clase
6.21-
tabulación
I
O¡
4
- 11.8
11.81 - 14.6 |ilil ill
14.61 - 17.4 ililI ilil|
17.41 - 20.2 ililt ililt ililt iltl
9.01
20.2't
23.01
25.8
8
10
19
-23
4'r.
-25.8
o
-
t
l0
28.6
80
Como ya se indicó, una vez agrupados los datos, cada observación pierde su
identidad, en el sentido que deja de conocerse su valor exacto. Esto puede
provocar dificultades cuando deseamos ofrecer descripciones adicionales de los
datos, pero se puede salvarlas representando cada observación en una clase con
su punto intermedio llamada marca de clase. para calcular la marca de clase se
suman los límites superiores e inferiores y se divide la suma entre dos, se denota
como Xi; para los datos de emisión de óxido de azufre se tiene:
Toneladas de
oxido de azufre
6.219.01 - 11.8
I
-
11.81 14.6
14.6 1- 17.4
17.4 1-20.2
20.21-23
X¡
4
7R
ó
10
19
10.4
13.2
16
18.8
21.6
23 01- 25.8
I
25.81
10
80
-28.6
T
28
ll¡
24.4
27.2
1.2.4 Distribución De Frecuencias-Acumutadas.
solo cuando las variables son cuantitativas se puede determinar una frecuencia
acumulativa de clases como la suma de frecuencias de clases para todas las
clases. Para encontrar la frecuencia absoluta acumulada, que se denota con
suman todas las frecuencias absolutas hasta la clase K_ésima.
]V K=
Ni
se
+.
Ln,
¡=t
Por ejempfo
N
r=Zn,
: ñ1+n2 +n3+¡4 =:4+7+8+10
=2g.
t=l
A continuación se muestra la frecuencia acumulada de las toneladas de óxidos oe
azufre
Toneladas de oxido de
'
fl¡
Ni
4
4
7
11
29
48
20.21-23
ó
10
19
13
23 01- 25.8
o
25.81-28.6
't0
azu'fre
I
6.219.01 - 11.8
11.81 14.6
14.6 1- 17.4
17.4 1- 20.2
-
lo
A4
70
80
Existen varias formas alternativas de distribuciones para la agrupación ocasionan
de datos. Las más comunes son las distribuciones acumulativas ,,mayor que" y "o
más", estas tablas se construyen a partir de las tablas de frecuencia acumulaoa
respect¡va. .una distribución de frecuencias acumulativa "menos de" muestra el
número total de observaciones inferiores a valores dados. Estos valores deben ser
fímites de clases apropiados, pero no pueden ser marcas de clases. para el
ejemplo de las toneladas de óxidos de azufre sería:
29
Frecuencia acumulada menor oue
Oxido de azufre
Menor de 6.2
Menor de 9
Menorde 11.8
Menor de 14.6
Menor de 17.4
Menor de 20.2
Menor de 23
Menor de25.8
Menor de28.6
N¡
4
4
11
19
¿v
48
61
70
80
Frecuencia acumulada mayor que
Oxido de azufre
6.2 o más
80
9omás
TO
11.8 o más
14.6 o más
17.4 o más
20.2 o más
23 o más
25.8 o más
28.6 o más
N¡
OY
6'l
51
32
lo
10
0
1.2.5. Distribuciones Porcentuales
Si se desea comparar distribuciones de frecuencias, puede ser necesario (o al
menos conven¡ente) convertidas en distribuciones porcentuales. Para ello
sencillamente dividimos cada frecuencia de clase entre la frecuencia total, esto se
conoce como frecuencia relativa , que se denota con fi y se calcula
30
así: f
=
L;
,I
luego se multiplica este cociente por cien, de esta forma se ¡nd¡ca que porcentaje
de los datos corresponde a cada clase de la distribución. Lo mismo puede hacerse
con distribuciones acumulativas, con lo que se convertiría en distribuciones
acumulativas porcentuales.
A
continuación
se
muestran ambos tioos de
distribuciones:
Oxido de azufre
6.21- 9
9.01 - 11.8
11.81 - 14.6
14.6 1- 17.4
17.4 1- 20.2
20.21 -23
23 01- 25.8
25 81 - 28.6
T
Fi
f
fl¡
nnq
4
7
0.0875
8
01
10
0.125
0.2375
0.1625
0.1125
0 125
l9
13
Y
10
80
1.0
fix 100
Fi
5%
8.75%
1jYo
F,
0.05
0.1375
0.2375
0.3625
0.6
0.7625
0.875
1.00
12.5o/o
23.7 5o/o
16.25%
11 .250/o
12.5%
100%
x100
55o/o
13.7 5o/o
23.75%
36.25o/o
600k
76.25o/o
87 .5o/o
100Yo
se le conoce como frecuencia relativa acumulada.
En la siguiente tabla se muestra una d¡stribución de frecuencias y la interpretación
de cada una de las columnas que la conforma.
clase
Oxidos de azufre
ni
N¡
f¡
%o
F¡
Relativo
1
¿
o.z- Y
9.01 - '1 1.8
4
7
11
11.81
8
19
10
19
13
29
48
-
14.6
14.6 1- 17.4
17.4 1-20.2
¿u.¿ | - ¿J
23 01- 25.8
25.81 -28.6
4
7
B
I
3l
I
10
80
4
61
70
80
0.05
0 0875
0.1
u. t¿c
u.¿ó I c
0.1625
0.1125
0.125
1.0
8.75
10
12.5
23.75
16.25
11.25
12.5
100%
o/o
Xi
Acumulado
0.05
0.1375
u.¿ó t c
0.3625
0.6
0.7625
0.875
55
7.6
tJ-/3
23.75
36.25
60
76.25
104
1.00
100
ó/.3
tJ.z
16
18.8
zt.o
24.4
27.2
1.2.6. lnterpretación De Tabla
Se interpreta un dato de cada columna
1.
na= 1g' esto quiere decir que en diez días se presento una emisión de oxido
de azufre comprendido entre 14.6 y 17.4 toneladas diarias.
2.
Nu=
46
quiere decir que durante cuarenta y ocho días la emisión de oxido
de azufre estovo entre 6.2 y 20.2 toneladas.
3.
fa= Q.l=19%; quiere decir que el diez por ciento de los días la emisión de
oxido de azufre producida por la fabrica estuvo entre 11.8 y 14.6 toneladas.
4.
Fu= 9.7625= 76.250/o; quiere decir que
el
76.250/o
de los días la fabrica
produjo entre 6.2 y 23 toneladas de emisión de oxido de azufre.
5. Xr='19.4'
quiere decir que en siete días se produjo 10.4 toneladas de oxido
de azufre en la fabrica.
Actividad 1.1:
'
Se presenta el registro de las edades en meses cumplidos, de 40 niños de un
iardín infantil
1232920
24 29 23
16 30 15
14 17 22
21
22
30
183429362725
11 23 2s 28
19 31 30 35
17 27 33 38
26
28
33
34
26
39
A partir de los datos anteriores: construye una tabla de frecuencias e interpreta
cada una de las columnas que la conforma.
)¿
1.2.7 Representación Gráfica De Frecuencias
Una gráfica es otra manera de describir conjunto de datos; a menudo, una
representación de datos mediante ilustraciones hace más evidentes c¡ertas
caracterÍsticas que una tabla de frecuencias.
se puede afirmar que una gráfica estadística es aquella en la cual se presentan
los datos estadísticos en términos de magnitudes, para interpretarlos en forma
visuala
Hay representaciones gráficas de muchos tipos las más usadas son: Histogramas,
polígonos de frecuencias, diagramas de barra, circulares, y ojivas. A continuación
se hacen las ilustraciones de cada una de ellas.
1.2.7,1. Gráficos De Barras.
Los gráficos de barras proporcionan buena información
y permiten una
apreciación estadística más rigurosa. Aunque no existen normas específicas para
la distribución de gráficos de barras, miremos estas recomendaciones que serán
de gran utilidad en este campo:
o
Verificar que
el gráfico quede b¡en balanceado, evitando que las barras
resulten muy anchas o demasiado altas.
.
.
.
Hay que dejar siempre un espacio prudencial entre las barras, que no sea
inferior a la mitad del ancho de ellas.
Se deben de realizar, pero esto es a gusto de quien las hace, líneas de fonoo
en la gráfica; ellas facilitan la lectura de los valores.
No recargar las barras tratando de expresar demasiados productos en ellas.
Confiar en nuestra buena apreciación visual y buen sentido. Veamos el siguiente
Ejemplo. Las horas dejadas de trabajar en un mes, por los empleados
'
MARTINEZ. 8., estadística comercial. E. Norma. Bogora. | 98 l. pág 42.
-'t -J
de
un
laboratorio de investigación animal
Número de horas dejadas de trabajar
I
7
o
5
2
1
0
1.2.7.2. Diagrama Circulares
Estos gráficos o diagramas circulares o diagramas de pastel, son muy utilizados
para representaciones gráficas de distribuciones porcentuales se forma un gráf¡co
circular cuando se individualiza con una marca la porción de pastel que conesponde
cada característica que se quiere visualizar
Para determinar el tamaño de cada sector necesitamos cono@r el ángulo cental de
cada uno de ellos, dicho ángulo se puede calcular así;
El ángulo central de 360' equivale a un sedor del 100%, es decir
34
Ansuto
central-
boo'hoo /'*) = (¡oo
Ir,)
100%
Es decir multiplicamos la frecuencia relativa por 360.
Ejemplo. Las horas dejadas de trabajar en un mes, por los empleados
de
un
laboratorio de investigación animal
10o/o
5o/o
14o/o
1.2.7.3. Histogramas
son una forma de representación gráfica de las frecuencias de clase, y consiste
en representar las frecuencias por medio de áreas de rectángulo (banas). Los
histogramas son diferentes de los diagramas de barras; en un diagrama de barras,
las alturas de éstas miden el tamaño de la variable y usualmente se grafican
35
separadas, es decir, dejando espacios entre
sí.
En un histograma, las frecuencias
quedan representadas por el área de sus rectángulos mas no por sus alturas y las
barras necesar¡amente se dibujan sin dejar espacios entre ellas.
El concepto de densidad de frecuencia es un concepto relativo, puesto que
relaciona el volumen de un cuerpo con su masa. En Estadística un concepto
similar es la densidad de frecuencia, que para este caso se relaciona con las
banas del histograma, de modo que multiplicando el área por la densidad de
frecuencia se obtiene la frecuencia absoluta o número de casos que caen dentro
del intervalo de clase.
El eje vertical en los histogramas mide la densidad de frecuencia y el eje horizontal
es la linea del intervalo de clase. Por ejemplo, en la
corresponde
a
intervalos de clase de diferente anchura,
el
corresponde al intervalo 11-12 v el dos al intervalo 12-16.
6
5
Área rectángulo I = (1) (5) = 5
4
Área rectángulo ll = (4) (2) = 8
3
2
1
36
siguiente figura
rectángulo uno
nil
El
rectángulo uno representa
5
unidades de frecuencia
y el rectángulo dos
representa 8 unidades de frecuencia. Observe que si la base del rectángulo es la
unidad, entonces su altura corresponde a la frecuencia. En muchos histogramas,
cuando los intervalos de clase tienen la misma anchura, es común escoger como
unidad de base de los rectángulos la misma anchura del intervalo y eso nos lleva a
que las alturas de las barras midan la frecuencia. Se aconseja manejar muy bien
este concepto y tratar siempre la frecuencia como expresión del área de los
rectángulos.
Con el fin de dar generalidad a la impresión visual que brinda un histograma, los
estadísticos recomiendan, para la elección de la longitud de los ejes, utilizar la
regla de los tres cuartos, que no es otra cosa que el eje vertical debe ser los tres
cuartos de la longitud del eje horizontal. El eje de las abscisas se escoge de
acuerdo con las condiciones del problema y luego se fija el eje vertical en los tres
cuartos de la longitud del eje horizontal.
POLIGONOS DE FRECUENCIA
Un polígono de frecuencia se obtiene uniendo con segmentos de recta
los
efremos de las ordenadas (altura de los rectángulos) correspond ientes a marcas
de clases vecinas. Hay que tener cuidado que cuando los intervalos de clase son
del mismo ancho, el área bajo la poligonal equivale a la suma de las áreas de los
rectángulos que la
)t
definen. La poligonal culmina con el eje X añadiendo un
intervalo de clase antes del inicio y otro a continuación del último; así se obtuvo en
la
figura poligonal ABCDEF.
En la anterior figura, preste especial atención a las parejas de triángulos con
líneas horizontales
y
verticales, ya que son iguales entre sí, es dec¡r, uno de ellos
quita área al rectángulo y el otro le añade, obteniendo de este modo que el área
bajo la poligonal es igual o equivalente a la suma de las áreas de los rectángulos
del histograma. En caso de que los intervalos de clase no sean iguales, entonces
el área bajo la poligonal es muy aproximada a la suma de las áreas de
los
rectángulos; entre más reducido sea el ancho de los intervalos de clase, es más
aproximado este cálculo.
1.2.7.5 Oj¡vas
Las ojivas resultan al mostrar la información de una distribución de frecuencia
acumulada mayor que o menor que.
38
Veamos un ejemplo con la siguiente tabla:
Edades
Número de
Menor que 49.5
0
Menor que 52.5
Menor que 55.5
¿ó
Menor que 58.5
65
Menor que 61.5
92
100
Un gráfico que recoja las frecuencias acumuladas, por debajo de cualquiera de
las fronteras de clase superiores respecto de dicha frontera, se llama un polígono
de frecuencias acumuladas u ojiva, y se ilustra
39
A
ciertos efectos, es deseable considerar una distribución de frecuencias
acumuladas de todos los valores mayores
o iguales que la frontera de
clase
inferior de cada intervalo de clase. Como eso hace considerar edades de 4g.5
años
o mas, de 52.5 años o más. Etc, se le suele llamar una distribución
acumulada
o
"más", mientras que la antes considerada es una distribución
acumulada "menor que". Es fácil deducir una de otra. Las correspondientes ojivas
se conocen con los mismos aoodos.
Actividad 1.2
1. Teniendo en cuenta los datos
de la actividad
1.1 realiza un histograma,
polígono de frecuencia.
2.
Realiza Un gráfico que recoja las frecuencias acumuladas(ojivas) de las
emisiones de oxido de azufre que se encuentra en la página 29
40
un
Resumen
La Estadística es la encargada
otganizar, resumir
y
de estudiar
los métodos cientÍficos para recoger,
analizar datos, así como para sacar conclusiones válidas y
tomar decisiones razonables basadas en tal análisis; la parte de la Estadística que
se ocupa
de
describir y analizar un grupo dado, sin sacar conclusiones sobre un
grupo mayor se denomina Estadística Descriptiva; la EstadÍstica Inductiva es ¡a
parte de la Estadística que se ocupa de inferir importantes conclusiones sobre la
población a partir del análisis de la muestra.
Existen 4 tipos de datos los cuales
son:
nominales, ordinales, de intervalos y de razón. Las
variables se pueden clasificar en q¡anühtivas y cualibtivas, las primeras se clasifican en
discretas y continuas, las segundas en binomial y multinomial
Las distribuciones de frecuencia se refieren
a la manera como se organizan,
agrupan y clasifican datos estadísticos de acuerdo con algún método. Una vez se
hallan organizado estos datos, es posible eleg¡r cierto tipo de gráfico para
visualizarlo y tratar de comprenderlos mejor. Algunos tipos de gráficos mas
comunes son las barras, las cuáles nos proporcionan más información y permiten
una apreciación estadística más rigurosa; los gráficos circulares o diagramas de
pastel son mas usados
en
representaciones gráficas
de
distribuciones
porcentuales; los histogramas son una forma de representación gráfica de las
frecuencias de clase, que consiste en representar las frecuencias por medio de
áreas de rectángulos (barras). En tanto que los polígonos de frecuencias se
construyen un¡endo con segmentos de recta los extremos de la ordenadas (altura
de los rectángulos), correspondientes a marcas de clase vecinas.
41
EJERCICIOS
A continuación encontraras un enunciado y cuatro posibilidades de respuesta,
entre las cuales debe escoger sólo una, la que considere correcta.
RESPONDE
SIG
LAS PREGUNTAS DEI AL 5 DE ACUERDO CON LA
UIENTE
INFORMACION:
91
78
85
77
70
,8071
87
65
50
68
84
73
98
72
83798374746769
10't 86 78 92
93 95 93 81
66 71 70 84
79 76 72 84
102
79
57
59
75
82
90
80
83
69
94
97
Los datos anteriores nos muestra las pulsaciones por minutos de los pac¡entes
que llegan a consulta al hospital, se quiere realiza una tabla de frecuencia.
1
.
el rango de los datos anteriores es:
a.
'
50 b.52
c.
60
d.62
2. cual es el número de clases
a.
5
b.
6
c.7
d.8
3. La amplitud de cada clase es:
a.5
42
b.6 c.7
d.8
4. El intervalo de la clase 4 es:
a.64-72 b.72-80 c.80-88
d.88-96
5. el valor de n3 es
a.
10
b.
11
12
c.
d.13
RESPONDE LAS PREGUNTAS 6
y 7 DE ACUERDO CON LA SIcUtENTE
TNFORMACIÓN:
lsaac por cada 10 unidades que vende de un producto gana $2.500.
En la siguiente tabla se muestra la ganancia que obtuvo lsaac
6-
DIA
Ganancia en Deso
Lunes
25.000
Miércoles
17.50
Jueves
27.500
Viernes
22.500
de acuerdo con la información de la tabla la venta del dia viernes fue de:
a. 90
unidades
b. 100 unidades
c.2.525 unidades d. 2500 unidades
7.
Que día vendió 109 unidades del producto
a. 90
c.
43
Lunes
b. Miércoles
viernes d. Domingo
8. La tabla indica los resultados de una encuesta sobre la preferencia sobre los
programas de de televisión. ¿Qué porcentaje de los encuestados prefiere los
programas de suspenso
Programas
Humor
Suspenso
Terror
acción
orama
a.2oo/o b.24o/o c. 36%
44
Numero de personas
50
OU
40
bU
40
d. 42%
LECTU RAS COMPLEMENTARIA
MÉToDos ESTAD¡STIGoS
La materia prima de la estadística consiste en conjuntos de números obtenidos a¡
contar o medir elementos. Al recopilar datos estadísticos se ha de tener especial
cuidado para garantizar que la información sea completa v correcta.
El primer problema para los estadisticos reside en determinar qué información y
en que cantidad se ha de reunir. En realidad, la dificultad al compilar un censo
está en obtener el número de habitantes de forma completa y exacta; de la misma
manera que un físico que quiere contar el número de colisiones por segundo entre
las moléculas de un gas debe empezar determinando con precisión la naturaleza
de los objetos a contar. Los estadísticos se enfrentan a un complejo problema
cuando, por ejemplo, toman una muestra para un sondeo de opinión o una
encuesta electoral. El seleccionar una muestra capaz de representar con exactituo
las preferencias del total de la población no es tarea fácil.
Para establecer una ley física, biológica o social, el estadístico debe comenzar con
un conjunto de datos y modificarlo basándose en la experiencia. por ejemplo, en
los primeros estudios sobre crecimiento de la población, los cambios en el número
de
habitantes
se
predecían calculando
la
diferencia entre el número de
nacimientos y el de fallecimientos en un determinado lapso. Los expertos en
estud¡os de población comprobaron que la tasa de crecimiento depende sólo del
número de nacimientos, sin que el número de defunciones tenga importancia. por
tanto, el futuro crecimiento de la población se empezó a calcular basándose en
45
er
número anual de nacimientos por cada 1.000 habitantes. Sin embargo, pronto se
dieron cuenta que las predicciones obtenidas utilizando este método no daban
resultados correctos. Los estadísticos comprobaron que hay otros factores que
limitan
el
crecimiento
de la
población. Dado que
el
número
de
posibles
nacimientos depende del número de mujeres, y no del total de la población, y dado
que las mujeres sólo tienen hijos durante parte de su vida, el dato más importante
que se ha de utilizar para predecir la población es el número de niños nacidos
vivos por cada 1.000 mujeres en edad de procrear. El valor obtenido utilizando
este dato mejora al combinarlo con el dato del porcentaje de mujeres sin
descendencia. Por tanto, la diferencia entre nacim¡entos y fallecimientos sólo es
útil para indicar el crecimiento de población en un determinado per¡odo de tiempo
del pasado, el número de nacimientos por cada 1.000 habitantes sólo expresa la
tasa de crecimiento en el mismo periodo, y sólo el número de nacimientos por
cada 1.000 mujeres en edad de procrear sirve para predecir el número de
habitantes en el futuro.
Tomado de Biblioteca de Consulta Microsoft @ Encarta
+o
@
2005.
UNIDAD 2
Medidas de tendencia central y dispersión
\¡v¿-
47
PRESENTACION
En la unidad anterior se estudiaron los métodos para organizar los datos mediante
y
gráficas, estas técnicas representan medios visuales de descubrrr
relaciones, modos de comportamiento y tendencia de los datos; por eso en esta
unidad queremos complementar las interpretaciones visuales, con medidas
tablas
numéricas
de
característ¡cas
poseídas por muchas colecciones de
datos
cuantitativos; dichas características incluyen el centro, la dispersión y los puntos
de posición de un conjunto de datos,
48
OBJETIVOS ESPEC!FICOS
1. Interpretar lo relacionado con las medidas de tendencia central
para
comprender su campo de aplicación.
2.
Desarrollar destrezas
y
habilidades para efectuar los cálculos
de
las
medidas de tendencia central.
3. Realizar un análisis
comparativo
de las distintas medidas de
tendencia
central con el ánimo de seleccionar la más útil según las circunstancias.
4.
Desarrollar destrezas para calcular las medidas de dispersión.
5.
Comparar las medidas de dispersión
determ¡nada aplicación.
49
y
seleccionar
la mejor para una
REQUISITOS PARA EL ESTUDIO DE LA UNIDAD
Para el estudio de esta unidad, es necesario tener conocimientos básicos de
Estadística como distr¡buciones de frecuencia, gráficos, y algunos conocimientos
de Matemáticas, como promedio, operaciones con números reales v sumatoria.
50
ATREVETE A OPINAR
Lee con atención y desarrolla los siguientes ejercicios, esto te permitirá evaluar
que tanto manejas y recuerdas sobre los temas que se estud¡aran en esta unidad.
1.
El jefe de comercialización de frigorífico de la Sabana presenta las cantidades
de cabezas de ganado sacrificado por día en la semana anterior, y le pide el
favor de Hallar la media aritmética. El número de animales sacrificados son:
84, 91 , 78, 95, 92, 90.
2.
Las calificaciones sobre un máximo de 100 puntos obtenidas por un grupo de
12 alumnos licenciatura con énfasis en cienc¡as naturales fueron:
En Matemáticas: 60, 40, 70, 30, 80, 40,70,20,30, 40, 50, 60.
Estadística: 40, 60, 80, 40, 50, 60, 50, 70, 60, 50, 40, 40,
Halle: (a) el promedio en Matemáticas (b) el promedio en Estadística (c) el
promedio general en ambas materias.
3.
4.
5l
Calcule: (a) la moda en Matemáticas (b) la mediana en Estadística
Calcule: (a) varianza y desviación estándar en Estadística
DINAMICA PARA CONSTRUIR EL CONOCIMIENTO
ACTIVIDAD PREVIA: (Trabajo independiente)
1.
Lea detenidamente la Unidad.
2.
Responda de manera escrita la sección Atrévete a responder.
3.
Haga un resumen sobre los conceptos básicos de la unidad.
4.
Realice cada una de las actividades propuestas en
el
desarrollo de la
unidad.
5.
Anote las dudas y dificultades presentadas durante la lectura de la unidad y
el desarrollo de las actividades propuestas.
ACTIVIDAD EN GRUPO (CIPAS)
1.
Reunidos en CIPAS, lea nuevamente la Unidad.
2.
Socialicen
los
resúmenes elaborados
de
manera individual
e
independ iente.
3. Socialicen las respuestas de la secc¡ón Atrévete
a
responder, que
desarrollaron de manera individual.
4.
Socialicen las respuestas de las actividades, que respondieron de manera
individual.
5. Desárrollen los ejercicios que se encuentra al final de la Unidad
y
discútanlos en el grupo de estudios.
6.
Estos ejercicioo deben ser socializados en la sesión junto con todos los
compañeros de grupo y entregados al tutor.
7.
)2
Aclare las dudas con el tutor.
2. MEDIDAS
DE TENDENCIA CENTRAL Y DISPERSIÓN
2. 1 MEDIDAS DE TENDENCIA CENTRAL
Existen 3 métodos para delerminar el centro en torno al cual se sitúa los
elementos de un conjunto de datos. Los cuales son media aritmética, mediana y
moda.
2.1.1. Media Aritmética.
Es la medida de tendencia central que más se utiliza, y es conocida como
oromed io
La media aritmética de cierto número de cantidades es la suma de sus valores
dividido dicho número. Designado por:
N = número de observaciones
X=
valor de cada observación
7=
media aritmética, media, o simplemente, X barra
Setiene:
53
X=
\'_LX'
¡=¡
N
Ejemplo
El valor promedio o media aritmética de 450, 460, 470, 470, 480, 480,.
v-
450+460+470+480+480
= 468.33
2.1,2, Media en una Distribución de Frecuencias Agrupada.
En aritmética, el concepto de media aritmética ponderada se aplica para calcular
el valor promedio de cantidades a cada una de las cuales está asociado
un
número o peso que la pondera. Así, por ejemplo, si un comerciante compra tres
partidas de un cereal a $8.60, $7.50y $8.30 el kilogramo, para calcular el precio
promedio por kilogramo es necesario conocer el peso de cada partida; si estos
pesos son 230, 800 y '140 kilogramos respect¡vamente, entonces:
Precio promedio por kitogramo-
8'60(230)1]'59(8-00) +-8'30(1a0)
230+800+140
- t.tt
En general si Xr, Xz, ...Xn son las cantidades y mt, ñtz, ...mn las respectivas
ponderaciones, entonces la media ponderada X es:
X_
La
mrX, + mrX, + ...,+ m,X,
mt+m2+...+mll
Tr-
Y
Lm,
media aritmética ponderada de un conjunto de cantidades Xr, X2,...,
Xn
ponderadas por los pesos rnr, ñ12,..., mn, queda expresada por el cociente entre la
54
suma de los productos de las cantidades por sus respectivas ponderaciones y la
suma de las ponderaciones.
Ejemplo.
En el examen de admisión a una universidad un aspirante obtuyo las siguientes
calificaciones: Matemáticas, 7; Redacción, 6.5; Física, 7.6; ldiombs, 8.4; hallar el
promed¡o
si las ponderaciones son: Matemáticas, 5; Redacción, 3; Física, 4;
e
ldiomas, 2.
-
7(s) + 6.s(3) + 7.6(4) + 8.4Q)
5+3+4+2
En una distribución de frecuencias agrupadas, todos los valores que caen dentro
de un intervalo de clase se consideran de un mismo valor igual a la marca de
clase; entonces las frecuencias son las ponderaciones de los valores que
con las marcas de clase. Es decir, en una distribución oe
agrupadas, las ponderaciones son las frecuencias y las marcas de
corresponden
frecuencias
clase son los valores que se ponderan.
Zx n,
Así i=-
s
N
En el siguiente ejemplo, se muestra la forma de operar con frecuencias agrupadas
para el cálculo de la media.
' SPIEGEL, Murria. Estadística. Editorial McGraw Hill. México 1984. pag.47
))
Ejemplo
Toneladas de oxido de azufre
I
6.219.01 - 11.8
11.81 14.6
14.6 1- 17.4
17.4 1-20.2
20.21 -23
23 01- 25.8
25.81 -28.6
-
Marca
Frecuencia
X¡
ñ¡
7.6
10.4
tJ.¿
16
18.8
21.6
24.4
4
1
8
10
19
13
I
¿t.¿
10
80
I
ni Xi
30.4
72.8
r 05.6
160
357.2
280.8
219.6
272
1498.3
4qR '¡
=
" *
=18'729
Es decir: La planta industrial producen en promedio 18.729 toneladas d¡arias de
oxido de azufre
Al calcular la media aritmética con frecuencias agrupadas, su valor se aprox¡mará
bastante al valor obtenido con datos no clas¡ficados. El valor de la media no será
suficientemente aproximado si la distribución de frecuencias agrupadas es muy
irregular, demasiado asimétrica
o
presenta imperfecciones. En general, la
a la media obtenida con frecuencias agrupadas es suficiente para
trabajos estadíst¡cos. En los ejercicios que se proponen, usted advertirá estas
aproximaciones de la media aritmética. Al entregar la información con datos
aproximación
agrupados, se pierde parte de la información primaria y no queda otro recurso que
trabajar con marcas de clases en lugar de los datos or¡g¡nales.
2.1.3. Mediana.
Se define como el valor que divide una distribución de datos ordenados en dos
mitades, o sea aquel que deja por arriba igual número de términos que por debajo
de é1. En otras palabras, la mediana es el valor del término del medio
56
Para el cálculo de la media aritmética no interesa oue los valores estén
o
no
ordenados; en cambio la mediana impiica que el conjunto sea un conjunto de
valores ordenados de menor
a mayor. El concepto de término del medio
es
correcto si se tiene un número impar de términos ordenados; así, por ejemplo, si
tenemos los siguientes datos 10, 12, 18, 19 y 21; 18 es el valor del medio, o sea la
med¡ana, puesto que deja dos valores por debajo y dos valores por enc¡ma. Pero
si se tiene un número par de términos entonces no hay término del medio, en
estos casos la mediana es el valor equ¡distante de los dos valores centrales y no
coinciden con ninguno de los términos; así, por ejemplo, en la serie de valores 10,
$12, 18, 19,21 y 22. Hay dos valores centrales que son 18
y
19, el valor
equidistante entre ellos es la media aritmética de ellos, o sea,
18+19 =
18.5
2
y en este caso la mediana es 18.5 y satisface su definición puesto que hay tres
valores por debajo de 18.5 y tres valores por enc¡ma.
2.1.4 Mediana para datos agrupados.
La mediana para datos agrupados6 se calcula mediante la siguiente formula:
(n
)
l;-N,- lA
: m=L+l
'
lll¡
n
2
6
:
|
donde:
I
es la mitad de la muestra.
SPIEGEL, Murria. Estadfstica. Editorial Mccraw Hill. México 1984 Pá9. 47
57
1y'_,: Frecuencia absoluta acumulada anterior a la clase donde se encuentra la
med¡ana
n
: Frecuencia absoluta de la clase media
A: amplitud de la clase mediana
Ejemplo:
Para la ilustración de las toneladas de oxido producidos por una planta industrial,
la mediana se calcula de la siguiente manera:
Tonefadas de oxido de azufre
6.219.01 - 11.8
11.81 - 14.6
14.6 1- 17.4
17.4 1-20.2
20.21 -23
23 01-25.8
25.81 -28.6
I
r
n
Ni
4
7
4
R
'10
19
13
I
10
80
11
19
29
48
ol
70
80
Como se tienen 80 observaciones el dato que ocupa la posición del centro es 40 y
41, esta observación se encuentra ubica en la quinta clase de la distribución;
puesto que hasta aquí hay 48 observaciones, como se puede ver en la tabla
anterior luego se tiene:
:rR0
= ::
22
=y',Q
N,-' =ly'r-' =No=29
rl,= /l,r=19
A2.8
L=17.4
58
Remplazando en la
formula
m = 17.5 + f
qq:?2
| 19
lz.8 = 1 5.78tonetadas.
)
Es decir: el 50% de los día la planta industrial produce 15.78 toneladas diarias de
oxido de azufre
o menos y el otro 50%
de los días
se produce más de15.78
toneladas diarias de oxido de azufre.
2.1.5. La moda
En una distribución de frecuencias, la moda es el valor que ocurre con mayor
frecuencia. Así, por ejemplo, en la serie de valores: 1,3,5,5,7,7,9,9,9,10,I1, el
número 9 es la moda por ser el valor que tiene mayor frecuencia. La moda se
puede considerar como
el valor más
representativo
o típico de una serie de
valores. en el sentido de oue ocurre más comúnmente.
2.1.6. Moda para datos agrupados
En el caso d datos agrupados, la clase que contenga la moda es la clase modal y
la que posee una densidad de frecuencia más alta. Considere los datos de
producción de oxido de azufre producido por cierta fabrica.
Toneladas de oxido de azufre
6.219.01 - 11.8
I
't|
-
81 14.6
14.6 1- 17.4
17.4 1- 20.2
20.21
59
n
4
7
8
10
-23
13
23 01-25.8
I
25.81
-28.6
10
I
BO
X¡
7.6
10.4
13,2
to
18.8
21.6
24.4
27.2
Ni
4
11
lo
29
48
61
70
80
la
La clase modal es la quinta, en este caso seria 18.8 toneladas.
Otra forma es utilizando la formulaT:
ft'l
|/^tI
M,,= L *l-:r;lA
donde:
lClt+Clt)
L =limite inferior de la clase modal.
y la frecuencia
inmediatamente
6lr: Es la diferencia entre la frecuencia modal y la frecuencia
inmediatamente
61,: Es la diferencia entre la frecuencia modal
anter¡or
poster¡or
l:Amplitud
Para muestra ilustración
L'.=17.4
¿1,:= 19 - 10 = 9
61,:=19 -13=6
A:2.8
tsl
M,,=17 .4 *lLv*+ ol12.8 = 1e.08
Esto quiere decir que la mayoría de los días la fabricas produ¡o 19.08 tonelada de
oxido de azufre.
Actividad 2.1
Teniendo en cuenta los datos de la actividad 1.1. Calcula
e interpreta: Media
aritmética, med¡ana y moda.
'SPIEGEL, Murria. Estadística. Editorial McGraw Hill. México 1984. pag. 48
60
2.2 MEDIDAS DE DISPERSIÓN
En los temas anteriores se estudiaron las medidas de tendencia central, las cuáles
describen el comportamiento de los datos en una distribución de frecuencia. Pero
las informaciones y datos que arrojan esa clase de medidas son un poco limitadas
y no nos dicen
mucho acerca de la forma en
Qg-,q
los datos se encuentran
dispersos o diseminados con relación a la tendencia central. Por otro lado, nos
dicen muy poco sobre la relación de un dato respecto a otro u otros de la
distribución.
Para una correcta interpretación de cierto tipo de datos, es necesario conocer
información que nos permita conocer la dispersión de los valores alrededor de la
medida de tendencia central.
2.2.1. Desviación Media
La desviación medias es la media aritmética de los valores absolutos de las
desviaciones de las variables resDecto a la media aritmética"
Es decr'. DM =
Llx¡- xl
La desviación media es una medida de la dispersión bastante objetiva: cuanto
mayor sea su valor, mayor es la dispersión de los datos; sin embargo, no
proporciona una relación matemática precisa entre su magnitud y la posición de un
dato dentro de la d¡str¡bución. Por otra parte, al tomar los valores absolutos mide la
" SPIEGEL, Murr¡a. Estadistica. Editorial
61
Mccraw Hill. México 1984. Pá9. 49
desviación de una observación sin mostrar si está por encima o por debajo de la
media aritmética.
Ejemplo
Hallar la desviación media de los siguientes valores: 10, 8, 6, 4,9,11.
L^
a- \'-
_
l0+8+6+4+9+11
N6
Ilx-71
_ lto - sl+
DM =
=)--------)
ls
-
sl+ le - sl+
l¿
=8
- sl+ lg-sl+lt r -
sl
_,.,
8
Ejemplo
Considere los datos de la producción de oxido de azufre producido por cierta
fabrica.. Hallar la desviación media
Toneladas Oxido de
azufre
6.2-9
9.01-11.8
11.81-14.6
14.61-17.4
17.41-20.2
20.21-23
23.01-25
52.81-28.6
'
xl
D* =>"1+-
X,
n,
7.6
10.4
't3.2
16
18.8
21.6
24.4
27.2
4
7
ó
10
19
13
I
10
80
'\,n, lX,-Xl nx-x
l-ll_,-
30.4
72.8
105.6
160
357.2
280.8
219.6
272
1498.3
11.129
8.329
5.529
2.729
0.0
2.871
5.671
44.516
58.303
44.232
27.29
0.0
37.323
51.039
8.471
84.71
235.4',t3
Dm
?'15 4t 1
=
ff=2e42
El valor 2.942la dispersión de los datos en torno a la media aritmética.
2,2.2Ya¡ianza
Para calcular la desviación media, fue necesario prescindir de los signos negativos
tomando los valores absolutos de las desviaciones respecto a la media aritmética.
Si elevamos al cuadrado las desviaciones, logramos con esta operación que todas
las desviaciones den resultados positivos, sumando los cuadrados de
las
desviaciones y dividiendo por N se obtiene el estadístico llamado vaianza que
sirve de base para calcular la desviación estándar que es la más importante de
todas las med¡das de dispersión que vamos a estudiar.
La varianza es la media aritmética de los cuadrados de las desviaciones respecto
a la media aritmética.
Para datos no agrupados
_ ) lx-xf
Cr-¿-¿\
N
s-
l.-
Ln,\x - x-\2)
Veamos los siguientes ejemplos de aplicación:
a
".:#
OJ
Ejemplo
La siguiente serie de datos representa el número de horas empleadas en
la
realización del presupuesto de educación por diferentes secretarios de 6 alcaldías
diferentes; 10, 5, 15,12, 3, 9. Hallar la varianza.
l0 + 5 + 15 + 12 + 3 + 9
t)
Aplicando la fórmula Para datos no agrupados
S'? =
-o
L\X -XT
N
Tenemos:
c2 (10-e)'+(s-e)'+(t s-of +(tz-e)' +(r-e)'+(o-o)'
1¿11
6
Nota.
Para hallar la varianza se debe de trabaiar en valores absolutos.
Veamos otro ejemplo utilizando la distribución de frecuencias agrupadas del
ejemplo anterior, agregando las columnas necesarias para el cálculo de la
vananza.
Ejemplo Considere los datos de la producción de oxido de azufre producido por
cierta fabrica.. Hallar la vatianza
64
'rq
Toneladas Oxido de
azufre
6.2-9
X,
7.6
10.4
13.2
16
18.8
21.6
24.4
27.2
9.0'1-11.8
11.8't-14.6
14.61-17.4
17.41-20.2
20.21-23
23.01-25
52.81-28.6
n,
4
x,n,
30.4
72.8
105.6
¡l
10
19
IJ
160
357.2
280.8
219.6
272
1498.3
I
10
80
_t
|
I
n,lX,-X
lY
- vl nlX-Xl
t--'-^l
11.129
8.329
5.529
2.729
0.0
2.871
5.671
8.471
44.516
58.303
44.232
27.29
0
37.323
51.039
84.71
2.959
495.418
485.605
244.558
74.474
0
107.154
182.380
717.578
23071.16
2
z 23071.16
J=
so
.t'=
288.389
A
pesar de su imporbncia y de la utilidad de la varianza esta presenh dos grandes
problemas
1.
Es un número bashnb grande en relación con las propias observacirnes, por su enorme
tamaño, casi s¡empre resulh dificil habajar con ella.
2. otra
es que los resultados vienen dados en
por lo que no tendría ningún sentido su
desventaja, más grave aún,
unidades elevadas
al
cuadrado,
interpretación.
Estos dos problemas se pueden obviar si se trabaja con la desviación típica.
Desviación Tipica o Estándar
La desviación típica es
():)
la raíz cuadrada de la varianz". S
=.F
Ejemplo. Para las horas empleadas
en la realización del
presupuesto de
educación por diferentes secretarios de 6 alcaldías diferentes; 10, 5, 15,12, 3, 9.
Se tiene que la varianza es
S'?
ra
lii
rf
=16.33 Luego la desviación tlpica.
s =Js'=
,
=[633=4.94.
Se puede decir que las horas empleadas media de g con tendencia a variar 4.04.
por encima y por debajo.
Ejemplo Para la producción de oxido de azufre producido por cierta fabrica.
Se tiene que:
s'=
288.389 Luego:
t)
s =Js-= s
={288.99= 16.98
Es decir la producción diaria de oxido de azufre puede variar 16.g8 toneladas por
encima y por debajo
Actividad 2.2.
Teniendo en cuenta los datos de
desviación estandar
66
,.j'
la ac{ividad 1 .1 . Calcula e
interpreta: la
Resumen
Las medidás de tendencia central son utilizadas, para describir y establecer
comparaciones cuantitativas entre distribuciones de frecuencia.
La Media Aritmética es la medida de tendencia central más utilizada su cálculo se
efectúa de acuerdo a las siguientes situaciones:
i'
La media aritmét¡ca de cierto número de cantidades es: :
la media ponderada
mt + m2 + ...+ mn
La media para datos agrupados: X =
X='='
N
uvn
LX,n,
La Mediana se define como el valor
oue divide una distribución
ordenados en dos mitades
La mediana para datos agrupados
:m=L+
;-N,
n,
)
I
l/7
l
-
La Moda es el valor que ocurre con mayor frecuencia
67
de
datos
La moda para datos agrupados:
M,,=
L *l
, l¿
,d.'
lOtt
Clz)
Las medidas de dispersión son medidas que se utilizan para conocer la dispersión
de los valores alrededor de la medida de tendencia central.
La Desviación Media es una medida
de
dispersión bastante objetiva y se define
como la Media Aritmética de los valores absolutos de las desviaciones de las
variables respecto a la Media Aritmética"
O* -Znl4-i
I
La varianza es la Media Aritmética de los cuadrados de las desviaciones respecto
a la Media Aritmética.
Para datos no agrupados .s' =
Para datos
agrupados
I(":
N
"-L
,' =Ln'VN - xl
La Desviación Típica se define como la raiz cuadrada de la Varianza
68
EJERCICIOS
A continuación encontraras un enunciado y cuatro posibilidades de
respuesta,
entre las cuales debe escoger sólo una, la que considere correcta.
RESPONDE LAS PREGUNTAS Det
SIG U I E NTE INFORMACIÓN:
80
87
65
50
68
Los
71
84
73
98
72
91
78
85
77
70
83
101
93
66
79
79
86
95
71
76
1 AL S DE ACUERDO CON LA
83
78
93
70
72
1. La media aritmética de los dados es:
a.59 b.69 c.79
d.89
2. La mediana de los dados es:
a.78 b.68 c.58
d.98
3. La moda de los datos es
a.7O.3 b.60.3 c.70.3
d.80.3
4. La varianza de los datos es:
69
74
102
79
57
59
67
75
82
90
80
69
83
69
94
s7
datos anteriores nos muestran las pulsaciones por minutos de los pacientes
que llegan a consulta al hospital
a.
74
92
81
84
84
54.83
b.
64.83 c.74.83
d.84.53
5. La desviación estándar se define como
a. la potencia de la
varianza
c. el exponencial de la
varianza
b. el logaritmo de varianza
d. la raiz cuadrada de la varianza.
LAS PREGUNTAS 6 Y 7 SE CONTESTAN CON BASE EN LA SIGUIENTE
INFORMACION.
Durante cinco horas, en una estación de gasolina son tanqueados 60 automóviles
de diferentes clases (camionetas, camperos, camiones, tractomulas). La siguiente
muestra la capacidad de los tanques de gasolina y el numero de automóviles
tanoueados.
Capacidad de los tanques de
.
Numero de automóviles
gasolina (galones)
tanqueados
12-18
20
19-25
44,
26-32
12
JJ-óV
10
40-46
5
6. La frecuencia relativa de cada uno de los datos de la muestra reoresenta:
a. El numero de automóviles tanqueados por hora y su capacidad de tanqueo
b. El numero de automóviles tanqueados respecto al total de automóviles
tanoueados
c.
La capacidad promedio de automóviles tanqueados respecto al total de
automóviles tanqueados
d.
El promedio de automóviles tanqueados durante las cinco horas y su
capacidad de tanqueo
70
7.
Para terminar que el 50% de los automóviles de la muestra tienen
capacidad para 22 galones de gasolina o menos, se necesita conocer:
a.
b.
La marca de clase del intervalo con mayor frecuencia absoluta
c.
El intervalo, que incluye la capacidad de tanqueo que supera a no mas de
El total de automóviles tanqueados y la capacidad promedio de los tanques
la mitad de los carros tanoueados
d.
La capacidad de los tanques, que incluye la mitad de carros tanqueados
durante las primeras dos horas
8. Las calificaciones obtenidas sobre 100 puntos por 16 aspirantes a ocupar
vacantes en el ministerio de educación fueron:
Calificación
302
40
50
60
70
80
90
Número de
¿
z
4
3
,|
z
Halle: (a) med¡a (b) mediana (c) moda (d) la desviación media (e) var¡anza.
7l
¡i.i
ñ
LECTU RAS COMPLEMENTARIAS
EL ENGAÑOSOg TÉRMINO MEDIO
Productos Artilugio (PRODILUGIO S.A) tiene
una pequeña fabrica de
superart¡lugios.
La dirección de la empresa esta a cargo del señor artilugio, su hermano y cinco
parientes.
la
fuerza laboral consiste en cinco encargos y diez operarios. Los
negocios van bien, y la fabrica precisa un operario más.
El señor artilugio esta entrevistando a Félix al puesto.
Señor Artilugio: Aquí muy bien. El salario medio es de 60.000 pesos semanales.
Durante el periodo de formación solo cobrara usted 15.000, pero pronto le
subiremos el sueldo.
Al cabo de unos cuantos días Félix quiso ver al jefe.
Félix: ¡Me ha engañado usted! He hablado con los otros operarios y ninguno gana
más de 20.000 pesos a la semana. ¿Cómo puede ser de 60.000 pesos el salario
medio?
Señor Artilugio: vamos, Félix, no se excite. El salario medio es 60.000 pesos Se
lo voy a demostrar.
'
CARDNER,Martln. Paradojas. Labor, s.a. Barcelona,4a edición 1989
72
Señor Artilugio: He aquí la nómina semanal. Yo gano 480.000; mi hermano,
200.000; mis seis parientes sacan 50.000 cada uno; los cinco capataces, 40.000, y
los diez operarios 20.000 cada uno. El total semanal es de 1'380.000 oara 23
Personas. ¿Me equivoco?
Félix: ¡vale, vale! Tiene usted razón. El promedio es de 60 billetes a la semana.
Pero. aun así. usted me ha enoañado.
Señor Artilugio: No estoy de acuerdo. Lo que pasa es que usted
no
ha
comprendido nada. Pude haber ido diciéndole los salarios por orden; el salario
med¡o seria entonces 40.000 pesos. Pero no es la media sino la mediana.
Féfix: ¿Y que pinta aquí los 20.000?
Señor Artilugio: Eso se llama moda. Es
el
salario ganado por máximo número
oe personas.
Señor Artilugio: Muchacho, lo malo de usted es que no distingue entre media,
mediana y moda.
Félix: Bueno, ahora ya se la diferencia. Y... ¡me despidol
Los enunciados estadísticos pueden ser en extremo paradójicos, y en ocasiones,
directamente engañoso. La historia de la fábrica de artilugio hace ver una fuente
de confusiones frecuentes entre media. mediana v moda.
La palabra media es por lo común abreviatura de media aritmética. Es una medida
estadistica muy valiosa. No obstante, cuando hay valores extremos muy dispares,
como su cede con los elevados salar¡os de los dueños y personal administrativo
de la fabrica, el salario medio puede crear una impresión falsa.
Es muy fácil encontrar situaciones parecidas donde la media induce a error. Un
periódico, por ejemplo, informa que una persona sea ahogado en un río cuya
profundidad
es de solo 50 cm. ¿Podemos sorprendernos? No, cuando
nos
enteramos de que la desgracia se produjo en uno de los pocos sitios donde la
profundidad pasa de tres metros.
Las informaciones sobre estadísticas resultan aún más desconcertantes a causa
de que termino medio, se aplica en ocasiones no a la media aritmética, s¡ no a la
med¡ana o la moda. La mediana es el valor que ocupa la posición centrar en una
lista de valores ordenados de menor a mayor. Cuando el numero de términos de la
lista es impar, la mediana es sencillamente el termino centrar. Cuando la lista
consta de número par de términos es costumbre tomar para la mediana la media
aritmética de los dos valores situados en el centro.
A Félix la mediana le da información más útil que la media aritmética, pero incluso
la mediana le da una imagen desformada de los salarios de su empresa. Lo que
realmente le convenÍa saber es la moda, el valor de más frecuente aparición de ta
lista. En este caso, la moda es el salario que las personas perciben. Frases como
un caso típico suelen aludir a la moda, ultimo ejemplo una familia típica de la
ciudad -que presente la moda de ingresos- puede ser muy pobre, aun cuando la
renta media, debía a un reducido numero de gente muy rica, sea muy alta.
74
UNIDAD 3
PROBABILIDAD
!:
75
PRESENTACION
La Teoría de la Probabilidad se rémonta a comienzos del siglo XVll, debido a
estudios e investigaciones empíricas acerca de los juegos de azar de la época, y
que hoy en día aun están vigentes.
o'
.f
Desde entonces, muchos ¡nvestigadores y matemáticos, como también científicos
de importancia reconocida, contribuyeron a que se desarrollara y se perfeccionara
paralelamente con
la Estadística, llegando a ser un complemento y una
parte
importante de esta rama de la ciencia.
A pesar de haberse comenzado a investigar tanto t¡empo atrás, sus desarrollos
más relevantes y su fundamentación matemática sólo se consolidó durante los
años treintas y cuarentas del siglo X X a partir de esta etapa, se le denominó
Teoría Moderna de la Probabilidad, en la que se precisaron conceptos de gran
importancia y se colocó sobre una firme base matemática.
La siguiente unidad se presta fácilmente para estudiar por cuenta propia y
presenta temas de gran relevancia, los cuáles son fundamentales para
introducirnos al mundo de la probabilidad; y únicamente exige un conocimiento
previo de Álgebra de secundaria.
76
OBJETIVOS ESPEGIFICOS
1
.
ldentificar algunos conceptos básicos
de Probabilidad, como eventos
y
espacio muestral.
2.
Conocer cuándo una distribución de Probabilidad es discreta v cuándo es
cont¡nua.
3.
77
Adquirir el conocimiento necesario para realizar análisis combinatorio.
{
tL
REQUISITOS PREVIOS
Debido a que básicamente se desarrollarán temas que introducen al mundo de la
Probabilidad, lo único que se requiere es un conocimiento previo de Álgebra
\..
78
ATREVETE A OPINAR
Lee con atención y desarrolla los siguientes ejercicios, esto te perm¡tirá evaluar
que tanto manejas y recuerdas sobre los temas que se estudiaran en esta unidad.
1. Se lanza dos veces un par de dados.
¿Cuál es la probabilidad de obtener
totales de sieté y once?
2.
dos veces mayor que la cruz. Si se lanza tres veces la moneda, ¿cuál es la
probabilidad de obtener dos cruces y una cara?
F
79
Se carga una moneda de modo que la cara tenga una posibilidad de ocurrir
3.
El número de permutaciones de las letras de la palabra "Dios" es:
4.
El número de combinaciones que se pueden dar de las letras a, b d , c
DINAMICA PARA CONSTRUIR EL CONOCIMIENTO
ACTIVIDAD PREVIA: (Trabajo independiente)
l.
Lea detenidamente la Unidad.
2. Responda de manera escrita la sección Atrévete a responder.
3. Haga un resumen sobre los conceptos básicos de la unidad.
4. Anote las dudas y dificultades presentadas durante la lectura de la
un¡dad y el desarrollo de las actividades propuestas.
5.
Realice un juego creativo teniendo en cuenta los conceptos leídos
ACTTVTDAD EN GRUPO (CTPAS)
l.
Reunidos en CIPAS, lea nuevamente la Unidad.
2. Socialicen los resúmenes elaborados de manera individual
e
indeoendiente.
3. Socialicen las respuestas de la sección Atrévete a responder,
que
desarrollaron de manera individual.
4. Socialicen
y
participe
en cada uno de juegos creados por
sus
compañeros.
5.
Desarrollen los ejercicios que se encuentra
al final de la Unidad y
discútanlos en el grupo de estudios.
6.
Estos ejercicios deben ser socializados en la sesión junto con todos los
compañeros de grupo y entregados al tutor.
7.
80
Aclare las dudas con el tutor.
3. TEORIA DE LA PROBABILIDAD
3.I
ESPACIO MUESTRAL
En el estudio de la Estadística tratamos básicamente con la presentación e
interpretación de resultados fortuitos que ocurren en un estudio planeado o
investigación c¡entífica. Por ejemplo, podemos registrar el número de accidentes
que ocurren mensualmente en la intersección del Monumento a las Vacas en la
ciudad de Sincelejo, con el deseo de justificar la instalación de un semáforo;
podemos clasificar los artículos que salen de una linea de montaje como
"defectuosos" o "no defectuosos"; o nos podemos ¡nteresar en el volumen de gas
que se libera en una reacción química cuando se hace variar la concentración de
un ácido. Por ello, el estadístico a menudo trata con datos
conteos
o mediciones
representativos,
experimentales,
o quizá con datos categóricos que se
pueden clasificar de acuerdo con algún criterio.
Nos referiremos a cualquier registro de información, ya sea numérico o categór¡co,
como una observación. Así, los números 2,0, 1 y 2, que representan el número de
accidentes que ocurrieron en cada mes de enero a abril durante el año pasado en
la intersección Monumento a las Vacas en la ciudad de Sincelejo, constituyen un
conjunto de observaciones. De forma similar, los datos categóricos N' D' N' N y
D, que representan los artículos defectuosos
o no defectuosos
cuando se
inspeccionan cinco artículos, se reg¡stran como observaciones.
Los estadísticos utilizan la palabra experimento para describir cualquier proceso
que genere un conjunto de datos. un ejemplo simple de experimento estadístico
81
es el lanzamiento al aire de una moneda. En este experimento sólo hay dos
resultados posibles: cara o cruz. Otro experimento puede ser el lanzamiento de un
misil y la observación de su velocidad en t¡empos específicos. Las opin¡ones de
los votantes con respecto aun nuevo impuesto sobre ventas también se pueden
de un experimento. Estamos particularmente
interesados en las observaciones que se obtienen por la repetición del
experimento varias veces. En la mayor parte de los casos, los resultados
dependerán del azar y, por tanto, no se pueden predec¡r con certeza. Si un
considerar como observaciones
químico realiza un análisis varias veces bajo las mismas condiciones, obtendrá
diferentes medidas, que indican un elemento de probabilidad en el procedimiento
experimental. Incluso, cuando se lanza al aire una moneda de forma repetida, no
podemos tener la certeza de que un lanzamiento dado tendrá como resultado una
cara. Sin embargo, conocemos el conjunto completo de posibilidades para cada
lanzamiento.
El conjunto de todos los resultados posibles de un experimento estadístico se
llama espacio muestrallo y se representa con el símbolo S.
Cada resultado en un espacio muestral se llama elemento o miembro del espac¡o
muestral, o simplemente punto muestral. Si el espacio muestral tiene un número
finito de elementos, podemos listar los m¡embros separados por comas y
encerrarlos en paréntesis. De esta forma, el espacio muestral S, de los resultados
posibles cuando se lanza al aire una moneda, se puede escribir
g = {H, T},
Donde H y T corresponden a "caras" y "cruces", respectivamente.
Ejemplo 3.1.1 Considere el experimento de lanzar un dado. Si nos interesamos en
el número que muestra en la cara superior, el espacio muestral sería
Sr={1 ,2,3,4,5,6}.
'o KREYSZIG, Edwin. Introducción
82
a la estadistica Matemática. Ed¡torial Limusa 1979. pá9.56.
Si nos interesamos sólo en si el número es par o impar, el espacio muestral es
simplemente
52 = {par, impar}.
El ejemplo ilustra el hecho de que se puede usar más de un espacio muestral para
describir los resultados de un experimento. En este caso, 51 proporciona más
información que 52. Si sabemos cuál elemento en Sr tiene lugar, podemos decir
cuál resultado ocurre en S2; no obstante, el conocimiento de lo que pasa en 52 no
es de ayuda en la determinación de cuál elemento en Sl ocurre. En general, se
desea utilizar un espacio muestral que dé la mayor información acerca de los
resultados del exoerimento.
En algunos experimentos es útil listar los elementos del espacio muestral de forma
sistemática mediante un diagrama de árbol.
el ejemplo
.2. Un experimento cons¡ste en lanzat una moneda y
después lanzarla una segunda vez si sale cara. Si sale cruz en el primer
lanzamiento, entonces se lanza un dado una vez. Para listar los elementos del
Veamos
3.1
espacio muestral que proporcione la mayor información, construimos el d¡agrama
de árbol de la siguiente figura.
Primer
Resultado
Segu ndo
resultado
punto de
La muestra
H
HH
T
HT
1
T1
T2
T3
T4
T5
T6
83
Ahora
bien, las
diversas trayectorias a lo largo de las ramas del árbol dan los
distintos puntos de la muestra. Al comenzar con la rama superior izquierda y
movernos a la derecha a lo largo de la primera trayectoria, obtenemos el punto
muestral HH, que indica la posibilidad de que ocurran caras en dos lanzamientos
sucesivos de la moneda. Asimismo, el punto muestral T3 indica la posibilidad de
que la moneda muestre una cruz seguida por un 3 en el lanzamiento del dado. Al
seguir a lo largo de todas las trayectorias, vemos que el espacio muestral es
5 = {HH, HT, T1, T2, T3, T4, T5, T6}.
3.2 EVENTOS
Para cualquier experimento dado podemos estar interesados en la ocurrencia de
ciertos eventos más que en el resultado de un elemento específico en el espacio
muestral. Por ejemplo, podemos estar ¡nteresados en el evento A en el que el
resultado cuando se lanza un dado sea divisible entre 3. Éste ocunirá si el
resultado es un elemento del subconjunto A = {3,6} del espacio muestral S1 del
ejemplo 3.1 .
Un eventolr es un subconjunto de un espacio muestral.
Ejemplo 3.2.1. Dado el espacio muestral 5 = {t / t > 0}, donde t es la vida en años
de cierto componente electrónico, entonces el evento A de que el componente
falle antes de que finalice el quinto año es el subconjunto tr = {V0< t < 5}.
Es concebible que un evento pueda ser un subconjunto que incluya todo el
espacio muestral S, o un subconjunto de S que se denomina conjunto vacío y se
denota mediante el símboloZ, que no contiene elemento alguno. Por ejemplo, si
"
KREYSZIG, Edw¡n. Introducción a la estadist¡ca Matemática. Editor¡al L¡musa 1979. pá9.57
84
hacemos que A sea el evento de detectar un organismo microscópico a simple
vista en un experimento biológico, entonces A = O. También, sí
g = {r/x es un factor par de 7},
Entonces B debe ser el conjunto vacío, pues los únicos factores posibles de 7 son
los números nones 1 y 7.
un experimento donde se registran los hábitos de fumar de los
empleados de una empresa industrial. Un posible espacio muestral podría
Considere
clasificar a un individuo como no fumador, fumador ligero, fumador moderado o
fumador empedernido. Sea el subconjunto de los fumadores un evento. Entonces
la totalidad de los no fumadores corresponde a un evento diferente, también
subconjunto de S, que se denomina complemento del conjunto de fumadores.
El complemento de un evento A con respecto a S es el subconjunto de todos los
elementos de S que no están en A. Denotamos el complemento de A mediante el
símbolo A'.
Ejemplo. Sea R el evento de que una carta roja se seleccione de una baraja
ordinaria de 52 cartas, y sea S toda la baraja. Entonces R' es el evento de que la
carta seleccionada de la baraja no sea una roja s¡no una negra.
Ejemplo. Considere el espacio muestral
S = {libro, catalizador, ciganillo, precipitado, ingeniero, remache}.
Sea A = {catalizador, remache, libro, cigarrillo}. Entonces
4' = {precipitado, ¡ngen¡ero}.
Consideremos ahora ciertas operaciones con eventos que tendrán como resultado
la formación de nuevos eventos. Estos eventos nuevos serán subconjuntos del
85
mismo espacio muestral como los eventos dados. Suponga que A y B son dos
eventos asociados con un experimento. En otras palabras, A y B son
subconjuntos del mismo espacio muestral S. Por ejemplo, en el lanzamiento de
un dado podemos hacer que A sea el evento de que ocurra un nÚmero par y B el
evento de que aparezca un número mayor que 3. Entonces, los subconjuntos A =
{2,4,6} y B = {4, 5, 6} son subconjuntos del mismo espacio muestral
5 = {1 ,2,3,4, 5,6}.
Nótese que A y B ocurrirán ambos en un lanzamiento dado si el resultado es un
elemento del subconjunto {4,6}, que es precisamente la intersección de A y B.
La intersecciónr2 de dos eventos A y B, denotada mediante el símbolo A
el evento que contiene a todos los elementos que son comunes a A y a B.
n
B, es
Ejemplo. sea P el evento de que una persona seleccionada al azar mientras cena
en un restaurante de moda sea un contribuyente, y sea Q el evento de que la
persona tenga más de 65 años de edad. Entonces el evento PnQ es el conjunto
de todos los conhibuyentes en el restaurante que tienen más de 65 años de edad.
Sean M = {a, e, i, o, u} y N = {r, s, t}; entonces se sigue que
M n N = @. Es decir, M y N no tienen elementos en común y, por tanto, no
oueden ocurrir ambos de forma simultánea.
Ejemplo
3.2.5.
y
Para ciertos experimentos estadísticos no es nada extraño definir dos eventos, A
A
B, que no pueden ocurrir de forma simultánea. Se dice entonces que los eventos
y B son mutuamente excluyentes. Expresado de manera más formal, tenemos la
definición siguiente:
r?
pá9 59.
KREYSZIG, Edwin. Introducción a la estadíst¡ca Matemática. Editorial Limusa 1979.
86
Dos eventos A y B son mutuamente excluyentes o disjuntos si
An
B =@;es
decir si A y B no tienen elementos en común.
Ejemplo. Una compañía de televisión por cable ofrece programas en ocho
diferentes canales, hes de los cuales están afiliados con ABC, dos con NBC, y uno
con CBS. Los otros dos son un canal educativo y el canal de deportes ESPN.
Suponga que una persona se suscribe a este servicio enciende un televisor sin
seleccionar de antemano el canal. Sea Al evento de que el programa pertenezca a
la red NBC y B el evento de que pertenezca a la red CBS. Como un programa de
televisión no puede pertenecer a más
de
una red, los eventos A y B no tienen
programas en común. Por tanto, la intersección A
n
B no contiene programa
alguno y en. consecuencia los eventos A y B son mutuamente excluyentes
A menudo, nos interesamos en la ocurrencia de al menos uno de dos eventos
asociados con un experimento. Así, en el exper¡mento de lanzamiento de un dado,
si
¡=
Q, a,6) y B = {4, 5, 6},
Podemos interesarnos en que ocurra A o B, o que ocurran A y B. Tal evento, que
se llama la unión de A y B, ocurrirá si el resultado es un elemento del subconjunto
{2, 4, 5, 6}.
La unión de dos eventos A y B, que se denota mediante el símbolo A u B, es el
evento que contiene todos los elementos que pertenecen a A o a B o a ambos'
Ejemplo. Sea A = {a, b, c} y B = {b, c, d, e}; entonces
AUB={a,b,c,d,e}.
Ejemplo. sea P el evento de que un empleado seleccionado al azar de una
compañía petrolera fume cigarros. Sea
$;
87
?
Q el evento de que el
empleado
selecc¡onado ingiera bebidas alcohól¡cas. Entonces el evento P
v
Q es el conjunto
de todos los empleados que beben o fuman, o que hacen ambas cosas.
3.3. PROBABILIDAD DE UN EVENTO
Quizá fue la sed insaciable del hombre por el juego la que condujo al desarrollo
temprano de la Teoría de
la
Probabilidad. En un esfuerzo por aumentar sus
a los matemáticos que les proporcionaran las estrategias
ópt¡mas para varios juegos de azar. Algunos de los matemáticos que
ganancias pidieron
proporcionaron estas estrategias fueron Pascal, Leibniz, Fermat
y
James
de este primer desarrollo de la Teoría de la
inferencia estadística, con todas sus predicc¡ones y
Bernoulli. Como resultado
Probabilidad,
la
generalizaciones, se extiende más allá de los juegos de azar para abarcar muchos
otros campos asociados con los eventos aleatorios, como la política, los negocios,
la predicción del clima y la investigación científica. Para que estas predicciones y
generalizaciones sean razonablemente precisas, es esencial una comprensión de
la estructura del experimento, para tener algún grado de confianza en la validez de
la afirmación.
En el resto de este capítulo consideramos sólo aquellos exper¡mentos para los que
el espacio muestral contiene un número finito de elementos. La probabilidad de la
ocurrencia de un evento que resulta de tal experimento estadístico, se evalúa por
med¡o de un conjunto de números reales denom¡nados pesos o probabil¡dades
1.
Para todo punto en el espacio muestral, asignamos una
probabilidad tal que la suma de todas las probabil¡dades es 1. Si tenemos razón
para creer que es bastante probable que ocurra cierto punto muestral cuando se
que van de 0
a
a
lleva a cabo el experimento, la probabilidad que se le asigne debe ser cercana
punto muestral
1. Por otro lado, una probabilidad cercana a cero se asigna a un
que no es probable que ocurra. En muchos experimentos, como lanzar una
de
moneda o un dado, todos los puntos muestrales tiene la misma oportunidad
88
ocurrencia y se les as¡gnan probabilidades iguales. Para puntos fuera del espac¡o
muestral,
es decir, para eventos simples que no es posible que
ocurran,
asignamos una probabilidad de cero.
Para encontrar la probabilidad de un evento A, sumamos todas las probabilidades
que se asignan
a los puntos muéstrales en A.
Esta suma se denomina
probabilidad de A y denota con P(A).
La probabilidad de un evento A es la suma de los pesos de todos los puntos
muestrales en A. Por tanto,
0
f
P(A)
1't,
P(a) = 0,
y
P(S) =
1.
Ejemplo Se lanza dos veces una moneda. ¿Cuál es la probabilidad de que ocurra
al menos una cara?
Solución
El espacio muestral para este experimento es
g = {HH, HT, TH, TT}
Si la moneda esta balanceada, cada uno de estos resultados tendrá la misma
probabilidad de ocurrencia. Por tanto, asignamos una probabilidad de w a cada
uno de los puntos muéstrales. Entonces 4w = 1, o w = To. Si A representa el
evento de que ocurra al menos una cara, entonces
4 = {HH, HT,
TH}
y
P(A) = Yr+ /a+
/a=/o.
Ejemplo Se carga un dado de forma que sea dos veces más probable que salga
un número par que uno non. si E es el evento de que ocurra un número menor
oue 4 en un solo lanzamiento del dado, encuentre P(E)
89
Solución
El espacio muestral es S = {1, 2, 3, 4,5,6}. Asignamos una probabilidad de w a
cada número non y una probabilidad de 2w a cada número par. Como la suma de
las probabilidades debe ser 1, tenemos 9w = 1 o w = 1/9. Por ello se asignan
probabilidades de 1/9 y 219 a cada número non y par, respectivamente. por tanto,
E=
{1,2,3}
y
P(E) = 1¡9 + 219 +
119
=
419.
Si el espacio muestral para un experimento contiene N elementos, los cuales
tienen la misma probabilidad de ocurrencia, asignamos una probabilidad igual a
1/N a cada uno de los N puntos. La probabilidad de cualquier evento A que
contenga n de estos N puntos muestrales es entonces la razón del número oe
elementos en A al número de elementos en S.
Si un experimento puede tener como resultado cualquiera de N diferentes
resultados igualmente probables, y si exactamente n de estos resultados
.
corresponden al evento A, entonces la probabilidad del evento A
es p(A) = n/N
Ejemplo Un surtido de dulces contiene seis mentas, cuatro chicles y tres
chocolates. Si una persona hace una selección aleatoria de uno de los dulces.
encuentre la probabilidad de sacar a) una menta o b) un chicle o un chocolate.
Solución
M, T y C representan los eventos de que la persona seleccione, respectivamente,
una menta, un chicle o un chocolate. El número total de dulces es 13, los cuales
tienen la misma probabilidad de ser seleccionados.
(a) Como
seis de los 13 dulces son mentas, la probabilidad del evento
seleccionar una menta al azar. es
P(M) = 6713.
90
M,
(b) Como siete de los
l3 dulces son chicles
o chocolates, se sigue que
P(TwC)=t¡13
Si los resultados de un experimento no tienen igual probabilidad de ocurrencia,
las probabil¡dades se deben asignar sobre la base de un conocimiento previo o
de evidencia experimental. Por ejemplo, si una moneda no está balanceada,
podemos estimar las probabilidades de caras y cruces al lanzar la moneda un
número elevado de veces y regishar los resultados. De acuerdo con la definición
de frecuencia relativa de la probabilidad, las probabil¡dades verdaderas serían
las fracciones de caras y cruces que ocurren a largo plazo.
Para encontrar un valor numérico que represente de manera adecuada la
probabilidad de ganar en el tenis, debemos depender de nuestro rendimiento
pasado en el juego así como también del de nuestro oponente y, hasta cierto
punto, en nuestra creenc¡a de ser capaces de ganar. De manera similar, para
encontrar la probabilidad de que un caballo gane una carrera, debemos llegar a
una probabilidad que se base en las marcas anteriores de todos los caballos que
participan en la carrera, así como de records de los jockeys que montan en los
caballos. La intuición, sin duda, también juega una parte en la determinación del
monto de la apuesta que estemos dispuestos a jugar. El uso de la intuición, las
creencias personales y otra información indirecta para llegar a probabilidades se
denom¡na como la definición subjetiva de probabilidad.
En la mayor parte de las aplicac¡ones de probabilidad de este texto a
¡nterpretación de frecuencia relativa de probabilidad es la que opera. Su
fundamento es el experimento estadístico en lugar de la subjetividad. Se le
considera mas bien como frecuencia relativa limitante. Como resultado, muchas
aplicaciones de probabilidad en la ciencia
y la ingeniería se deben basar
en
experimentos que se puedan repetir. Nociones menos objetivas de probabilidad se
9l
encuentran cuando asignamos probabilidades que se basan en información y
opiniones previas. Como ejemplo, "hay una buena oportunidad de que de que el
Cortuluá pierda el Campeonato Nacional de Fútbol". Cuando la opiniones y la
información previa difieren de individuo
a individuo, la probabilidad subjetiva
se
vuelve el recurso relevante.
3.4 ESPERANZA MATEMÁTICA
Si p es la probabilidad de que una persona reciba una cantidad S de dinero, la
esperanza matemática (o simplemente esperanza) se define como pS.
Ejemplo 3.5.1. Si la probabilidad de que un supervisor de Electrocosta gane un
ascenso de $10 es 1/5, su esperanza matemática es l/b(g1O) = g2.
El concepto de esperanza matemática se extiende fácilmente. Si X denota una
variable aleatoria d¡screta que puede tomar los valores X1, X2, ..., X¡ con
probabilidades
pt, pz, ..., p¡, donde p1
matemática13 de
*
pz
+ ... * pr = 1, la esperanza
X (o simplemente esperanza de X), denotada E(X), y se define
como
E(X) = pr Xr + p2X2+... +prXr=
Ip¡\ =lpX
,-
|
Si las probabilidades pj en esa expresión se sustituyen por las frecuencias
relativas /¡/N, donde N =
If,
la esperanza matemática se reduce a (I/X)/N, que
es la media aritmética X de una muestra de tamaño N en la que X1, Xz, ..., X.
aparecen con estas frecuencias relativas. Al crecer N más y más, las frecuencias
relativas se acercan a las probabilidades g. Así que nos vemos abocados a
interpretar E(X) como la media de la población cuyo muestreo se consideraba. Si
llamamos m a la media muestral, podemos denotar la med¡a poblacional por la
'' SPIEGEL, Murria. Estadística. Editorial Mccraw
92
H¡tt. México 1984.
páo. 102
correspondiente letra griega
p (m¡u). Puede definirse, asimismo, la esperanza
matemát¡ca para variables aleatorias continuas, pero requiere el cálculo.
3,5. RELACION ENTRE POBLACIÓN, MEDIA MUESTRAL Y VARIANZA
Si seleccionamos una muestra de tamaño N al azar de una población (o sea,
suponemos que todas las posibles muestras son igualmente probables), entonces
es posible mostrar que el valor esperado de la media muestral m es la media
poblacionalp.
No se deduce, sin embargo, que el valor esperado de cualquier cantidad calculaoa
sobre una muestra sea la cantidad correspondiente de la población. Así, el varor
esperado de la varianza muestral, como la hemos definido, no es la varianza de ¡a
1)/N veces dicha varianza. por eso algunos estadísticos
prefieren definir la varianza como nuestra varianza multiplicada por N/(N 1).
población, sino (N
-
3.6. ANÁLISIS COMBINATORIO
Al hallar probabilidades de sucesos complicados, suele resultar difícil y tediosa
una enumeración de los casos. El análisis combinatorio facilita mucho esa tarea.
Principio fundamental.
Si un suceso puede ocurrir de n1 maneras, y si cuando éste ha ocurrido otro
suceso puede ocurrir de o2 fiáñ€rás, entonces el número de maneras en que
ambos pueden ocurrir en el orden especificado €S h1n2.
Ejeníplo. Si hay 3 candidatos para gobernador y 5 para alcalde, los dos cargos
pueden ocuparsede 3 5 = 15 formas.
.
93
Factorial de
n1a
La factorial de n, denotada por n!, se define como
n! = n(n
Así, 5! = 5 *4 * 3"
-
1)(n
2-
-2)
...
1
1=120,y 4!3! = (4 " 3-
2.
1)(3-
2. 1)= 1¿¿. Conviene
definir 0!=1.
Permutaciones
una permutación de n objetos tomados de r en r es una relación ordenada de
r
objetos de entre n. El número de permutaciones de n objetos tomados de r en r se
denota por nPr, P(n, r), o Pn,. y viene dado por:
nPr = n(n-1)(n-2)...(n
- r +t)
=(n :
- r)l
En particular, el número de permutaciones de n objetos tomados de n en n es:
i P = n(n
-
l)(n
-
2)...1 =
nr.
Ejemplo. El número de permutaciones que se pueden dar de las letras a, b y c
tomadas de dos en dos es 3P2 = 3 * 2 = 6. Son ab, ba, ac, ca, bc, cb.
El número de permutaciones de n objetos, de los que n1 son iguales, n2 son
¡guafes, ... es nl ln1ln2l... donde n = fl1 r n2 * ...
Ejemplo. El número de permutaciones de las letras de la palabra "stat¡stics" es:
'o
SPIEGEL, Murria. EstadÍstica. Ed¡torial Mccraw Hill. México 1984. páo. 103
94
i
i
10!
3!3!1!2n!
Porque hay 3 eses, 3 tes,
1a,2 iesy 1c.
Combinacionesl5
una combinación de n objetos tomados de r en r es una selección de r de ellos,
sin importar el orden de los r escogidos. El número de combinaciones de n
objetos, tomados de r en r se denota por (
lrl
L"J
n(n l)...1n
,1
") y viene dado
r+l)
por:
nt
7r.(n
- r)!
Ejemplo. El número de combinaciones de ras letras a, b y c tomadas de dos en
oos es:
l3l 3*2 ='
Lrl= o
Que son ab, ac y bc. Nótese que ab es la misma combinación que va, pero no
misma permutación.
Reglas Multiplicativas
Teorema
Si en un experimento pueden ocurrir los eventos A y B, entonces
P(AnB)=P(A)P(B/A).
Editor¡al Mccraw Hi . Méx¡co 1984. pág.
'' SPIEGEL, Murria. EstAdfst¡ca.
,r .r;l
t'.
':|
95
.103
ta
Así la probabilidad de que ocurran A y B es igual a la probabilidad de que ocurra A
multiplicada por la probabilidad de que ocurra B, dado que ocurre A. Como los
eventos A
n
ByB
n A son equivalentes,
se sigue del teorema anterior que
también podemos escribir:
P (A
n
B) = P (BnA) =P(B)P(A/B).
En otras palabras, no importa cuál evento se considera como A y cuál como B.
Ejemplo. un jefe de almacén de Electrocosta tiene una caja de fusibles que
contiene 20 unidades, de las cuales cinco están defectuosos. Si se seleccionan
dos fusibles al azar y se separan de la caja uno después del otro sin reemplazar et
primero, ¿cuál es la probabilidad de que ambos fusibles estén defectuosos?
soLUcloN
sean A el evento de que el primer fusible esté defectuoso y B el evento de que el
segundo esté defectuoso; entonces interpretamos A n B como el evento de que
ocurra A,
y entonces B ocurre después de que ocurre A. La probabilidad
de
separar primero un fusible defectuoso es %; entonces la probabilidad de separar
un segundo fusible defectuoso de los restantes 4 es 4t1g. por ello.
P(A
n
B) = (1t41(4t191= 1t19
Ejemplo. Un Supervisor de Electrocosta tiene una caja que contiene cuatro
fusibles blancos y tres negros, y una segunda caja que contiene tres blancos y
cinco negros. se saca un fusible de la primera caja y se coloca sin verlo en
96
ra
segunda. ¿Cuál es la probabilidad de que ahora se saque un fusible negro de la
segunda caja?
SOLUCIÓN
Sean 81, Bz, v Wr respectivamente, la extracción de un fusible negro de la caja 1,
uno negro de la caja 2 y un blanco de la caja 1. Nos interesa la unión de los
eventos mutuamente excluyentes B1o 82
! w1nB2. Las diversas posibilidades y
sus probabilidades se ilustran en la siguiente figura. Entonces,
P[(B1o 82) o (W1n
B2)]
= P(Brn Bz) + p(Wrn Bz)
= P(81
) P( B2lB1 ) + P(Wl) P (82/ Wr)
=(3/7X6/9) +
(t7)(5t9) = (38/63).
P(B¡
P(B¡
n
Br) = (3i7) (6/9)
n w) = (3/7)(3/9)
P(w'n Bt
P(Wr
97
.\
W,
= (4/7X5l9)
= (4/1)(419)
Si, en
el
primer fusible se reemplaza y los fusibles se reacomodan por completo
antes de que se extraiga el segundo, entonces la probabilidad de un fusible
defectuoso en la segunda selección aún es /o; es decir, p(B/A) = p(B) y los
eventos A y B son independientes. cuando esto es cierto, podemos sustituir p(B)
por P(B/A) en el teorema anterior para obtener la siguiente regla especial de
multiplicación.
Teorema
Dos eventos A y B son independientes si y sólo si
P(A
Por tanto,. para obtener
la
n
B) = P(A) P(B).
probabilidad
independientes, simplemente calculamos
el
de que
ocurran dos eventos
producto de sus probabilidades
individuales.
Ejemplo. Una pequeña ciudad tiene un carro de bomberos y una ambulancra
disponibles para emergencias. La probabilidad de que el carro de bomberos esté
disponible cuando se necesite es 0.98 y la probabilidad de que la ambulancia esté
disponible cuando se le requiera es 0.g2. en el caso de que resulte un herido oe
un edificio en llamas, encuentre la probabilidad de que la ambulancia y el carro de
bomberos estén disponibles.
Solución
sean A y B los respectivos eventos de que estén disponibles el carro de bomberos
y la ambulancia. Entonces,
P(A
98
n
B) = P (A) P(B) = (0.98) (0.92) = 0.9016.
Ejemplo se lanza dos veces un par de dados. ¿cuál es la probabilidad de obtener
totales de siete y once?
Solución
Sean A1,
Az,
Bt y 82 los eventos independ¡entes respectivos de que ocurra un
siete en la primera tirada, ocurra un siete en el segundo lanzamiento, un once en
el primero y un once en el segundo. Nos interesa la probabilidad de la unión oe
los eventos mutuamente excluyentes A1 n 82 y B1n A2. por tanto,
P[(A1
n
Bz)
u(BrnAz)] =P(A1 nBz)+P(BrnAz)
= P (A1 )P( 82) + P(Br )P(A2)
=(r/6X1/1 8) + (1/18)(1/6)
=
1154.
Los teoremas anteriores se pueden generalizar para cubrir cualquier número de
eventos, como se establece en el teorema siguiente.
Teorema
Si, en un experimento, pueden ocurrir los eventos A1, 42, 43, ..., AK, entonces,
P(A1
nA2n43ñ " nAr)
P (A1 )P(A2IA1 )P(& /A1 n Az ) ... P(AK/AI
=
n
Az
n
...
n Ar-r
).
Si.los eventos A1, A2, A3, ..., AK son independientes, entonces,
P(A1 n 42 n 43n ... n A¡{= P(A1 ) P(A2 )P(A3 )
P(Ar)
t
99
Ejemplo Se sacan tres cartas una tras otra, sin reemplazo, de una baraja
ordinaria. Encuentre la probabilidad de que ocurra el evento Ar ó Az o A¡, donde
Ar es el evento de que la primera carta sea un as rojo, 42 el evento de que ta
segunda carta sea un 10 0 una sota y A¡, el evento de que la tercera carta sea
mayor que tres pero menor que siete.
Solución
Primero definimos los eventos
Ar:
Az:
A¡:
la primera carta es un as rojo,
la segunda carta es un 10 o una sota,
la tercera carta es mayor que tres pero menor que siete.
Entonces,
P(A)=2¡52,
P(A2IA1)=g/91,
p(A3/Ar^A2)=.12lSO,
Y de aquí, por el último teorema,
P(A1
n 42 n
43
)
= P(A1 )p(A2lA1 )p(A3/A1 n 42 )
= (2 |
Ejemplo.
52)(8 | 5 1 ) (1 21 50) =
g¡
5525.
se carga una moneda de modo que ra cara tenga una
posibiridad de
ocurr¡r dos veces mayor que la cruz. si se lanza tres veces la moneda,
¿cuál es ta
probabilidad de obtener dos cruces V una cara?
Solución
El espacio muestral para er experimento consiste en los ocho elementos.
5 = {HHH, HHT, HTH, THH, HTT, THT, TTH, TTT}.
Sin embargo, con una moneda no balanceada ya no es posible asignar
probabif idades iguales a cada punto de la muest ra. para
encontrar las
100
probabil¡dades, cons¡dérese primero
el
espac¡o muestral S1
= {H, T}, que
representa los resultados cuando se lanza una vez la moneda. si se asignan
probabifidades de w y 2w para obtener un cruz y una cara, respectivamenre,
tenemos 3w
= 1 o w = 1/3. Por tanto
P(H)
= 2¡3 y p(T) = 1/3. Sea ahora A el
evento de obtener dos cruces y una cara en los tres lanzamientos de la moneda.
Entonces,
4
= {TTH, THT, HT-r},
Y como los resultados en cada uno de los tres lanzamientos son independientes,
se sigue del último teorema que
P(THH)
= P(Trl Tn
H) = P(T)P(T)P(H) = (1/3)
(l/3)
(2t3,¡ = 2¡27.
De manera similar,
P(THT) = P(HTT) = 2127 y por ello P(A) = 2¡27 + 2t27 + 2t27 = 2tg.
101
Resumen
El espacio muestral se define como el conjunto de todos los resultados posibles oe
un experimento estadístico y cada resultado de un espacio muestral se denomina
punto muestral. Un evento es un subconjunto de un espacio muestral.
La unión de dos eventos A y B, que se denota mediante er símboro A
evento que contiene todos los elementos que pertenecen
u B, es er
aA o a B o a los dos.
se definen dos eventos A y B mutuamente excluyentes, si la intersección de
los
dos es vacía; es decir, si no tienen elementos en común.
La intersección de dos eventos A y
B
se denota mediante el símbolo
A n B: es ei
evento que contiene a todos los elementos que son comunes a A v a B.
Probabilidad: Quizás la sed insaciable del hombre por el juego fue lo que condu¡o
a
desarrollar tempranamente
probabilidad de un evento
muestrales en
la teoría de probabilidades, definiéndose
ra
A como la suma de los pesos de todos los puntos
A. Para todo punto en el espacio muestral, asignamos
una
probabilidad tal que la suma de todas las probabilidades es igual a 1. si tenemos
razón
para creer que es bastante
probable que
ocurra c¡erto punto
muestral
cuando se lleva a cabo el experimento, la probabilidad que se le asigne debe ser
102
cercana a 1. Por otro lado, una probabilidad cercana a cero se asigna a un punto
muestral que no es probable que ocurra.
Existen dos enfoques para definir probabilidades, un enfoque subjetivo el cual usa
la intuición, las creencias personales y otra información indirecta; y un enfoque de
frecuencia relativa,
el cual es más
científico
y
tiene bases matemáticas y
numéricas para estimar las probabilidades.
Permutaciones
Una permutación de n objetos tomados de r en r es una relación ordenada de r
objetos de entre n. El número de permutaciones de n objetos tomados de r en r se
denota por nP,', P(n, r), o Pn,, y viene dado por
nP, = n(n
-
1Xn
-2).
.(n
-
r + 1) = n!/(n
-
r)l
Combinaciones
una combinación de n objetos tomados de r en r es una selección de r de ellos.
sin importar el orden de los r escogidos. El número de combinaciones de
'
objetos, tomados de r en r se denota
103
p",
("\
t
y viene dado por
;j
n
EJERCICOS
A continuación encontraras un enunciado y cuatro posibilidades de
respuesra,
entre las cuales debe escoger sólo una, la que considere correcta.
1. lván tiene tres camisas, cuatro
pantalones y dos pares de zapatos. El número
de maneras en que se puede vestir es:
a. Mas de dos formas
b. Por lo menos doce formas
c. Al menos veinticuatro maneras
d. Exactamente veinticuatro formas
2.
Un grupo de cinco amigos, que se intercambian diariamente al sentarse en una
mesa, vuelven a quedar cada uno en el mismo sitio al cabo de:
a.
25
días b. 120 días
c. 125
días d.
240 días
3. De un sombrero con papeles numerados del 1 al g, se extraen 4
con
reemplazamiento (se saca uno, se anota el resultado y se vuelve a depositar
en el sombrero), teniendo que el numero total de posibilidades es de g4. Ahora,
si la extracción se hace sin reemplazamiento (no se vuelven a colocar en el
sombrero) el total es 9x8x7x6. Sea x, la variable que representa el número
obtenido. Todos los números tienen el mismo chance de salir. La probabilidad
de que el número más pequeño extraÍdo sea 3 en las dos situaciones:
a.
Menor que 1 en ambos casos
b. Mayor que cero y menor que uno
c. En el primer caso mayor que en el segundo
d. Es mayor si se hace sin reemplazamiento que con reemplazamiento
104
4. Se realiza el experimento de lanzar un dado cargado una vez. La letra
representa el resultado del lanzamiento y po representa la probabilidad de este.
como se muestra en el siguiente recuadro:
J
P(i)
1
z
2t15
P6
2t15
4
1t5
1/6
La probabilidad de obtener un número primo se puede representar con
expresión:
P(J=s)
b.1 - {(2t1s )+ (1/15 )+ (1/6 )}
a. PA=4 + P(i=3)+
6
1t6
ra
b. p(J11,4,6)
c.p6+ (2t15 ) + (1/6
)}
Resuelve
1. se lanza una moneda 2 veces. ¿cuár es ra probabiridad de que
ocurra ar menos
una cruz? .
2.
se carga un dado de forma que sea 2 veces más probabre que sarga un número
impar que uno par. Si E es el evento de que ocurra un número menor que
3 en un
solo lanzamiento del dado, encuentre p(E).
3.
Una nevera térmica contiene un surtido de herados compuesto por seis oe
vainilla, cuatro de arequipe y 3 de chocolate. si un cliente realiza una seleccion
aleatoria de uno de ros herados, encuentre ra probabiridad de sacar: a) uno
de
vainilla, b) uno de arequipe c) uno de chocolate.
4.
5.
La probabilidad de que J.p. Montoya gane er gran premio de Marasia, er cuar
otorga U$ 1'000.000, es 1/5. ¿Cuál es su esperanza matemática?
En un negocio aventurado, una señora puede ganar $300 con probabilidad 0.6
o perder $ 100 con probabilidad de 0.4. Hallar su esperanza matemática.
105
6. Hay que colocar a 5 hombres y 4 mujeres en una fila de modo que las
mujeres ocupen los lugares pares. ¿De cuántas maneras puede hacerse?
(permutación)
7 ¿De cuántas formas se pueden repart¡r 10 objetos en dos grupos de 4 y 6
objetos, respectivamente? (combinación)
8 ¿De cuántas maneras se puede formar con 9 personas una comisión de 5
miembros? (combinación)
9
De entre 5 administradores y 7 ingenieros, hay que constitu¡r una comisión l'
de 2 administradores y 3 ingenieros. ¿De cuántas formas podrá hacerse si: a)
todos son elegibles, b) un ingeniero particular ha de estar en esa comisión y c)
dos administradores concretos tienen prohibido pertenecer a la comisión?
'rF
106
f
t-
LECTURAS COMPLEMENTARIAS
ORIGENES DEL CONSEPTO DE PROBABILIDAD
El concepto de probabilidad es muy reciente. En 16s4 el noble francés Antonro
Gombard, conocido como caballero de mére, persona muy aficionada al juego, se
hizo varias preguntas sobre problemas relacionados con el juego de dados, a
partir de su experiencia como asiduo jugador.
Mere observo que apostar a que al menos apostar un seis doble en una secuencra
de 24 tiradas de dos dados, es un juego en el que se pierde ligeramente mas que
se gana. Mere no daba crédito a sus resultados, pues pensaba que si sacar un
seis doble en una partida se obtiene una vez de 36, en 24 part¡das
serial,
que
JO
I
.z -.
es menor que
Para salir de su perplejidad escribió al matemático
franés Blaise pascal (16231662) una carta comentándoles estas cuestiones. Interesado pascal en
semejantes problemas inicio una correspondencia con su colega pierre de fermat
(1601-1665), tratando de resolver los problemas planteados por mere.
La correspondencia entre estos dos grandes matemáticos se considera hoy día
como el origen de la teoría de la probabilidad.
r07
En 1774, Pierre simón laplace (1749-1827) enuncio la primera def¡nición que se
conoce del concepto de probabilidad y que hemos expuesto en el desarrollo de
lección.
ra
Después de laplace, el interés por el cálculo de probabilidades fue disminuyendo,
llegando prácticamente a desaparecer como disciplina matemática durante el siolo
XIX.
El gran número de paradojas y dificultades surgidas a comienzos del presente
siglo aconsejaron una profunda revisión del concepto de probabilidad utilizando las
herramientas matemáticas más premisas del momento; esto es: la teoría de
conjuntos desarrollada principalmente por Emile borel (1g71-i9b6) y la potente
teorÍa de la medida debida a Henri lebesgue (l1B7S-1941).
El matemático ruso Andrei nicolevich kolmogorov (i 903-r gg7) construyo una
axiomática para el calculo de probabilidades, cuya idea fundamental fue
considerar la intima relación que existe entre Frecuencia relativa de un suceso y
su Probabilidad, cuando el numero de pruebas es muy granoe.
108
'''ü'"ri
BIBLIOGRAFíA
MURRIA, R. Spiegel, Estadistica, Serie Schaum, Mc. Graw Hill Editores, 1990.
LINCOYAN, Portus Govinden, Curso Práctico de Estadística, Mc. Graw Hill
Editores, 1986.
MARTÍNEZ, Ciro. Estadística. Eco Ediciones. Bogotá 1g92.
SPIEGEL, Murria. Estadística. Editorial McGraw Hill. México 1984
WALPOLE, Myers. Probabilística y Estadística, Pearson Education, 1998.
HINES W. Willian y MONTGOMERY C. Douglas, Probabitidad y Estadística,
Editorial CECSA, 1999.
GEORGE, Canavos. Probabilística y Estadística, Mc Graw Hill Editores, 1997.
CASTILLO
H, Mario. Apuntes de Estadística,
Universidad de los Andes, 2002.
MORRIS, Hide Groot. Probabilidad y Estadística, Mc Graw Hill Editores, 2001.
l0h
DIRECCIÓN DE EDUCACIÓN ABIERTA Y A DISTANCIA Y VIRTUALIDAD
LICENCIATURA EN EDUCACIÓN BÁSICA CON ÉNFASIS EN CIENCIAS NATURALES Y EDUCACIÓN AMBIENTAL
ESTADÍSTICA
Carretera Troncal de Occidente - Vía Corozal - Sincelejo (Sucre)
Teléfonos: 2804017 - 2804018 - 2804032, Ext. 126, 122 y 123
Mercadeo: 2806665 Celular: (314) 524 88 16
E- Mail: facultadeducacion@cecar.edu.co
Descargar