TEMA 1: ESTADÍSTICA 1. EL PORQUE ESTUDIAMOS ESTADÍSTICA

Anuncio
TEMA 1:
ESTADÍSTICA
1. EL PORQUE ESTUDIAMOS ESTADÍSTICA
Las Ciencias de la Salud incluidas las ciencias de la Salud y del Medio Ambiente incluyen una gran
variabilidad en los resultados, influye la variabilidad biológica de los sujetos experimentales si son seres
vivos, dos seres vivios nunca son iguales o un ser vivo nunca es igual en diferentes etapas de la vida. Otro
hecho que influye en la variabilidad de los resultados es la imprecisión de los aparatos de medida; la
calibración del aparato, que la medida la haga una persona u otra.
La estadística también va a ser muy importante en el control de la calidad como muchas veces vamos a
trabajar con fenómenos cuyos resultados van a ser muy difíciles de predecir, entonces las afirmaciones van a
ser en termino de posibilidad o probabilidad.
El modo de obtener resultados científicos validos de estos datos, que son fundamentalmente impredecibles, es
a través de las técnicas estadísticas.
Además en las ciencias de la salud son esencialmente experimentales y como tales están sujetas a
razonamiento de tipo inductivo, es decir, que van de lo particular a lo general, es decir, pretenden extender las
conclusiones obtenidas de una parte a todo. Se estudia a un grupo de individuos (muestra) y se extrapola a
todos (población) y el único método científico para validar tales extensiones es el método estadístico.
No existe una definición internacionalmente aceptada de estadística pero para nuestro propósito nos basta con:
estadística es el método necesario para recoger, clasificar, representar y resumir datos (científicos) así como
para hacer inferencia a partir de ellos de ahí que consta de dos partes, estadística descriptiva cuyo fin es la
recogida, clasificación, representación y resumen de los datos y estadística deductiva que tiene como fin
extender las conclusiones obtenidas en una parte de la población (muestra) a toda ella.
− TIPOS DE DATOS
Los datos pueden ser cualitativos o cuantitativos según el carácter estudiado sea medible o no. Son
cualitativos si se refieren a una cualidad y cuantitativos aquellos que requieren una expresión numérica, dentro
de los datos cualitativos algunos solo afectan a dos variables se llaman dicotómicos y a veces un cualitativo es
susceptible de ser de un modo ascendente o descendente, entonces reciben el nombre de ordinales aunque hay
casos en los que no son ni dicotómicos ni ordinales, Ej. Grupos sanguíneos; por otro los datos cuantitativos
pueden ser de dos tipos discretos o continuos. Discretos son aquellos que solo pueden tomar valores
numéricos aislados, los continuos pueden tomar cualquier valor dentro de un intervalo.
− PRESENTACIÓN TABULAR DE LOS DATOS
En muchas ocasiones es necesario trabajar con muchos datos (muestras), es necesario recoger y ordenar esos
datos.
Una muestra de 500 alumnos varones de una universidad en la que se desea estudiar el grupo sanguíneo (dato
cualitativo), el número de hermanos excluido el mismo (dato cuantitativo discreto) y el peso (cuantitativo
continuo)
TABLA 1
1
ALUMNO
1º
2º
3º
GRUPO SANGUÍNEO
A
B
0
Nº HERMANOS
0
3
2
PESO (KG)
70,52
67,23
69,92
Si tenemos así los datos nos topamos con el problema de la extensión no podemos sacar información
inmediata, no podemos responder a preguntas tales como cual es el número de hermanos más frecuente para
responder a estas preguntas los podemos ordenar de la siguiente manera:
TABLA 2: DISTRIBUCIÓN DEL GRUPO SANGUÍNEO DE 500 ALUMNOS
GRUPO SANGUÍNEO
A
B
AB
0
TOTAL
FRECUENCIA
ABSOLUTA (fi)
150
75
25
250
500
FRECUENCIA
RELATIVA (hi)
0,30
0,25
0,05
0,50
1
PORCENTAJE
30%
15%
5%
50%
100%
A los distintos modos de presentarse los datos se les llama clase o modalidades, de los datos de la tabla 2 es
fácil obtener el número de individuos que presenta cada una de las modalidades del grupo sanguíneo, este
número se conoce como frecuencia absoluta de clase o modalidad se representa por f con un subíndice i que
alude al número de clase del que se trata.
Las frecuencias relativas se definen como el cociente entre la frecuencia absoluta y el tamaño de la muestra y
se representa por hi: fi/n
Las frecuencias relativas nos permiten comparaciones entre dos o más tablas que tengan diferente tamaño de
muestra, a partir de las frecuencias (absolutas) no es posible hacer comparaciones pero si a partir de las
frecuencias relativas.
La frecuencia relativa es en realidad un tanto por 1 y también es frecuente representarlos resultados en % estos
se obtiene multiplicando por 100 las frecuencias relativas. Si las frecuencias relativas son extremadamente
bajas en lugar de multiplicar por 100 se multiplica por 1000,.
Los mismo criterios que sirven para el caso cualitativo sirve para el caso cuantitativo discreto, lo podemos ver
en la siguiente tabla:
TABLA 3: DISTRIBUCIÓN DE NÚMERO DE HERMANOS ECLUIDO EL MISMO DE UNA MUESTRA
DE 500 ALUMNOS VARONES.
Nº HERMANOS
0
1
2
3
4
5
fi
72
155
97
81
30
27
hi
0,144
0,310
0,194
0,162
0,060
0,054
PORCENTAJE
14,4%
31,0%
19,4%
16,2%
6,0%
5,4%
2
6
+7
20
18
0,040
0,036
4,0%
3,6%
Hay que observar que las clases sean dispuesto de modo ordenado ascendente y no de modo desordenado,
igual se debe hacer si los datos son cualitativos ordinales, a partir del 6 representan frecuencias muy bajas se
perdería el fin clarificador de la tabla y se agrupan.
TABLA 4: DISTRIBUCIÓN DEL PESO (x) EN KG DE UNA MUESTRA DE 500 ALUMNOS DE UNA
UNIVERSIDAD
INTERVALO
DE CLASE
x<45
45"x<50
50"x<55
55"x<60
60"x<65
65"x<70
70"x<75
75"x<80
80"x<85
85"x<90
x"90
TOTAL
fi
Fi
hi
%
1
3
12
75
103
155
101
29
11
8
2
500
1
4
16
91
194
349
450
479
490
498
500
500
0,002
0,006
0,024
0,150
0,206
0,310
0,202
0,058
0,022
0,016
0,002
1,000
0,2%
0,65
2,4%
15,0%
20,6%
31,0%
20,2%
5,8%
2,2%
1,6%
0,2%
1,000
MARCA DE
CLASE
42,5
47,5
52,5
57,5
62,5
67,5
72,5
77,5
82,5
87,5
92,5
−
En el caso de datos cuantitativos continuos aun valiendo los criterios anteriores se presenta la dificultad de la
formación de clases. Los datos deben agruparse en clases llamadas ahora intervalos de clase si se decide
agrupar a los alumnos de 5 en 5 kg la presentación de los datos sería como la tabla 4 cada clase viene definida
por un par de valores llamados limites de clase, denominados respectivamente limite inferior (LI) y limite
superior (LS) del intervalo de clase. La diferencia entre ambos es llamada longitud de clase.
Observad que los intervalos primero (x<45) y último (x
90) no constan de los dos limites ni tienen igual longitud que los demás, son unos intervalos cajón desastre
que se hace así buscando soluciones prácticas. Conviene que todos los intervalos de clase tengan igual
longitud con excepción, por las razones indicadas, de los extremos.
Las clases no deben solaparse ni presentar huecos entre ellas esto es así para evitar que un individuo puede
pertenecer a dos clases diferentes o que no haya clase en la que clasificarlo.
En general el número de clases a tomar o la longitud de ellos es algo que debe decidir el experimentador en
función de n y de la dispersión de los datos, cuanto más dispersos sean los datos mayor longitud han de tener
los intervalos. El objetivo final es que la tabla ha construir quede bien, dando unas frecuencias indicativas de
cómo se distribuye el peso como norma general el número de intervalos ha de estar entre 5.
A veces conviene tomar un nuevo valor como representante de cada clase valor llamado marca de clase, se
define como (LI + LS) / 2
A las clases extremas como les falta uno de los limites se les asigna a tales intervalos igual longitud ficticia
que al resto.
3
Estas tablas que hemos visto reflejan diferentes clases con sus respectivas frecuencias se denominan
distribución de frecuencias y como regla general deben verificar las siguientes condiciones:
• debe llevar un enunciado que las explique totalmente sin necesidad de recurrir al texto.
• deben indicar los totales de cada una de las columnas numéricas.
• deben indicar claramente las unidades de medida.
• los datos de una misma columna deben venir expresados con igual número de decimales.
−PRESENTACIÓN GRÁFICA DE LOS DATOS
La información proporcionada por las tablas es bastante completa pero tiene la dificultad de que su lectura
requiera un cierto tiempo y capacidad de comparación para relativizar la información de unas clases respecto
de las otras, las representaciones gráficas constituyen uno de los principales y el más sencillo método de
exponer la información por su capacidad de impactar al lector con muy poco esfuerzo por su parte dan una
información rápida y global y permite tener una idea general de los resultados. Las representaciones gráficas
pueden ser de dos tipos todos se basan en el principio general de que las figuras construidas para cada clase
deben áreas (longitudes) proporcionales a las frecuencias de aquellas.
−Histogramas.
Es la representación gráfica más frecuente en la investigación científica en él los distintos clases se
representan sobre el eje de abscisas (eje horizontal) y sus frecuencias absolutas o relativas sobre el eje de
ordenadas (eje vertical) si los datos son cualitativos o discretos en las ábsidas se le asignas un punto o un
intervalo todos de igual anchura. Si los datos son continuos en el eje de ábsidas se anotan los intervalos de
clase y sobre ellos se levanta un rectángulo de tanta altura como frecuencia allá. Los histogramas pueden ser
de frecuencias absolutas o de frecuencias relativas o por otro lado pueden ser de barras o de rectángulos,
siendo estos últimos obligatorios en los datos continuos, cuando los datos son ordinales conviene insertarlos
en el eje de abscisas en su orden lógico y en el caso de clases extremas que no tienen igual longitud que los
demás conviene dibujarlos con igual anchura.
Histograma sanguíneo:
Histograma de número de hermanos:
4
Histograma del peso:
− Polígono de frecuencias.
Esta especialmente indicado para los datos cuantitativos continuos, si bien puede hacerse para los datos
discretos y ordinales. En abscisas se pone el valor de las distintas clases o marcas de clase y en ordenadas las
frecuencias absolutas o las frecuencias relativas. El polígono de frecuencias es especialmente útil para ver
como evolucionan las frecuencias conforme aumenta el valor de los datos por ello9 no es aplicable e los datos
cualitativos no ordinales.
Número de hermanos:
Peso:
En una misma gráfica se pueden mezclas varios datos con polígonos de frecuencias relativas.
−Pictogramas.
5
Se basan en la representación gráfica de un dibujo alusivo al carácter que se esta representando se define una
figura o motivo y se le amplia el modo proporcional, o la frecuencia.
−Diagrama de sectores.
Consta de un círculo en el que a cada clase se le asigna un sector de área (y por consiguiente un ángulo) para
obtener el ángulo se multiplican 3600 por la frecuencia relativa hi o también
Las representaciones gráficas deben verificar las siguientes condiciones:
− 1º Deben indicar claramente las escalas y unidades de medida.
• 2º Deben explicarse por si solas de ahí que sea fundamental que posean un título totalmente
explicativo.
• 3º Deben contribuir a clarificar el material presentado.
−SÍNTESIS DE DATOS
Además de la representación tabular y gráfica, a veces es más simple y representativo dar características
numéricas que lo resuman adecuadamente. Estas características son denominadas de un modo genérico:
medidas de posición y medidas de dispersión.
−Medidas de posición.
• Moda
es la clase o intervalo con más frecuencia absoluta o relativa.
Ej. De nº de hermanos: moda 1
Ej. Peso en Kg: moda 65"x<70
• Media
es la medida de posición más usual es el promedio de los valores de la muestra.
6
Media aritmética de nº de hermanos:
X=
En el caso de datos continuos en forma de intervalos de clase los valores Xi que se utilizan para el cálculo de
la media son las marcas de clase.
X=
X=
• Mediana
se define como aquel dato perteneciente o no a la muestra que deja tantas observaciones de la muestra
por un lado como por el otro.
Si n es impar
m
Si n es par
La mediana no tiene sentido con datos cualitativos no ordinales por no existir en ellos un orden. Cuando los
datos están en forma de tabla de frecuencias el calculo de la mediana se facilita con la notación de las
frecuencias acumuladas absolutas, Fi, por definición es la suma de las frecuencias de todas las clases
anteriores a la número i más la de ella misma.
F1 = f1 F2 = f1+ f2 F3 = f1+f2+f3
Fn = f1+f2+f3+.fn−1+fn
TABLA 3:
MEDIANA
n = 500
m=
7
=
=
= X250,5
TABLA 4:
MEDIANA
n = 500
m=
=
=
= X250,5
(70−65)= 5
155
m−65
250,5−194=56,5
m−65 =
= 1,82 m = 66,82
−PERCENTILES, DECILES Y CUARTILES
La mediana divide a la muestra ordenada en dos partes iguales como generalización de ella se definen los
percentiles que son aquellos calores que dividen a la muestra ordenada en 100 partes iguales. Suele
anotárseles p1,p2,p3........p100. En general el pi es aquel valor que deja a su izquierda el i% de los valores de
la muestra ordenada, los percentiles son muy indicados para describirlos casos raros de la población. Así
afirmar que el percentil 10 del peso de los niños varones recién nacidos es 2.700g indica que solo un 10% de
ellos tiene un peso inferior a 2.700g. Algunos percentiles por su especial relevancia reciben nombres
especiales, así los p25, p50, p75 son los llamados primero, segundo y tercer cuartil porque dejan a su
izquierda a la cuarta parte, la mitad y las tres cuartas partes respectivamente de la muestra ordenada, es decir,
dividen a la muestra ordenada en 4 partes iguales. De igual modo a los percentiles p10, p20, p30... p90 se les
llama deciles por dividir a la muestra ordenada en 10 partes iguales. El cálculo de los percentiles se hace de
modo similar al cálculo de la mediana, pero ellos solo tiene sentido en muestras muy grandes.
p10 de la tabla 4
p10
8
10% (500) = 50 Fórmula
X= X1+
5
75
p10−55
50−16 = 34 p10−55 =
= 2,27 p10 = 57,27
− MEDIDAS DE DISPERSIÓN
Describen o valoran la agrupación o dispersión de los datos, dentro de estos vamos a ver recorrido, rango o
amplitud: no dan demasiada información es poco importante, es la medida de dispersión más simple y de
mayor valor intuitivo se define como la diferencia entre los valores más grande y más pequeño de la muestra
(con la marca de clase)
A = X(n)− X(1)
− DESVIACIÓN MEDIA, VARIANZA Y DESVIACIÓN TÍPICA
Las tres consideran la distancia de cada dato con respecto a la media.
Desviación − es la media aritmética de las desviaciones absolutas a la media.
dm =
Como en el desarrollo matemático esta formula da problemas se utiliza la varianza que se interpreta como la
media de los cuadrados de las desviaciones de la media.
n − muestra
(n−1) − población
La varianza es fácil de tratar matemáticamente por lo que es la medida de dispersión más utilizada en la
información estadística, su principal inconveniente es que viene expresada en unidades que son el cuadrado de
las unidades de las observaciones originales. Para obviarlo (quitarlo) se extrae la raíz cuadrada obteniéndose
así la desviación típica que el la medida de dispersión más usada.
9
Estas fórmulas nos evitan tener que hallar la media:
Para el cálculo de la desviación típica con una variable cuantitativa continua (intervalos de clase) se utiliza la
marca de clase correspondiente, al igual que para la media.
− COEFICIENTE DE VARIACIÓN
Se define como el cociente entre la desviación típica y la media aritmética y se da en %.
CV =
x 100
Este coeficiente sirve para comparar métodos de medidas distintas. Ej. consideramos dos métodos de medidas
distintas, una mide la altura de los individuos con una desviación típica de 1cm y el segundo mide la altura de
los edificios con una desviación típica de 2cm; en principio es mejor aquel método que presente la menor
desviación típica, pero no es lo mismo cometer un error de 2cm en 25m que 1cm en 1,70m, el problema es
que las desviaciones típicas no se pueden comparar porque están referidas a distintas medidas.
1º. CV =
x 100 = 0,6% 2º. CV =
x 100 = 0,08%
Cuanto menor sea el coeficiente de variación mayor es la precisión del método.
− CAMBIOS DE ESCALA
Con frecuencia los investigadores cambian de escala o unidades de medida, vamos a conocer como varían las
medidas de dispersión y posición al cambiar la escala o las unidades de medida. La moda, mediana,
percentiles y derivados, varían con los cambios de escala como lo hace la propia escala. Si a todos los datos de
la muestra se les suma o resta un mismo número su media queda sumada o restada por dicho número y su
varianza permanece inalterada. Si a todos los datos de una muestra se les multiplica o divide por un mismo
número su media queda multiplicada o dividida por tal número; su desviación típica multiplicada o dividida
10
por dicho número y su varianza multiplicada o dividida por dicho número al cuadrado. De un modo general
un cambio de escala consiste es restara un número y dividir por otro, es decir pasar de X a
.
Datos: 4, 6, 8, 10.
Datos: 0, 1, 2, 3.
−PROBABILIDAD
¿Por qué es necesario estudiar probabilidad? Lo que hemos visto hasta ahora se ha limitado al análisis de un
conjunto de datos dado, este método de proceder suele ser insuficiente para satisfacer las exigencias que
plantean la mayor parte de las ciencias experimentales.
El estudio de la población es en muchos casos imposible, entonces hay que proceder al análisis de una o varias
subpoblaciones o muestras y las conclusiones sacadas en ellas extenderlas luego a la población completa, este
es el paso de la estadística descriptiva a la estadística inductiva donde nos va ha hacer falta conocer el manejo
de un instrumento básico que es la probabilidad.
EXPERIMENTOS ALEATORIOS
En la naturaleza podemos observar fenómenos de carácter muy diferente consideremos por ejemplo estos dos
fenómenos: la caída libre de los cuerpos en las proximidades de la tierra y el segundo el consumo de oxígeno
de una cierta especie de peces. En el primer caso nuestras medidas experimentales revelan que en el espacio
recorrido por el cuerpo en su caída solo depende del tiempo que dure la caída. En el segundo caso las
observaciones efectuadas proporcionan datos distintos. En la primera situación bajo un conjunto de
condiciones definidas se produce el mismo resultado por el contrario en la segunda situación aunque
prefijemos la especie de peces, su tamaño, las condiciones ambientales, etc., nuestras medidas de consume de
oxígeno serán diferentes. A los fenómenos de tipo físico, movimiento, pueden considerarse como
deterministas pero la gran mayoría de los problemas de interés medio ambiental, grado de contaminación de
las aguas, son de carácter aleatorio, es aquel en el cual no podemos fijar que un proceso ocurra necesariamente
11
a pesar de realizarlo bajo unas condiciones y circunstancias, esto es lo que se denomina condición de azar y se
interpreta en el sentido de que intervengan factores desconocidos o imprevisibles. El experimento aleatorio es
un proceso que cumple con las siguientes propiedades:
• Se efectúa en base a un conjunto de reglas.
• Se repite o puede concebirse la repetición del mismo.
• No se puede predecir un resultado único, como ejemplo de experimentos aleatorios podemos citar lanzar un
dado, tirar una moneda al aire, seleccionar aleatoriamente e inspeccionar un grupo de piezas.
Al conjunto de todos los resultados posibles de un experimento aleatorio se le denomina espacio muestral del
experimento, suele denotarse E, así para los experimentos citados en el ejemplo anterior tendremos los
siguientes espacios muestrales.
a) Lanzar un dado:
E=
b) Lanzar una moneda al aire:
E=
c) Inspeccionar las piezas:
E = defectuosa, no defectuosa
A cada uno de los subconjuntos del espacio muestral se le llama suceso e evento, se representa comúnmente
por S.
Sa= Sb= Sc=
Cada uno de ellos contiene elementos del espacio muestral del que fue obtenido.
Supongamos que queremos extraer 2 piezas de un conjunto de 5. El espacio muetral para este experimento
estará formado por las siguientes parejas:
Rojo − defectuosa, Azul − no defectuosa.
12345
E=
Si nos interesa conocer el número de piezas defectuosas podemos obtener tres respuestas. Que se
corresponden con los tres eventos posibles: a) ninguna defectuosa, b) una defectuosa, c) las dos defectuosas.
Sa = Sb = Sc =
Al número de veces que ocurre un suceso o evento se le denomina frecuencia absoluta o simplemente
frecuencia y la relación entre esta y el número total de experimentos realizado se define como frecuencia
relativa.
0
12
Cuando el número de experimentos realizado se hace muy grande o tiende a infinito la frecuencia relativa de
ocurrencia de un evento se hace igual a la probabilidad de ocurrencia de dicho evento.
FR (S)=P (S) n
La probabilidad de que un evento ocurra esta dada por la relación entre el número de casos en que el evento
ocurre y el número de experimentos aleatorios realizados. Cuando el número de experimentos tiende a
infinito.
P(S )= 1 Si el evento ocurre siempre.
P(S) = 0 Cuando nunca ocurre.
Otra definición de probabilidad es la relación entre el número de casos favorables y el número de casos
posibles.
P(S)=
Lanzar una moneda:
P(cara) =
Lanzar un dado:
P(4) =
La probabilidad de que suceda una cualquiera de los resultados del espacio muestral del experimento siempre
es igual a la unidad.
Moneda:
P(E) =
El hecho de que las probabilidades de que salga cara o cruz tengan igual valor tiene sentido sólo si el número
de lanzamientos de la moneda se hace infinitamente grande, para un número pequeño de lanzamientos el
resultado puede ser muy distinta. La probabilidad teórica de obtención del 3 al lanzar un dado es ¿Cuál es la
probabilidad de que no salga un 3 ?
P(de que algo no ocurra) = 1−P(de que ocurra)
P(3) P(no salga 3) =
P(1, 2, 4, 5, 6) = P(1) + P(2) + P(4) + P(5) + P(6) =
P( Para sucesos incompatibles.
Sucesos incompatibles o exclusivos
P (A
Sucesos compatibles
13
A = Obtener 1 ó 2
B = Obtener un número par
123
456
P(A) = P(1)+ P(2) =
P(B) = P(2) + P(4) + P(6) =
P
P
P
− PROPIEDADES DE LA PROBABILIDAD
• La probabilidad de un suceso A es un número comprendido entre 0 y 1. 0
• La probabilidad de un suceso imposible es 0 P(ó)=0
• la probabilidad de un suceso es igual a uno menos la probabilidad del suceso contrario P(A)=1−P
• La suma de las probabilidades de todos los sucesos elementales de un fenómeno es igual a la unidad.
• Si un suceso esta incluido en otra la probabilidad del primero a de ser menos o igual que la probabilidad del
segundo.
A
• La probabilidad de la unión de dos sucesos cualesquiera es igual a la probabilidad del primero más la del
segundo menos la probabilidad de la intersección de ambos.
• Si dos sucesos son incompatibles (exclusivos) la probabilidad
de la unión de ellos es la suma de las probabilidades.
• Experimentos compuestos/probabilidad condicionada
Si dos sucesos son independientes:
Si son sucesos dependientes:
Si P(A) " 0
Si P(B) " 0
− EXPERIMENTO COMPUESTOS (DIAGRAMA DE ÁRBOL)
Reciben el nombre de experimentos compuestos aquellas experiencias aleatorias que consisten en la
realización consecutiva de dos o más experiencias simples. El espacio muestral del experimento compuesto es
el conjunto de todos los resultados elementales que tienen lugar en un experimento compuesto. La
probabilidad de un experimento cómputos puede calcularse multiplicando las probabilidades de los sucesos
14
elementales que conforman la experiencia compuesta. Los diagramas de árbol son una herramienta muy útil
en la descripción de las experiencias compuestas y en el calculo de probabilidades asociadas a estas
experiencias.
Ej. Dos personas A, B organizan el siguiente juego: tiran un dado tres veces, si sale algún 1 gana A y si no
sale ningún 1 gana B. ¿Cuál de las dos personas tiene más probabilidades de ganar?
• sale algún 1
• nos ale ningún 1
P(B) =
P(A) =
P(A) =
P(A) = 1 − P(B)
P(A) = 1−= 0,4213
Cuando es unión se suma.
Cuando es intersección se multiplica.
− SUCESOS DEPENDIENTES E INDEPENDIENTES
Son numerosos los experimentos compuestos que se realizan con reemplazamiento o devolución de las
experiencias previas. En estos casos éstos no influyen o condicionan los experimentos que siguen, en estas
situaciones decimos que los sucesos que ocurren son independientes. Por contra en los experimentos
compuestos sin devolución o emplazamiento los resultados de unas experiencias influyen o condicionan a las
otras, en estas situaciones decimos que los sucesos son dependientes.
Para dos sucesos A y B que pueden provenir de experiencias compuestas, decimos que A y B son
independientes si se cumple P(A
Para dos sucesos A y B que pueden provenir de experimentos compuestos, decimos que son dependientes si
cumplen P(ALos sucesos A y B cuando son dependientes cumplen P(A supuestos que ha ocurrido A) y a estos
se le llama probabilidad de B condicionada a A: P(B/A)
Una caja contiene 10 tornillos de los cuales 1 es defectuosos ¿Cuál es la probabilidad de que al extraer dos
tornillos estos no sean defectuosos? Sin reemplazamiento.
A − Que el 1º sea bueno
B − Que el 2º sea bueno
P(A) =
P(B) =
P(A = P(A) · P(B/A)
15
P (A =
a=4
b=2
1,3,5,7
dm =
A
B
A
B
A
B
16
Documentos relacionados
Descargar