Métodos estadíticos de la ingeniería

Anuncio
MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA
1. – ¿Cual es la diferencia entre combinaciones y variaciones de m elementos tomados de n en n?
En las variaciones influye el orden en que estén colocados los elementos, mientras que en las
combinaciones NO influye el orden.
2. – ¿Existen situaciones donde pueden asignarse probabilidades de manera indiferente mediante la
regla de Laplace o la frecuentista?
Sí. Por ejemplo cuando se realizan un número elevado de experimentos, siendo los sucesos igualmente
verosímiles. Por ejemplo, lanzar una moneda al aire un número elevado de veces.
3. – ¿Es cierto que el teorema de Bayes puede aplicarse en cualquier situación?
No. Se requiere que los sucesos sean tales que su unión nos dé el suceso seguro y que su intersección,
tomados de dos en dos, sea cero.
4. – ¿Que es una variable aleatoria?
Una forma de expresar numéricamente el resultado de un experimento aleatorio. Por ejemplo, sea X=”nº
obtenido al lanzar un dado”, entonces X= (1,2,…,6).
5. – ¿Existen diferentes tipos de espacio muestrales asociacios a V.A.?
Sí. Dependiendo del rango que puedan tomar. Así, tenemos variables discretas (pueden tomar cualquier
valor finito) y continuas (pueden tomar valores infinitos o continuos).
6. – Concepto de esperanza matemática de una V.A.:
Es el valor esperado, lo que se espera ganar en una partida de azar. El producto de la cantidad potencial
que un jugador espera ganar y la probabilidad de que gane.
7. – Sean las variables aleatorias X1 y X2, de las que se conoce E[X1], V[X1], E[X2], V[X2] y COV[X1,X2] y sea
otra V.A.Y tal que………:
V(Y)=(b1)2·V[X1]+(b2)2·V[X2].
8. – Existe alguna medida que sirva para comparar la variabilidad entres dos V.A. cualesquiera:
S
X
Sí. CV = ̅ . Coeficiente de variación. A mayor coeficiente, menor homogeneidad de datos.
9. – La distribución F de Snedecor, ¿puede expresarse como una distribución asociada a la normal?
Sea X1∈ 𝛸 2 𝑛1 y X2∈ 𝛸 2 𝑛2 dos variables aleatorias independientes. La variable aleatoria X definida como
𝑋 /𝑛
𝑋 = 𝑋1 /𝑛1 se dice que sigue una distribución F de Snedecor con n1 y n2 grados de libertad
2
2
10. – Enuncie el teorema central de límite de Lindeberg-levy:
Sean X1, X2,...,Xn variables aleatorias independientes entre sí, y tales que, todas ellas, tengan la misma
distribución con igual media e igual varianza, entonces se cumple que 𝑍 =
𝑥−𝑢
√𝑛·𝜎 2
siendo N(0,1).
11. – ¿Cual es la diferencia entre variables numéricas medidas en una escala por intervalos y variables
numéricas medidas en una escala por ratios?
La diferencia es que en la escala por ratios se le puede asignar un punto de origen de calor cero a la unidad
de predicción.
12. – ¿Es lo mismo coeficiente de correlación simple que múltiple?
No. El coeficiente de correlación simple estudia el grado de relación entre DOS variables aleatorias,
mientras que el múltiple estudiar la interdependencia entre más de Dos variables aleatorias.
13. – ¿Existe alguna diferencia entre estadístico y estimador?
Sí. El estadístico puede ser cualquier función que se obtenga a partir de una muestra, mientras que el
estimador también es una función de la muestra pero debe cumplir, además, los requisitos de insesgadez,
consistencia, suficiencia y eficacia.
14. – ¿Existen diferencias entre muestra aleatoria y realización de una muestra?
En un muestreo aleatorio las distintas observaciones se obtienen con igual probabilidad y de forma
independiente y cuando se realiza el muestre se puede hacer con o sin reemplazamiento.
15. – ¿Existe algún procedimiento genérico para obtener estimadores puntuales?
Si. Siendo los principales métodos el de máxima verosimilitud y el de los mínimos cuadrados.
16. – ¿Que quiere decir que un estimador sea consistente?
Cuando al aumentar n de forma indefinida, converge en probabilidad al parámetro estimado.
17. – ¿Cuando se puede decir que un estimador es eficiente?
Decimos que θ1 es más eficiente que θ2 cuando V[θ1]<V[θ2]
18. – ¿Como se interpreta el coeficiente de confianza en la estimación por intervalo de confianza de un
parámetro poblacional desconocido?
El intervalo de confianza I(1-α) de cualquier parámetro (µ,σ2) quiere decir que dicho parámetro se encuentra
dentro de dicho intervalo con una certeza de (1-α)%.
19. – ¿Que es error de tipo 1 y de tipo 2 en un contraste de hipótesis?
Error de tipo 1 cuando se rechaza H0 siendo cierta, y error de tipo 2 cuando se acepta H0 siendo falso.
20. – ¿Es igual espacio paramétrico θ0 asociada a hipótesis nula que región de aceptación C0 de la
hipótesis nula?
(1) Espacio paramétrico H0: Conjunto de posibles valores de parámetro θ que estamos contrastando bajo
hipótesis nula.
(2) Región de aceptación H0: Conjunto de valores muestrales de un estadístico que lleva a la decisión de
aceptar la hipótesis.
21. – Explicar cuál es la desigualdad de Tchbycheff:
La desigualdad de Thebycheff afirma que si consideramos un intervalo de centro µ y radio k veces σ, la
probabilidad de realizar una observación de la variable y que esta no esté en dicho intervalo es inferior o
igual a 1/k2
22. – ¿Cual es la diferencia conceptual entre una distribución de tipo geométrica y otra de tipo binomial
negativa?
La geométrica nos indica la probabilidad de que ocurra el primer éxito, mientras que la binomial negativa
nos da la probabilidad del éxito numero k.
23. – ¿En qué consiste un proceso de tipificación?
Hacer una relación que nos permita calcular probabilidad de sucesos asociados a V.A. normales de
cualquier pareja de parámetros, usando las tablas de la N(0,1).
24. – ¿Que representan los grados de libertad en una distribución t de Student?
El grado de achatamiento que tiene la curva con respecto a la normal.
25. – Enuncie el teorema central del límite de De Moivre:
Una sucesión de variables aleatorias {Xn} verifica este teorema si la sucesión de distribuciones binomiales
del mismo parámetro es asintóticamente N(np,npq).
26. – ¿En qué consiste la corrección de continuidad de Yates?
Consiste en sumar o restar 0.5 al valor que tome X, y así compensar los valores reales que toma la V.A.
continúa.
27. – ¿Defina el concepto de V.A. n-dimensional?
Se da cuando se estudian varias características del colectivo.
28. – ¿Como se interpretaría que el coeficiente de correlación de Pearson entre dos variables numéricas
fuese cero. Serian las dos variables independientes?
Que la relación entre las dos variables es nula. Sí que serian independientes ya que no hay relación entre
ellas.
29. – ¿Que es una muestra aleatoria?
La que se obtiene de forma que se obtienen con igual probabilidad y de forma independiente unos de
otros.
30. – Función de verosimilitud de una muestra aleatoria:
Sea una población X en la que se conoce la forma de su distribución, o sea de su función de densidad (si es
continua) o de probabilidad (si es discreta), f(x)=f(𝑥̅ ;θ).
El diseño experimental se basa en la toma de una muestra aleatoria y a partir de esta se define la función
de verosimilitud.
31. – ¿Cual es la diferencia entre muestreo estratificado y muestreo por conglomerados?
En el muestreo estratificado los subconjuntos en los que se divide la población se toman lo más
heterogéneos entre sí, mientras que por conglomerados se toman los más homogéneos.
32. – Defina el concepto de función de distribución empírica o muestral:
Sea una población W en la que se observa una característica X cuya distribución se supone Normal, de
media y varianza desconocida X perteneciente a N(µ,σ2).
33. – ¿Cual es la importancia principal del teorema de Glivenko-Cantelli?
Este teorema justifica el proceso inferencial asociado al muestreo aleatorio simple, es decir, a partir de una
muestra puede obtenerse información sobre la distribución de la característica X en la población W. Cuanto
mayor sea la muestra, las diferencias entre la distribución de la población y la de la muestra cada vez son
más pequeñas.
34. – ¿Cuando puede decirse que un estimador es el mejor estimador insesgado?
Cuando cumple las propiedades de insesgadez, consistencia y eficacia para el parámetro en cuestión.
35. – Supongamos dados un I0,9(σ2) y un I0,95(σ2). ¿Existe alguna relación entre ambos intervalos de
confianza? ¿Cual contiene a cual?
La relación existente es que el I0,9(σ2) está contenido en el I0,95(σ2)
36. – ¿Cual es la diferencia, si existe, entre coeficiente de confianza y nivel de significación?
Coeficiente de confianza es 1-α y nivel de significación es α.
37. – Comentar brevemente el método de Student para la construcción de intervalos de confianza:
Si se dispone de un estadístico T=T(x1,x2,…,xn;θ) que es función continua y monótona de teta en el espacio
paramétrico de θ, y cuya distribución muestral es conocida y no depende de θ, se deduce que el intervalo
de confianza, 1-α a partir de los cuantiles t (1-α_2) y t(α_1) tales que α1+α2=α pues P[t(1-α_2)<T(𝑥̅ ;θ)< α_1]=1-α
38. – ¿Cual es el error que se comete en la estimación de µ en una población N(µ,σ), donde se conoce
sigma?
I1-α(µ)= (𝑥̅ - ε; 𝑥̅ + ε)  𝜀 = ∓𝐼𝛼/2
𝜎
√𝑛
39. – ¿Cual es la diferencia entre un contraste de hipótesis paramétrico y otro no paramétrico?
El objetivo general de muchos métodos estadísticos es obtener información sobre la distribución de una
característica X medida sobre los elementos de un colectivo a partir de muestras aleatorias. A veces basta
con obtener información n sobre parámetros de X como la media o la varianza. Las técnicas
correspondientes pertenecen a una rama denominada estadística paramétrica. En otras ocasiones se trata
de realizar inferencias sobre la distribución F(x) de X sin hacer referencia a ningún parámetro poblacional,
métodos asociados a la estadística no paramétrica.
40. – ¿En qué consiste una regla de decisión en un contraste de hipótesis?
Se toma una muestra aleatoria simple en X y a partir de los valores de la muestra concreta se decide si
aceptar H0. Para ello se construye una regla de decisión formada por dos conjuntos, la región de aceptación
C0 y la región crítica C1. Por lo tanto si la muestra concreta x media pertenece a C0 se acepta la hipótesis H0
y si no, se acepta la H1.
41. – ¿Que son las llamadas ecuaciones normales den la obtención de un modelo de regresión?
El método de los mínimos cuadrados establece como lógica en la estimación de los parámetros de
regresión β0 y β1, considerar aquellos que hagan mínima la suma de cuadrados de los residuos, es decir, los
valores mínimos de H, lo que se consigue resolviendo en llamado sistema de ecuaciones normales.
42. – ¿Que son los residuos en regresión?
La distancia entre el valor observado y el estimado es el error cometido en la estimación épsilon.
Denominado ε=yi-𝑦̂𝑖 estimada.
43. – ¿Para qué se utiliza el coeficiente de determinación?
Al término p2y, cuadrado del coeficiente de correlación múltiple, se le denomina coeficiente de
determinación y es una medida de la interdependencia lineal entre y e 𝑦̂𝑖 estimada, o lo que es lo mismo,
entre Y y las variables X1,X2,…,Xn.
Descargar