SYLLABUS ESTADISTICA DESCRIPTIVA

Anuncio
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
RED NACIONAL UNIVERSITARIA
UNIDAD ACADEMICA DE SANTA CRUZ
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
CARRERA DE MARKETING Y PUBLICIDAD
CUARTO SEMESTRE
SYLLABUS DE LA ASIGNATURA
ESTADÍSTICA DESCRIPTIVA
Autor: Ing. Raúl Arce Justiniano.
Gestión Académica II/2011
U N
I V E
R S
I D A D
D E
A Q
1
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
UDABOL
UNIVERSIDAD DE AQUINO BOLIVIA
Acreditada como PLENA mediante R.M. 288/01
VISION DE LA UNIVERSIDAD
Ser la Universidad líder en calidad educativa.
MISION DE LA UNIVERSIDAD
Desarrollar la Educación Superior Universitaria con calidad
y Competitividad al servicio de la sociedad
Estimado (a) alumno (a):
La Universidad de Aquino te brinda a través del syllabus, la oportunidad de contar con una
compilación de materiales que te serán de mucha utilidad en el desarrollo de la asignatura.
Consérvalo y aplícalo según las instrucciones del docente.
U N
I V E
R S
I D A D
D E
A Q
2
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
SYLLABUS
Asignatura:
Bioestadística
Código:
FIT-212
Requisito:
PRA-115
Carga Horaria:
Créditos:
60 horas Teórico Prácticas
3
I. OBJETIVOS GENERALES DE LA ASIGNATURA.

Dotar al estudiante de los conocimientos necesarios para utilizar los procedimientos de bioestadística en
trabajos de investigación.

Interpretar las principales fuentes de información y los datos elaborados en análisis estadísticos.

Aplicar métodos estadísticos para el análisis de estado de la salud pública con respecto a las tasas
poblacionales en las áreas de estudio relacionadas con la especialidad.

Formular medidas de control cuando hay brotes en enfermedades infecciosas.

Diagnosticar, tratar y prevenir enfermedades de diferentes agentes etiológicos.
II. PROGRAMA ANALÍTICO DE LA ASIGNATURA:
UNIDAD I: CONCEPTOS PRELIMINARES.
1.1 Introducción.
1.1.1 Naturaleza de la bioestadística.
1.1.2 Población y muestra.
1.1.3 Métodos bioestadísticas.
1.1.4 Características, variables, atributos y recorrido de una población.
UNIDAD II: FRECUENCIAS.
2.1 Clases de frecuencias.
2.1.1 Frecuencia absoluta ordinaria, acumulada, relativa, relativa acumulada.
2.1.2 Series estadísticas, tablas y distribución de frecuencias.
2.1.3 Aplicaciones de las series estadísticas.
UNIDAD II: ESTADÍSTICAS DE UNA SOLA VARIABLE.
3.1 Tipos de distribución.
3.1.1 Distribuciones del tipo I
3.1.2 Distribuciones del tipo II
3.1.3 Distribuciones del tipo III
3.1.4 Marcas de clase.
3.1.5 Aplicaciones de la distribución de frecuencias
U N
I V E
R S
I D A D
D E
A Q
3
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
UNIDAD IV: REPRESENTACIONES GRÁFICAS.
4.1 Gráficas de:
4.1.1 Diagramas de barras.
4.1.2 Histogramas.
4.1.3 Polígono de frecuencias.
4.1.4 Curvas de frecuencias.
4.1.5 Ojivas: ascendente y descendente.
4.1.6 Asimetría de una curva.
4.1.7 Coeficiente de una asimetría.
4.1.8 Gráfica circular.
4.1.9 Aplicaciones de las curvas.
UNIDAD V: MEDIDAS DE POSICIÓN CENTRAL O PROMEDIOS
5.1 Características:
5.1.1 Media aritmética.
5.1.2 Mediana.
5.1.3 Moda.
5.1.4 Media armónica.
5.1.5 Media cuadrática.
UNIDAD VI: MEDIDAS DE DISPERSIÓN.
6.1 Representaciones de la media.
6.2 Desviación media.
UNIDAD VII: VARIANZA.
7.1 Varianza.
7.2 Desviación Standard
UNIDAD VIII: COEFICIENTE DE VARIACIÓN
8.1 Coeficiente de variación de Pearson.
8.2 Casos de redondeos si no son promedios.
UNIDAD III. VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES
TEMA 7. DISTRIBUCIONES BIDIMENSIONALES.
7.1.
7.2.
7.3.
7.4.
7.5.
Introducción.
Tablas estadísticas bidimensionales.
Frecuencias absolutas y relativas bidimensionales.
Distribuciones marginales.
Distribuciones condicionales.
TEMA 8. REGRESIÓN Y PREDICCIÓN.
8.1.
8.2.
8.3.
8.4.
Diagrama de dispersión.
Correlación lineal.
Regresión lineal simple.
Método de los mínimos cuadrados.
U N
I V E
R S
I D A D
D E
A Q
4
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
8.5.
8.6.
8.7.
Análisis de resultados.
Predicción.
Problemas de regresión lineal
III. ACTIVIDADES A REALIZAR DIRECTAMENTE EN LA COMUNIDAD
i.
Tipo de asignatura para el trabajo social.
Asignatura de Apoyo
ii.
Resumen de los resultados del diagnóstico realizado para la detección de
los problemas a resolver en la comunidad.
Los datos obtenidos de las instituciones responsables de las estadísticas
de la población con respecto a las necesidades básicas que tienen los
habitantes del PLAN 3000
iii.
Nombre del proyecto al que tributa la asignatura
Recopilación de datos de servicios generales
iv.
Contribución de la asignatura al proyecto.
Aplicación de los conocimientos estadísticos y transferencia de actitudes, de los estudiantes para
con los vecinos de las juntas vecinales en estudios
v.
Actividades a realizar durante el semestre para la implementación del proyecto.
Trabajo a realizar por
los estudiantes
Organización de las
actividades
del
proyecto
Coordinación con los
dirigentes
para
ejecutar el trabajo
Trabajo de campo o
encuesta
Procesamiento
de
datos (empleo de
paquete estadístico
SPSS )
Análisis
de
la
información
Presentación
del
proyecto
U N
I V E
Localidad
Incidencia social
Fecha
UDABOL
(Aula)
Agosto
2007
PLAN 3000
Socialización
Septiembre
2007
PLAN 3000
Entrevista
Septiembre
2007
Octubre
2007
UDABOL
(Aula)
UDABOL
(Aula)
PLAN 3000
R S
I D A D
Noviembre
2007
Diciembre
2007
Socialización
D E
A Q
5
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
IV. EVALUACIÓN DE LA ASIGNATURA

PROCESUAL O FORMATIVA
A lo largo del semestre se realizarán 2 tipos de actividades. Las primeras serán de aula, que consistirán en
clases teóricas, exposiciones, repasos cortos, trabajos grupales.
Las segundas serán actividades de “aula abierta con la participación del estudiantado en las actividades de
trabajo social y en el proyecto” RECOPILACION DE DATOS DE SERVICIOS GENERALES
Cada una se tomará como evaluación procesual calificándola entre 0 y 50 puntos independientemente de la
cantidad de actividades realizadas por cada alumno.

DE RESULTADOS DE LOS PROCESOS DE APRENDIZAJE O SUMATIVA (examen parcial o final)
Se realizan 2 evaluaciones parciales con contenido teórico y práctico. El examen final consistirá en un
examen escrito (con un valor del 80% de la nota del final) y en la presentación y socialización de los
documentos resultantes del trabajo de las BRIGADAS realizadas en las juntas vecinales (20% restante de la
nota).
V.- BIBLIOGRAFIA BASICA:


●
DANIEL, WAYNE. Bioestadística. Editorial Limusa Wiley – México D. F. 2004. (574.015 195 D22)
MOYA,RUFINO. Probabilidad e inferencia estadística. 1ra. Edición. Ed. San Marcos Perú (519
M87)
ZIMMERMANN, FRANCISCO. Estadística para investigadores. Universidad de la Sabana.
Colombia 2004. (519.5 Z66)
BIBLIOGRAFÍA COMPLEMENTARIA:






AMON J. “Estadística para Psicólogos.”, Editorial Pirámide – Madrid. 1986.
E. CASA ARUTA, “Estadística descriptiva”, Editorial, Vivens Vives – Barcelona. 1973.
SCHAUM, “Estadística” Mursay Spiegel. – Madrid. 1970.
H. RICO QUIROGA “Estadística Pedagógica”. Vivens Vives – Madrid. 1970.
E. CANSADO, “Curso de Estadística General”. Tupak Catari – La Paz. 1960.
MA. MURILLO OPORTO “Elementos de Estadística”. Tupak Catari – La Paz. 1958.
VI. PLAN CALENDARIO
U N
I V E
R S
I D A D
D E
A Q
6
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
SEMANA
ACTIVIDADES ACADÉMICAS
OBSERVACIONES
1ra.
Avance de materia
UNIDAD I
2da.
Avance de materia
UNIDAD I
3ra.
Avance de materia
UNIDAD II
4ta.
Avance de materia
UNIDADII
5ta.
Avance de materia
UNIDAD III
6ta.
Avance de materia
UNIDAD III
7ma.
Avance de materia
Primera Evaluación Primera Evaluación
8va.
Avance de materia
Primera Evaluación Primera Evaluación
9na.
Avance de materia
UNIDAD IV
10ma. Avance de materia
UNIDADIV
11ra. Avance de materia
UNIDAD IV
12da. Avance de materia
UNIDAD V
13ra. Avance de materia
UNIDAD V
14ta.
Avance de materia
Segunda Evaluación
15ta.
Avance de materia
Segunda Evaluación
16ta.
Avance de materia
UNIDAD VI
17ma. Avance de materia
UNIDAD VI
18va. Avance de materia
UNIDAD VII
19na. Avance de materia
UNIDAD VII
20va
Presentación de Notas
2da. Instancia y Cierre de gestión
I V E
Segunda Evaluación
Evaluación final
Evaluación final
U N
Segunda Evaluación
R S
I D A D
D E
A Q
7
Presentación de Notas y Informe
final
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
WORK PAPER # 1
UNIDAD O TEMA: Conceptos preliminares.
TITULO: Población y muestra
FECHA DE ENTREGA:
PERIODO DE EVALUACIÓN:
POBLACIÓN Y MUESTRA:
La Bioestadística tiene por objeto el estudio de los colectivos y de las relaciones que existen entre ellos
entendiendo por colectivo, población o conjunto grande de elementos, personas, animales o cosas. Así,
pues, la bioestadística necesita de una masa de elementos para poder ser aplicada, puesto que trata de
hallar leyes de comportamiento del conjunto en general y no de cada uno de los elementos en particular.
La población, puede ser, según su tamaño, finita o infinita. Es población finita aquella que tiene un número
determinado, por grande que sea, de elementos, mientras que una población infinita es aquella que tiene un
número infinito de elementos.
Esta distribución tan solo existe en teoriza, pues, en la practica no nos encontramos nunca con poblaciones
de un numero enormemente grande de elementos. Sin embargo en la bioestadística de matemática la
población con numero “suficientemente” grande de elementos son tratados como si fueran infinitos.
Cuando la población o colectivo es muy grande, se hará difícil la observación de los caracteres a estudiar en
cada uno de los elementos, debido al enorme costo que acarrearía la observación de toda la población y
debido también a la enorme capacidad de trabajo y el tiempo necesario para llevar a cabo dicha observación
exhaustiva.
Estos inconvenientes pueden ser superados mediante la elección de una muestra lo suficientemente
representativa de la población, entendiendo por muestra una parte del conjunto total de elementos que
componen la población o colectivo.
CUESTIONARIO:
1.
2.
3.
4.
¿Qué entiende por población?
¿Qué entiende por muestra?
¿Qué es una muestra representativa?
¿Diferencia entre muestra finita e infinita?
U N
I V E
R S
I D A D
D E
A Q
8
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
DIF’s # 1
UNIDAD O TEMA: Conceptos preliminares.
TITULO: Población y muestra – Representaciones gráficas.
FECHA DE ENTREGA:
PERIODO DE EVALUACIÓN:
Muchas veces, una buena representación grafica de la distribución en estudio puede ayudar eficazmente a
extraer conclusiones sobre el comportamiento real de la variable. Para ello es necesaria que el impacto
visual de la representación grafica responda a la realidad y por consiguiente, que el método seguido este
basado en unos principios geométricos.
Pese a la gran importancia que van adquiriendo los sistemas de representación de las variables
estadísticas, no hemos de perder nunca de vista que el verdadero objetivo de dichas representaciones
graficas no esta mas que en la divulgación de los datos estadísticos cuya evaluación y composición se
hacen mas comprensible de forma plástica, no debiendo pasar de mero instrumento auxiliar de análisis y
representación por parte del investigador.
De las muchas formas de representación grafica que se utilizan comúnmente mencionaremos las siguientes:
Diagrama de barras.
Histograma.
Polígono de frecuencias.
Curva de frecuencias.
Ojiva ascendente y descendente
Grafica circular.
TAREA
El grupo de trabajo deberá, mediante ejemplos especificar en que ocasiones se utiliza cada una de estas
graficas.
U N
I V E
R S
I D A D
D E
A Q
9
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
WORK PAPER # 2
UNIDAD O TEMA: Estadísticas de una sola variable.
TITULO: Tipos de distribución: 1º, 2º tipo.
FECHA DE ENTREGA:
PERIODO DE EVALUACIÓN:
Estadísticas de una sola variables:
Tipos de distribuciones.
Las distribuciones de frecuencias de una sola variable, se clasifican en tres tipos, eligiéndose uno u otro
tipo de consideración al número de observaciones y al número de valores distintos que toma la variable.
Distribuciones del tipo I
Son aquellas distribuciones que constan de un reducido número de observaciones y, en consecuencia de
un reducido número de valores distintos que toma la variable.
Su presentación no exige una técnica determinada, ya que, además, casi no son susceptibles de
tratamiento estadístico, puesto que, para que exista éste, es necesario un volumen masivo de
observaciones.
Distribuciones del tipo II
Cuando el número de observaciones es grande, pero el número de valores distintos que toma la variables
es pequeño, distribuiremos o agruparemos los resultados de las observaciones según el tipo II, es decir,
disponiendo los datos en dos columnas: una para los valores distintos que toma la variable y otra para las
frecuencias absolutas de cada uno de ellos.
CUESTIONARIO
1. ¿Que se entiende por tablas de distribución?
2. ¿En que consiste las distribuciones correspondientes al 1° tipo?
3. ¿Plantéese un ejercicio supuesto, que corresponda al 2° tipo?
U N
I V E
R S
I D A D
D E
A Q
10
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
DIF’s # 2
UNIDAD O TEMA: Estadísticas de una sola variable.
TITULO: Tipos de distribución: 1º, 2º tipo.
FECHA DE ENTREGA:
PERIODO DE EVALUACIÓN:
Las estadísticas de una sola variable, presentan en su distribución distintos tipos por la observación del
comportamiento de una población, como en el 1° tipo, ya que la población de estudio es muy pequeño
considerando al número de observaciones y al número de valores distintos que toma la variable.
Lo que no ocurre con el comportamiento del colectivo en las tablas de distribución que corresponde al 2°
tipo. Donde las observaciones de la población son grandes y el número de valores que toma la variable
también son grandes y necesita otro tratamiento muy distinto al 1°! Tipo.
De los distintos tipos en las tablas de distribución se presentan:
1° tipo.
2° tipo.
3° tipo
TAREA
El grupo de trabajo deberá, mediante ejemplos especificar en que ocasiones se utiliza cada una de estos
de distribuciones
U N
I V E
R S
I D A D
D E
A Q
11
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
WORK PAPER # 3
UNIDAD O TEMA: Estadísticas de una sola variable.
TITULO: Tipos de distribución: 3º tipo.
FECHA DE ENTREGA:
PERIODO DE EVALUACIÓN:
Distribuciones del tipo III.
Si el número de observaciones es grande y el número de valores distintos que toma la variable es también
grande, agrupamos los resultados obtenidos de las observaciones según una distribución del tipo III, es
decir, eligiendo unos intervalos Li-1---- Li con amplitud variable o fija ai que se dispondrán en una primera
columna. La segunda contendrá el número de frecuencias correspondientes a cada intervalo.
U N
I V E
1
3
5
2
4
4
6
1
2
4
3
4
1
3
6
7
1
4
3
6
1
4
6
2
4
2
3
4
3
5
5
4
1
2
6
5
4
7
3
1
4
3
2
7
1
4
2
7
6
5
R S
I D A D
D E
A Q
12
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
Li – 1 ------ Li
Lo
L1
L2
L3
.
.
Lk-1
-
L1
L2
L3
L4
.
.
Lk
-
Li – 1 ------ Li
ni
n1
n2
n3
n4
.
.
nk
0
1
2
3
4
5
6
N
ni
1
2
3
4
5
6
7
8
7
8
12
5
6
4
50
Nota. En ambos tipos se evidencia que el número de valores distintos de la variable y los intervalos k será
siempre inferior al número total de observaciones de la población N.
CUESTIONARIO
1. ¿Que se entiende por tablas de distribución, que corresponden al 3° tipo?
2. ¿En qué consiste la diferencia del: 1°, 2° y 3° tipo?
3. ¿Plantéese un ejercicio supuesto, que corresponda al 3° tipo?
U N
I V E
R S
I D A D
D E
A Q
13
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
DIF´s
# 3
UNIDAD O TEMA: Estadísticas de una sola variable.
TITULO: Tablas de distribución correspondientes al 3° tipo
FECHA DE ENTREGA:
PERIODO DE EVALUACIÓN:
Distribuciones del tipo III.
Si el número de observaciones es grande y el número de valores distintos que toma la variable es también
grande, agrupamos los resultados obtenidos de las observaciones según una distribución del tipo III, es
decir, eligiendo unos intervalos Li-1---- Li con amplitud variable o fija ai que se dispondrán en una primera
columna.
La segunda contendrá el número de frecuencias correspondientes a cada intervalo.
Lo que no ocurre con el comportamiento del colectivo en las tablas de distribución que corresponde al 3°
tipo. Donde las observaciones de la población son grandes y el número de valores que toma la variable
también son grandes y para su tratamiento, se tiene que transformar al segundo tipo, sacando la marca de
clase y operar como tal.
De los distintos tipos en las tablas de distribución se presenta:
3° tipo
TAREA
El grupo de trabajo deberá contestar las siguientes interrogantes y demostrarlas en el aula mediante
ejemplos
- ¿Qué se hace para trabajar con las tablas de distribución, que corresponden al 3° tipo?
- Realiza un trabajo de tu imaginación en forma supuesta.
U N
I V E
R S
I D A D
D E
A Q
14
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
WORK PAPER # 4
UNIDAD O TEMA: Medidas de posición central o promedios.
TITULO: Características: Media, mediana y moda.
FECHA DE ENTREGA:
PERIODO DE EVALUACIÓN:
Media aritmética.
La medida de posición central o promedio más corriente es la llamada media aritmética simple que se
define, como del primer tipo.
Se suma todas las observaciones de la variable (xi) y se divide entre el total de las observaciones.
Para alas distribuciones del tipo II y III, la media aritmética es igual a la sumatoria de la multiplicación de la
variable por la frecuencia absoluta ordinaria y este resultado se divide por la población, que, resulta de la
sumatoria de las observaciones de la frecuencia absoluta.
Para el tipo III, cuando tiene amplitud de intervalo. Para su tratamiento se convierte al tipo II, sacando la
marca de clase (m.c.) de las amplitudes de intervalo (a.i.).
Mediana.
El promedio llamado mediana se refiere como el valor del elemento central del colectivo, ordenados todos
sus elementos en el sentido creciente o decreciente de sus valores.
Si existen dos elementos centrales, por tratarse de un Nº par, la mediana se calcularía por la media
aritmética de los dos valores correspondientes.
El método más práctico y cómodo para encontrar la mediana en las distribuciones del tipo II es calcular la
columna de las frecuencias acumuladas (Ni), y observar la fila de la primera Ni mayor que la mitad de la
población, el valor de xi correspondiente a esta fila es, por definición la mediana.
En las distribuciones del tipo III, puede hallarse la mediana eligiendo cualquiera de los dos caminos
siguientes.

Transformar la distribución del tipo III, en una del tipo II, mediante las marcas de clase y hallar la
mediana consecuentemente.

Una vez hallada la columna de las frecuencias acumuladas (Ni), aplicar la fórmula al intervalo
correspondiente, superior inmediato.
U N
I V E
R S
I D A D
D E
A Q
15
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
Esta fórmula se fundamenta en la hipótesis de una distribución uniforma de las frecuencias a lo largo de
todo el intervalo.
Moda.
La moda es el valor de la variable que más veces se repite, es decir, el valor de la variable que viene
afectada por la máxima frecuencia de la distribución.
En las distribuciones del tipo III, pueden seguirse también dos caminos.

Transformar en una del tipo II, mediante las marcas de clase y tratarlas como tal.

Observar el intervalo al cual correspondería la mayor altura del histograma correspondiente
(intervalo modal) y aplicar a él la fórmula correspondiente a la moda. ( Se halla en el Work paper
complementario).
Cuando la distribución fuese de amplitud constante obtendríamos el intervalo modal con la simple
observación de la columna de frecuencias, correspondiéndole precisamente la mayor de todas ellas, de
dicho intervalo se aplica la fórmula correspondiente.
Las distribuciones con una sola moda son llamadas unímodales, y las distribuciones con más de una moda
se llaman plurimodales, vi modales, trimodales, etc.
CUESTIONARIO
1. Observar el intervalo al cual correspondería la mayor altura del histograma correspondiente (intervalo
modal) y aplicar a él la fórmula correspondiente a la moda. (Se halla en el Work paper complementario).
2. ¿Que se entiende por medidas de posición central?
3. ¿En qué consiste la diferencia de la media aritmética, mediana y moda o modo?
4. Plantéese un ejercicio real con las edades y peso de tus compañeros de clase.
U N
I V E
R S
I D A D
D E
A Q
16
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
DIF’s # 4
UNIDAD O TEMA: Medidas de posición central o promedios.
TITULO: Media, mediana y moda.
FECHA DE ENTREGA:
PERIODO DE EVALUACIÓN:
Realiza los ejercicios contemplados en tu Work paper complementario, de acuerdo a la codificación
correspondiente y entrega tus ejercicios en el momento oportuno para tu calificación procesual.
Realizar los ejercicios: 10, 11, 12 y 13 que es una miscelánea de las medidas de posición central.
Nota. Trabaja siempre con tu par para el mejor aprendizaje y fijar mejor el conocimiento de la estadística.
Hallar la media aritmética de la siguiente distribución de frecuencias.
1. Se tiene las siguientes distribuciones:
4
4
4
5
7
5
4
5
6
4
3
6
4
8
6
5
6
5
4
5
5
6
6
5
6
7
7
3
6
4
5
5
7
5
8
8
2
7
4
4
9
9
4
9
5
5
4
4
7
6
1
7
4
5
6
2
1
8
5
5
8
5
5
7
4
4
5
5
5
9
5
9
8
2
4
5
5
4
5
5
1
9
4
3
9
7
6
8
6
4
1
4
4
5
1
5
9
4
5
TAREA
El equipo de trabajo deberá realizar el siguiente ejercicio:
Tabular en una tabla estadística.
Hallar los límites. (Inferior y superior).
Graficar: El diagrama de barras, histograma y polígono de frecuencias
U N
I V E
R S
I D A D
D E
A Q
17
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
WORK PAPER # 5
UNIDAD O TEMA: Medidas de dispersión.
TITULO: Características : Desviación media, Varianza, desviación
Standard o tipo y coeficiente de variación de Pearson.
FECHA DE ENTREGA:
PERIODO DE EVALUACIÓN:
MEDIDAS DE DISPERSIÓN:
Representatividad de la media: Dispersión y concentración. Aun siendo la media aritmética el promedio mas
utilizado en la practica, muchas veces puede dar lugar a falsas interpretaciones. Esto ocurrirá cuando no se
tenga suficiente grado de representatividad, es decir, cuando los valores de la variable están poco
concentrados o lo que es lo mismo, muy dispersos a su alrededor; entonces poco podrá decirnos la media
sobre el colectivo en estudio.
Es necesario, pues, acompañar la media aritmética con otra medida del grado de dispersión de los valores
de la variables a su alrededor, de forma que cuanto mayor sea esta medida, menor será el grado de
representatividad de la media y viceversa.
De todas las medidas de dispersión el recorrido es la mas sencilla de calcular, pero también la mas
imperfecta. Se define como la diferencia entre el último valor de la variable y el promedio, es decir, el campo
de variación de la variable medio numérico.
Desviación media. Esta se define como la media aritmética de las desviaciones de los valores de la variable
con respecto a un promedio, tomándose aquellas en valor absoluto.
CUESTIONARIO
1. ¿Que es dispersión y concentración?
2. ¿Cómo se calcula la media aritmética?
3. Plantéese un ejercicio donde se saca la media aritmética y la desviación media.
U N
I V E
R S
I D A D
D E
A Q
18
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
DIF’s # 5
UNIDAD O TEMA: Medidas de dispersión.
TITULO: Características : Desviación media, Varianza, desviación
Standard o tipo y coeficiente de variación de Pearson.
FECHA DE ENTREGA:
PERIODO DE EVALUACIÓN:
Realiza los ejercicios contemplados en tu Work paper complementario, de acuerdo a la codificación
correspondiente y entrega tus ejercicios en el momento oportuno para tu calificación procesual.
Realizar los ejercicios: 14, 15, 16 y 17 que es una miscelánea de las medidas de posición central.
Nota. Trabaja siempre con tu par para el mejor aprendizaje y fijar mejor el conocimiento de la estadística.
TAREA
El equipo de trabajo deberá presentar el siguiente trabajo:
1. ¿Que se entiende por medidas de dispersión?
2. ¿En qué consiste la diferencia de la varianza y la desviación Standard o tipo?
3. Plantéese un ejercicio real con las edades y peso de tus compañeros de clase y calcula el coeficiente de
variación de Pearson.
U N
I V E
R S
I D A D
D E
A Q
19
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
WORK PAPER # 6
UNIDAD O TEMA: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES
TITULO: DISTRIBUCIONES BIDIMENSIONALES
FECHA DE ENTREGA: 18 al 23 de junio de 2007
PERIODO DE EVALUACION: Exámen final
TEMA 7 DISTRIBUCIONES BIDIMENSIONALES
7.1 INTRODUCCIÓN.
En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una población.
En el caso de dos (o más) variables estudiadas conjuntamente se habla de variable bidimensional
(multidimensional); si se trata de dos caracteres cualitativos, de par de atributos.
Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo dos variables
de cada elemento de la población: por ejemplo: peso y altura de un grupo de estudiantes; superficie y
precio de las viviendas de una ciudad; potencia y velocidad de una gama de coches deportivos.
Para representar los datos obtenidos se utiliza una tabla de correlación
7.2 DISTRIBUCION DE FRECUENCIAS
Una distribución de frecuencias es una herramienta estadística muy útil para organizar un grupo de
observaciones.
Distribución de frecuencias: Es una serie de datos agrupados en categorías, en las cuales se muestra
el número de observaciones que contiene cada categoría.
7.3 DISTRIBUCIONES MARGINALES.
Para distinguir las frecuencias de cada variable al estudiarlas aisladamente llamaremos frecuencias
marginales a las de cada variable por separado. De esta forma tendríamos dos distribuciones
unidimensionales a partir de las conjuntas.
a) FRECUENCIA ABSOLUTA MARGINAL:
 Para la X (xi.) sería el número de veces que se repite el valor x i sin tener en cuenta los valores de
Y, la representamos por ni. .
 Para la Y (y.j) sería el número de veces que se repite el valor yj sin tener en cuenta los valores de
X, la representamos por n.j .
b) FRECUENCIAS RELATIVAS MARGINALES: A partir de las anteriores, y del mismo modo se
construirían estas frecuencias. fi. y f.j.
La distribución de frecuencias marginales pueden colocarse en una tabla separadamente como lo
hacíamos en el tema anterior. Pero si deseamos tener toda la información en una misma tabla lo que se
suele hacer es colocar:
 En la última columna de la tabla conjunta, las frecuencias marginales de X es decir, n i., añadiendo
tantas columnas como otros tipos de frecuencias marginales se deseen añadir.
7.4 DISTRIBUCIONES CONDICIONALES.
A partir de la distribución de frecuencias conjuntas podemos definir otro tipo de distribuciones
unidimensionales, tanto para X como para Y. Estas distribuciones se obtendrán al fijar el valor de la otra
variable y reciben en nombre de distribuciones condicionadas.
U N
I V E
R S
I D A D
D E
A Q
20
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
a)
FRECUENCIA ABSOLUTA CONDICIONADA PARA X=xi dado que Y=yj es el número de veces que
se repite el valor xi teniendo en cuenta solo aquellos valores en que Y=yj ;así es:
ni(j) = nij i=1,...,k.
b)
FRECUENCIA ABSOLUTA CONDICIONADA PARA Y=yj dado que X=xi es el número de veces que
se repite el valor yj teniendo en cuenta solo aquellos valores en que X=xi ; así es: n(i)j = nij j=1,...,h
En las distribuciones condicionadas no se suelen utilizar las distribuciones absolutas, puesto que, estas
dependen del número de datos y el número de datos será diferente para cada distribución, pues
dependerá de la frecuencia del valor que fijamos de la otra variable. Son mucho más útiles las frecuencias
condicionadas que se definen:
FRECUENCIA RELATIVA CONDICIONADA PARA X dado que Y=yj es fi(j) = nij/n.j
FRECUENCIA RELATIVA CONDICIONADA PARA Y dado que X=xi es f(i)j = nij/ni.
7.5 REPRESENTACION GRAFICA
Al igual que en el caso univariante, la forma de la distribución conjunta se aprecia a primera vista y se
retiene más fácilmente en la memoria con una adecuada representación gráfica.
 DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS
Se obtiene representando cada par observado (x i,yj) como un punto en el plano cartesiano. Se
utiliza con los datos sin agrupar y sobre todo para variables continuas. Si los datos están
agrupados tomaríamos las marcas de clase. Es el más útil porque nos permite ver visualmente la
relación entre las dos variables
CUESTIONARIO
1. Sea el conjunto:
Peso
50
80
75
50
60
80
55
50
60
Edad
25
38
30
22
25
30
20
25
30
Sexo
M
H
H
M
H
M
M
M
H
Calcular:
 Las frecuencias absolutas, relativas por cada una de las variables , interpretar
2. Investigue la producción de soya en los últimos 10 años en el departamento de santa cruz y a partir de
ellos determine las frecuencias y su interpretación.
U N
I V E
R S
I D A D
D E
A Q
21
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
PROGRAMA DE CONTROL DE CALIDAD
WORK PAPER # 7
UNIDAD O TEMA: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES
TITULO: REGRESION Y PREDICCION
FECHA DE ENTREGA: 23 al 27 de junio de 2007
PERIODO DE EVALUACION: Evaluación final
TEMA 8. REGRESION Y PREDICCION
8.1 DIAGRAMA DE DISPERSIÓN.
La primera forma de describir una distribución bivariante es representar los pares de valores en el plano
cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión
Un diagrama de dispersión es una representación gráfica de la relación entre dos variables, muy
utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de
soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente destacables
son que el descubrimiento de las verdaderas relaciones de causa - efecto es la clave de la resolución
eficaz de un problema, que las relaciones de causa - efecto casi siempre muestran variaciones, y que
es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números
8.2 CORRELACIÓN LINEAL.
Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna
curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre
diremos que hay correlación lineal. La recta se denomina recta de regresión.
Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez
más débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta.
En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que
hemos dibujado está próxima a los puntos de la nube.
Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene
también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la
correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir
U N
I V E
R S
I D A D
D E
A Q
22
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
8.3 REGRESIÓN LINEAL SIMPLE.
La regresión lineal simple es entonces una técnica sencilla y accesible para valorar la relación entre dos
variables cuantitativas
Tiene como objeto estudiar cómo los cambios en una variable, no aleatoria, afectan a una variable
aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida
por una expresión lineal, es decir, su representación gráfica es una línea recta. Cuando la relación
lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de
regresión lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y,
según lo establecido, se tendrá:

Función Lineal: Y = a + bx

Parábola de segundo grado: Y = ax2 + bx + c

Función potencial: Y = cxb

Función exponencial: Y = cbx
8.4 METODO DE LOS MINIMOS CUADRADOS
Se conoce como regresión lineal, correlación de Pearson o método de mínimos cuadrados, al
procedimiento de encontrar la ecuación de la recta "que mejor se ajuste a un conjunto de puntos". El
método de mínimos cuadrados nos permite encontrar el grado de correlación lineal entre un conjunto de
pares de valores numéricos
El procedimiento consiste entonces en minimizar los residuos al cuadrado Ci²
Re emplazando nos queda
U N
I V E
R S
I D A D
D E
A Q
23
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
La obtención de los valores de a y b que minimizan esta función es un problema que se puede resolver
recurriendo a la derivación parcial de la función en términos de a y b: llamemos G a la función que se va a
minimizar:
Los valores a y b también se pueden obtener de la siguiente forma: partiendo de las ecuaciones normales
tenemos
Entonces:
U N
I V E
R S
I D A D
D E
A Q
24
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
8.4 PREDICCIÓN.
Cuando se verifican las hipótesis sobre las que se asienta el modelo, la recta de regresión puede ser
utilizada para predecir el valor medio de la variable Y para cada valor concreto de X. Calculando la
esperanza matemática en ambos lados de la ecuación (1) se obtendrá
de modo que la línea de regresión proporciona un estimador del valor medio de Y para cada valor de X.
Como tal estimador, debemos considerar la incertidumbre asociada a esta recta, que puede ser reflejada
mediante regiones de confianza que contienen a la recta.
La ecuación Y= a +bx se puede usar para predecir o estimar la respuesta media Esperaríamos que el error
de predicción fuese mas alto en el caso de un solo valor predicho en el caso donde se predice una media.
Esto, entonces, afectara el ancho de nuestros intervalos para valores que se predicen
Cuestionario:
1. Dada la difícil situación por la que atraviesa actualmente la empresa QUEMALAPATA en la que hemos
empezado a trabajar, se propone la reducción de determinados gastos. Para ello se estudia la relación que
existe entre dos variables como son: los gastos en publicidad (variable X) y los beneficios (variable Y). De
ambas variables disponemos de los siguientes datos:
Año
Gastos en publicidad
Beneficios
1993
70
33
1994
75
45
1995
80
50
1996
90
65
1997
104
67
Se pide:
 ¿Se puede considerar que ambas variables guardan algún tipo de relación?
 ¿Cuál sería la variable dependiente y cuál la independiente?
U N
I V E
R S
I D A D
D E
A Q
25
U I N O
B O
L I V I A
FACULTAD DE CIENCIAS ECONOMICAS Y FINANCIERAS
 Realizando un gráfico adecuado. ¿Se puede suponer que la relación que las liga es de tipo lineal?
 Construye las dos rectas de regresión mínimo cuadrática asociada con las variables.
 Si la empresa para el próximo año realizará un esfuerzo para poder invertir 11.500.000 Bs en
publicidad. ¿Cuáles resultarían ser sus beneficios? ¿Con qué fiabilidad realizaría usted la predicción?
 ¿Cuáles resultarían ser sus beneficios si la predicción se efectúa considerando tan solo como
variable explicativa el tiempo? ¿Cuál sería la fiabilidad de esta otra predicción? Comente los resultados.
3. Hallar la proyección para la producción de soya de un agricultor por periodo de tiempo:
Año
2000
2001
2002
2003
2004
Producción
300
310
320
325
335
 Proyectar para el año 2006, 2007 y 2008
 Graficar
 Interpretar
4. Las precipitaciones (lluvias en mm) en el departamento santa cruz son la siguientes:
Año
2000
2001
2002
2003
2004
precipitación
150
220
120
230
410
 Proyectar para el año 2006, 2007 y 2008
 Graficar
 Interpretar
U N
I V E
R S
I D A D
D E
A Q
26
U I N O
B O
L I V I A
Descargar