metodo tabular

Anuncio
UNIDAD II METODOS DE ORGANIZACIÓN Y PRESENTACIÓN DE LA
INFORMACION
Una vez obtenidos los datos, surge el problema de interpretar correctamente los
mismos, por tanto se requiere disponer de métodos que permitan organizar y
presentar las observaciones de tal forma que los aspectos más sobresalientes de
las mismas sean fáciles de percibir.
Los métodos a usar deberán tener características que nos permitan alcanzar los
objetivos mencionados, entre dichas características tenemos:
a) Que proporcionen la máxima información respecto a los datos, en forma
rápida y fácil de visualizar.
b) Que sean sencillos en su operación.
c) Que permitan presentar los datos de manera estética, es decir limpios y de
manera que llamen la atención del observador.
Los métodos que se utilizan para describir conjuntos de datos son los tabulares y
los gráficos. Cuando los datos estadísticos se presentan en forma de tablas o
tabulares los datos se arreglan en un cuadro de doble entrada llamado así
porque en el cruce de filas y columnas se da entrada a la información. Un
diagrama estadístico o grafica es un medio plástico para presentar datos
estadísticos.
METODO TABULAR
Es común que una gran cantidad de reportes, ya sean científicos, de negocios,
administración privada o publica, así como en revistas, periódicos y en los
medios de comunicación, los datos se presenten por medio de Tablas o tabulares.
La presentación tabular es una disposición sistemática de la información
arreglada en filas y columnas con propósitos comparativos.
TIPOS DE TABULARES
Las tablas estadísticas pueden ser de dos tipos, de acuerdo con los propósitos
para los cuales sirven las tablas: Tablas para propósitos generales y Tablas para
propósitos especiales.
Las tablas generales, también llamadas de referencia, proporcionan información
para uso general, sirviendo como deposito de la información, contienen cifras
absolutas, deben incluir cifras sin redondear y su presentación debe facilitar su
entendimiento.
Las tablas publicadas por las distintas agencias gubernamentales son casi
siempre de tipo general. Este tipo de tablas se colocan usualmente en el apéndice
de los trabajos de investigación para facilitar su referencia. Las tablas generales
se usan para construir las tablas especiales o derivadas.
Las tablas especiales también llamadas de resumen, de texto o analíticas,
presentan los datos de manera que se realcen relaciones específicas,
proporcionando información para una exposición particular, puede utilizar
cifras redondeadas y para facilitar su interpretación el material seleccionado
deberá presentarse en un espacio reducido. Este tipo de tablas es muy común en
las empresas.
PARTES PRINCIPALES DE UNA TABLA O TABULAR
Las partes que constituyen una tabla estadística pueden variar, pero en general
puede incluir 7 partes principales y estas son: titulo, encabezados, columna
matriz o conceptos, cuerpo, nota de encabezado, nota de pie y fuente de los datos.
Las cuatro primeras son básicas y deben incluirse en todas las tablas. Las tres
partes restantes son adicionales, pero siempre que sean aplicables deben estar
presentes en la tabla.
Todas las partes deben ser presentadas en forma clara y simple, pero completa
con objeto de gastar la menor cantidad de tiempo y obtener la mayor
información de la presentación de la tabla.
1. TITUL0.- Es una descripción del contenido de la tabla, e indica la
naturaleza de los datos, localidad a la que corresponden y el periodo de
tiempo incluido. Se sitúa encima de la tabla y es usual que se utilice en la
letra de mayor tamaño.
2. ENCABEZADO.- Es el titulo de la parte superior de una columna.
Algunas tablas tienen más de dos encabezados y algunas llegan a tener
encabezados y subencabezados.
3. COLUMNA MATRIZ.- Es la sección de la tabla que contiene los
encabezamientos de las líneas, debe tenerse cuidado al agrupar los
elementos de la matriz de que esto facilite la interpretación de los datos.
Las descripciones en hileras de la tabla son llamadas conceptos, los cuales
se colocan al lado izquierdo de la tabla y usualmente representan las
clasificaciones de las cifras incluidas en el cuerpo de la tabla. La naturaleza
de las clasificaciones es indicada por los encabezados de la columna. De ser
necesario cada concepto puede ser dividido en subconceptos.
4. CUERPO.- Son los datos estadísticos en si, los cuales son arreglados de
acuerdo con las clasificaciones de los encabezados y conceptos, por tanto
podemos decir que una presentación efectiva de los datos de un tabular
depende de los arreglos de las columnas e hileras.
5. NOTA DE ENCABEZADO.- Son usadas para explicar ciertos puntos
relacionados con la tabla completa que no han sido incluidos en el titulo, ni
en los encabezados, ni en los conceptos. Se colocan arriba de los
encabezados y abajo del titulo.
6. NOTA DE PIE.- Son usualmente colocadas debajo de la tabla y encima de
la fuente. Se referencia por símbolos o por letras del alfabeto, nunca por
un número porque este pudiera tomarse como parte de los datos. Son
usadas para clarificar algunas partes incluidas en la tabla que no son
explicadas en otras partes.
7. FUENTE.- La fuente se sitúa debajo de las notas de pie. Si los datos fueron
recopilados y presentados por la misma persona es costumbre no
establecer la fuente en la tabla. Sin embargo si los datos fueron tomados de
otras fuentes publicadas, la fuente debe ser declarada para darle
consistencia a la información y asignarle el crédito a quien corresponda
por la información.
8. CONSTRUCCION DEL TABULAR. En una tabla las líneas deben
situarse de la siguiente forma:
a) Se sitúan líneas horizontales debajo de la cabecera y del cuerpo de la
tabla.
b) Las columnas se separan mediante líneas, las cuales no son muy
necesarias pero si son útiles.
c) La Matriz y la cabecera se separan de las cifras por líneas dobles o
más gruesas, especialmente si las tablas no son impresas.
d) Los totales se separan del resto de las cifras mediante una línea.
Para poner en relieve ciertos aspectos de la tabla se pueden usar líneas dobles
o más gruesas, caracteres de cursiva, contrastes tipográficos, etcétera.
PARTES DE UN TABULAR
Tabla 1.- Indicadores de desarrollo y Bienestar de algunos países de
Asia en 1995.
PAÍS
AFGANISTAN
A. SAUDITA
ARMENIA
AZERBAIYAN
BANGLADESH
CAMBOYA
CHINA
CHIPRE
EMIRATOS A.
FILIPINAS
GEORGIA
INDIA
INDONESIA
IRAN
IRAQ
ISRAEL
JAPON
KUWAIT
LIBANO
MALASIA
MONGOLIA
NEPAL
PAKISTAN
R. DE COREA
RUSIA
SINGAPUR
SIRIA
TAIWAN
TURQUIA
VIETNAM
INGRESO PER
ESPERANZA DE
CÁPITA
VIDA AL NACER
(DÓLARES EUA)
(AÑOS)
220
7510
780
740
220
200
470
9820
22020
770
850
310
670
2200
1940
13220
28190
16160
1400
2790
900
170
420
6790
2510
15730
1160
8790
1980
220
43
69
70
71
55
50
69
77
72
65
72
61
60
65
65
76
79
75
66
71
64
54
59
71
69
75
67
71
67
67
ÍNDICE DE
MORTALIDAD
INFANTIL (POR
CADA 1000 HAB.)
ALFABETIZACIÓN
(% POB.> 15 AÑOS)
164
28
21
82
91
117
31
10
20
40
19
79
66
65
80
9
5
14
40
14
60
99
95
13
20
5
36
5
54
37
29.4
62.4
95.3
N.D. *
34.8
48.0
77.7
94.5
73.0
88.7
N.D. *
48.2
77.6
65.2
59.7
91.8
100.0
73.0
80.1
78.4
97.9
37.7
25.6
96.3
99.0
90.7
79.9
92.8
80.7
87.6
*N. D. No determinado
Fuente: Los Recursos mundiales en el periodo 1994-1995, Departamento de prensa, Universidad de
Oxford, Estados Unidos de América.
El ejemplo más importante del uso del método tabular en la presentación de
conjuntos de datos es la tabla de frecuencias o distribución de frecuencias.
DISTRIBUCIÓN DE FRECUENCIAS.
Una vez efectuadas las mediciones de una característica de interés sobre los
elementos que componen una muestra o una población, los valores resultantes
se hallan formando un conjunto desordenado, lo cual dificulta su análisis y
por tanto la información no es suficiente para llegar a conclusiones respecto al
conjunto. Para organizar adecuadamente la información se deben seguir los
pasos siguientes:
A) ORDENACIÓN.
Es necesario organizar los datos para así obtener un arreglo ordenado de los
valores, es decir un listado de los valores en orden ascendente o descendente.
Ejemplo: Los datos siguientes corresponden a la variable estatura de una
muestra seleccionada al azar de 72 alumnos varones que cursaron el 3er.
Grado en la Escuela Preparatoria 1 UAN en el ciclo escolar 2002-2003.
Realice la ordenación ascendente y descendente de los datos.
1.62
1.51
1.68
1.69
1.62
1.75
1.89
1.80
1.76
1.55
1.67
1.55
1.60
1.68
1.70
1.78
1.75
1.85
1.50
1.67
1.69
1.50
1.70
1.72
1.80
1.86
1.75
1.65
1.60
1.70
1.60
1.70
1.70
1.75
1.75
1.80
1.70
1.73
1.70
1.60
1.72
1.72
1.78
1.78
1.78
1.68
1.73
1.65
1.75
1.68
1.70
1.84
1.75
1.85
1.70
1.72
1.75
1.70
1.72
1.70
1.76
1.81
1.78
1.70
1.74
1.70
1.73
1.70
1.71
1.87
1.85
1.75
1.75
1.75
1.75
1.75
1.75
1.75
1.75
1.75
1.75
1.76
1.76
1.78
1.78
1.78
1.78
1.78
1.80
1.80
1.80
1.81
1.84
1.85
1.85
1.85
1.86
1.87
1.89
a).- Ordenación ascendente
1.50
1.50
1.51
1.55
1.55
1.60
1.60
1.60
1.60
1.62
1.62
1.65
1.65
1.67
1.67
1.68
1.68
1.68
1.68
1.69
1.69
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.71
1.72
1.72
1.72
1.72
1.72
1.73
1.73
1.73
1.74
b).- Ordenación descendente
1.89
1.87
1.86
1.85
1.85
1.85
1.84
1.81
1.80
1.80
1.80
1.78
1.78
1.78
1.78
1.78
1.76
1.76
1.75
1.75
1.75
1.75
1.75
1.75
1.75
1.75
1.75
1.74
1.73
1.73
1.73
1.72
1.72
1.72
1.72
1.72
1.71
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.70
1.69
1.69
1.68
1.68
1.68
1.68
1.67
1.67
1.65
1.65
1.62
1.62
1.60
1.60
1.60
1.60
1.55
1.55
1.51
1.50
1.50
B) DIAGRAMA DE TRONCO Y HOJA.
Ordenar un conjunto numeroso de datos ya sea en forma ascendente o
descendente puede ser una tarea difícil, además de que la lista de números
sigue siendo una vasta pieza de información, por tanto es útil contar con una
forma de manejar estos valores a partir de una técnica que nos permita
organizar los datos, llamada diagrama de tronco y hoja, para su construcción
siga los siguientes pasos:
1º Divida cada dato en dos partes, tallo y hoja.
2º Haga un listado de los tallos en una columna, trace una línea vertical a su
derecha.
3º Para cada dato escriba la hoja en la misma fila al tallo que corresponda.
4º Realice la ordenación de las hojas de menor a mayor.
Ejemplo: Considere las calificaciones obtenidas en una prueba de biología
aplicada a 20 estudiantes como a continuación se detalla:
50
55
57
61
62
63
64
65
67
68
68
72
74
74
77
78
82
84
89
93
5
6
7
8
9
Con este paso disponemos las posiciones del tronco, luego se marcan las hojas
por elementos de datos individuales en orden consecutivo.
El diagrama de tronco y hojas final lucirá así:
5
6
7
8
9
0
1
2
2
3
5
2
4
4
7
3 4 5 7 8 8
4 7 8
9
El grafico de tronco y hojas contiene la misma información que el listado
original pero de forma mucho mas compacta, destacando los aspectos
importantes de los datos, como por ejemplo en este conjunto nos revela que la
mayoría de los datos pertenece al orden de los 60.
Si bien el arreglo ordenado hace que las observaciones adquieran mas
significado, puede lograrse una mayor síntesis agrupando los datos en un
grupo de intervalos contiguos evitando que se traslapen de modo que cada
valor pueda colocarse en uno solo de los intervalos que en forma genérica se
les llama intervalos de clase o simplemente clases.
C) DESCRIPCIÓN NUMÉRICA.
Una distribución de frecuencias es el resultado de agrupar los datos en grupos
o clases de la misma magnitud o en clases con límites determinados con
anterioridad, señalando el numero de valores que toma la variable que
pertenecen a cada clase, lo cual se denomina frecuencia de clase.
El primer punto a considerar es la determinación de cuantos intervalos deben
incluirse, siendo esto un asunto delicado no conviene incluir pocos intervalos
debido a que hay perdida de información, asimismo si se utilizan demasiados
intervalos no se logran los objetivos de la síntesis.
Para determinar el número de intervalos a considerar se tiene el recurso de la
Regla de Sturges, aplicando el modelo matemático:
K = 1 + 3.3 (log10 n) donde K representa el numero de intervalos de clase y n
el numero de valores en el conjunto a consideración.
El resultado dado por la Regla de Sturges debe de considerarse únicamente
como una guía y proceder según sea conveniente, a beneficio de una
presentación clara, aumentando o disminuyendo el número de clases.
Si por alguna causa se tiene problemas para calcular logaritmos de base 10 se
puede emplear la ecuación de cambio de base:
log a x = ln x / ln a
Aplicando esta formula tenemos:
log10 75 = ln75/ ln10 = 4.3175/ 2.3026 =1.8751
Considerando los datos del ejemplo antes citado tenemos.
K = 1 + 3.3 ( log10 75) = 1 + 3.3 ( 1.8751) = 1 + 6.1878 = 7.2
Con base en lo anterior K = 7, pero quizás otras consideraciones nos llevarían
a utilizar 8 o quizás 6 intervalos de clase.
Otro método usual para la determinación del número de clases lo es el tabular
de tamaño de la muestra:
TAMAÑO DE LA NUMERO DE
MUESTRA
INTERVALOS
De 10 a 20
5
De 20 a 45
6
De 45 a 90
7
De 90 a 180
8
De 180 a 360
9
De 360 a 720
10
Mas de 720
De 10 a 20
Si retomamos el ejemplo anterior veremos que en base al tamaño de la muestra
(75) el numero de intervalos recomendado es 7.
Una vez determinado el número de intervalos de clase, debe calcularse la
amplitud que tendrán dichos intervalos, debiéndose cuidar que sea la misma
amplitud para todos los intervalos, para lo cual calculamos primeramente la
amplitud o rango el cual es la diferencia entre las observaciones extremas, es
decir la mayor y la menor del conjunto:
R = XN – Xn
Para el conjunto en cuestión R = 1.89 – 1.50 = 0.39, donde XN es el dato mayor
del conjunto y Xn el dato menor del mismo.
La amplitud de intervalo entre clases (W) se determina dividiendo el Rango
entre K es decir el número determinado de clases. Por tanto:
W = R / K = 0.39 / 7 = 0.055
Es evidente que conviene usar una amplitud de 0.06 para el intervalo de clase.
Podemos ahora construir los intervalos; dado que el valor más pequeño es 1.50 y
el mas grande 1.89, deben empezarse los intervalos por 1.49 con objeto de
disminuir el error experimental y terminar en un valor tal que incluya al 1.89, lo
cual nos arroja los siguientes intervalos:
1.49-1.54
1.55-1.60
1.61-1.66
1.67-1.72
1.73-1.78
1.79-1.84
1.85-1.90
Puede observarse que resultan los 7 intervalos recomendados, que el intervalo de
las clases es 0.06 y que la ultima clase incluye al dato 1.89
Para determinar el numero de valores o datos que caen dentro de cada intervalo
o sea la frecuencia absoluta (fi), se utiliza una tabla de conteo observando los
valores uno a uno y colocando una pequeña marca a un lado del intervalo al cual
corresponda.
CLASES
1.49-1.54
1.55-1.60
1.61-1.66
1.67-1.72
1.73-1.78
1.79-1.84
1.85-1.90
TABLA DE CONTEO
111
111111
1111
1111111111111111111111111111
11111111111111111111
11111
111111
TOTAL
fi
3
6
4
28
20
5
6
72
Según el tabular observamos que cada clase esta limitada o determinada por dos
números llamados limites aparentes de clase. Por ejemplo la clase 1.49 -1.54 tiene
como limite aparente inferior él número 1.49 y como limite aparente superior el
1.54 La longitud de cada intervalo es el número de valores posibles que los datos
pueden tener para pertenecer a la clase. Si aumenta la longitud del intervalo o
ancho de la clase disminuye por consecuencia el número de clases y viceversa. La
distribución que acabamos de realizar es llamada distribución de frecuencias
absolutas.
En ocasiones es útil conocer la proporción más que el número de valores que
caen dentro de un intervalo de clase. Esta información se obtiene dividiendo la
frecuencia absoluta de cada clase entre el numero total de datos, generándose
una distribución de frecuencia relativa.
CLASES
1.49-1.54
1.55-1.60
1.61-1.66
1.67-1.72
1.73-1.78
1.79-1.84
1.85-1.90
fi
3
6
4
28
20
5
6
Σ 72
FRECUENCIA RELATIVA
3/72 = 0.042 =
4.2%
6/72 = 0.084 =
8.4%
4/72 = 0.055 =
5.5%
28/72 = 0.389 =
38.9%
20/72 = 0.277 =
27.7%
5/72 = 0.069 =
6.9%
6/72 = 0.084 =
8.4%
Σ72/72 Σ1.000
Σ 100.0%
Si deseamos conocer la frecuencia de valores que caen dentro de 2 o más
intervalos de clase, estos se pueden obtener sumando las frecuencias que caen
dentro de los intervalos de clase de interés. Con lo anterior se genera la
distribución de frecuencias acumuladas ya sean absolutas o relativas.
CLASES
1.49-1.54
1.55-1.60
1.61-1.66
1.67-1.72
1.73-1.78
1.79-1.84
1.85-1.90
Σ
fi
3
6
4
28
20
5
6
72
fai
3
9
13
41
61
66
72
frel
3/72 = 0.042 =
4.2%
6/72 = 0.084 =
8.4%
4/72 = 0.055 =
5.5%
28/72 = 0.389 = 38.9%
20/72 = 0.277 = 27.7%
5/72 = 0.069 =
6.9%
6/72 = 0.084 =
8.4%
Σ72/72 Σ1.000 Σ 100.0%
farel
4.2 %
12.6 %
18.1 %
57.0 %
84.7 %
91.6 %
100.0 %
CONSTRUCCION DE UNA TABLA DE FRECUENCIAS PARA DATOS SIN
AGRUPAR
Ejemplo: Veinticinco empleados de la cadena de Moteles Candida estudiaron un
curso de primeros auxilios, al termino del mismo se les practico un Evaluación
de lo aprendido contando con 20 puntos en total y los resultados fueron los
siguientes: 17, 17, 16, 16, 17, 19, 12, 19, 17, 16, 14, 15, 18, 18, 14, 20, 15, 15, 17, 18,
17, 16, 16, 13, 17.
Con la información proporcionada realice la Distribución de frecuencias
absolutas, relativas y acumuladas.
Xi
12
13
14
15
16
17
18
19
20
fi
1
1
2
3
5
7
3
2
1
Σ 25
Frecuencia relativa
1/25 = 0.04 = 4%
1/25 = 0.04 = 4%
2/25 = 0.08 = 8%
3/25 = 0.12 = 12%
5/25 = 0.20 = 20%
7/25 = 0.28 = 28%
3/25 = 0.12 = 12%
2/25 = 0.08 = 8%
1/25 = 0.04 = 4%
Σ 1.00 =100%
fai
1
2
4
7
12
19
22
24
25
farel
1/25 = 0.04 = 4%
2/25 = 0.08 = 8%
4/25 = 0.16 = 16%
7/25 = 0.28 = 28%
12/25 = 0.48 = 48%
19/25 = 0.76 = 76%
22/25 = 0.88 = 88%
24/25 = 0.96 = 96%
25/25 = 1.00 = 100%
CONSTRUCCION DE UN TABULAR CON DATOS AGRUPADOS EN
CLASES
Ejemplo: Estatura en centímetros de una muestra de 80 alumnos que
cursaron el 2º Grado en la Escuela Preparatoria UNIVER, plantel Tepic, en el
ciclo escolar 2006-2007. Realice la distribución de frecuencias.
162
151
168
169
162
175
189
180
176
155
167
155
160
168
170
178
175
185
150
167
169
150
170
172
180
186
175
165
160
170
160
170
170
175
175
180
170
173
170
160
172
172
178
178
178
168
173
165
175
168
170
184
175
185
170
172
175
170
172
170
176
181
178
170
174
170
173
170
171
187
185
175
190
193
190
194
196
191
191
193
175
175
175
175
175
175
175
175
175
176
176
178
178
178
178
178
180
180
180
181
184
185
185
185
186
187
189
190
190
191
191
193
193
194
196
Primer paso ORDENACION
150
150
151
155
155
160
160
160
160
162
162
165
165
167
167
168
168
168
168
169
169
170
170
170
170
170
170
170
170
170
170
170
170
170
170
171
172
172
172
172
172
173
173
173
174
Segundo paso DIAGRAMA DE TRONCO Y HOJA
1
5
0, 0, 1, 5, 5
1
6
0, 0, 0, 0, 2, 2, 5, 5, 7, 7, 8, 8, 8, 8, 9, 9
1
7
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5,
5, 5, 5, 6, 6, 8, 8, 8, 8, 8
1
8
0, 0, 0, 1, 4, 5, 5, 5, 6, 7, 9
1
9
0, 0, 1, 1, 3, 3, 4, 6
Tercer paso DESCRIPCION NUMERICA
R = XN – Xn = 196 – 150 = 46
Log10 80 = ln 80 / ln 10 = 4.38202/2.3026 = 1.90307
K = 1 + 3.3 (log10 n) = 1 + 3.3 (1.90307) = 7.28 ≈ 7
W = R / K = 46 / 7 = 6.5 ≈ 7
CLASES
149-155
156-162
163-169
170-176
177-183
184-190
191-197
fi
5
6
10
35
9
9
6
Σ 80
fai
5
11
21
56
65
74
80
5/80 =
6/80 =
10/80 =
35/80 =
9/80 =
9/80 =
6/80 =
Σ80/80
frel
0.0625 ≈ 0.06 = 6%
0.0750 ≈ 0.08 = 8%
0.1250 ≈ 0.12 = 12%
0.4375 ≈ 0.44 = 44%
0.1125 ≈ 0.11 = 11%
0.1125 ≈ 0.11 = 11%
0.0750 ≈ 0.08 = 8%
Σ1.000 Σ 100.0%
farel
6%
14%
26%
70%
81%
92%
100.0 %
METODO GRAFICO
Otra método usado para presentar la información son las de graficas, que son
una expresión plástica donde es posible resumir una gran cantidad de
información, la ventaja de su uso es la facilidad de su análisis e interpretación,
permitiendo una mejor visualización de una distribución determinada o de la
tendencia manifiesta de un fenómeno. Una gran variedad de graficas han sido
usadas en estudios estadísticos para presentar datos o mostrar las relaciones
entre varios grupos de datos. De hecho, casi todos los tipos de información
cuantitativa pueden ser representados por graficas.
Una persona que entiende como construir buenas graficas presenta información
cuantitativa mas rápidamente que si tuviera que arreglar las cifras en forma
tabular o describir la misma información con palabras. Es frecuente la expresión
“Una buena grafica vale mas que mil palabras”.
Las graficas son dibujadas de acuerdo con el sistema de coordenadas
rectangulares, las cuales se basan en dos líneas rectas mutuamente
perpendiculares de referencia en un plano. La línea horizontal es llamada eje de
las X o la absisa, mientras que la línea vertical es referida como eje de las Y o la
ordenada. Las dos líneas dividen el plano en cuatro partes llamadas cuadrantes y
el punto de intersección de las dos líneas se conoce como origen.
CLASIFICACION DE GRAFICOS
Existen tres grandes grupos de graficas que en forma común se usan para
presentar información:
a).- Graficas de áreas.
b).- Graficas de líneas.
c).- Pictogramas.
GRAFICAS DE AREAS
Utilizan figuras geométricas para representar por algunos de sus elementos, las
variaciones de un fenómeno cuantitativo en relación con las variaciones de otro
fenómeno. Un diagrama puede ser simple o múltiple, simple cuando representa
un solo fenómeno y múltiple cuando representa a varios. En general, deben
emplearse figuras geométricas de fácil interpretación, ya que el objeto principal
de los diagramas es mostrar a primera vista las variaciones del fenómeno, cosa
que seria imposible siendo la figura complicada. Ejemplos de graficas de áreas
son el grafico de barras, el histograma, los diagramas de sectores circulares y los
cartogramas o mapas.
GRAFICAS DE LINEAS
Es bastante útil para llevar a efecto la comparación de los datos de dos o más
distribuciones. Consiste en unir por medio de segmentos de recta, los puntos de
coordenadas determinados por los datos de dos variables que se corresponden o
de variables que dependen del tiempo. Ejemplo de este tipo de grafico es el
polígono de frecuencias.
PICTOGRAMAS
Es uno de los gráficos que mas atrae la atención razón por la cual se recurre a el
con frecuencia. Consiste en representar por medio de figuras determinadas
magnitudes, siendo su principal desventaja el que no permite comparaciones
satisfactorias.
GRAFICAS MÁS USUALES
GRAFICA DE BARRAS
Grafico de barras horizontales
f
CLASES
e
d
c
b
a
0
5
10
FRECUENCIA ABSOLUTA
15
Se emplean por lo general para
representar grupos de datos
estadísticos, ya sean cronológicos,
geográficos, o cualitativos, que
pertenecen a cada categoría como
áreas rectangulares de tamaño
proporcional, usando la base de
cada rectángulo para representar
la variable, y la altura para
representar a escala la intensidad
que adquiere el fenómeno en cada
uno de los casos. Pueden utilizarse
este tipo de graficas para
representar valores absolutos o
relativos.
Para elaborar este grafico se utilizan clases con limites aparentes, por lo cual las
barras no deben ir contiguas, sino con un espacio entre ellas.
Se pueden presentar las barras o celdas de dos formas diferentes: verticales u
horizontales.
Grafico de barras verticales
14
12
10
8
fi
6
4
2
0
a
b
c
d
e
f
CLASES
HISTOGRAMA
30
25
1.485 – 1.545
1.545 – 1.605
1.605 – 1.665
1.665 – 1.725
1.725 – 1.785
1.785 – 1.845
1.845 – 1.905
20
15
10
5
0
fi
Es un grafico que representa una distribución de frecuencias, con límites
verdaderos de clase, su diferencia del grafico de estriba en que las barras o
rectángulos van contiguos uno de otro, eliminando los espacios entre celdas.
Cuando construimos una distribución de frecuencias a partir de los datos, los
límites aparentes de clase reflejan por lo general el grado de precisión de los
datos en bruto. Se sabe que algunos de los valores que caen dentro del segundo
intervalo de clase si se midieran con precisión quizás serian poco menores que el
límite aparente inferior y algunos serian un poco mayores que el límite aparente
superior.
Considerando la continuidad fundamental de la variable y suponiendo que los
datos se redondearon hasta el número más próximo es conveniente pensar que
los límites reales de clase son los límites verdaderos de este segundo intervalo,
por tanto debemos calcular los límites verdaderos para cada uno de los
intervalos de clase.
Los límites reales inferiores de clase se determinan sumando al límite aparente
inferior de cada clase, el límite aparente superior de la clase anterior y el
resultado lo dividimos entre 2.
Los límites reales superiores de clase se determinan sumando al límite aparente
superior de cada clase, el límite aparente inferior de la clase siguiente y el
resultado se divide entre 2.
Ejemplo: Si continuamos con el ejemplo de estatura, de los alumnos de la
Preparatoria No. 1.
CLASES
1.49 – 1.54
1.55 – 1.60
1.61 – 1.66
1.67 – 1.72
1.73 – 1.78
1.79 – 1.84
1.85 – 1.90
fi
3
6
4
28
20
5
6
Σ 72
a).- Determinación de los limites reales superiores.
1ª) 1.54 + 1.55 entre 2 = 1.545
2ª) 1.60 + 1.61 entre 2 = 1.605
3ª) 1.66 + 1.67 entre 2 = 1.665
4ª) 1.72 + 1.73 entre 2 = 1.725
5ª) 1.78 + 1.79 entre 2 = 1.785
6ª) 1.84 + 1.85 entre 2 = 1.845
7ª) 1.845 + 0.06
= 1.905
Para calcular el límite real superior de la 7ª clase tenemos el problema que no
existe 8ª clase, entonces optamos por aplicar lógica matemática; Podemos
observar que la diferencia entre límites reales contiguos es igual a 0.06 o sea el
intervalo de clase.
Por tanto al limite real superior de la 6ª clase (1.845) le sumamos el intervalo y
tenemos 1.845 + 0.06 = 1.905 valor del limite real superior de la 7ª clase.
b).- Determinación de limites reales inferiores.
1ª) 1.545 – 0.06
= 1.485
2ª) 1.55 + 1.54 entre 2 = 1.545
3ª) 1.61 + 1.60 entre 2 = 1.605
4ª) 1.67 + 1.66 entre 2 = 1.665
5ª) 1.73 + 1.72 entre 2 = 1.725
6ª) 1.79 + 1.78 entre 2 = 1.785
7ª) 1.85 + 1.84 entre 2 = 1.845
Podemos observar que la diferencia entre limites reales inferiores sigue siendo
0.06, por tanto el primer limite real lo determinamos restándole al limite real
inferior de la 2ª clase el intervalo y así 1.545 – 0.06 = 1.485. Nuestro tabular e
Histograma con límites reales quedan de la siguiente manera:
CLASES
1.485 – 1.545
1.545 – 1.605
1.605 – 1.665
1.665 – 1.725
1.725 – 1.785
1.785 – 1.845
1.845 – 1.905
fi
3
6
4
28
20
5
6
GRAFICO DE PASTEL
También llamado gráfico de sectores circulares o de pay, estos muestran la
cantidad de datos que pertenecen a cada categoría como una parte proporcional
de un círculo. Se construye a partir de distribuciones de frecuencia donde las
cuales las clases no se relacionan de manera cuantitativa. Para realizar un
grafico de pastel se deben seguir los pasos siguientes:
1).- Calcule la frecuencia relativa de cada clase, su representación decimal, se
obtiene dividiendo la frecuencia absoluta de clase entre el numero total de datos.
CLASES
118 – 127
128 – 137
138 – 147
148 – 157
158 – 167
168 – 177
TOTAL
fi
3
6
14
9
5
3
40
Frel
3/40 = 0.075
6/40 = 0.150
14/40 = 0.350
9/40 = 0.225
5/40 = 0.125
3/40 = 0.075
1.000
2).- Multiplique los resultados obtenidos por 360º, para determinar los grados
que debe tener cada subsector.
a)
b)
c)
d)
e)
f)
0.075 X 360º = 27º
0.150 X 360º = 54º
0.350 X 360º = 126º
0.225 X 360º = 81º
0.125 X 360º = 45º
0.075 X 360º = 27º
3.- En un circulo marque los sectores con los angulos iguales a los obtenidos en el
paso 2, trazamos un radio superior y empezamos a contar los grados del primer
sector en el sentido en que giran las manecillas del reloj, continuamos así hasta
insertar todos los subsectores angulares.
De esta manera obtenemos el grafico de pastel, tarta, pay o de sectores
circulares.
Grafico de pay o pastel
118 – 127
128 – 137
138 – 147
148 – 157
158 – 167
168 – 177
POLIGONO DE FRECUENCIAS
El polígono de frecuencias es un grafico de puntos y líneas que se realiza
buscando la intersección de las marcas de clase y la frecuencia de la clase que se
trate. Una vez ubicados los puntos se unen estos a través de segmentos de recta.
Ejemplo: Con los datos del siguiente tabular determinemos los puntos medios de
clase, para lo cual sumamos los dos limites ya sean reales o aparentes que
conforman cada clase y los promediamos es decir los dividimos entre 2, así
tendremos los valores de las marcas de clase.
CLASES
118 – 127
128 – 137
138 – 147
148 – 157
158 – 167
168 – 177
TOTAL
fi
3
6
14
9
5
3
40
Frecuencia relativa
3/40 = 0.075
6/40 = 0.150
14/40 = 0.350
9/40 = 0.225
5/40 = 0.125
3/40 = 0.075
1.000
Marcas de clase ( mi )
118+127/ 2 = 122.5
128+137/ 2 = 132.5
138+147/ 2 = 142.5
148+157/ 2 = 152.5
158+167/ 2 = 162.5
168+177/ 2 = 172.5
POLIGONO DE FRECUENCIAS
15
14
10
fi
9
5
6
5
3
3
0
122.5
132.5
142.5
152.5
162.5
172.5
Marcas de clase
El polígono de frecuencias de una cantidad
grande de datos puede estar
formado por muchos pequeños segmentos que aproximan al conjunto a una
curva, las cuales son llamadas curvas de frecuencias, absolutas o relativas según
sea el caso. Es razonable pensar que las curvas provengan de la suavización de
los polígonos de frecuencias de la muestra, donde la aproximación será más
exacta conforme se aumente el tamaño de la muestra, por tal razón una curva de
frecuencias se conoce también como polígono de frecuencias suavizado. Las
curvas de frecuencia presentan determinadas formas características que sirven
para distinguirlas entre si, y estas pueden ser:
a) Simétricas se caracterizan por el hecho de que las observaciones equidistan
del máximo central tienen la misma frecuencia.
b) Sesgadas se caracterizan porque la cola de la curva que se encuentra de un
lado del máximo central es mayor que al otro lado. Si la cola mayor se presenta a
la derecha de la curva se dice que esta sesgada a la derecha o que tiene un sesgo
positivo, mientras que si ocurre que la curva sea sesgada a la izquierda se dice
que tiene un sesgo negativo.
c) En forma de J o J invertida son aquellas que el máximo se presenta en un
extremo.
d) En forma de U son aquellas que tienen el máximo valor en los dos extremos.
e) Bimodal son las que tienen dos máximos, y la multimodal tiene más de 2
máximos.
CURTOSIS O APUNTAMIENTO
La curtosis es una medida del apuntamiento de un polígono de frecuencias y
sólo se aplica a distribuciones unimodales (distribuciones que tienen un único
“pico”). Generalmente el grado de curtosis de una distribución se compara con
un modelo de distribución que estudiaremos más adelante que es la
llamada distribución normal.
Así, las distribuciones que tienen el mismo grado de apuntamiento que la normal
se llaman mesocúrticas. Las distribuciones que tienen mayor grado de
apuntamiento que la normal se llaman leptocúrticas y las que lo tienen menor
platicúrticas. Los índices empleados habitualmente para calcular la curtosis son
demasiado complicados, comparados con su utilización, por lo que en estas notas
no haremos referencia a ellos.
Figura: Ejemplos de distribuciones con distintos tipos de curtosis. La A es
leptocúrtica, la B mesocúrtica y la C platicúrtica.
POLÍGONO DE FRECUENCIA ACUMULADA U OJIVA
La gráfica de la frecuencia acumulada es muy útil porque en ella podemos
determinar cuántas observaciones hay por arriba o por debajo de algún valor
que nos interese.
La gráfica que se obtiene de la frecuencia acumulada también se conoce con el
nombre de ojiva.
Para trazar dicha gráfica se procede como en los gráficos anteriores, es decir, en
el eje horizontal se trazan los intervalos de clase y marcas de clase y en el vertical
las frecuencias acumuladas.
Ejemplo: Sea el conjunto de datos siguiente, grafique la ojiva correspondiente.
CLASES
118 – 127
128 – 137
138 – 147
148 – 157
158 – 167
168 – 177
TOTAL
fi
3
6
14
9
5
3
40
fai
3
9
23
32
37
40
45
40
35
30
25
20
15
10
5
0
122.5
132.5
142.5
152.5
162.5
172.5
Descargar