estadistica - Facultad de Medicina - UNNE

Anuncio
Universidad Nacional del Nordeste
Facultad de Medicina
ATENCIÓN PRIMARIA DE LA SALUD,
EPIDEMIOLOGÍA E INFORMÁTICA II
PROF. ALBERTO C PALLADINO
AÑO 2011
ESTADISTICA
INTRODUCCIÓN
La variabilidad de los fenómenos que estudia la medicina (tanto la clínica como la
salud pública) llevan a diferentes problemas al intentar el análisis de los mismos. Por
empezar, se presenta la dificultad de cómo expresarlos sin recurrir a la repetición del total de
los resultados obtenidos en la observación. Piénsese, por ejemplo, en el dilema que se le
presentaría a un cirujano que desee relatar su experiencia de veinte años en el tratamiento
quirúrgico del cáncer de mama. La acumulación de casos diversos en: las características de
las pacientes tratadas, la naturaleza misma de la neoplasia, la técnica empleada y los
resultados inmediatos y mediatos, harían sumamente complicado presentar en forma clara,
entendible y con posibilidades de análisis la información acumulada. El mismo problema se
le presentaría a un docente universitario que desee analizar los resultados de un turno de
examen (con alrededor de trescientos examinados) y su relación con las condiciones
personales del alumno y con las distintas metodologías de enseñanza utilizadas.
Una segunda dificultad en el manejo de información es el establecer cierto grado de
probabilidad en la ocurrencia de un fenómeno o en la evolución futura del mismo. El
tratamiento que se sugiere (o se indica a un paciente) es el que ha mostrado haber sido exitoso
en una proporción importante de casos en los que se ha utilizado; aunque en algunos de esos
casos la intervención haya sido ineficaz o, peor aún, haya tenido efectos indeseables. ¿Cómo
saber si el enfermo al que se le está indicando vacuna antirrábica no hará una reacción
alérgica y, si la hiciera, cuál sería su probabilidad de morir en la emergencia?. El médico se
maneja con el conocimiento de que este riesgo es menor (por la frecuencia con la que ocurre
el accidente alérgico) que el riesgo de dejar al paciente sin tratamiento (por la frecuencia con
la que la enfermedad se presenta sin el tratamiento). En otro ejemplo (pero que está
relacionado con el problema en cuestión) es el que se presenta cuando a partir de un estudio
especial (por ejemplo el control de la presión arterial a un grupo seleccionado de estudiantes)
se desea extraer conclusiones para toda la población de la que proviene el grupo estudiado (en
el ejemplo: todos los estudiantes del mismo curso).
El manejo de estos problemas lo permite el uso de la estadística. Siguiendo a Kendall
MG y Buckland WR (A Dictionary of Statistical Terms, 4th ed. London; Longman, 1982) se
puede definir la estadística como la : “Disciplina que tiene por objeto la recolección,
resumen y análisis de datos sujetos a variaciones por el azar”.
Prof. Dr. Alberto C Palladino
1
Las finalidades básicas de la estadística son:
1) Resumir una masa importante de mediciones.
2) Cuantificar la influencia del azar.
3) Controlar variables de confusión.
La primera de las finalidades es lo que comprende la estadística descriptiva y de las
dos restantes se ocupa la estadística inferencial (o inferencia estadística).
Las etapas del método, y de acuerdo a la definición dada de estadística, incluye:
1) la recolección de datos; 2) su elaboración o procesamiento y 3) su análisis.
VARIABLES - CATEGORÍAS - DATO ESTADISTICO
La obtención de datos estadísticos se hace por recolección directa del investigador o
por la utilización de fuentes de datos disponibles ( es decir datos obtenidos y elaborados por
otros investigadores). De acuerdo a una clasificación utilizada, en el primer caso la fuente es
primaria y, en el segundo, es secundaria. A su vez, esta últimas pueden ser directas (bases
de datos) o indirectas (información elaborada y presentada en tablas y gráficos). Cuando el
propio investigador es quién recoge los datos puede dar fe de la confiabilidad de los mismos;
asimismo, puede definir las variables, las categorías, los indicadores , los procedimientos, etc.
La desventaja, obviamente, son los recursos que debe destinar. Lo inverso ocurre con las
fuentes secundarias. De éstas, constituye una ventaja las fuentes directas por las extensas
posibilidades de análisis que brindan. Las fuentes de datos más utilizadas (tanto por la salud
publica como por la clínica) son los registros de hechos vitales (básicamente nacimientos y
defunciones), los registros hospitalarios (consultorio externo, internación) y los censos de
población que brindan el universo de referencia, necesario para la construcción de
indicadores y para contextualizar los fenómenos. De manera excepcional se utilizan encuestas
y censos especiales, registros de obras sociales, fuerzas armadas, estudios especiales, etc.
La recolección de datos (primera etapa del método estadístico) implica la
observación de la realidad (reglada de acuerdo a técnicas específicas) con la finalidad de
medir las características que los fenómenos de la misma presentan. (El término “medición”
es aplicable aunque el resultado sea una expresión numérica o literal). Esas características a
medir son las variables. Una variable puede definirse como “una cualidad, propiedad o
característica de las personas, cosas o hechos en estudio que puede ser enumerada o
medida y que puede variar de un sujeto a otro y, a veces, de un momento a otro en el
mismo sujeto”. Las variables son utilizadas para describir las particularidades que distinguen
al fenómeno en estudio y a las personas que lo presentan. Los diferentes modos en que puede
encontrarse una variable en el sujeto de estudio son sus estados, categorías o valores.
Aunque éstos términos son aplicables indistintamente, algunos autores utilizan categoría sólo
para los estados de las variables cualitativas (llamando a éstas: atributos) y valor numérico
para los de las variables cuantitativas. Aquí se utilizarán las tres primeras expresiones como
sinónimos, independientemente del tipo de variable de que se trate.
Según el nivel de medición que pueda alcanzarse, a las variables se las clasifica en
cualitativas y cuantitativas. Las variables cualitativas se refieren a propiedades de los
sujetos en estudio cuya medición sólo informa sobre la pertenencia a una categoría sin poder
precisar la “intensidad” de la característica de manera cuantificable. El sexo, la ocupación, el
Prof. Dr. Alberto C Palladino
2
color de cabello, la conducta frente a una adicción, etc., son variables cualitativas. En tanto,
las variables cuantitativas brindan información sobre diferentes tipos de intensidad con la que
se presenta en los sujetos; permitiendo establecer órdenes jerárquicos y comparaciones
numéricas entre los diferentes estados en que puede observarse la variable. Las medidas
antropométricas y muchas de las determinaciones bioquímicas son buenos ejemplos de ellas.
A su vez, las variables cuantitativas pueden ser de dos tipos: discretas o discontinuas o
continuas. Las primeras pueden expresar el estado de la variable sólo por algunos valores
(habitualmente valores enteros); no admitiendo valores intermedios (número de hijos por
mujer, consultas por paciente, etc.). Es posible expresar la paridez por “0, 1, 2, 3 hijos”; pero
no por “1y 1/2, 2 y 3/4 hijos” por mujer. Las continuas pueden expresar el estado de la
variable por un número infinito de valores (edad, peso, uremia, etc.) dentro de un rango
determinado por la naturaleza misma de la variable; siendo el límite de la capacidad de
discriminación la del instrumento de medición o la del observador. Una persona de 25 años,
por ejemplo, puede expresar su edad de esa manera o, también: 25 años y 3 meses, 25 años 3
meses y 2 días; 25 años 3 meses 2 días y 1 hora, etc.; y así hasta el infinito (con las
limitaciones expresadas).
El resultado de una observación es la obtención de un dato estadístico. Se puede
decir que dato estadístico es la expresión del resultado de la medición de una variable. Es
decir, es expresar el estado en que se encuentra una variable. Observación y medición son
utilizados aquí como sinónimos. Más adelante se verá que esta expresión puede incluir un
valor numérico o, simplemente, hacer referencia a un atributo.
La confiabilidad del dato está referida a la medida en la que el dato refleja el
hecho que se mide. Un dato será mas confiable cuanto más se acerque a la realidad a la que
se refiere. Por ejemplo, la lectura de una baciloscopía será más confiable si quien la realiza
tiene mayor experiencia en esa prueba. Es decir, cada vez que se expide sobre una
observación como “positiva” existe alta probabilidad de que realmente el material provenga
de un paciente bacilífero; y cada vez que informe un resultado “negativo” existe alta
probabilidad de que se trata de un paciente no bacilífero. Los problemas de confiabilidad
asociados a los datos mas comúnmente utilizados en clínica y en salud publica se refieren a
los provenientes de: 1) la definición de caso utilizada; 2) el sujeto en observación
(variabilidad de los fenómenos biológicos y sociales); 3) los instrumentos utilizados en la
medición (tanto formularios de recolección de datos como aparatos de medición); 4) los
procedimientos utilizados (tipo de encuesta, problemas de recuerdo y de declaración, etc.); 4)
el observador (capacitación, experiencia, fatiga al momento de la medición). Un dato será
confiable en la medida en que sea reproductible; es decir, repetidas observaciones deben
producir los mismos resultados (con las variaciones tolerables estadísticamente). La
confiabilidad se controla por la repetición de la observación por parte del mismo observador
(confiabilidad intraobservador) y por el control con otro /s observador /es (confiabilidad
interobservador). A fin de que las lecturas reiteradas informen sobre la reproductibilidad es
necesario que se cumpla: 1) las sucesivas mediciones deben realizarse bajo las mismas
condiciones de observación; 2) la técnicas deben estar lo suficientemente estandarizadas; 3)
el observador no debe conocer el resultado de la lectura anterior (propia o de otro
observador). La confiabilidad suele expresarse por índice de Kappa; el que varía entre –1 y
+1. El –1 indica el máximo desacuerdo y el +1 el mayor acuerdo. El “0” se interpreta como
un valor de acuerdo aleatorio. Entonces, esta medida indicará mayor confiabilidad (intra o
interobservador) cuanto más cerca esté de + 1.
Prof. Dr. Alberto C Palladino
3
MEDICIÓN – ESCALAS
Medición es la asignación de una categoría o valor de una característica o variable
dada a un sujeto de observación. Estas características (o variables) pueden presentarse de
distinta manera de un sujeto observado a otro. Por ejemplo, sexo: varón, mujer; estado civil:
soltero, casado, separado viudo; edad: 2 meses 3 años; talla: 55 cm 2 mm. Como se ve,
existen diferentes “estados” en los que se puede encontrar una variable en un sujeto de
observación. Estos son los estados, categorías o valores de la variable y lo que hace la
medición es verificar esa situación. Para esto se aplica una escala; o sea, un instrumento
referencial en el que están contemplados todos los posibles estados de esa variable. Es decir,
la medición es la aplicación de una escala en una observación con la finalidad de
verificar el estado de la variable en la unidad observada. También, medición es la
cuantificación de las diferentes categorías de la variable en la población estudiada. Una
escala de medición es el conjunto (ordenado o no) de categorías (o estados o valores) que
puede presentar una variable. No confundir la escala con el aparato que sirve de soporte a
la misma; por ejemplo, una regla lleva inscripta una escala que corresponde a medidas de
longitud del sistema métrico decimal. La escala no es la regla, es el conjunto de valores allí
grabados cuya existencia es independiente del aparato.
La medición puede ofrecer diferentes niveles de información, según la discriminación
(o precisión) que brinde respecto al estado en que se encuentra la variable. No es lo mismo,
por ejemplo, decir sobre una persona que es varón (variable: sexo, para la que no hay mas que
dos posibilidades) que decir que mide 1,82m (variable: estatura, para la que las posibilidades
de resultados diferentes son mayores). En función del tipo de escala que se aplique es que se
tendrá esa mayor o menor diferenciación en la información. Hay cuatro clases de escalas que
determinan distintos tipos de medición:
NOMINAL: Es la que da el nivel mas elemental de medición; la que alcanza al simple
conteo de las unidades sin que del resultado de la medición pueda establecerse un orden
jerárquico (del estilo de “mayor a menor” o “más intenso a menos intenso”). Se pueden
considerar dos tipos: dicotómicas y politómicas. Las primeras admiten sólo dos categorías
(dolor: si / no; sexo: masculino / femenino; condición al egreso: vivo / muerto); mientras que
las politómicas admiten mas de dos categorías, sin que esto implique un orden (nacionalidad:
argentino / paraguayo / brasileño / boliviano / uruguayo / peruano / español / etc.; estado
civil: soltero / casado / viudo / otros). Nótese que en todos los casos lo que se expresa es la
presencia o ausencia de la categoría. Esto se cumple, aún, en una escala politómica; en donde
sólo es posible determinar la presencia o ausencia de un estado o valor de la variable. Por
ejemplo: la categoría “argentino” (para nacionalidad) implica la ausencia de las restantes; es
decir, excluye cualquier otro tipo de nacionalidad. El estado (o valor) de esa característica se
define por el tipo SI / NO; no existiendo posibilidad de discriminación de intensidad en la
medición (siguiendo con nacionalidad: no es posible definir mayor o menor grado de
´argentino´).
ORDINAL: Con este tipo de escala el resultado de la medición se expresa por categorías que
indican un orden; aunque no es posible establecer relaciones cuantitativas entre ellas (bueno,
por ejemplo, no es el doble o el triple de regular). (Soplo: grado I / II / III / IV; temperatura:
afebril / subfebril / febril; resultado de una evaluación: excelente / bueno / regular / malo). O
sea, el uso de una escala ordinal permite establecer un “orden jerárquico” entre las categorías
de la variable; pero no es posible definir la “distancia” que separa una de otra. A su vez no es
posible distinguir entre diferentes intensidades dentro de una categoría. Si a la variable edad
Prof. Dr. Alberto C Palladino
4
se la mide con una escala ordinal se tendrán categorías del tipo: niño / adolescente / adulto /
viejo; en donde la categoría niño incluirá a un conjunto de observaciones con distintas edades,
no diferenciables con este tipo de medición.
DE INTERVALO: En esta escala las distancias entre categorías de las variables son
cuantificables y la separación entre unidades de la escala se hace por períodos iguales. Con
ella se miden variables cuantitativas. Una característica de este tipo de escala es que el “cero”
es arbitrario y convencional. Esto no permite la comparación entre dos escalas que no tengan
fijado en el mismo punto ese valor cero. Además, no es posible establecer razones o
proporciones entre diferentes valores (ver medidas de resumen). La temperatura es un
ejemplo: el cambio se marca por espacios iguales. Así, de 36° C a 37° C existe la misma
distancia que entre 38° C y 39° C y lo mismo se podría hacer para variaciones de décimas o
divisiones menores de la escala. Sin embargo no se puede afirmar que 40° C es el doble de
20° C. Sólo se dirá, en este caso, que 40° C son veinte grados más que 20° C. Por otra parte,
0° C no expresa ausencia de temperatura sino un estado más de la variable. Las escalas que
miden el cociente intelectual corresponde, también, a este tipo.
DE PROPORCIÓN O RAZÓN: Esta escala constituyen el nivel mas alto de medición para
variables cuantitativas. Además de las propiedades que posee la de intervalo, se destaca el
hecho de que posee el cero absoluto: este valor expresa la ausencia de la característica. Así es
posible obtener proporciones o razones entre valores. Un individuo de 40 años de edad ha
vivido el equivalente a dos de 20 años de edad. El peso, la talla, la capacidad inspiratoria y
muchas de las medidas utilizadas en medicina (antropométricas y cuantitativas de
laboratorio) utilizan este tipo de escala.
Por extensión, suele hacerse referencia a las dos primeras como escalas cualitativas y
a las dos restantes como escalas cuantitativas. En este trabajo se usa, alternativamente, esta
terminología para simplificar.
Un nivel más alto de medición (más alta discriminación) posibilita el uso de un mayor
número de técnicas estadísticas; lo que determina el alcance del análisis de los datos que se
efectuará. Por ello, es recomendable aplicar la escala de mayor nivel posible para la variable a
medir. Por ejemplo, edad acepta la medición por medio de una escala de proporción o razón.
Pero es posible, también, expresarla en categorías tales como: niño, adolescente, adulto,
viejo, utilizando una escala ordinal; y, aún, como: mayor y menor, utilizando una escala
nominal. (Siempre que hay sólo dos categorías se trata de una escala nominal). En realidad
cuando se utiliza una escala de intervalo o de proporción suele hacerse una “conversión” a
una escala de tipo nominal u ordinal, con fines de síntesis. Claro está que existen variable
que, por su naturaleza, no pueden ser medidas con escalas de intervalo o de proporción (sexo,
profesión, estado civil); por lo que, en estos casos, no cabe más que la categorización nominal
u ordinal, según corresponda. En el caso contrario, cuando se aplica una escala cuantitativa,
es posible efectuar la referida conversión. Por ejemplo, la presión arterial puede expresarse
por los valores de la medición (escala de razón) o por categorías cómo: normotensión,
hipertensión leve, hipertensión moderada, hipertensión grave (escala ordinal). Habitualmente,
en medicina se recurre a esta conversión de escalas para hacer referencia al diagnóstico, al
tratamiento o al pronóstico. Se puede decir que dicha conversión solo es posible de una escala
de mayor a menor poder de discriminación del estado de la variable: 1) de cuantitativa a
ordinal o nominal; o 2) de ordinal a nominal. Nunca en sentido inverso
Prof. Dr. Alberto C Palladino
5
Como se dijo anteriormente, el término medición no hace referencia, exclusivamente,
a la aplicación de una escala de intervalo o de proporción. Simplemente, es la aplicación de
una escala (de cualquier tipo) en la observación para el reconocimiento del estado de una
variable. El simple conteo (3 varones, 4 mujeres) es el resultado de haber utilizado una forma
(la mas simple) de medición estadística (presencia o ausencia de la categoría).
El resultado de una medición arroja un dato estadístico. Si la medición se efectuó
con una escala nominal u ordinal el dato se expresará por el nombre del estado o categoría de
la variable. Si se lo hizo con una escala de mayor nivel el dato será expresado por un valor
numérico y una unidad de medida. El valor numérico es la expresión en cifras con la que
se hace alusión al estado de la variable de acuerdo a la escala utilizada. La unidad de
medida es la base (dentro de esa escala) con la que se está expresando el resultado.
He aquí ejemplos de mediciones de variables cuantitativas de dos tipos en las que se
han utilizado una escala de proporción o razón:
Variables cuantitativas
continua
edad
Dato estadístico
28
discreta
concentración de glóbulos rojos en sangre
años
Valor num. un. de medida / valor num.
5.000.000
de glóbulos rojos x mm3
un. de medida
Una vez más se destaca: una variable puede presentar diferentes estados, o categorías
o valores (todos sinónimos). Cualquiera sea la variable observada, puede presentar distintos
valores en esta aceptación del término. En tanto, el valor numérico es una parte constitutiva
del dato estadístico proveniente de una medición con escala de intervalo o de proporción.
Otro término utilizado en Estadística es el de unidad de análisis. Está referido a:
cada elemento constitutivo del conjunto en el que se estudia un fenómeno (universo). La
definición de la unidad de análisis es de suma importancia a los efectos de que el fenómeno
que se investiga sea observado y medido, exclusivamente, en aquellos elementos que forman
parte del conjunto que es materia de estudio. La unidad de observación en tanto, es el
elemento definido para la observación efectiva del fenómeno. Si se quiere evaluar
cobertura de vacuna BCG en menores de un año de una localidad, por ejemplo, cada niño de
esa edad será la unidad de análisis; pero, a los efectos de localizar los niños en una muestra
habrán de definirse familias que serán las unidades de observación. En otros casos ambas
unidades coinciden. Algunos autores utilizan el término “unidad de análisis” para ambos
conceptos. En general, así se lo utilizará en este documento. Las unidades de análisis pueden
tener mayor o menor agregación. Pueden ser unidades de análisis de un estudio: niños
menores de un año de edad; las escuelas de una provincia; los barrios de una ciudad; las
provincias de un país; los países de un continente. Según cómo haya sido definida la unidad
de análisis, será la definición de las variables a estudiar. Algunas pueden ser utilizadas
solamente en determinados niveles de agregados. Por ejemplo: violencia familiar requerirá
una forma de medición que no es sustituible por la violencia de cada uno de sus miembros.
Otras veces, las variables de las unidades de análisis surgen de la combinación de variables
de unidades más desagregadas. Por ejemplo, la mortalidad infantil con la que se expresa el
fenómeno en una localidad o provincia es un resumen estadístico de la presencia o ausencia
del fenómeno (defunción antes del año de edad) en cada uno de los nacidos dentro de un
período.
Prof. Dr. Alberto C Palladino
6
DISTRIBUCIÓN DE FRECUENCIAS - CLASIFICACIÓN
Obtenidos todos los resultados de las mediciones de un estudio se cuenta con una
masa de datos estadísticos cuyo análisis requiere de un tratamiento previo que la haga más
comprensible. Esta es la primera de las finalidades de la estadística (citada al inicio): resumir
una masa importante de datos.
Lo primero es ordenar los datos conforme a la escala utilizada o a la naturaleza de la
variable medida. Si se aplicó una escala cualitativa la categorización es simple y se la hará
según la presencia o ausencia de la característica estudiada si es nominal (ictericia: presente /
ausente) o con arreglo a un determinado orden si es ordinal (dolor: ausente / leve / moderado
/ intenso). Si la escala es cuantitativa el orden estará en función de los valores referenciales de
la escala y los datos se “acomodarán” de forma que exista una progresión creciente o
decreciente. He aquí un ejemplo con número de hijos por mujer entrevistada en una encuesta,
tal como fue registrada la información:
0
3
2
1
3
3
3
1
0
4
7
4
0
1
1
2
1
7
2
4
1
3
5
3
2
El primer paso consiste, entonces, en ordenar los datos. Aquí se lo ha hecho en
sentido creciente. (Podría hacérselo decreciente).
0
3
0
3
0
3
1
3
1
3
1
3
1
4
1
4
1
4
2
5
2
7
2
7
2
Con esto se ha obtenido una serie. Una serie es un conjunto ordenado de datos. La
lectura y comprensión de los datos así presentados resulta, ahora, más fácil. Sin embargo,
poco puede decirse sobre que valores se repiten mas, cuáles menos o cuáles faltan en la serie;
es decir, la descripción de la misma, aún, es dificultosa. Como habitualmente se trabaja con
serie, todavía, más grandes, este problema es mayor si no se avanza en el proceso de
“resumir” la información. El paso siguiente es el agrupar los datos según la característica
referida; haciendo nucleamientos con los que arrojan iguales resultados o que reflejan un
mismo estado de la variable. Para ello se agrupan según esas similitudes, colocando el valor
de referencia y al lado las veces que ese valor se presenta en el conjunto de datos. Esto último
es la frecuencia ( f ): número de veces que un fenómeno se presenta con determinada
característica en una serie de datos. Lo que se obtiene es una distribución de frecuencias;
es decir, un ordenamiento de datos en función de los estados de la variable y de las
frecuencias que le corresponden a cada uno de esos estados.
En el ejemplo dado:
N° de hijos
f
0
1
2
3
4
5
6
7
3
6
4
6
3
1
0
2
25
TOTAL:
Prof. Dr. Alberto C Palladino
7
Ahora se tienen ocho grupos de datos. Cada grupo representa un estado de la variable
(número de hijos) y “f” la frecuencia con la que se observa ese estado (mujeres que tiene ese
número de hijos). Podría sintetizarse más esta serie (haciendo mas fácil su descripción y
análisis) agrupando las observaciones que tiene un número “parecido” (aunque no
exactamente igual) de hijos.
N° de hijos
f
f.r.
0a1
2a3
4a5
6a7
9
10
4
2
36 %
40 %
16 %
8%
TOTAL:
25
100 %
Se ha obtenido, ahora, una agrupación en clases. Clase es una subdivisión de una
escala que permite agrupar datos de características similares. En el último ejemplo se ha
incluido la frecuencia relativa ( f.r. ); la que resulta de expresar en forma proporcional (acá
como porcentaje) la relación de cada clase con el total. Su utilidad está dada por la mejor
comprensión que brinda la expresión en proporciones cuando lo que se desea es destacar el
peso que tiene una parte en el todo (véase “Proporciones”). Otra frecuencia que suele
calcularse es la acumulada; tanto para valores absolutos (frecuencia acumulada: f.a.) como
para valores relativos (frecuencia acumulada relativa: f.a.r) y que resultan de sumar desde
el inicio de la serie (desde el menor valor o desde al mayor valor, según como se haya hecho
el ordenamiento) las frecuencias de cada agrupamiento en forma acumulativa. Esto es útil
cuando se quiere expresar la cantidad de observaciones (en número absoluto o en proporción)
que existe desde el inicio de una serie hasta determinado valor. Continuando con el ejemplo:
N° de hijos
f
0a1
2a3
4a5
6a7
9
10
4
2
f.r.
f.a
f.a.r.
36 %
40 %
16 %
8%
9
19
23
25
36%
76%
92%
100%
Se ha desarrollado un ejemplo de datos provenientes de una medición con escala
cuantitativa. Si los datos fueron obtenidos por aplicación de una escala cualitativa se tendrán
resultados que señalan el estado de la variable respecto a la característica buscada sin
discriminación de “intensidad”; la medición, aquí, se limita a cuantificar la presencia o
ausencia de cada una de las categorías. Supóngase los siguientes resultados para la variable
“estado civil”, correspondiente a las mujeres del ejemplo anterior, según el orden en el que
fueron registradas:
soltera casada casada soltera casada unión de hecho viuda casada soltera
soltera soltera casada casada separada casada unión de hecho soltera
casada casada casada soltera casada unión de hecho soltera casada
Aquí el ordenamiento se hace por la similitud del estado en la que se encontró cada
unidad relevada; no habiendo mayor posibilidad de discriminación en la medición por la
naturaleza misma de la escala (cualitativa):
Prof. Dr. Alberto C Palladino
8
soltera soltera soltera soltera soltera soltera soltera soltera casada casada
casada casada casada casada casada casada casada casada casada casada
unión de hecho unión de hecho unión de hecho viuda separada
La distribución de frecuencias se construiría con las siguientes clases:
N° de hijos
soltera
casada
unión de hecho
viuda
separada
TOTAL:
f
f.r.
8
12
3
1
1
25
32 %
48 %
12 %
4%
4%
100 %
El número de clases a definir dependerá del interés en diferenciar los distintos estados
de la variable. Lo que, en definitiva, se busca es obtener agrupamientos que sean
homogéneos hacia su interior (que reúnan observaciones de características parecidas) y
heterogéneos hacia afuera (diferenciables de las observaciones de otros agrupamientos).
Esta “homo” o “heterogeneidad” está referida a cómo se piensa que se comporta el fenómeno
en estudio respecto a esos agrupamientos. Las clases deben ser exclusivas y excluyentes.
Exclusivas significa que a cada observación le corresponde una clase; y excluyente que,
correspondiéndole a una observación una clase, no puede corresponderle otra.
La clasificación de datos no es más que este procedimiento por el que se ha llegado a una
distribución de frecuencias, se han obtenido clases y calculado las frecuencias de cada una.
El número de clases dependerá del interés del estudio; pero recordando el principio de
economía que debe regir en la estadística a fin de hacer más comprensible la información que
se procesa y que se analizará. Un número elevado de clases hace engorroso el análisis (casi
como si la información no estuviera agrupada); mientras que si se obtienen pocas clases la
clasificación podría no servir para mostrar diferencias de frecuencias entre grupos que,
naturalmente, son diferentes. Como quiera que se definan las clases debe tenerse presente
que una clasificación debe ser exhaustiva; esto es: todos los posibles estados de las variables
deben estar contemplados en ella. Al definir las clases en una escala cuantitativa se deben
fijar puntos de separación entre ellas (adonde termina una y comienza otra). Estos se
denominan puntos de corte y son de suma importancia para definir categorías distintas de la
variable. En medicina son útiles para diferenciar estados mórbidos, con fines de diagnóstico
y pronóstico. P.ej., si se toma 110 mg % como límite de normoglucemia; se está definiendo
que por encima se pasa a otro estado: hiperglucemia, con las implicancias de tratamiento y
de pronóstico que esta definición implica. Cuando se trata de resultados de tipo cualitativo,
cada clase corresponde a una categoría definida nominalmente (también llamada, en este
caso “atributo”).
Prof. Dr. Alberto C Palladino
9
PRESENTACIÓN DE DATOS ESTADÍSTICOS: TABLAS Y GRÁFICOS
En la presentación de un informe, al hacer referencia a un conjunto de datos
estadísticos, se puede recurrir a más de una manera de mostrar esos datos. Dependiendo del
detalle de información que se brinde y de la claridad que esto implique para la lectura y
análisis se tiene distintas formas de presentación. Entonces, la presentación de datos
estadísticos es la manera en la que se muestran los resultados de un estudio, experiencia
o investigación. Puede ser: textual, semitabular, tabular o gráfica. Desde la primera a la
última se gana en síntesis, comprensibilidad en la lectura e interpretación de los resultados;
pero, a su vez, se va perdiendo en la cantidad de información que es posible mostrar y en el
grado de precisión de los resultados presentados.
La presentación textual es la forma más simple y consiste en la inclusión de
datos estadísticos en el texto de un informe. Es decir, es una forma de brindar resultados
numéricos en el relato mismo del informe. Esto brinda la posibilidad de explicar cada grupo
de datos (o, aún, hacer referencia a un dato en particular) y discutir sobre el conjunto tan
detalladamente como al autor le interese. Claro que la lectura de esta información puede ser
abrumadora; lo que complicará su interpretación. Por ello, se suele recurrir a otras formas de
presentación complementarias de la textual; las que enriquecen el informe.
Otra manera de mostrar datos estadísticos es mediante la presentación tabular. Ésta
es una forma de presentación que utiliza una grilla en la que se incluyen las frecuencias
de las diferentes clases definidas. Una tabla estadística consta de tres partes: título, cuerpo
y notas aclaratorias. El título, que habitualmente encabeza la presentación, debe ser claro,
conciso y debe expresar cabalmente el fenómeno que se presenta. Numerado en forma
correlativa dentro del informe, el título no debe llevar abreviaturas (excepto las que son muy
conocidas y no se prestan a confusión) y suele escribirse con letras mayúsculas. Para obtener
un título completo, es decir que haga una buena referencia al fenómeno que se presenta, debe
responder a las siguientes preguntas: ¿Qué?, ¿Cómo?, ¿Dónde? y ¿Cuándo?. Estas preguntas
se refieren a: la naturaleza del hecho que se presenta (el “qué”), el criterio utilizado en la
clasificación -variables presentadas- (el “cómo”) y el lugar y tiempo en que ocurrieron los
hechos (el “dónde” y el “cuándo”). El cuerpo es la parte mas importante de la tabla; en él se
escriben las frecuencias. Es un entrecruzamiento de líneas horizontales y verticales que
forman filas y columnas y que determinan cuadriláteros a los que se les conoce como
casillas, celdas o celdillas. En la primera fila y en la primera columna se inscriben los títulos
de las columnas y de las filas, respectivamente, y corresponden a las categorías de las
variables utilizadas como criterio clasificatorio. La última fila y la última columna (a veces,
las segundas) se reservan para los totales. En las celdas se inscriben las frecuencias
correspondientes a cada clase; las que podrán expresarse en forma de valores absolutos o
relativos. Las inscripciones S/I y S/D se reservan para cuando no existe información. Nunca
una celda debe quedar vacía. En aquellas categorías en donde no hubo ninguna observación
la frecuencia será “ 0 ”. El cero, entonces, es un tipo de frecuencia. No es correcto en estos
casos, dejar la celda en blanco o colocar “ - ”. En realidad, no es correcto dejarla en blanco
en ningún caso. Si del cruzamiento de dos variables utilizadas resulta una categoría
“inexistente” se lo consignará: “ - ”. Por ejemplo, si se ha hecho una clasificación según
sexo y tipo de cáncer, en el entrecruzamiento de “femenino” y “cáncer de próstata” no habrá
una categoría posible; lo cual se lo consignará como “ – ” y no “ 0 ”. Las notas aclaratorias
van al pié del gráfico y sirven para especificar o referir algún elemento especial que deba ser
aclarado o que se desee explicar con mayor detalle. No debe abusarse de estas aclaraciones,
pues la inclusión de un texto extenso haría perder sentido a la presentación tabular.
Prof. Dr. Alberto C Palladino
10
Siempre debe incluirse la fuente de datos en esta sección. En el ejemplo dado en
distribución de frecuencias se ha trabajado con dos variables: número de hijos y estado civil
de la madre que corresponden al criterio de clasificación. La presentación tabular de los
datos trabajados quedaría como lo muestra la Tabla N° 1 (los datos son imaginarios):
TABLA N° 1: EMBARAZADAS CONTROLADAS EN EL CENTRO DE
SALUD “SAN BENITO” SEGÚN ESTADO CIVIL DE LA MADRE POR
NÚMERO DE HIJOS . GOYA (CORRIENTES). MARZO DE 2003
EST. CIVIL | N° HIJOS
SOLTERA
CASADA
UNION DE HECHO
VIUDA
SEPARADA
TOTAL
0-1
3
3
1
1
1
2-3
3
6
1
0
0
4-5
1
3
0
0
0
6-7
1
0
1
0
0
TOTAL
8
12
3
1
1
9
10
4
2
25
FUENTE: Sección Estadísticas del Centro de Salud “San Benito” (Goya, Corrientes)
NOTA: Todas las madres residen en el barrio “San Benito” de Goya, Corrientes.
Los errores mas frecuentes en la construcción de una tabla derivan de la
inobservancia de las recomendaciones generales dadas: títulos muy extensos, confusos o con
abreviaturas no usuales; clasificaciones que no son exhaustivas o no son excluyentes en sus
clases; celdas en blanco; falta de totales; notas aclaratorias demasiado extensas que
transforman la lectura de la tabla, casi, en una lectura textual, etc.
Una forma intermedia (entre la textual y la tabular) es la presentación semitabular.
Esta se caracteriza por ofrecer un ordenamiento de los datos en filas y columnas que no
reúnen todos los elementos de una tabla (título, fuentes, notas aclaratorias, trazado de
la grilla). Se la utiliza para facilitar la lectura de los datos dentro de una presentación
textual; no pudiéndosela interpretar fuera del texto que la contiene. Los agrupamientos dados
anteriormente en “Distribución de Frecuencias” son ejemplos de presentaciones
semitabulares.
Por último, se dispone de la presentación gráfica. Es una forma de presentación de
datos estadísticos mediante un dibujo que resume las principales características
cuantitativas del conjunto de observaciones medidas y sirve para comparar la
intensidad de las variables y de las categorías del estudio.
La presentación gráfica no pretende brindar precisión en los valores de las categorías
que se presentan; más bien, es un auxilio visual para facilitar la comprensión de información
numérica. La inclusión de cifras dentro del dibujo no es necesaria; siempre que no
complique la lectura e interpretación del gráfico. En este caso puede llegar a ser
contraproducente en el sentido de la finalidad misma de esta forma de presentación.
Un gráfico estadístico consta de cinco partes: título, dibujo, referencias, letreros y
notas aclaratorias. Para el título (que en los gráficos se acostumbra escribirlo abajo) y para
las notas aclaratorias se aplican las mismas recomendaciones que para la tabla estadística.
El dibujo es la parte mas importante; representándose en él las variables y categorías con sus
Prof. Dr. Alberto C Palladino
11
correspondientes frecuencias. Los letreros dan denominación a las escalas (son el nombre de
las variables presentadas). Las referencias hacen aclaraciones sobre aspectos de la técnica
del dibujo (color, textura, rayado, etc.); es decir, aclaran respecto a la manera en la que se
han representado las variables y sus categorías. A los gráficos se los clasifica según la base
utilizada para el dibujo en: gráficos de coordenadas cartesianas (de barras simples, dobles,
superpuestas, proporcionales; histogramas; lineal; semilogarítmico; de correlación); gráficos
circulares (sectorial) y gráficos mixtos (pictograma; cartograma, tridimensionales; etc.).
En el cuadro que sigue se resume la clasificación general de gráficos.
1.- GRÁFICOS DEL SISTEMA DE COORDENADAS CARTESIANAS
1.1.- DE BARRAS
1.1.1.- DE BARRAS SIMPLES
1.1.2.- DE BARRAS DOBLES, TRIPLES, MULTIPLES
1.1.3.- DE BARRAS SUPERPUESTAS
1.1.4.- DE BARRAS PROPORCIONALES
1.2.- HISTOGRAMA / POLÍGONO DE FRECUENCIA
1.3.- LINEAL
1.4.- SEMILOGARITMICO
1.5.- DE CORRELACIÓN
2.- GRÁFICOS CIRCULARES
2.1.- SECTORIAL
3.- GRÁFICOS DE TÉCNICA MIXTA
3.1.- PICTOGRAMA
3.2.- CARTOGRAMA
3.3.- TRIDIMENSIONAL
3.4.- GRÁFICO DE CAJA
ETC.
Es interesante señalar que a medida que se avanza en la clasificación (de 1. a 3. del
cuadro) los gráficos ganan en facilidad de lectura y en comprensibilidad de los fenómenos
presentados; a la vez que pierden precisión y detalles de cuantificación de las distintas
variables y categorías.
GRÁFICOS DE COORDENADAS CARTESIANAS: Utilizan este sistema para el
dibujo graficándose en el área que queda arriba y a la derecha del entrecruzamiento de una
línea horizontal (abcisa) y una vertical (ordenada). El entrecruzamiento de ambas
representa el valor cero para las escalas que se inician hacia la derecha (sobre la abcisa) y
hacia arriba (sobre la ordenada). (Algunos gráficos hacen excepción a esto último). La escala
de la ordenada indica las frecuencias de las categorías que se presentan. La escala de la
abcisa señala las categorías de clasificación. (Ver gráficos N° 1 al N° 6, inserto mas adelante,
para mayor comprensión del tema).
Los primeros de este grupo, los gráficos de barra, son de los mas utilizados para
presentaciones científicas. Sirven para datos medidos con escala cualitativa o cuantitativa
Prof. Dr. Alberto C Palladino
12
(variables discretas). Para su construcción se dibujan barras (figuras cuadriláteras de igual
ancho) que, partiendo de la línea de la abcisa, se alzan hasta la altura que referencialmente
marca la escala de las frecuencias (trazada sobre la ordenada, verticalmente). El ancho de las
barras, así como el espacio que las separa, será definido por quién construye el gráfico y
dependerá del efecto visual que se desee obtener. El gráfico de barras simple (Gráfico N°
1) sirve para la presentación de una sola variable y cada barra representa una categoría. Si la
variable, por ejemplo, es “sexo” habrá dos barras (una para “masculino” y otra para
“femenino”). Es posible presentar dos variables agrupando barras y se tienen, así, los
gráficos de barras dobles, triples o múltiples (Gráfico N° 2). En éstos cada grupo de
barras representan una categoría de una de las variables y cada tipo de barra individual
(dentro de cada grupo) representa una categoría de la otra variable utilizada como criterio de
clasificación. El gráfico de barras superpuestas o subdivididas (Gráfico N° 3) se utiliza,
también para representar clasificaciones de dos variables; pero en lugar de agrupar las barras
se las “apila”. El gráfico de barras proporcionales muestra la composición de cada
categoría de una variable según las categorías de una segunda variable (Gráfico N° 4). Es
parecido al anterior (de barras superpuestas) con la diferencia que, en el proporcional, todas
las barras tiene la misma altura. Cada una representa el cien por ciento de una categoría de la
primera variable utilizada en la clasificación y se la subdivide en función de la participación
proporcional (habitualmente., en porcentajes) que tienen las categorías de la segunda
variable. Los gráficos de barra suelen presentarse, también, en posición horizontal; es decir,
con el dibujo rotado 90° (en el sentido de las agujas del reloj); con lo que la abcisa queda
vertical y la ordenada horizontal. Esto no cambia la técnica de construcción ni la
interpretación del gráfico. Para datos cuantitativos continuos se utiliza el histograma, en
donde las categorías están representadas por “cuadriláteros” (como barras; aunque, acá,
pueden ser de ancho desiguales) que se dibujan adosados unos a otros. La intensidad del
fenómeno lo marca la superficie de esos cuadriláteros y no su altura (como en los anteriores).
En la abcisa de este gráfico se inscribe una escala de tipo cuantitativa continua y los
cuadriláteros que representarán a cada clase tendrán el ancho que sus intervalos determinen.
La altura estará dada por la frecuencia media para cada valor individual de la clase; de modo
que al multiplicar la base (el intervalo) por la altura (esa frecuencia media) dará la frecuencia
total de la clase. Por ejemplo, si se tiene que para una clase de 5 a 9 años de edad hay una
frecuencia de 80 casos, el ancho será el dado por los valores “5” y “9” de la escala de la
abcisa y la altura será de “16”; que es el promedio de casos por año de ese grupo. Un
ejemplo de histograma es la pirámide de población. Si se traza el perfil del histograma
uniendo los puntos medios de los lados superiores de cada cuadrilátero (y borrando el resto
del dibujo del histograma) se obtendrá una línea “quebrada” que indicará (con el área que
quede por debajo) la frecuencia del fenómeno; y los distintos niveles de la línea, las
variaciones por clase. A este gráfico se lo llama polígono de frecuencias y, su utilidad, se
hace más manifiesta cuando en un mismo gráfico se dibujan varios “perfiles de histograma”;
ya que, con esto, se puede comparar un fenómeno en diferentes poblaciones.
El gráfico lineal es útil para presentar series de datos obtenidas por mediciones a lo
largo del tiempo. Sirve para mostrar la tendencia de fenómenos (o variables); ya sea, a través
de los años o meses de un período de tiempo o de las diferentes edades de una población.
Para su construcción se marcan puntos en los lugares en que se entrecruza la referencia de la
escala de la abcisa (un año, un mes, una edad determinada) con la frecuencia que le
corresponde en la escala de la ordenada. Al unir estos puntos se traza una línea que es lo que
da el nombre a este tipo de presentación. (Gráfico N° 5). Pueden graficarse más de una
variable o más de una categoría de una variable. Cada una será representada por una línea. El
número de líneas a dibujar estará determinado por las que puedan leerse sin confusión.
Prof. Dr. Alberto C Palladino
13
Aunque clasificado por separado, el gráfico semilogarítmico es, en definitiva, un gráfico de
tipo lineal; con la salvedad que para las frecuencias (sobre la ordenada) se usa una escala
logarítmica. En ella la progresión de los valores se hace en forma geométrica y no aritmética.
Es decir, a igual tramo en la escala no corresponde un igual incremento en valores absolutos
(10, 20, 30); sino un igual incremento en términos relativos (10, 100, 1000). (Gráfico N° 6).
Esto permite comparar fenómenos (o variables) cuyas intensidades corresponden a tramos
muy distantes en la escala de referencia y en donde las tendencias no son bien reflejadas por
el gráfico lineal. Los gráficos 5 y 6 presentan las tasas de mortalidad infantil y de mortalidad
materna de un área (expresadas por mil nacidos vivo) en sendas series según los siguientes
valores:
Mortalidad Infantil
Mortalidad Materna
1985
1987
1989
1991
66,0
3,0
48,0
2,2
38,0
1,7
35,0
1,0
Como puede observarse las variaciones son mayores (en términos de diferencia
absoluta de los valores) para la mortalidad infantil que para la mortalidad materna; lo que
determina una caída más pronunciada en la curva que refleja el primer fenómeno. Sin
embargo, en términos relativos el descenso ha sido mayor para la mortalidad materna: en el
período referido descendió a un tercio desde su inicio; mientras que la mortalidad infantil
descendió menos de la mitad de su nivel inicial.
El gráfico de correlación se utiliza para representar dos variables cuantitativas que
han sido medidas simultáneamente en cada unidad de observación; por ejemplo: glucemia y
glucosuria. Poseen, en consecuencia dos escalas (una para cada variable) que se trazan sobre
la abcisa y la ordenada, respectivamente. En este caso, esas escalas no necesariamente deben
partir de “ 0 “. En realidad, debe marcarse el tramo de la escala que vaya del menor al mayor
valor para cada una de las dos variables. A su vez, y a fin de obtener el efecto visual que se
describirá, el largo de ambas escalas debe ser igual. Cada unidad de observación es
representada por un punto que se marca en la intersección de líneas imaginarias que pasan
por los valores correspondientes en cada una de las escalas. El conjunto de puntos
(correspondiente al conjunto de observaciones) forma un sombreado, un “puntillado”
(nombre, este último, con el que se conoce, también, a este gráfico) cuya dispersión en el
área indicará si existe alguna asociación estadística entre ambas variables. Si el puntillado
forma una franja que corre oblicuamente de izquierda a derecha, en forma ascendente o
descendente, indica que hay alguna asociación. Ésta será “directa” si es ascendente: ambas
variables se mueven en un mismo sentido en cada escala (como temperatura y pulso); e
“inversa” si es descendente: las variables se mueven en sentido opuesto en cada escala
(como ingreso familiar y desnutrición infantil). Cualquier otra distribución del puntillado
indicará que no existe “asociación estadística” entre las variables. Y esa asociación será más
fuerte cuanto menos ancha sea esa franja (más se acerque a una línea) y, a su vez, más se
aproxime a los 45º de inclinación. El coeficiente de correlación de Pearson indica la fuerza
de esa asociación. Este coeficiente varía entre -1 y +1. Ambos valores indican una
asociación perfecta: a igual incremento en la escala de una variable corresponde un aumento
o una disminución (asociación directa o inversa) siempre igual en la escala de la otra
variable. No existe un valor universalmente aceptado como “bueno” para este coeficiente;
aunque comienza a considerarse una asociación aceptable cuando es superior a 1 (con
cualquier signo).
Prof. Dr. Alberto C Palladino
14
GRAFICOS CIRCULARES: A este grupo corresponde un solo tipo: el gráfico
sectorial. Es, éste, un gráfico de fácil comprensión que no requiere demasiado
entrenamiento para su lectura. Por este motivo es útil, también, para difusión masiva de
datos estadísticos. Sirve para la presentación de datos provenientes de mediciones con
cualquier tipo de escala. Para su construcción se utiliza la escala radial, en donde los 360°
(toda la superficie del círculo) representan el total de observaciones. Cada categoría de la
variable que se presenta ocupará un sector del círculo, cuya superficie será proporcional al
peso que tiene esa categoría en el total de las observaciones. Por ejemplo, en un grupo cuya
composición por sexo sea: 80 varones y 40 mujeres, la determinación del sector que le
corresponde a cada categoría se obtiene por una la regla de tres simple:
VARONES
120 observaciones
80 observaciones
X=
80 x 360
= 240°
120
MUJERES
360°
X
120 observaciones
40 observaciones
X=
40 x 360
360°
X
= 120°
120
(Los varones serán representados por un sector de 240° y las mujeres por uno de 120°)
En la página de gráficos se presenta mediante un sectorial (el N° 7) a las mujeres de 0
a 1 hijo según estado civil correspondiente a la serie presentada en la Tabla N° 1 ( y en los
gráficos 1 a 4). Son limitaciones del gráfico sectorial: se debe conocer la totalidad de las
observaciones (trabaja con el 100%) y no es aconsejable representar más que una variable
como criterio de clasificación. (Una segunda variable obligaría a subdividir los sectores; lo
que lo haría muy confusa la lectura e interpretación).
GRÁFICOS DE TECNICAS MIXTAS: El pictograma es útil para difusión masiva por
ser muy comprensible; aunque carece, en absoluto, de precisión. (No es usado,
habitualmente, en presentaciones científicas). Lo que se busca con este gráfico es la rápida
interpretación; para lo que se usan dibujos (esquemáticos, artísticos o humorísticos) en los
que cada unidad dibujada representa un número de observaciones. Así, por ejemplo: si se
quiere representar “camas hospitalarias por provincia” y una provincia tiene dos mil camas,
se pueden dibujar veinte elementos (un dibujo simple que represente una cama) dándole el
valor de cien camas a cada elemento del dibujo. Como puede deducirse, es ésta una forma
de presentación donde la precisión es muy escasa. (Si se deseara graficar dos mil catorce
camas, por ejemplo, habría que recurrir a un elemento más para incluir las catorce unidades
excedentes de dos mil; el que sería incompleto y, obviamente, muy impreciso).
El cartograma es un gráfico que utiliza un mapa, un plano o un croquis para referir
frecuencias de fenómenos acaecidos por áreas geográficas. Las frecuencias se representan
por colores o diferentes tramados del dibujo; o adhiriéndole chinches, alfileres, imanes que
expresen determinado número de casos por elemento agregado; o, simplemente, inscribiendo
el número de casos en área. Tiene la particularidad de que, sobre el dibujo base, es posible la
actualización permanente de los datos; lo que lo convierte en un medio útil en vigilancia
epidemiológica. (Los gráficos lineales comparten esta utilidad).
Los gráficos tridimensionales tienen las características de los gráficos de barra; pero
le agregan una tercera dimensión (en profundidad). De esta manera es posible representar
Prof. Dr. Alberto C Palladino
15
hasta tres variables: una por cada grupo de barras, otra por cada barra dentro de cada grupo y
otra por cada plano en profundidad. Su lectura e interpretación es más compleja que los
anteriores.
Un gráfico de mucha utilidad para la comparación de diferentes series de datos
cuantitativos es el gráfico de caja (“box-plot”, en inglés). Para su construcción, SE traza una
escala (la de los valores de referencia) sobre una línea vertical que es creciente de abajo
hacia arriba; y a su derecha, la/s caja/s. Cada una de ellas representa una serie. La caja es un
cuadrilátero que tiene por altura la extensión que va del cuartil 1 al cuartil 3 de la serie (ver
Medidas de Resumen); es decir, comprende al 50 % de las observaciones. El ancho no tiene
más significado que el determinado por la estética del dibujo. Dentro de la caja, una línea
transversal marcará la ubicación de la mediana. Hacia arriba y hacia debajo de la caja salen
líneas verticales (llamadas “bigotes”) que tendrán, como máximo, una longitud igual al largo
de la caja; hasta abarcar el 95 % de las observaciones; es decir, corresponde a la amplitud
dada por dos desvíos estándar (ver Medidas de Resumen). Terminan en los llamados
“cercados interiores”. Si no hay observaciones que lleguen a esos extremos, el bigote podrá
ser más corto y, también, podrán ser diferentes el superior al inferior. Si la serie Con puntos
o estrellitas se marcan observaciones distantes; las que están por fuera de los bigotes. Como
puede verse, este gráfico permite tomar conocimiento de las características de una serie: su
simetría, su apuntamiento (curtosis), la ubicación de la mediana, del intervalo intercuartílico
y de eventuales valores extremos; así como, comparar varias series en un mismo gráfico. La
Figura 1 muestra una serie asimétrica, con su cola más larga hacia los valores más altos de la
serie y sin que se observen “periféricos” (observaciones que están más allá de los cercados
interiores. Aquí se ha dibujado una serie y de manera horizontal; pero, lo habitual (se reitera)
es graficar la caja verticalmente y, por otro lado, puede compararse varias series en la misma
presentación.
1
2
3
4
5
6
7
8
9
(años de edad)
Figura 1: Gráfico de caja en una distribución “muy sesgada” (sesgo positivo).
Existen otros tipos de gráficos que por su complejidad y su menor uso en medicina y
en ciencias sociales no son pertinentes desarrollar en este documento. El buen manejo de los
ya descriptos es suficiente para una buena presentación de datos en esas disciplinas.
Es importante considerar que, en la actualidad, los programas informáticos realizan
gráficos de todo tipo. Con solo introducir datos y seleccionar el tipo de dibujo el programa
efectuará una presentación que, por otra parte, supera estéticamente lo que pueda hacerse
manualmente. Sin embargo, esto no invalida el conocimiento básico de graficación que
debiera disponerse a la hora de “graficar” con la computadora; puesto que la indicación de
qué gráfico utilizar en cada caso, así como ciertos efectos del diseño, son posible sólo si el
operador conoce la necesidad de su introducción. Un programa es capaz de mostrar un
Prof. Dr. Alberto C Palladino
16
dibujo totalmente inadecuado al fenómeno estudiado o que no exprese lo que se desea si no
se han sabido dar lar órdenes pertinentes.
Para finalizar este punto es menester reiterar que las formas de presentación tabular y
gráfica persiguen la finalidad de mejorar la comprensión de los datos presentados y solo
debe recurrirse a ellas cuando la complejidad de la información lo haga recomendable.Un
informe pletórico de tablas y dibujos no aseguran la calidad de la presentación y, mucho
menos, la validez de la información que se está brindando.
MEDIDAS DE RESUMEN
Se ha visto que una de las finalidades de la estadística (la primera) es la de poder
resumir una masa importante de datos a efectos de mejor comprender las variaciones del
fenómeno (o fenómenos) en estudio. Algo de esto se logra al ordenar, clasificar y
presentar los datos. Sin embargo, aún así, no se expresa con suficiente síntesis la
distribución de frecuencias de los datos. Es mas cómodo (y más útil para el análisis) el
trabajar con unos pocos valores que representen al conjunto observado. Para el citado
objetivo se recurre a las medidas de resumen (MR): instrumentos estadísticos que
sintetizan en unos pocos valores los correspondientes a un conjunto numeroso de
observaciones. Es decir, son valores que representan a una serie. A estos valores que
“resumen” a otros se los llama, también, estadísticos.
Dependiendo de cómo han sido medidas las observaciones existen MR para escalas
cualitativas y MR para escalas cuantitativas. Las primeras corresponden a las cifras
relativas, (muy utilizadas en epidemiología) y conocidas como: proporciones, tasas y
razones. Dentro de las segundas se tiene a las: medidas de posición (de tendencia central
-MTC- o promedios y no centrales –los cuantiles-) y medidas de variabilidad o de
dispersión (MD). En la página siguiente se presenta un cuadro con una síntesis de la
principales MR utilizadas.
CIFRAS RELATIVAS: Es la que resulta de relacionar dos valores absolutos; en dónde
uno es tomado como base de comparación. Desde el punto de vista matemático es un
cociente.
Las proporciones son cifras relativas en las que el numerador está contenido en el
denominador (proporción de alumnos de sexo masculino de un curso, p. ej.). Las tasas son
proporciones especiales en las que se expresa el riesgo (= probabilidad) de ocurrencia de un
fenómeno. La característica especial por las que se las diferencia de las proporciones
comunes es la referida expresión de riesgo y la necesidad de un período de referencia
durante el cual hayan ocurrido los hechos. La tasa indica la “velocidad” de ocurrencia de un
fenómeno y el riesgo de la población expuesta de padecerlo. Por ello, se dice que siempre
está implícita la idea de un período de ocurrencia: el período en el que ocurrieron los hechos.
Una tasa de mortalidad es un ejemplo. En tanto que la proporción indica la participación de
una categoría dentro de una variable, sin que sea necesario un período para su referencia. El
porcentaje de alumnos varones (anteriormente mencionado) es una proporción. Ambas son
cocientes en los que el numerador está contenido en el denominador. En consecuencia, el
resultado variará entre “ 0 ” y “ 1 ”. Como los fenómenos de morbilidad y mortalidad son de
baja frecuencia, ese resultado suele ser un número con varios ceros después de la coma; lo
Prof. Dr. Alberto C Palladino
17
que lo torna difícil de expresar y de interpretar. Por eso, se lo multiplica por un factor de
amplificación que no es más que la unidad seguida de cero; utilizándose más habitualmente:
100, 1000, 10000, 100000, 1000000. El uso del factor de amplificación, además, permite
comparar cifras relativas correspondientes a poblaciones diferentes en tamaño; ya que ajusta
la expresión del fenómeno al número de casos por “XX” cantidad de habitantes. Así, al decir
que una tasa de mortalidad general es del 8.0 ‰ se está diciendo que cada mil habitantes
mueren 8 en el período de referencia. El factor de amplificación utilizado hace referencia a la
cantidad de población (denominador) tomado para la expresión del fenómeno.
ESCALA
CUALITATIVA
TIPO DE MEDIDA
MEDIDA DE RESUMEN
CIFRAS
RELATIVAS
-
PROPORCIONES
TASAS
RAZONES
MEDIDAS DE
TENDENCIA
CENTRAL
-
MEDIA ARITMETICA
MEDIANA
MODO
CUANTILES o FRACTILES:
MEDIDAS DE POSICIÓN
CUANTITATIVA NO CENTRALES
MEDIDAS DE
VARIABILIDAD
O DE DISPERSIÓN
-
PERCENTILES
DECILES
QUINTILES
CUARTILES
ETC.
-
AMPLITUD
DESVIO MEDIO
DESVIO ESTÁNDAR
INTERVALO INTERCUARTÍLICO
Una razón, en tanto, es una cifra relativa que relaciona dos fenómenos diferentes
(p.ej.: densidad poblacional = habitantes / superficie) o dos categoría diferentes de un mismo
fenómeno o variable (p.ej.: índice de masculinidad = varones / mujeres). Pueden llevar o no
factor de amplificación. Si se coloca el valor mayor en el numerador el resultado se
expresará por “cada unidad del denominador”. (Densidad de habitantes: 12 hab/km2).
Sin embargo, y sólo por costumbre, algunas razones se utilizan con factor de amplificación.
(Índice de masculinidad al nacer: 106 varones c/100 mujeres).
Las cifras relativas son de uso frecuente en epidemiología y salud pública;
sugiriéndose la consulta de un texto de estas disciplinas para una explicación más detallada.
Prof. Dr. Alberto C Palladino
18
MEDIDAS DE TENDENCIA CENTRAL: Las MTC (o promedios) son MR que
tienden a ubicarse en el centro de una serie de observaciones y sirven como valores
representativos de la misma. Brindan información sobre el punto (o tramo) de la escala de
referencia donde se “posiciona” la distribución; por lo que se las llama, también,
constantes de posición.
La media aritmética (X) es una medida algebraica de esa posición media; para cuyo
cálculo se tienen en cuenta los valores de todas las observaciones de la serie. En el lenguaje
no técnico es el conocido como promedio; aunque, estadísticamente, promedio es sinónimo
de medida de tendencia central. Matemáticamente, se obtiene por la sumatoria de los valores
de cada una de las observaciones dividido el número de esas observaciones:
n
x
i
x
i
1
n
Donde:
X = media aritmética
= sumatoria de los valores de las observaciones ( i )
n = número de observaciones
Si se trata de datos agrupados en clases el numerados será la sumatoria de los
productos de los puntos medios de clase por la frecuencia de clase. (Punto medio de clase:
promedio de los límites superior e inferior de una clase –mayor y menor valor
respectivamente- que se utiliza como valor representativa de la misma). El denominador
siempre se refiere al conjunto de observaciones. Pueden resumirse las ventajas de la media
aritmética así: es el más conocido de los promedios, es de cálculo fácil, toma en cuenta todas
las observaciones y tiene estabilidad en el muestreo (medias obtenidas de diferentes muestras
de un mismo universo tienden a ubicarse en un mismo punto de la escala). Respecto a sus
desventajas puede decirse: no es posible utilizarla cuando no se conocen los valores de
algunas de las observaciones y tiende a desplazarse del centro en series muy asimétricas (lo
cual puede ocurrir, por ejemplo, cuando existen valores extremos o aberrantes). Se entiende
por valores aberrantes a aquellos que se apartan del agrupamiento principal de la
distribución. Su presencia influye en la media aritmética haciendo que la misma se desplace
hacia el extremo donde se ubica el valor aberrante, dejando de ser una MTC ya que su valor
no tenderá a ubicarse en el centro de la serie.
Obsérvese el siguiente ejemplo de datos referidos a edades (en años):
2, 2, 3, 4, 4, 5, 5, 5, 6
Aplicando la fórmula: la sumatoria de los valores es 36. Al dividir esta sumatoria
por 9 observaciones, dará: 4. Por lo tanto la media aritmética es de 4 años de edad; valor
que, como puede verse, corresponde a una posición central en el tramo de la escala utilizada
para la medición de estas observaciones; es decir un valor que cae en el centro de la serie.
Prof. Dr. Alberto C Palladino
19
Supóngase, ahora que uno de esos valores fuera muy apartado del conjunto (un valor
aberrante):
2, 2, 3, 4, 4, 5, 5, 5, 24 (!!)
Ahora la suma será 54 y la media será de 6 años de edad. Este, obviamente, no es un
valor central y, por lo tanto, mal representará a esta serie. En estos casos resulta aconsejable
la utilización de otra medida: la mediana (Ma). Esta es una MTC que se ubica en el
centro espacial de la serie. Es el valor que corresponde a un lugar de la serie que deja
igual número de observaciones por delante y por detrás de la misma. Para su cálculo es
necesario seguir los siguiente pasos:
1) Ordenar los datos. (Es decir, hacer del conjunto de datos una serie).
2) Hallar el lugar donde cae la mediana.
3) Hallar el valor de la mediana.
n+1
2
Ordenada la serie se busca el lugar. Para ello se aplica la fórmula:
Siguiendo con el ejemplo anterior:
9+1 = 5
2
“5” es el lugar donde cae la mediana. Hallar el valor, en este caso en que hay un
número impar de observaciones, es fácil: es la quinta observación (contando de izquierda a
derecha o de derecha a izquierda). Esa observación tiene el valor 4. Por lo tanto, la mediana
de esta serie es de 4 años de edad.
2, 2, 3, 4, 4, 5, 5, 5, 6
Si el número de observaciones fuera par:
2, 2, 3, 4, 4, 5, 5, 5, 6, 8
10 + 1
2
= 5,5
“5,5” es el lugar donde cae la mediana; es decir en la mitad entre el 5º y el 6º lugar.
Para hallar el valor deberá sacarse la media de los valores de las observaciones que
corresponden a esos lugares; ya que 5,5 representa la mitad del espacio comprendido entre
ambas. El quinto y el sexto lugar lo ocupan observaciones que tiene valores 4 y 5,
respectivamente. Por lo tanto, la mediana será la media de 4 y 5; es decir: 4,5 años de edad.
Si existiera un valor aberrante:
2, 2, 3, 4, 4, 5, 5, 5, 24
10 + 1
2
= 5,5
Como puede verse el lugar de la mediana no cambia y su valor tampoco; es decir, no
se ve influido por un valor aberrante.
Podría ocurrir, también, que no se conociera el valor de una o más observaciones;
pero sabiendo que ellas existen. En este caso se distribuyen en el comienzo y en el final de la
serie como S/D (o, lo que es lo mismo, ignorándolas). Para el ejemplo dado con diez
observaciones, si se desconociera el 3 y el 6 se ordenaría así:
S/D, 2, 2, 4, 4, 5, 5, 5, 8, S/D
10 + 1
2
= 5,5
Nuevamente, acá se ve cómo la mediana no se ve afectada por esta circunstancia.
Prof. Dr. Alberto C Palladino
20
Para datos agrupados en clases la mediana se calcula siguiendo los tres pasos
descriptos con anterioridad; sólo que, en este caso, el lugar donde cae la mediana estará
ubicado dentro de una clase. Para obtener el valor (que estará comprendido dentro de esa
clase) se aplica una fórmula especial por la que se establece la proporción del intervalo de
clase que representa la distancia entre el inicio de la misma y el lugar donde cae esta MTC.
(Intervalo de clase: distancia entre una clase y la siguiente, indica el tamaño de la clase o el
tramo de la escala de referencia que la define).
En resumen, las ventajas de la mediana son: es útil en series muy asimétricas (como
las que se obtienen cuando existen valores aberrantes) y es aplicable aún, cuando falta
información (como ocurre en series agrupadas con clases abiertas). Sus desventajas son: su
cálculo es algo más complejo que el de la media; es, matemáticamente, menos exacto como
promedio y su estabilidad en el muestreo es menor. Aunque aquí se ha clasificado a la
mediana como de uso para datos cuantitativos, es aplicable también en datos provenientes de
una medición con escala ordinal. Ordenados los datos de manera jerárquica, la mediana
corresponderá al valor de la observación ubicada en el centro; igual que con datos
cuantitativos, aunque no se exprese numéricamente.
Por último se dispone del modo (Mo) que es el valor que se repite con mayor
frecuencia en una serie. En el ejemplo que se viene desarrollando:
2, 2, 3, 4, 4, 5, 5, 5, 6, 8
El modo será 5 (5 años de edad) ya que se presenta con mayor frecuencia que los
otros valores. Son ventajas del modo: es fácilmente comprensible y de fácil obtención. Y son
sus desventajas: matemáticamente es el promedio menos exacto; no tiene estabilidad en el
muestreo; puede no ser una MTC y, aún más desventajoso, una serie puede tener más de un
modo (series bimodales, polimodales) e, incluso, no tener ninguno. Como promedio es el
menos útil como medida de tendencia central (usado aisladamente). También el modo es
aplicable en datos cualitativos: será, simplemente, la frecuencia del tipo de dato que más se
repite.
En realidad las tres medidas son útiles de alguna manera y su uso simultáneo brinda
información, no sólo de la posición que la distribución de frecuencias ocupa en la escala de
referencia, sino también de la mayor o menor simetría de la curva que la representa, como lo
muestra la Figura 2.
modo
mediana
modo
media
mediana
media
modo
mediana
media
asimetría negativa
curva simétrica
asimetría positiva
Figura 2: Diferentes curvas de distribución de frecuencias (según su simetría) y
ubicación de la medidas de tendencia central.
Prof. Dr. Alberto C Palladino
21
Cuanto más simétrica sea esa curva, más tenderán a confluir las tres medidas en el
centro de la misma. En las curvas asimétricas la media aritmética se desplaza en el sentido
del lado en donde se encuentra el mayor peso o la cola más larga; alejándola de la posición
central. En tanto, la mediana, habitualmente, se desplaza menos; lo que la ubica entre la
media aritmética y el modo. Este, siempre estará en el punto más alto de la curva ya que, por
definición, es el valor de mayor frecuencia en la serie. Cuanto más apartadas están estas
medidas entre si indican una mayor asimetría de la distribución. Representando gráficamente
estas distribuciones:
MEDIDAS DE POSICIÓN NO CENTRALES: Son medidas de posición que no se ubican
en el centro de la distribución. Surgen de divisiones de la serie en tramos iguales de
observaciones. Son los cuantiles o fractiles. El valor del cuantil será el que le corresponda
a la observación ubicada en la posición que esta medida señala. De aquellos, los más usados
son: los percentiles, los quintiles, los deciles y los cuartiles. Los percentiles (P), o
percentilos o centiles o centilos, resultan de dividir la serie de observaciones en cien. De
modo que hay cien percentiles, uno por cada división centesimal. Cada percentil tomará el
valor que corresponde a la observación ubicada en esa división centesimal. Se nominan del
“percentilo 1” (P1) al “percentilo 100” (P100).
Supónganse los siguientes valores y frecuencias acumuladas en una serie de
cuatrocientas observaciones de sujetos normales:
Glucemia (mg /100cc):
Observación N°:
Percentilo:
67
4
1
75 83 87 91 95 98 100 105 112
40 120 160 200 280 320 360 380 400
10 30 40 50 70 80 90 95 100
Hasta el valor 67 hay cuatro observaciones = 1% de observaciones de la serie
67 mg es el percentilo 1
Hasta el valor 83 hay 120 observaciones = 30% de observaciones de la serie
83 mg es el percentilo 30
Hasta el valor 112 hay 400 observaciones = 100% de observaciones de la serie
112mg es el percentilo 100
Entonces, el percentilo 40 será 87 mg /100 cc; el percentilo 50: 91 mg/100 cc; etc.
Obsérvese que la mediana constituye el percentilo 50.
Con la misma metodología puede dividirse la serie en cinco y se obtienen los
quintiles (Q); o en diez y se obtienen los deciles (D); o en cuatro y se obtienen los cuartiles
(C). El C1 = P25, el C2 = P50, el C3 = P75. Es decir, el decil 5 y el cuartil 2 corresponden
al percentilo 50; el que, a su vez es la mediana.
Prof. Dr. Alberto C Palladino
22
Aunque estas son medidas de posición dan idea, también, de la dispersión de los
valores al señalar el mayor o menor alejamiento del cuantil respecto al centro de la
distribución. Cuando está indicado el uso de la mediana como MTC se la suele acompañar
de los cuartiles, como MD. Se llama intervalo intercuartílico (o recorrido o rango
intercuartílico)a la diferencia entre el tercer cuartil (C3) y el primer cuartil (C1). Este
espacio abarca el 50% de las observaciones.
MEDIDAS DE VARIABILIDAD O DE DISPERSIÓN: Las MD son MR que sirven
para expresar como se distribuyen las observaciones en una serie. Son el complemento
necesario de las medidas de tendencia central para describir una distribución de frecuencias.
Las MTC indican en qué punto de la escala se ubica la distribución y las MD como se
dispersan sus observaciones. Se describirán, aquí, dos de las más utilizadas: amplitud o
rango y desvío estándar.
La amplitud o rango es la diferencia entre el mayor valor (extremo superior) y el
menor valor (extremo inferior) de una serie. (También existe una amplitud de clase que
es la diferencia entre el mayor valor, o límite superior y el menor valor, o límite inferior de
una clase). La amplitud da una idea acerca de la dispersión de las observaciones; pero es la
menos útil para ese fin.
El desvío estándar (s) es la medida de dispersión más utilizada y se calcula en
base a la media aritmética. Se halla con la fórmula que se muestra a continuación; en
donde puede advertirse que su valor dependerá del “distanciamiento” que tengan los valores
de las observaciones individuales respecto a la media.
n
xi - x
2
i
s
2
1
n
Donde:
x = media aritmética
n
x
= valor de cada una de las observaciones
= sumatoria de los valores de las observaciones (i )
= número de observaciones
Como puede observarse, se trata de promediar los desvíos de cada valor individual
respecto de la media aritmética. (El exponente tiene por finalidad anular la compensación
que resultaría al sumar desvíos de signos opuestos y la raíz cuadrada es para invertir aquella
operación). En la “curva normal” (correspondiente a una distribución de frecuencias
simétrica) el valor del desvío estándar sumado y restado a la media abarca el 68,3% de
las observaciones. Si se utilizan dos desvíos estándar se abarca el 95,4 % y con tres el
99,7 % de las observaciones. (Porcentajes aproximados). Esta es la importancia de esta
Prof. Dr. Alberto C Palladino
23
medida de resumen: poder expresar con un valor en cuánto se apartan de la media aquellos
porcentajes de observaciones; lo que indica su dispersión.
Siguiendo el ejemplo trabajado hasta aquí, se tenía la serie: 2, 2, 3, 4, 4, 5, 5, 5, 6
(edad en años). Aplicando la fórmula del desvío estándar se obtiene un valor de 1,33 años de
edad (redondeando en dos decimales). Ya se había calculado la media (4 años de edad). Por
lo tanto puede afirmarse que el 68,3 % de las observaciones tiene edades que están
comprendidas en el intervalo de 4
1,33 años de edad; es decir en el intervalo
comprendido entre 2,67 y 5,33 años de edad, que son los valores que resultan de sumar y
restar a la media aritmética una vez el valor del desvío estándar. Si se suma y resta el valor
correspondiente a dos desvíos estándar: 4 2,66 años de edad se tendrán los límites (1,34 y
6,66 años de edad) del intervalo entre los que estarán comprendidos el 95,4 % de las
observaciones. Por último sumando y restando el valor correspondiente a tres desvíos
estándar a la media se tendrá comprendido el 99,7% de las observaciones. ¿Por qué no se
cumplen con exactitud las proporciones en esta distribución?. Primero, porque el tipo y
número de observaciones no permite el cálculo de los porcentajes dados. Pero, por otra parte
y más importante que lo anterior, porque estas proporciones se darán si la distribución es del
tipo “normal” (ver curva normal). Sin embargo, aún en los casos en que el fenómeno se
presenta con una distribución “aproximada” a la normal (como son muchos de los
fenómenos que se observan en la realidad estudiada por la medicina y por la salud pública)
es aplicable el cálculo del desvío estándar; el que brindará intervalos en los que el número de
observaciones tendrán porcentajes aproximados a los dados. En la figura N° 3 (tomada de
“Introducción a la Bioestadística” de H. Bancroft) puede observarse como se distribuyen las
observaciones en la curva normal según el desvío estándar.
Prof. Dr. Alberto C Palladino
24
Una idea de la dispersión de una distribución, también, se obtiene a partir del
coeficiente de variación (CV). El CV es el cociente entre la distribución estándar y la media
aritmética, expresado en porcentaje. P. ej., si se tiene una media de estaturas de 170 cm y un
desvío estándar de 17 cm, el cv será del 10 %. Cuanto menor sea este porcentaje habrá una
mayor concentraión de las observaciones alrededor de la media respecto a sus valores.
Dos medidas mas, que describen la distribución de frecuencia, completan el conjunto
de estadísticas utilizadas para la descripción de un conjunto de observaciones. Son la
curtosis y la simetría. Sobre esta última ya se mostraron diferentes distribuciones. El valor
que refiere esta característica oscila entre – 1 y +1. Siendo “ 0 “ el valor correspondiente a
una distribución simétrica, un valor negativo indicará asimetría negativa (o sesgo negativo:
la cola más larga hacia los valores inferiores de la escala) y un valor positivo asimetría
positivo (o sesgo positivo: la cola más larga hacia los valores superiores de la escala}.
La curtosis, en tanto, señala el grado de dispersión de los datos en torno a la mediana. O sea,
cuán “picuda” o “aplanada” es la curva. También, aquí los valores oscilan entre – 1 y + 1.
Las curvas se denominan “leptocúrticas” cuando son apuntadas (“picudas”), “platicúrticas”
cuando son aplanadas y mesocúrticas a las de situación intermedia. A esta última le
corresponde el valor “ 0 “ en esta medida; el que será positivo cuando tienda a leptocúrtica y
negativo cuando tienda a platicúrtica.
La curva normal es la que representa a un tipo de distribución de frecuencias
simétrica a la que se adaptan (por aproximación) muchos de los hechos y fenómenos
biológicos y sociales. En ella las tres MTC coinciden en un lugar de la escala que
corresponde al acmé (punto más elevado) de la curva y dividen la distribución en dos
mitades iguales (imagen en espejo); comprendiendo, cada una, el cincuenta por ciento de las
observaciones y la distribución de esas observaciones se hace de acuerdo a los porcentajes
vistos en “desvío estándar”. La asimetría y la curtosis tienen valor “ 0 “ en este tipo de
distribución. En realidad, prácticamente no hay fenómeno en medicina y en ciencias sociales
cuya distribuye tenga estas características. Sin embargo, las estimaciones estadísticas que se
basan en medidas como el desvío estándar se utilizan, aún, en el caso que el fenómeno no
tenga un comportamiento “exactamente” como el de la distribución normal. Estos
estadísticos, ofrecen un razonable grado de aproximación para la valoración de las
distribución de las observaciones; excepto que la serie sea marcadamente asimétrica.. Si la
distribución es “muy asimétrica” el error puede ser importante y conviene, en ese caso,
utilizar otras medidas como la mediana y los cuantiles, según lo desarrollado en el párrafo
anterior
La importancia en medicina de comprender estos aspectos básicos de la curva normal
radica en que lo definido como normal para los fenómenos que aquélla estudia hace
referencia a la normalidad estadística. Al aplicar una prueba diagnóstica a sujetos normales
(definidos como tales por una prueba patrón: anatomía patológica, por ejemplo) se obtiene
una gama importante de resultados. Si con éstos se construye una curva se observará que la
mayor frecuencia se encuentra al centro; declinando las frecuencias hacia los extremos.
Existen valores apartados en la curva correspondientes a observaciones que, siendo normales
(según criterios patrón), son poco frecuentes y, en realidad, están en un sector de la escala en
donde es más común observar sujetos anormales (siempre de acuerdo al criterio patrón). Se
suele definir como “normal” a los resultados de una prueba que se encuentran en el intervalo
Prof. Dr. Alberto C Palladino
25
comprendido por la media aritmética ± 2 desvíos estándar. Esto representa el 95,44 % de las
observaciones; o sea, habrá un 2,28 % de sujetos normales que presentarán valores por
debajo y otro tanto por encima de aquel intervalo. Este casi 5 % de normales (según el
criterio patrón) serán catalogados como “anormales” por el resultado de la prueba.
Ha modo de síntesis, he aquí un cuadro con las medidas de resumen más
comúnmente utilizadas y posible de aplicar según el tipo de escala usada en la medición de
las variables:
Debe entenderse que las escalas de mayor poder de discriminación en la medición
suman a las medidas señaladas para ellas las que son posibles de aplicar en escalas de más
bajo poder de discriminación.
INFERENCIA ESTADÍSTICA
El término “inferencia”, en sentido general, se refiere al conocimiento que se
obtiene a partir de otros conocimientos disponibles. La expresión “inferencia estadística”
está vinculada a la aplicación de técnicas estadísticas dentro de ese significado.
Inferencia estadística es una de las funciones de la estadística que permite hacer
generalizaciones de resultados obtenido en muestras, seleccionadas de manera
aleatoria, al universo del cual aquéllas fueron extraídas; estimando la probabilidad de
error debido al azar.
Por esta definición, ya puede derivarse que este capítulo de la estadística viene a
cumplir la segunda finalidad de esta disciplina (“cuantificar la influencia del azar”) señaladas
al comienzo de este documento.
Los estudios sobre poblaciones humanas se realizan, generalmente, sobre una
muestra del universo investigado. Esto es así por la amplitud que suelen tener dichos
universos y por tratarse, muchas veces, de conjuntos permanente cambiantes. La técnica del
muestreo permite obtener resultados que, cuando aquélla se ha realizado con rigurosidad
metodológica, son generalizables a la población de la que fue extraída la muestra y, aún, a
otras poblaciones que posean características similares. Sin embargo, estas generalizaciones
tienen un margen de error derivado del hecho mismo de no trabajar con el total de las
observaciones sino con una parte que (en algunos casos) puede no ser representativa del
Prof. Dr. Alberto C Palladino
26
conjunto. Entiéndase por “error”, aquí, al obtener una muestra no representativa del universo
a pesar de haberse seguido una técnica de muestreo correcta. Si bien no es posible identificar
a la muestra no representativa, puede estimarse la probabilidad de que los resultados
obtenidos provengan de una de ellas. Se suele representar esa estimación por la letra “ p ”
seguida de una fracción de la unidad que indica la probabilidad de error. Por ejemplo:
“ p 0,01 ” significa que existe no más del uno por ciento de probabilidad de que el valor
de la muestra no se corresponda con el del universo. A este nivel de “p” se le llama nivel de
significación estadística. Suele tomarse como aceptable un nivel de significación estadística
no mayor al cinco por ciento ( p 0,05 ); aunque esto es una convención que sólo intenta
marcar un margen de seguridad y suele ser exigido para la aceptación de trabajos científicos.
Básicamente, las inferencias que se realizan a partir de muestran tienen dos
aplicaciones: 1) estimar un parámetro poblacional y 2) estimar diferencias entre grupos.
ESTIMACIÓN DE PARÁMETROS: Se denomina estimador a un valor correspondiente
a una medida estadística obtenido en una muestra. Son estimadores las medidas de resumen:
x = media aritmética, Ma = mediana, s = desvío estándar; y, también, medidas riesgo, de
correlación y diferencias encontradas en muestras. En tanto, parámetro es el valor de una de
esas medidas en el universo y que se desea estimar a partir de los valores muestrales. Los
parámetros de las medidas de resumen se simbolizan con letras griegas: μ = media
aritmética; σ = desvío estándar. Esta inferencia suele hacerse expresando un tramo de la
escala dentro del que se piensa está el parámetro. Este tramo, que se denomina “intervalo de
confianza se construye calculando, previamente, el error estándar de la muestra (EEM).
Este proviene de una fórmula en dónde entran en consideración: la variabilidad del fenómeno
(desvío estándar, p. ej.) y el tamaño de la muestra. El valor del EEM sumado y restado al del
estimador (valor de la muestra) definirá el intervalo de confianza. Puede construirse un
intervalo de confianza aplicando 1, 2, 3 ó más EEM. La cantidad de EEM con la que se
construya el intervalo definirá el nivel de confianza con el que se realiza la estimación. Ese
nivel tiene valores similares al del desvío estándar: 68 %, 95 %, 99 %, según se tomen 1, 2, 3
desvíos estándar. Si se expresa, por ejemplo, que la media de la colesterolemia encontrada
en un estudio fue de:
225 mg / 100 cc (I.C. 95 %: 200 mg, 250 mg / 100 cc)
se está diciendo que, habiéndose obtenido un valor medio en la muestra de 225 mg/100 cc, la
media poblacional se estima que está entre 200 y 250 mg/100 cc con un nivel de confianza
del 95 %. Ahora bien, si ese es el nivel de confianza, lo que resta (un 5 %) será la
probabilidad de que el valor del universo NO esté dentro de ese intervalo. Por ello, el
resultado anterior, también, puede verse expresado de la siguiente manera:
225 mg / 100 cc
25 mg / 100 cc con una p
0,05
que significa que, habiéndose obtenido un valor medio en la muestra de 225 mg/100 cc, la
media poblacional se estima que está entre 200 y 250 mg/100 cc, con una probabilidad de
error no mayor al cinco por ciento.
Los valores que marcan los extremos del rango de la estimación se denominan
límite superior y límite inferior del intervalo de confianza.
Prof. Dr. Alberto C Palladino
27
Adviértase, entonces, que el error estándar es utilizado, en definitiva, para valorar la
probabilidad de que la estimación no sea la adecuada en virtud de que la muestra utilizada no
sea representativa del universo, a pesar de habérsela obtenido por un procedimiento
probabilístico. El error proveniente vicios o errores metodológicos en la selección de la
muestra no son mesurables estadísticamente.
Por último, se advierte que “error estándar” no es lo mismo que “desvío estándar”;
aunque para sus respectivas finalidades utilicen porcentajes iguales según el número de
estadístico tomado. El desvío estándar se aplica para mesurar la dispersión de valores
individuales en la muestra; mientras el error estándar se utiliza para valorar la probabilidad
de que un parámetro se encuentre dentro de un determinado rango de valores (intervalo de
confianza).
ESTIMAR DIFERENCIAS ENTRE GRUPOS: Las diferencias encontradas entre dos
grupos muestrales pueden corresponderse con diferencias “reales” (es decir que ambos
grupos provengan de universos diferentes) o ser, simplemente, diferencias encontradas por
haberse tomado una o más muestras no representativas de un universo único. Se denomina
prueba de hipótesis al testeo de una hipótesis para aceptar a diferencias encontradas entre
grupos muestrales como diferencias reales; es decir, correspondientes a diferencias entre
universos distintos. Éste es el caso de, cuando en un trabajo experimental, a un grupo se le
suministra una droga nueva, por ejemplo, y al otro se le aplica el tratamiento habitual o un
placebo. También, cuando en un estudio observacional se desea evaluar la relación entre un
daño y un factor de riesgo determinado (comparando las diferencias cuantitativas del daño
entre el grupo de expuestos y el de no expuestos). En estos casos se utiliza la expresión
“las diferencias fueron (o no fueron) estadísticamente significativas” para referir la
mencionada probabilidad de error. Serán estadísticamente significas si el valor de “p” es
igual o menor al 5 % (p 0,05); aunque éste es un valor tomado convencionalmente, como
ha sido dicho ya. Pudiera ser que ese valor sea superior al 5 % (p. ej.: p
0,10); pero las
diferencias sean importantes como para tenerlas en cuenta desde el punto de vista de la
intervención a realizar. Por eso cuando se expresa que la diferencia no fue estadísticamente
significativa, conviene consignar tanto el valor de la diferencia como el de “p” para dejar que
el lector pueda hacer su propio análisis. Como se ve, “significación estadística” no “implica
importancia clínica”. Las diferencias entre los grupos pueden ser importantes para la
clínica; aunque estadísticamente no se haya obtenido significación. Y lo contrario:
diferencias significativas estadísticamente pueden ser de muy poca utilidad en la clínica.
Obsérvese que la aplicación del término ´significativo´ es utilizado con la finalidad
estadística de extrapolación al universo y no de importancia por su magnitud.
Para obtener el valor de “ p “ se utilizan pruebas de significación estadística;
dentro de las cuales están: el chi cuadrado ( x2 ) y la t de Student ( t ). Existe una
importante variedad de éstas y otras pruebas de significación según el diseño y tipo de
estudio. Los cálculos que permiten obtener los valores de estas pruebas exceden los
propósitos de este documento y, actualmente, están disponibles en los principales programas
informáticos de análisis estadísticos. De todos modos, siempre la interpretación es la misma:
el valor de “p” hace referencia a la probabilidad de error en la generalización de los
resultados.
También puede valorarse estadísticamente las diferencias aplicando el intervalo de
confianza. La técnica será la misma: al valor de la diferencia se le suman y restan errores
estándar de la diferencia para construir un intervalo que tendrá el nivel de confianza
Prof. Dr. Alberto C Palladino
28
correspondiente al número de errores tomados; y que se expresará de la misma manera que la
que se hace al estimar un parámetro..
Como se ha visto, entonces, las técnicas de significación estadística se la utiliza:
1) cuando se desea estimar un parámetro poblacional, mediante el uso de intervalos de
confianza; y
2) cuando se desea valorar la probabilidad de que una diferencia hallada en muestras pueda
generalizarse a la población, mediante el uso de pruebas de significación estadística o
del intervalo de confianza.
BIBLIOGRAFÍA
1. Bancroft H. Introducción a la Bioestadística. Buenos Aires: EUDEBA; 1965.
2. Camel F F. Estadística Médica y de Salud Pública. Venezuela: Unde los Andes; 1970.
3. Milton JS. Estadística para Biología y Ciencias de la Salud. 2ª ed. España: McGrawHill Interamericana; 1994.
4. Norman G, Streiner D. Bioestadística. 2ª ed. Madrid: Mosby/Doyma Libros; 2001.
5. Pineda EB, de Alvarado EL, † de Canales FH. Metodología de la investigación.
Manual para el desarrollo de personal de salud. Serie PALTEX para ejecutores de
programas de salud Nº 35. 2a. ed. Washington: OPS; 1994.
6. Riegelman R K, Hirsch R P. Cómo estudiar un estudio y probar una prueba lectura
crítica de la literatura médica. OPS/OMS, Publ Cient 531; 1992.
7. Weintrub J, Douglas C, Gillings D. Bioestadística en Salud Bucodental. Washington:
OPS; 1989.
Prof. Dr. Alberto C Palladino
29
Descargar