Tratamiento estadístico de datos. Métodos y programas

Anuncio
E^sr.AOis^ric.^,A FsP.^!'vc^^..^
L. LEBART , A. MORINEAU, J . P. FENELON .
Tratamiento Estadístico de Datos.
M étodos y programas. Ed . Marcombo,
Barcelona . 1985, 520 + XI páginas.
Tablas, anexos y ap éndices.
por
C. M. CUADRAS
Universidad de Barcelona
La obra que reseñamos es traducción de "Traitement des données statistiques.
Méthodes et programmes", Bordas, París. Vista en conjunto, constituye una buena
sintesis de las técnicas clásicas y recientes de la estadística y la informática. Como
advierten los autores, el lector de "Tratamiento Estadístico de Datos" debe tener
conocimientos de cálculo de probabilidades, estadística aplicada ^e informática (a nivel
de conocer uno o varios lenguajes de programación). Por lo tanto se trata de una obra
para profesionales o usuarios conscientes de la estadística o para estudiantes de un
segundo ciclo de estadística aplicada.
La obra incorpora las técnicas recientes de la estadística (análisis de datos multidimensionales, análisis exploratoríos de datos, estimador jacknife, clasificación automática, ete.), junto con otras técnicas clásicas (pruebas no paramétricas, análisis de la
^arianza, etc.). Di^^idida en cinco grandes capítulos, en el capítulo 1 se presentan los
aspectos esenciales de la teoria de la probabilidad, en forma condensada pero bastante
completa (probabilidad en álgebras de sucesos, variables aleatorias finitas y generales,
distribuciones bivariantes y multivariantes, teoremas límites}, junto con algunas nociones de estadística (muestras, estadísticos, estimadores) y aplicaciones de las mismas
(métodos de Montecarlo, simulación, método "jacknife").
La introducción al razonamiento estadístico se hace por la via no paramétrica,
contrariamente a lo que sería usual. Así, los métodos no paramétricos, de uso más
general y explicación relativamente sencilla, son debidamente explicados en el capítulo
2. La exposición es bastante didáctica y rica en ejemplos. Además de las pruebas
clásicas (de los signos, de Wilcoxon - Mann-Whitney, binomiales) se presentan otras
menos habituales en la literatura sobre el tema.
Las técnieas de regresión y análisis de la varianza se explican en el capítuio 3, como
una consecuencia del modelo lineal, que se define y estudian sus propiedades, primero
sin hipótesis de normalidad y a continuación suponiendo normalidad sobre la variable
dependiente o endógena. En el primer caso se estudia la estimación de 1os parámetros
C'RITIC'A D£ LIBRC)5
199
del modelo y en el segundo caso se Ilega al test F y sus aplicaciones. Todo ello permite
enfocar con comodidad el análisis de la varianza (de un criterio o varios) y el análisis de
la covarianza. Es de destacar, que el clásico test t de Student no se explica como tal, y
que sólo se aborda el modelo lineal con matriz de diseño de rango máximo, lo que
permite evitar las matrices inversas generalizadas, pero impide abordar el caso general.
E1 análisis de datos, en sentido rnultidimensional, es decir, el tratamiento estadístico
simultáneo de varias variables, se inicia en el capítuio 4. En realidad es a partir de aqui
donde los autores aportan sus contribuciones más originales al tema, pues son acreditados especialistas. Distinguen {muy acertadamente} entre las " métodos factoriales" o
representación a través de modelos continuos, casi siempre a lo largo de uno o dos ejes
de coordenadas, y los "métodos de clasificación", que consiste en agrupar los datos a
clasificar, en clases o familias de clases, y que en algunos casos se representan mediante
grafos. Los "métodos factoriales" son objeto del capítulo 4. Los autores ( muy influidos
por las ideas subyacentes en el análisis de correspondencias) inician el tema con un
ajuste de una matriz n x^ de datos (n filas y^ columnas} en el espacio R^ (representación de ^^ f^las a través de >> calumnas), y en el espacio R" (problema inverso) para,
seguidamente, relacionar ambos tipos de representaciones.
Este enfoque es bastante interesante, pues permite abordar, bajo un punto de vista
común, el análisís de componentes pi-incipales, el análisis en componentes principales
normalizados, el análisis de los rangos, el análisis de las correlaciones parciales y el
análisis de correspondencias. Todos estos métodos son explicados con detalle y debidamente ilustrados con ejemplos.
Seguidamente, en el mismo capítulo, pero formando una sección independiente de los
anteriores métodos (pues obedecen a un esquema teórico diferente) se hace una breve
exposición del análisis factorial, la regresión ortogonal, la regresión sobre componentes
principales, el análisis canónico (o de carrelación canónica) y el análisis discriminante.
aunque sin ejemplos ilustrativos. No se aborda el análisis de coordenadas principales.
La clasificación automátíca (capítulo 5) se expone de una manera concisa pero
suficientemente clara. La clasiticación ascendente jerárquica se plantea a través de la
noción de distancia ultramétrica y su relación con el concepto de jeraryuía indexada. Se
describe entonces con detalle la construcción de la rnétrica subdominante, también
llamado método del mínimo. A continuación se describen algunos algoritmos de construcción de grafos parciales mínimos, es decir, grafos conexos sin ciclos cuyos vertices
son los objetos a rcpresentar, y que reciben el nornbre de árboles. En este apartado se
encuentra a faltar una referencia a la desigualdad aditiva, también llamado axioma de
los cuatro puntos, generalización de la desigualdad ultramétrica, que daría soporte
teórico a las representaciones mediante árboles. Tras tratar algunos aspectos, se describe
la clasificación no jerárquica, con especial énfásis en el método de clasiticación alrede-
'()()
E=sT,4D1ST1(',4 E.SPAÑC)l_.4
d^r de centros móviies, sobre el cual los autores hacen algunas observaciones respecto a
I^^ obtención de óptimos locales, y como resolver, aunque parcialmente, el problema de
^.^nconirar particiones óptimas. La literatura citada sobre este tema no es muy reciente.
La obra contiene varios apéndices. El primero se dediea a presentar el lenguaje
FORTRAN y una relación de los principales paquetes de pragramas estadísticos. E1
segundo es una breve presentación del lenguaje APL y el tercero es un repaso de 1os
principales conceptos del cálculo matricial. Contiene también las eorrespondientes tablas estadísticas.
Por otra parte, cada capítulo contiene un anexo con diversos programas escritos en
FORTRAN y APL, con f nalidad de proporcionar al lector la facilidad de poder tratar
informáticamente el material estadístíco de acuerdo con las técnicas expiicadas previamente. Se trata de una biblioteca de programas modular, con finalidad pedagógica,
pensada para que pueda ser adaptada por el usuario a sus propias necesidades. Contiene
algunos programas del SPAD (Systéme Portabie pour ['Analyse des Données), y otros
programas propios (pruebas fisherianas, modelo lineal, histogramas). No contiene correspondencias múltiples. La utilización de todos los programas está debidamente explicada.
La traduccicín es correcta. Algunos términos informáticos franceses son presentados
en su versión inglesa (software por logiciel, etc.). Esta versión castellana incluye también
algunos párrafos complementarios que se añaden al original en francés.
Actas de las I Jornadas de Estadística .
^ Ramón Ardamuy, coordinador) . Documentos
didácticos 115 . Instituto de Ciencias de la
Educación, Universidad de Salamanca . 1987 .
por
DANIEL PEIVA
Universidad Politécnica de Madrid
Estas jornadas incluyen siete de las nueve comunicaciones invitadas presentadas a las
jornadas, que están encaminadas a discutir las aplicaciones de la Estadística a la^
Ciencias Experimentales.
De las siete comunicaciones tres están dedicadas a las aplicaciones en Biología y
Medicina, una al muestreo, otra a la simulación, otra a la necesidad de la Estadística en
la investigacíón y, finalmente, la última trata un problema de la teoría de números y su
inclusión en estas jornadas no parece estar suf^cientemente justíficada, especialmente
C'RIT1C'A [^E LIHRC^S
201
cuando no se han incluido comunicaciones sohre las aplicaciones de la Estadística a la
Física, la Química o la Ingeniería, o a las C`iencias Sociales (Economía, Sociología,
Psicología, etc. ).
Las tres comunicaciones de aplicaciones a la Biología y Medicina son debidas a E.
Rubio ("Modelos Estadísticos en Medicina y E3iologia), S. Rios ("Panorámiea de Id
tnvestigación Operativa en Medicina y Sanidad"^ y J. M. Bernardo ("Diagnóstico
automática en Medicina"). Rubio describe modelos de crecimiento de poblaciones
basados en la teoría de procesos estocásticos, especialmente procesos de rami^icación,
procesos de nacimiento y muerte y proceso5 de renoti^ación. Rios expone diversas
aplicaeiones de la programación matemática, 1a teoría de colas y la simulaeión a la
Sanidad. Bernardo presenta el problema de decisión en Medicina cumo un problema de
discriminación estadística y propone un enfoque ba^^esiano basado en aproximar la
distribución a posteriori de cada enfermedad dada la e^ idencia observada por una
distribución logística. El criterio de aproximación es la medida de discrepancia de
Kullback-Leibler.
F. Azorín (" Aspectos aJ perspectivas del muestreo") contiene una re^^isión de algunos
prohlemas importantes en la elaboración de encuestas por muestreo. M. Martín C^íaz
("Simulación Estadística, Método de Monte Carlc^") re^^isa el método de montecarlo
indicando su aplicación a un problema de epidemia de sarampión. Finalmente L. Parras
("Necesidad e importancia de la Estadística en la in^^estigac:ión empírica") comenta la
metodología de construcción de modelos estadísticos ^^ la^ técnicas de diseño experimental.
Este volumen puede ser especialmente útil para profesionales trahajando en el área de
Biocsta^iística ^ par^i to^i+^^s los interesados en las aplicaciones de la Estadística.
Descargar