COMUNICACIÓN XI JORNADAS ASEPUMA Oviedo, 11 y 12 de Septiembre de 2003 TITULO: "MODELOS DE SUPERVIVENCIA ADECUADOS PARA ANÁLISIS ACTUARIALES DE MORTALIDAD" “SURVIVAL MODELS IN ACTUARIAL MORTALITY ANALYSIS” AUTOR (ES): SÁNCHEZ LÓPEZ, JOSÉ MARÍA MEDINA LÓPEZ, ANA INSTITUCION: UNIVERSIDAD REY JUAN CARLOS FACULTAD DE CIENCIAS JURÍDICAS Y SOCIALES Paseo de los Artilleros s/n; 28032; Madrid TELEFONO Y DIRECCION DE CONTACTO : jmsl@fcjs.urjc.es Teléfonos: 650645297 // 913737801 // 914887851 amedina@fcjs.urjc.es Teléfonos: 606694989 // 914887848 PALABRAS CLAVE: Mortalidad actuarial, Funciones de supervivencia, Modelos tabulares, Modelos paramétricos, Mixturas; Graduación, Rango edades, Ajuste; Proyecciones mortalidad. KEY WORDS: Actuarial mortality estimation, Survival functions, Tabular models, Parametric models, Mixed models; Graduation, Age rank, Fit-testing; Mortality projections. AREA TEMATICA: 3 (Matemática de las operaciones financieras y cálculo actuarial). RESUMEN En el seguro de vida, se destacará el interés de los denominados modelos o funciones de supervivencia como instrumentos imprescindibles en distintas fases del análisis de mortalidad. El estudio se adaptará a los mejores datos reales disponibles en las aseguradoras respecto de la población objetivo (población asegurable): datos de pólizas que evitan sesgos derivados del uso de tablas de población general. Se analizará la utilidad de los modelos de supervivencia actuarial a tres niveles. En primer lugar, se mostrará la necesidad de utilizar hipótesis de mortalidad intraintervalo para estimar las probabilidades anuales de muerte que permitan obtener un modelo tabular. En segundo lugar, los modelos se emplearán en la denominada graduación paramétrica para mejorar las estimaciones iniciales incorporando información sobre relaciones existentes en el conjunto de estimaciones y sobre creencias previas a las observaciones. En tercer lugar, nuevos modelos serán los instrumentos que proyecten el fenómeno de la mortalidad a futuro según la dinamicidad del colectivo estudiado respecto a la mortalidad. Se presentará una visión actual de las posibilidades existentes, valorando las alternativas y trabajos empíricos ya realizados, y ofreciendo nuevas posibilidades. ABSTRACT In the context of life insurance, survival models will be highlighted as essential instruments for the development of mortality analysis on its various stages. The research will be adapted to the most reliable data obtained from insurance companies in relation to the target population: data from policies which avoid errors that come together by using general population tables. Utility of actuarial survival models will be analysed in three stages: First of all, the use of between-the-integral-ages assumptions is necessary in order to make an estimation of the annual mortality probabilities which allow to obtain a table model. Secondly, models will be used in parametric graduation to improve initial estimations adding the information available about the beliefs previous to observations. On third place, new models will arise to project the mortality phenomenon to the future by following the mortality pattern drawn by the collective dynamic previously studied. It will be presented a new vision for possibilities having to do with mortality. The analysis is based on empirical works and it offers new ways of projecting mortality. 1.- PLANTEAMIENTO. La obtención de modelos paramétricos a partir de los datos brutos (dato incompleto) suministrados por las compañías aseguradoras puede conseguirse desde dos planteamientos distintos: uno es directo, el otro es indirecto. El planteamiento directo parte de los datos con los que efectúa una estimación directa del modelo de supervivencia. El planteamiento directo se critica en cuanto a su utilidad en el seguro de vida y se basa en la dificultad de encontrar una función para todo el rango de edades que explique los datos sólo en base a una única variable (incluso dentro de un grupo homogéneo previamente elegido). También se debe atender a unas muestras con diferente tamaño para las distintas edades. Se obtienen resultados más detallados si se fijan puntos temporales para estimar. Resulta más sencillo, práctico y formal realizar un análisis previo de la situación para intervalos anuales de edad. Todo esto, lleva a preferir los modelos no paramétricos como punto de partida para posteriores ajustes de modelos paramétricos. Tal como expone Elandt-Johnson, Regina and Johnson Norman, L. (1.980): “...destacamos los métodos de estimación dirigidos al ajuste de proporciones de supervivencia observada y defendemos enjuiciar los métodos de acuerdo a como se realiza esto”. El planteamiento indirecto parte de los datos, obtiene a continuación las probabilidades de muerte anual para todos los años y, finalmente, a través de las estimaciones anuales llega al modelo de supervivencia. Esta última situación se trata en el epígrafe referente a la graduación o rectificación de las estimaciones. La secuencia de valores revisados o graduados en estos métodos paramétricos se expresará como una función de argumento x, siendo vx una función que contiene los parámetros que deben fijarse desde los datos que configuran las estimaciones iniciales. La justificación de este tipo de graduación se basa en la necesidad de corregir las imprecisiones de la estimación (debidas a datos mal ubicados en el tiempo y a la aleatoriedad del muestreo) mediante el ajuste de una función matemática que se supone representa las verdaderas tasas de mortalidad. La opinión previa se manifiesta en la determinación de la forma funcional elegida (en la elección de dicha función también participa la información que suministran los datos). Las técnicas que se utilizan en el ajuste de las curvas para obtener los valores graduados (estimaciones corregidas) son las características de ajustes de curvas y de regresión en casos generales. El paso siguiente consiste en utilizar una batería de pruebas o test para confirmar si los valores conseguidos mediante el ajuste son “adecuados”, esto es, son coherentes con los datos y, a la vez, representados por una función matemática razonablemente sencilla (pocos parámetros) y suave (según el valor de las diferencias finitas). Esta aproximación convencional gradúa la fuerza de mortalidad ajustando una fórmula paramétrica a las tasas brutas de mortalidad (estimación previa) asumiendo que el número real de muertes son variables aleatorias tipo Poisson (condicionadas a la exposición). Alternativamente se utilizan la distribución binomial o normal. Con esta situación se puede llegar a una verosimilitud característica que permite estimar los parámetros. Tal como se ha indicado, para iniciar una graduación por fórmula matemática, se debe elegir el tipo de funciones. Se distinguen distintas posibilidades según el rango de edades en el cual se desea utilizar el método: rango no extenso, amplio rango y todo el rango. Finalmente, se muestra la necesidad de los modelos matemáticos para proyectar el fenómeno de la mortalidad a tiempo cronológico futuro. 2.- MODELOS PARAMÉTRICOS. El planteamiento directo, como ya se dijo, parte de los datos y supone una función de supervivencia adecuada. Se deben estimar los parámetros de la mencionada función, se expone el método de máxima verosimilitud suponiendo dato incompleto. En principio un individuo entra a observación en t=ri y deja la observación en t=ti por muerte o finalización del periodo programado de observación. Por ello, la probabilidad de sobrevivir será S (ti ) ti − ri p ri = S ( ri ) y la de morir f (ti ) . ti − ri q ri = ti − ri p ri × λ (ti ) = ti − ri p ri × S (ti ) Se puede construir la función de verosimilitud como S ( ti ) λ ( ti ) S (ti ) f ( ti ) S ( ti ) L=∏ =∏ ∏ ∏ S (ri ) A S (ri ) D D S ( ri ) A S ( ri ) distinguiendo la contribución de los individuos que mueren y de los individuos que sobreviven, o utilizar un indicador de la situación del individuo i-ésimo: n S (ti )[λ (ti )] [ S ( ti ) ] [ f ( ti ) ] . L=∏ =∏ S ( ri ) S ( ri ) i =1 i =1 Si se considera para los individuos de la muestra las posibles retiradas no programadas, tomándolas aleatorias, hay que introducir modificaciones en la función de verosimilitud, además de admitir el principio de independencia entre muerte y retirada. La probabilidad de sobrevivir entre ri y ti será: Sd (ti ) Sw(ti ) (τ ) (d ) ( w) = ti − ri p ri × ti − ri p ri = . ti − ri p ri Sd (ri ) Sw(ri ) Interviene una función de supervivencia respecto de la muerte y una función de supervivencia respecto a la retirada. Por ello, ti representará el tiempo hasta la muerte, hasta el fin programado o hasta la retirada aleatoria. La función de verosimilitud adoptará la forma: δi γi n Sd (ti ) Sw(ti )[λd (ti ) ] [λw(ti ) ] L=∏ = i =1 Sd ( r i ) Sw ( r i ) n =∏ δi 1−δi δi n [Sd (ti )]1−δ [Sw(ti )]1−γ [ fd (ti)]δ [ fw(ti)]γ i i i i Sd ( r i ) Sw ( r i ) utilizando indicadores de la situación del individuo i-ésimo respecto de la posible muerte o retirada. La estimación se realizará tras la especificación de las funciones de supervivencia (y, por tanto, de la tasa de azar). Las funciones dependerán de valores muestrales (según los datos que se tengan) y de parámetros (tratados como variables para maximizar la verosimilitud de la muestra que se tenga). La bondad del ajuste obtenido puede analizarse mediante test clásicos estadísticos, rectificados debido a los datos incompletos que se utilizan. Son de interés los trabajos de Stephens, M.A. (1.974, 1.977) donde aparecen como más convenientes el test de Kolmogorov-Smirnov modificado para dato incompleto con sólo la familia de funciones a ajustar especificada y, especialmente, el test de Anderson-Darling modificado. i =1 3.- FUNCIONES DE SUPERVIVENCIA CLÁSICAS: RANGO NO EXTENSO. Si se aplica para un rango de edades no extenso existen múltiples funciones básicas que se pueden utilizar. La principal utilidad de estas funciones está en permitir estimar la mortalidad anual mediante su uso en las hipótesis de mortalidad intraintervalo. Con las estimaciones para cada año de edad se obtiene el modelo tabular o tabla de mortalidad que es la forma más tratada en la literatura y más empleada en el trabajo actuarial. Resumiendo, el modelo tabular clásico utiliza valores enteros de x para los que se calcula su correspondiente valor según S(x). La falta de valores intermedios para valores no enteros de x se resuelve estableciendo unas hipótesis de mortalidad o métodos de interpolación entre valores enteros consecutivos que permiten considerar el modelo completamente especificado (especificado para todos los valores positivos de x). El modelo tabular se da a conocer como "tabla de mortalidad" , "tabla de supervivencia" o "tabla de vida". A continuación se presentan distribuciones de supervivencia clásicas, algunas con aplicación sólo durante intervalos muy cortos y específicos de tiempo (para las interpolaciones en la tabla de mortalidad), coherentes con la evidencia empírica. Ley de Moivre. Supone un comportamiento lineal, con la edad, de la función de supervivencia según una progresión aritmética no negativa pero decreciente: l (0) l (0) l ( x) = a − bx con b > 0, a = l (0), w = , x≤ . b b La fuerza de mortalidad que corresponde a la expresión anterior será: b µ ( x) = . l (0) − b • x Se tiene una fuerza de mortalidad siempre creciente con la edad, lo que restringe su utilidad a los tramos altos de edad. La probabilidad de muerte se obtendrá como / nqx = n • µ ( x) , esto es, directamente proporcional al tanto instantáneo de mortalidad o fuerza de mortalidad. Primera ley de Dormoy. Supone una determinada forma de variación de la función de supervivencia, lo que equivaldrá a una función de supervivencia exponencial no negativa, decreciente y convexa respecto de la variable edad: l ( x + 1) = b • l ( x) con 0 < b < 1 ⇒ l ( x) = a • b x con a = l (0) y b x → 0 si x → w. La fuerza de mortalidad que corresponde a la expresión anterior será: µ ( x ) = − ln b. Se tiene una fuerza de mortalidad constante respecto de la edad lo que restringe su utilidad a intervalos cortos (interpolación entre dos edades enteras consecutivas, por ejemplo). Según las expresiones anteriores se llega a probabilidades de muerte y de supervivencia de la forma / nqx = 1 − b n y npx = b n , que sólo dependen de la amplitud del intervalo considerado. Segunda ley de Dormoy. Se modifica la primera ley para que aparezca la variable edad en la fuerza de mortalidad. Se elige un polinomio de primer grado que conduce a una fuerza de mortalidad creciente con la edad (no aplicable a personas jóvenes): µ ( x) = a + b • x con b > 0. La función de supervivencia que corresponde a la expresión anterior será: − a• x b − •x2 2 l ( x) = l (0) • e •e . Esto es, no negativa, decreciente y cóncava. Según las expresiones anteriores se llega a probabilidades de muerte y de supervivencia que dependen de la amplitud del intervalo y de la edad considerada. Tercera ley de Dormoy. Se modifica la primera ley para que aparezca la variable edad en la fuerza de mortalidad. Se elige un polinomio de segundo grado: µ ( x) = a + b • x + c • x 2 . La función de supervivencia que corresponde a la expresión anterior será: b − •x2 c − •x3 l ( x ) = l (0) • e − a • x • e 2 • e 3 . Las expresiones anteriores permiten más posibilidades aunque complican los cálculos de posibles estimaciones. Ley de Sang. Supone un comportamiento de la función de supervivencia geométrico respecto de la edad junto con la existencia de otro factor diferente a la edad: l (0) • b w l (0) , k= . l ( x) = a + k • b x con 0 < b < 1, a = − w 1− b 1− bw La fuerza de mortalidad que corresponde a la expresión anterior será: ln b b x • ln b µ ( x) = − x = − w− x . w b −b b −1 Se observa como la función de supervivencia es decreciente y convexa respecto de la edad. En realidad, supone una modificación de la primera ley de Dormoy que se consigue añadiendo un término constante en la función de supervivencia para recoger la influencia en la mortalidad de un factor distinto de la edad. Ley de Gompertz. Se fundamenta en un determinado comportamiento del incremento de la fuerza de mortalidad: ∆µ ( x) = k • µ ( x) • ∆x + O(∆x) con k = cte., O(∆x) infinit. si ∆x → 0. Se llega a una fuerza de mortalidad de la forma: µ ( x) = c • e kx . La función de supervivencia que corresponde a la expresión anterior será: c c − •e kx l ( x) = l (0) • e k • e k . Las expresiones anteriores consideran la edad como la única causa de muerte (no incluye factores accidentales), siendo la fuerza de mortalidad siempre creciente con la edad, aspecto más relevante a edades altas. Primera ley de Makeham. Se fundamenta en un determinado comportamiento del incremento de la fuerza de mortalidad que refleja la posible existencia de factores accidentales: ∆µ ( x ) = k 1 • µ ( x ) • ∆x + k 2 • ∆x + O( ∆x ). Se llega a una fuerza de mortalidad nunca decreciente, de la forma: k2 µ ( x) = − + c • e k 1• x con c > 0, k 1 > 0. k1 La función de supervivencia que corresponde a la expresión anterior será: c k1 − c g •e k1 k2 •x k1 c k2 l ( x) = l (0) • e • e •e con g = k 1 • x. Segunda ley de Makeham. Se fundamenta en la anterior, pero añadiendo a la fuerza de mortalidad otro sumando proporcional a la edad: k2 µ ( x ) = − + b • x + c • e k 1• x . k1 La función de supervivencia que corresponde a la expresión anterior será: c − •e g b − •x2 •x l ( x) = l (0) • e k 1 • e k 1 • e k 1 • e 2 con g = k 1 • x. Las expresiones anteriores permiten más posibilidades aunque complican los cálculos de posibles estimaciones. Ley de Lazarus. Se introduce otro término en la primera ley de Makeham para ampliar su utilidad en edades no necesariamente altas: k2 µ ( x) = − + c • e k 1• x + d • e kd • x con e kd < 1. k1 La función de supervivencia que corresponde a la expresión anterior será: c + d − c •e g − d •e h k2 •x l ( x) = l (0) • e k 1 kd • e k 1 • e kd • e k 1 con g = k 1 • x, h = kd • x. Las expresiones anteriores permiten más posibilidades aunque complican los cálculos de posibles estimaciones. Ley de Weibull. Se basa en la siguiente forma que supone sigue la fuerza de mortalidad: µ ( x) = k • x n con k > 0, n > 0. La función de supervivencia que corresponde a la expresión anterior será: l ( x ) = l (0) • e − k n +1 x n +1 . 4.- GRADUACION PARAMETRICA: AMPLIO RANGO DE EDADES. Ciertas expresiones ofrecen la posibilidad de extenderse a un amplio rango de edades, son expresiones conocidas como “fórmulas Gompertz- Makeham de tipo (r,s)”, r GM α ( x) = ∑ α i x r ,s r+s i −1 +e i − r −1 ∑ αi x i = r +1 , i =1 o como “fórmulas Logit Gompertz- Makeham de tipo (r,s)”, GM αr , s ( x) LGM αr , s ( x) = , 1 + GM αr ,s ( x) que ofrece la ventaja de ser un logit con rango de valores posible entre cero y uno. Estas funciones son estudiadas dentro del marco de los modelos lineales y no lineales generalizados de utilidad en el ámbito actuarial por Renshaw, A.E. (1.991). Otra posibilidad surge con un conjunto de polinomios ortogonales formando una base. Ante un conjunto de puntos {( x j , y j ), j = 1,..., m} el problema de ajustar una curva, según unas ponderaciones positivas {w1 ,..., wm } , lleva a minimizar una expresión, para ciertas funciones, del tipo: ∑ w [y ] m j =1 j 2 − f n (x j ) . j Las funciones de la expresión son de la forma n f n ( x) = ∑ α i pi −1 ( x) ; i =1 siendo los polinomios según el grado marcado por el subíndice y ortogonales con la condición m 0 si r ≠ s w j pr ( x j ) ps ( x j ) = ∑ j =1 er si r = s con er ∈ R. La expresión a minimizar queda 2 n S = ∑ w j y j − ∑ α i pi −1 ( x j ) j =1 i =1 y se minimiza igualando todas las derivadas parciales (respecto de los distintos alfas) a cero. El resultado de estas ecuaciones, unido a la condición exigida a los polinomios, conduce a un valor de los parámetros que no depende del grado de la función polinómica elegida: m m αk = ∑w j =1 j y j p k −1 ( x j ) ∑ w [p m j =1 j k −1 (x j ) ] para k = 1,..., n . 2 5.- GRADUACION PARAMETRICA: TODO EL RANGO DE EDADES. Extenderse a todo el rango de edades, desde el primer año de vida al último posible, supone considerar funciones más flexibles. No existen muchos intentos en esta dirección ya que la solución más habitual lleva a dividir el rango de edades utilizando para cada rango una adecuada función. Una expresión debida a Heligman, L and Pollard, L.H. (1.980) es: n Di qx = ∑ Ai e − Bi [ f i ( x ) −Ci ] . 1 − q x i =1 Para utilizar esta fórmula hay que determinar el número de sumandos, determinar la función y ajustar los parámetros resultantes. En la población de Australia se utilizó la expresión: 2 C qx = A ( x + B ) + De − E (ln x −ln F ) + GH ( x − x0 ) . 1 − qx Se trata de una función continua y que toma valores entre cero y uno, se aplica a todo el rango de edades (aunque no incluya muchos parámetros), y tiene una deseable interpretación demográfica: el primer sumando es una exponencial de crecimiento rápido que indica el descenso de mortalidad en los primeros años; el segundo sumando recoge mediante una función similar a la lognormal la mortalidad por accidentes; el tercer sumando manifiesta la mortalidad en edades avanzadas con una ley de Gompertz. El significado de los parámetros se detalla a continuación. El parámetro A tiene un valor semejante al que toma la probabilidad de fallecimiento durante el primer año de vida. El parámetro B mide la localización de la mortalidad en el primer año de vida, teniendo efecto sólo a la edad de cero años. El parámetro C valora la disminución de la probabilidad de muerte en la infancia (edades superiores al año). El parámetro D mide la magnitud de la típica “joroba de accidentes” para individuos jóvenes. El parámetro E es inverso a la dispersión. El parámetro F localiza el máximo de la mencionada “joroba”. El parámetro G refleja el nivel base en la mortalidad senil, esto es, la mortalidad de tipo adulta-senil que se considera existe al nacer. El parámetro H indica el tanto de aumento de la mortalidad anterior para edades adultas. El parámetro x0 especifica una edad para la cual q x = 0'5 , muy próxima a la máxima considerada (la edad que se suele representar como w). El modelo de Carriere, J.F. (1.992 y 1.994) se basa en una mixtura de funciones de supervivencia: n S ( x) = ∑ wk S k ( x) . k =1 Cada función de la mixtura representaría un tramo de edad y sus ponderaciones indicarían las posibilidades de fallecimiento de cada nueva vida en esos tramos de edad. Carriere sugiere aplicar una mixtura de tres funciones: para la niñez una función de Weibull, para la adolescencia una inversa Weibull o un inversa Gompertz, y para edades adultas una función de Gompertz. El modelo resulta con ocho parámetros, igual que el modelo ya mencionado de Heligman y Pollard. 6.- SPLINES: AMPLIO O TODO EL RANGO DE EDADES. Los splines suponen una solución para ajustar funciones sencillas a un amplio rango o a todo el rango de edades. Aunque no es una función única para todo el rango de edades, sí se trata de un conjunto de funciones polinómicas con cierta “coherencia” conjunta. Esta coherencia se tiene por la condición exigida en los “nudos” o puntos de unión entre funciones: las funciones polinómicas debe ser derivables hasta un orden menos que el grado del polinomio que se tenga (siendo igual el resultado en cada nudo). No hay reglas generalmente admitidas para determinar el número de nudos y la fijación del punto o lugar de cada nudo. Cuantos más nudos haya, mayor aproximación existirá entre los valores iniciales y los graduados. 7.- AJUSTE Y EVALUACIÓN Para ajustar las funciones, en la graduación por fórmula matemática, se utilizan varios criterios, destacan: regresión lineal simple por mínimos cuadrados (más utilizado con splines), regresión no lineal por aproximación con series de Taylor, máxima verosimilitud y mínima chi-cuadrado. Publicado por U.N.E.S.P.A., una tabla de mortalidad para la población española ha utilizado la forma funcional de Makeham y fue ajustada por regresión mínimo cuadrática. Se trata del trabajo de Fernández, M.J. y Prieto Pérez, E. (1.994). También adecuado es el método de máxima verosimilitud. En el trabajo de Chan, L.K. and Panjer, H.H. (1.983) se recomienda y se expone su uso para modelos de decremento simple y de decremento múltiple, para muestras completas e incompletas, con datos agrupados y sin agrupar. Supone una ventaja sus propiedades asintóticas (insesgo, mínima varianza, normalidad) que facilitan la obtención de la matriz de covarianzas de los parámetros α subyacentes en las fórmulas que se utilicen: −1 ∂ 2 L(α ) . Cov(α ) = − E α α ∂ ∂ i j La distribución para el número de muertes será la binomial, Poisson o, por aproximación, la normal (comentadas en la estimación de mortalidad) lo que guía a la verosimilitud. Los parámetros se sustituyen por las funciones a ajustar que correspondan. En caso de pólizas duplicadas, se transforman los datos (antes de incluirlos en el modelo) dividiendo número real de muertes y exposiciones al riesgo de muerte entre un factor de corrección conocido como “ratio varianza”, ∑i i 2 f xi rx = , ∑ if xi i siendo f xi la proporción de asegurados para la edad x que tienen i pólizas, con lo que si no hay duplicaciones el ratio es uno y si hay es mayor que uno. La varianza queda entonces multiplicada por el “ratio varianza” como forma de compensar el incremento de dispersión que supone la aparición de pólizas duplicadas. En la graduación clásica, una vez seleccionada la fórmula y tomando, por ejemplo, un ajuste por máxima verosimilitud, permanece el problema de determinar el número de parámetros que se desea tenga la función elegida. La solución a este problema se puede obtener analizando graduaciones con la misma fórmula pero con número de parámetros diferentes como si se tratara de comparar dos graduaciones, con número igual de parámetros pero siendo cero varios parámetros de la graduación basada en la función de menos parámetros. El test “ratio verosimilitud” proporciona un estadístico de utilidad para este caso. Permite determinar si se tiene una mejora significativa al añadir más parámetros. Si se suponen dos funciones con n+k parámetros, con k parámetros igual a cero en una de ellas, se genera un estadístico que compara los valores máximos de las verosimilitudes: L(n + k ) D(k ) = 2[log L(n + k ) − L(n)] = 2 log . L( n) El estadístico se comporta como una chi-cuadrado con k grados de libertad. Una discusión sobre su aplicación en mortalidad está en Cox and Oakes (1.984). Una interesante aplicación de pruebas para aceptar o rechazar una determinada graduación puede encontrarse en Navarro, Eliseo (1.992). El análisis se dedica a examinar las desviaciones entre valores estimados y valores graduados a lo largo de toda la secuencia. Se considera que las desviaciones tienen que estar distribuidas de forma aleatoria (no hay errores sistemáticos en toda la secuencia de valores graduados) y su distribución concreta será coherente con las hipótesis iniciales utilizadas (según modelo binomial, Poisson o normal empleado). Atendiendo a estas directrices generales se elaboran unas pruebas para las desviaciones absolutas y relativas entre estimaciones iniciales y corregidas, considerándolas individualmente y dentro de la secuencia total. Los tests o pruebas que se mencionan son: test de intervalos de confianza, test de desviaciones relativas, test de desviaciones acumuladas, test de signos, test de cambio de signo, test de la chi-cuadrado, test de Kolmogorov-Smirnov. 8.- DINAMICIDAD DE LA MORTALIDAD. Parece evidente la evolución en el tiempo cronológico del fenómeno de la mortalidad. En el trabajo de MacDonald, A.S. et al. (1.998) se aportan y analizan estudios empíricos para comparar la evolución y las últimas tendencias apreciadas en la mortalidad en diferentes países. Esto indica que un estudio de mortalidad en base a datos presentes debe completarse, cuando se busque cierta validez a lo largo del tiempo, con una proyección hacia futuro. A nivel teórico presenta interés el artículo de Janssen, J. and Skiadas, C.H. (1.995). En este trabajo se destacan y se sigue a continuación, por su aplicación en el campo actuarial, las investigaciones de Benjamin, B. and Soliman, A.S. (1.995) y de Felipe Checa, María de los Ángeles y Guillén Estany, Montserrat (1.999). Una vez realizadas las estimaciones definitivas, para proceder a modelizar la mortalidad considerando el tiempo de calendario se puede proceder de tres formas: según proyecciones para cada valor de la tabla de mortalidad, según proyecciones del modelo estructural tomado en la tabla de mortalidad y según una proyección atendiendo a las causas del fallecimiento. Los métodos basados en proyecciones para cada valor de la tabla de mortalidad utilizan modelos paramétricos para cada edad en los que aparece la variable tiempo calendario de forma explícita. Son modelos del tipo: q x (t ) = f ( x,α , t ) , donde x es la edad que se estudia, t la variable tiempo calendario y α un vector de parámetros. Exigen un seguimiento en el tiempo de los estudios de mortalidad. En las tablas de mortalidad alemanas DAV1.994R se emplea el modelo: q x (t ) = a x bxt . Se linealiza tomando logaritmos y se aplica el método de mínimos cuadrados ordinarios. Los parámetros estimados determinan el modelo que proyecta la probabilidad de muerte según se introducen valores a la variable t. En las tablas españolas, realizadas para U.N.E.S.P.A. por Fernández Plasencia, M.J. y Prieto Pérez, Eugenio (1.994) para proyectar la mortalidad se utiliza un modelo para la esperanza de vida: e x (t ) = a x + bx 1 − e d xt , que permite obtener la probabilidad de muerte mediante la relación 0'5 − e x +1 qx = e x − 0'5 En las tablas de mortalidad suizas GRM/GRF1.995 se emplea el modelo: q x (t ) = q x (t 0 )·e − d x (t −t0 ) , siendo t0 el tiempo calendario inicial. [ ] De forma conjunta pero con un cambio de escala, se consideran la edad y el tiempo en el trabajo de Haberman, S.; Hatzopoulos P. and Renshaw, A.E. (1.996), mediante una expresión referida al tanto instantáneo de mortalidad y que contiene catorce parámetros: 3 3 5 µ x (t ) = exp b0 + ∑ b j L j ( x' ) exp a1 + ∑ c1 j L j ( x' ) t '+ a2 + ∑ c2 j L j ( x' ) t '2 . j =1 j =1 j =1 Todos estos modelos suponen la ausencia de cambios estructurales en el tiempo en el que se toman las muestras y en el tiempo futuro en que se proyecta. En estos casos, sólo la simulación de escenarios ayudaría a analizar el impacto futuro de cambios estructurales. Los métodos de estimación que se utilizan en la estimación de los parámetros suponen perturbaciones aleatorias con comportamiento normal de media cero. Esta hipótesis es discutible debido a las transformaciones logarítmicas que se realizan en los modelos. Además, se debería probar la no existencia de autocorrelación. Los métodos basados en proyecciones del modelo estructural utilizado en la tabla de mortalidad obtienen las probabilidades de fallecimiento proyectadas mediante cambios en los parámetros del modelo. El modelo más empleado en este tipo de proyecciones es el ya mencionado modelo de Heligman-Pollard. Un ejemplo se encuentra en Felipe Checa, María de los Ángeles y Guillén Estany, Montserrat (1.999): se estima la probabilidad de muerte por mínimos cuadrados no lineales ponderados (según la inversa de la probabilidad de muerte observada) para todo el rango de edades y cada uno de los años calendario, después se aplica el análisis univariante de series temporales (ARIMA) para cada uno de los parámetros de la ley Heligman-Pollard con el fin de obtener predicciones de todos ellos, éstas predicciones determinan las predicciones de las probabilidades de muerte (para cada edad en el calendario futuro). A pesar del interés de las proyecciones del modelo estructural, persiste el problema de la invalidez ante cambios posteriores al periodo de observación. Esta situación se debe al uso de series temporales (los parámetros tienen comportamiento autorregresivo). En la práctica, avances médicos relevantes o epidemias significativas impiden la validez de las proyecciones efectuadas. Los métodos basados en proyecciones atendiendo a las causas del fallecimiento argumentan que podrían obtenerse mejores predicciones de mortalidad futura proyectando por separado la mortalidad debida a ciertos grupos de enfermedades y la mortalidad un residuo de fallecimiento por causas varias. Finalmente, se sumarían las distintas proyecciones. Benjamin, B. and Soliman, A.S. (1.995) utilizan la clasificación de enfermedades de la O.M.S., las causas se consideran excluyentes y se deja una causa definida como “resto de causas”. La relación entre la probabilidad general de muerte y la probabilidad según las diferentes causas de muerte (I,II,VII,VIII,IX,XII,R) se supone de la forma: ln q xt = ln q xt ( I )·ln qxt ( II )·ln qxt (VII )· ·ln q xt (VIII )·ln qxt ( IX )·ln qxt ( XII )·ln q xt ( R). La evolución en el tiempo calendario se toma como: ln q x (i ) = ln a x (i ) + t ln bx (i ) con i = I , II , VII , VIII , IX , XII , R . Evidentemente, se necesita información detallada de la causa de muerte para realizar este análisis. Presenta los inconvenientes mencionados en el método denominado de proyección para cada valor de la tabla (sería una variante realmente). BIBLIOGRAFÍA. Benjamin, B. and Pollard, J.H. (1.980). The analysis of Mortality. Heinemann. Londres. Benjamin, B. and Soliman, A.S. (1.995). Mortality on the move. Ed. City University Print. Londres. Betzuen Zalbidegoitia, Amancio; Felipe Checa, Angie y Guillén Estany, Monserrat (1.997). Modelos de tablas de mortalidad en España y situación actual. Anales del Instituto de Actuarios Españoles. Tercera época, Núm.3, Págs.:79-104. Carriere, J.F. (1.992). Parametric models for life tables. Transactions of the Society of Actuaries. Vol.44, Págs.:77-99. Carriere, J.F. (1.994). A select and ultimate parametric model. Transactions of the Society of Actuaries. Vol.46, Págs.:75-97. Cox and Oakes (1.984). Analysis of Survival data. Ed. Chapman & Hall. London. Elandt-Johnson, Regina C. and Johnson Norman, L. (1.980). Survival models an data analysis. Wiley. New York. Felipe Checa, María de los Ángeles y Guillén Estany, Montserrat (1.999). Evolución y predicción de tablas de mortalidad dinámicas para la población española. Cuadernos de la Fundación. Editorial Mapfre Estudios. Fernández Plasencia, M.J. y Prieto Pérez, Eugenio (1.994). Tablas de mortalidad de la población española de 1.950 a 1.990. Tabla proyectada del año 2.000. Tablas con y sin margen de seguridad. UNESPA. Madrid. Forfar, D.O.; McCutcheon, J.J. and Wilkie, A.D. (1.988). On the graduation by mathematical formula. Journal of the Institute of Actuaries. Núm.115, Págs.:1-135. Haberman, S. and Renshaw, A.E. (1.997). Dual modelling and select mortality. Insurance: Mathematics and Economics. Vol.19, Núm.2, Págs.:105-126. North-Holland. Haberman, S.; Hatzopoulos P. and Renshaw, A.E. (1.996). The modelling of recent mortality trends in United Kingdom male assured lives. British Actuarial Journal. Vol.2, Núm.2, Págs.:449-478. Haberman, S.; Hatzopoulos P. and Renshaw, A.E. (1.997). On the duality of assumptions underpinning the construction of life tables. Astin Bulletin. Vol.27, Núm.1, Págs.:5-22. Heligman, L and Pollard, L.H. (1.980). The age pattern of mortality. Journal of the Institute of Actuaries. Núm.107, Págs.:49-80. Janssen, Jacques and Skiadas, C.H. (1.995). Dynamic modelling of life table data. Applied Stochastic Models and Data Analysis. Vol.11, Págs.:35-49. London, D. (1.985). Graduation: the revision of estimates. Actex. Connecticut. López de la Manzanara Barbero, Juan y López Cachero, Manuel (1.996). Estadística para actuarios. Editorial Mapfre. Madrid. MacDonald, A.S. et al. (1.998). An international comparison of recent trends in poputation mortality. British Actuarial Journal. Vol.4, Núm.1, Págs.:3-143. Navarro, Eliseo (1.992). Tablas de mortalidad de la población española 1.982. Metodología y fuentes. Editorial Mapfre. Madrid. Renshaw, A.E. (1.991). Actuarial graduation practice and generalised linear and nonlinear models. Journal of the Institute of Actuaries. Núm.118, Vol.2, Págs.295-312. Renshaw, A.E. (1.992). Joint modelling for actuarial graduation and duplicate policies. Journal of the Institute of Actuaries. Núm.119, Vol.1, Págs.69-85. Sánchez López, José María (2.001). Cuantificación de riesgos y análisis global de la empresa aseguradora de vida, Dykinson, S.L., Madrid. Sánchez López, José María (2.001). Construcción de tablas de mortalidad, Revista Española de Seguros. Núm.106, pp.:297-306. Madrid. Stephens, M.A. (1.974). EDF statistics for goodness of fit and some comparisons. Journal of the American Statistical Association. Núm.69, Págs.:730-737. Stephens, M.A. (1.977). Goodness of fit for the extreme value distributions. Biometrika. Núm.64, Vol.3, Págs.:583-588. Yuen, Kam C. (1.997). Comments on some parametric models for mortality tables. Journal of Actuarial Practice. Vol.5, Núm.2, Págs.:253-266.