Tablas de mortalidad dinámicas para España. Una aplicación a la hipoteca inversa Debón Aucejo, Ana Montes Suay, Francisco Sala Garrido, Ramón La redacción de este texto y el desarrollo de la aplicación E-VITA que le acompaña, han sido posibles gracias a la ayuda financiera concedida a los autores por parte de la Fundación ICO Índice general Introducción 1 1. Tablas de mortalidad 1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Probabilidades relacionadas con el tiempo de supervivencia 1.3. Estimación de las curvas de supervivencia . . . . . . . . . 1.3.1. Algunos modelos para la distribución del tiempo de vencia . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.2. Tablas de mortalidad . . . . . . . . . . . . . . . . . 1.4. Estructura y clasificación de las tablas de mortalidad . . . 1.4.1. Estructura . . . . . . . . . . . . . . . . . . . . . . . 1.4.2. Clasificación: tablas estáticas y tablas dinámicas . . 1.5. Evolución de la mortalidad . . . . . . . . . . . . . . . . . . . . . 3 5 5 7 . . . . . . 7 9 12 12 13 15 2. Revisión de los modelos dinámicos para la graduación de lidad 2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Modelos paramétricos . . . . . . . . . . . . . . . . . . . . . 2.2.1. Modelos estructurales . . . . . . . . . . . . . . . . . 2.2.2. Modelos no estructurales . . . . . . . . . . . . . . . 2.3. Modelos no paramétricos . . . . . . . . . . . . . . . . . . . 2.3.1. Suavizado con p-splines . . . . . . . . . . . . . . . . 2.3.2. Algoritmo Median-polish . . . . . . . . . . . . . . . 2.4. Últimas propuestas para la graduación de tablas dinámicas 2.4.1. Modelización de los residuos . . . . . . . . . . . . . 2.4.2. Modelos frágiles (Frailty models) . . . . . . . . . . 2.4.3. Riesgo de la longevidad . . . . . . . . . . . . . . . . 2.5. La esperanza de vida residual . . . . . . . . . . . . . . . . 2.6. Intervalos de confianza para la predicción . . . . . . . . . . i . . . . . . . . . . . . . . . supervi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . la morta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 21 22 23 31 35 36 37 38 38 39 39 39 40 ii ÍNDICE GENERAL 3. Análisis y predicción de la mortalidad española. Periodo 1980-2025 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Descripción de los datos y análisis preliminar . . . . . . . . . . . . . . 3.2.1. Tratamiento de las edades superiores a 85 años . . . . . . . . 3.3. Aplicación del modelo de Lee-Carter . . . . . . . . . . . . . . . . . . 3.3.1. Resultados del ajuste . . . . . . . . . . . . . . . . . . . . . . . 3.3.2. Bondad de ajuste . . . . . . . . . . . . . . . . . . . . . . . . . 3.4. Predicción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1. Predicción de qxt para el periodo 2006-2025 . . . . . . . . . . 3.4.2. Predicción de ext para el periodo 2006-2025 . . . . . . . . . . 43 45 45 46 47 50 51 52 53 55 4. Cálculo de la hipoteca inversa 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . 4.2. Rentas vitalicias . . . . . . . . . . . . . . . . . . . . . 4.2.1. Determinación del valor de las rentas vitalicias 4.2.2. Determinación del valor de las rentas vitalicias 4.3. Perspectiva general de la hipoteca inversa . . . . . . . 4.4. El planteamiento de la hipoteca inversa del ICO . . . 59 61 62 63 67 69 70 . . . . . . . . . . . . . . . . anuales . . . fraccionadas . . . . . . . . . . . . . . . . . . . . . . Apéndices A. Aplicación E-VITA A.1. Ventana Presentación . . . . . A.2. Ventana Hipoteca Inversa . . . A.3. Ventana Ajustes Lee-Carter . . A.4. Ventana Parámetros del modelo A.5. Ventana Proyección . . . . . . 75 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 77 78 79 79 81 B. Código en R 83 Bibliografı́a 87 Índice de figuras 1.1. 1.2. 1.3. 1.4. Gráfico de descenso de la mortalidad para algunas Rectangularización y expansión para los hombres. Rectangularización y expansión para las mujeres. Evolución de la esperanza de vida. . . . . . . . . edades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 16 16 17 2.1. Descomposición de la Ley de Heligman y Pollard . . . . . . . 2.2. Regresión con B-splines (izquierda) y con p-splines (derecha) . 2.3. Residuos para un ajuste de Lee-Carter (izquierda) y residuos pendientes (derecha) . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 . . . . 37 inde. . . . 38 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. 3.8. 3.9. . . . . . . . . . Probabilidades de muerte para los hombres. . . . Probabilidades de muerte para las mujeres. . . . . Valores estimados para el modelo de Lee-Carter. . Residuos Deviance para el modelo de los hombres. Residuos Deviance para el modelo de los mujeres. Proyecciones para el periodo 2006-2025. . . . . . . Predicciones para algunas edades. . . . . . . . . . Predicciones para edades avanzadas. . . . . . . . Esperanza de vida residual para edades elevadas. A.1. A.2. A.3. A.4. La ventana Presentación . . . . . . . . . . . La ventana Hipoteca Inversa . . . . . . . . . La ventana Ajuste de Lee-Carter . . . . . . . Gráfica de los parámetros ax que muestra la modelo . . . . . . . . . . . . . . . . . . . . . A.5. Gráfica de los parámetros bx que muestra la modelo . . . . . . . . . . . . . . . . . . . . . A.6. Gráfica de los parámetros kt que muestra la modelo . . . . . . . . . . . . . . . . . . . . . A.7. La ventana Proyección . . . . . . . . . . . . iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ventana Parámetros . . . . . . . . . . . ventana Parámetros . . . . . . . . . . . ventana Parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . del . . del . . del . . . . . . . . . . . . . 48 48 50 51 51 52 54 55 57 . 78 . 79 . 80 . 80 . 81 . 82 . 82 Índice de tablas 4.1. Expresiones para las rentas vitalicias con cuotas constantes . . . . . . 4.2. Expresiones para las rentas vitalicias con cuotas en progresión aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3. Expresiones para las rentas vitalicias fraccionas con cuotas constantes 4.4. Estimación de los gastos de formalización y gestión . . . . . . . . . . 4.5. Rentas percibidas a lo largo de los n años . . . . . . . . . . . . . . . . v 65 66 68 72 73 Prólogo Una de las más importantes derivaciones obtenidas a partir de los datos censales son las tablas de mortalidad de la población, instrumentos relevantes tanto para el cálculo actuarial (cálculo de primas y/o indemnizaciones) como para el estudio de la evolución de la población y sus movimientos. El profesional del seguro de vida ha de ser capaz de determinar adecuadamente las primas para garantizar ası́ las cantidades que habrá de pagar la compañı́a a la muerte del asegurado. En consecuencia, la predicción adecuada de las probabilidades de muerte constituye un elemento principal en la reducción del riesgo que se asume. Otra caracterı́stica de interés ligada a las tablas de mortalidad es la esperanza de vida de un individuo para las distintas edades. Se trata también de un indicador de la capacidad de supervivencia de una sociedad y su incremento supone, en todos los aspectos, una mejora de las condiciones de vida de la misma. A pesar de la importancia de ambas caracterı́sticas, probabilidad de muerte y esperanza de vida, y de la indudable influencia que la edad y el tiempo del calendario (año) ejercen sobre ellos, son pocos los trabajos que las han estudiado conjuntamente para los datos de mortalidad españoles. El objetivo final de este trabajo ha sido la construcción de tablas de mortalidad dinámicas a partir de los datos de mortalidad y población publicados por el INE correspondientes al periodo 1980-2006, y la obtención de predicciones de la mortalidad y de la esperanza de vida para los años venideros. El presente texto presenta una exposición exhaustiva y actual de los distintos métodos de ajuste de tablas dinámicas, intentando encontrar el equilibrio entre el rigor teórico que los especialistas exigen y la claridad que los usuarios técnicos desean. Sólo uno de estos métodos será utilizado para obtener el producto final buscado, las tablas dinámicas de mortalidad española. La elección se ha basado en criterios de bondad tanto para el ajuste como para la predicción, y el resultado se ofrece en forma del software interactivo E-VITA accesible a través de la dirección http://www.uv.es/evita. La estructura del texto es la siguiente: El Capı́tulo 1 está dedicado a la definición de los conceptos fundamentales que se utilizan en una tabla de mortalidad estática, finalizando con un análisis de la evolución de la mortalidad en España durante el último siglo. Se persigue con ello evidenciar la necesidad de introducir modelos que 1 2 Prólogo recojan y expliquen dicha evolución. El Capı́tulo 2 se ocupa de este tipo de modelos, los dinámicos, que introducen el tiempo del calendario. En algunos casos se trata de modelos clásicos adaptados a esta nueva circunstancias, otros son modelos ex-novo. Resumir convenientemente la información contenida en las tablas de mortalidad es una tarea que tradicionalmente se le ha encomendado a la esperanza de vida. A su definición y predicción se ha dedicado el final del Capı́tulo 2. El Capı́tulo 3 se ocupa del análisis de la mortalidad española en los últimos 25 años, ajustando a los datos del periodo 1980-2005 una tabla dinámica mediante el modelo de Lee-Carter, el que presenta mejor comportamiento global entre los expuestos en el capı́tulo anterior. El Capı́tulo 4 introduce el concepto de hipoteca inversa, un producto financiero que está adquiriendo gran popularidad a medida que envejece la población y menguan las pensiones. Un simulador de cálculo de la hipoteca inversa, y del seguro asociado para poder hacer frente a la eventualidad de sobrevivir al periodo para la que fue contratada, ha sido incorporado al software E-VITA, cuyo manual de uso se detalla en el Apéndice A. En el Apéndice B se reproduce el código R utilizado para obtener los resultados del Capı́tulo 3. El texto se cierra con una exhaustiva y actualizada bibliografı́a que los autores esperan sea de utilidad para los lectores que deseen profundizar en parte o todos de los temas tratados. Valencia, julio de 2008 Capı́tulo 1 Tablas de mortalidad 1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2. Probabilidades relacionadas con el tiempo de supervivencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3. Estimación de las curvas de supervivencia . . . . . . . . 7 1.3.1. Algunos modelos para la distribución del tiempo de supervivencia . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.3.2. Tablas de mortalidad . . . . . . . . . . . . . . . . . . . . . 9 1.4. Estructura y clasificación de las tablas de mortalidad . . 12 1.4.1. Estructura . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.4.2. Clasificación: tablas estáticas y tablas dinámicas . . . . . 13 1.5. Evolución de la mortalidad . . . . . . . . . . . . . . . . . . 15 3 1.1 Introducción 1.1. 5 Introducción La tabla de mortalidad, también llamada tabla de vida, es un modelo teórico que permite medir las probabilidades de vida o de muerte de una población en función de la edad. Las probabilidades de muerte asociadas a cada edad constituyen la piedra angular en todo cuanto se relaciona, directa o indirectamente, con la demografı́a de un grupo humano, desde el nivel y tendencia de la mortalidad hasta los sistemas de previsión y seguros, pasando por los estudios de fecundidad, la evaluación de programas de salud o el estudio de los movimientos de población. Estos son sólo alguno de los campos de aplicación de las tablas de mortalidad. Centrándonos en el campo de los seguros y el sistema de pensiones, tanto público como privado, las tablas de mortalidad son utilizadas, entre otras actividades, para: i) estimar las reservas actuariales que garanticen el pago de la obligaciones previsionales del sistema público de pensiones, ii) efectuar los cálculos del otorgamiento de pensiones y capital asegurado que administran los seguros de rentas vitalicias y los seguros de invalidez y supervivencia en el caso del Sistema Privado de Pensiones y, iii) determinar las primas de seguros vida y la constitución de las reservas técnicas en el caso del sistema asegurador. El interés de las tablas de mortalidad queda fuera de toda duda a la vista de las distintas aplicaciones mencionadas en los dos párrafos anteriores. Hemos de señalar que la probabilidad de muerte para cada edad es la primera y más inmediata forma de medir las mortalidad, basta para ello con conocer los datos absolutos de defunciones y la población expuesta a riesgo de morir. Existen sin embargo otras medidas alternativas de gran utilidad que se recogen en una tabla de mortalidad. El capı́tulo está dedicado a introducir todos aquellos conceptos que permiten obtener una tabla de mortalidad, la descripción de su contenido y la clasificación de los distintos tipos de tablas. Y finaliza con una descripción de los cambios sufridos en la mortalidad española durante el periodo 1908-2002. 1.2. Probabilidades relacionadas con el tiempo de supervivencia Denotemos por x la edad de un individuo, con x ∈ [0, ω], donde ω representa el lı́mite superior de supervivencia. Para dicho individuo, T o Tx , representa su tiempo futuro de supervivencia, una variable aleatoria a la que podemos asociarle ξ = T +x, la edad de fallecimiento. La función de distribución de probabilidad de T , G(t) = P (T ≤ t), t ≥ 0, 6 Capı́tulo 1. Tablas de mortalidad representa la probabilidad que el individuo tiene de morir dentro de los t años siguientes. A partir de G(t) podemos definir la función de supervivencia s(t) = 1 − G(t). Para cualquier t > 0, s(t) es la probabilidad que el individuo tiene de sobrevivir t años, de ahı́ que la hayamos denominado función de supervivencia. De su definición se derivan las dos propiedades siguientes: es una función no creciente, y en los extremos del intervalo de supervivencia toma los valores s(0) = 1, puesto que G(0) = 0, y s(ω) = 0, por tratarse de la edad máxima alcanzable. Algunos autores sugieren (Villalón, 1997) que es razonable y conveniente suponer que s(t) es una función continua de t. Probabilidades y valores esperados de interés pueden ser expresados en términos de las funciones g y G. La comunidad internacional de actuarios utiliza una notación propia para designar alguno de estos valores (Gerber, 1997). Ası́, t qx = G(t) = 1 − s(t) es la probabilidad de que un individuo de edad x muera en t años. De igual forma t px = 1 − G(t) = s(t), (1.1) denota la probabilidad de que un individuo de edad x sobreviva al menos t años. Otra notación habitualmente utilizada es s|t qx = P (s < T < s + t) = G(s + t) − G(s) = s+t qx − s qx , que denota la probabilidad de que un individuo de edad x sobreviva s años y muera dentro de los t años siguientes. De igual forma se usan frecuentemente s+t px = 1 − G(s + t) = (1 − G(s)) 1 − G(s + t) = s px · t px+s 1 − G(s) y G(s + t) − G(s) = s px · t qx+s . 1 − G(s) Si t = 1, el ı́ndice t se omite en los sı́mbolos, por ejemplo qx denota la probabilidad de morir durante el año siguiente. Una medida de mortalidad muy utilizada es la llamada fuerza de mortalidad de x a la edad x+t, también conocida como función de riesgo o tasa de hazard, definida mediante g(t) d µx+t = = − ln (1 − G(t)) . (1.2) 1 − G(t) dt s|t qx = G(s + t) − G(s) = (1 − G(s)) 1.3 Estimación de las curvas de supervivencia 7 Se trata de una probabilidad condicionada, en concreto la de morir inmediatamente después del tiempo t, t + dt, siendo ası́ que se ha sobrevivido hasta t. De (1.1) se obtiene d µx+t = − ln (t px ) , dt e integrando Z t t px = exp − µx+s ds . (1.3) 0 1.3. Estimación de las curvas de supervivencia La estimación de las curvas de supervivencia puede plantearse desde dos enfoques distintos, que como veremos dan lugar a su vez a modelos especı́ficos. El primero de ellos consiste en postular una distribución de probabilidad para la variable T . El segundo, que podrı́amos denominar enfoque actuarial, supone la construcción de una tabla de mortalidad. 1.3.1. Algunos modelos para la distribución del tiempo de supervivencia La modelización de T a partir de una función de distribución explı́cita, G, tiene la ventaja de permitir su estimación mediante un reducido número de parámetros. Ventaja nada desdeñable cuando se dispone de pocos datos. A lo largo del tiempo diversos autores han propuesto modelos para el comportamiento probabilı́stico de T . Entre los más utilizados, los que se exponen a continuación. De Moivre (1724) postula la existencia de una edad ω máxima y supone que T se distribuye uniformemente entre las edades 0 y ω − x, de forma que g(t) = µx+t = 1 , 0 < t < ω − x, ω−x 1 , 0 < t < ω − x. ω−x−t Gompertz (1825) supone que la fuerza de mortalidad crece exponencialmente µx+t = Bcx+t , t > 0, lo que expresa mejor el comportamiento de T y además no requiere la hipótesis de la edad máxima ω. 8 Capı́tulo 1. Tablas de mortalidad Makeham (1860) añade una componente constante A > 0 al crecimiento exponencial y postula la siguiente ley µx+t = A + Bcx+t , t > 0. La probabilidad de supervivencia en este modelo es B x t c (c − 1) . t px = exp −At − ln c Weibull (1939) sugiere que la fuerza de mortalidad crece como una potencia de t en lugar de hacerlo exponencialmente µx+t = k(x + t)n , siendo k > 0 y n > 0 parámetros fijos. La probabilidad de supervivencia se expresa ahora k n+1 n+1 (x + t) −x . t px = exp − n+1 Otros autores proponen modelos más sofisticados, en la creencia que una sola ley no recoge adecuadamente toda la experiencia de mortalidad. Thiele (1972) propone un modelo que relaciona la fuerza de mortalidad con la edad de distinta forma según el rango de ésta última, 1 2 µx = a1 exp(−b1 x) + a2 exp − b2 (x − c) + a3 exp(b3 x), 2 donde el primer término representa la mortalidad infantil, el último, que es una curva Gompertz, corresponde a la mortalidad para edades avanzadas y el central es una curva normal. Perks (1825) introduce una nueva familia de curvas cuya expresión general es, µx = A + Bcx . Kc−x + 1 + Dcx Estas leyes son sólo aplicables a las edades adultas y muchas fallan al representar lo que conoce como la joroba de los accidentes en las edades adultas. Heligman y Pollard (1980) mejoran la propuesta de Perks con el modelo qx c = A(x+B) + D exp −E(log x − log F )2 + GH x , px 1.3 Estimación de las curvas de supervivencia 9 cuyo número de parámetros puede parecer excesivo. Sin embargo, todos ellos tienen una interpretación real. Ası́, A es q1 , C mide la ratio con la que los niños se adaptan al entorno, G indica el nivel de mortalidad de las edades elevadas mientras que H mide el incremento de esa mortalidad, D representa la intensidad de la joroba de los accidentes, que más adelante se describe, F la sitúa y E indica su velocidad. Una descripción más detallada y un listado más exhaustivo de las leyes de mortalidad puede encontrarse en Benjamin y Pollard (1992), Gerber (1997) y Tabeau, van den Berg Jeths y Heathcote (Eds) (2001). 1.3.2. Tablas de mortalidad A partir de T podemos definir una variable aleatoria discreta, K = ⌊T ⌋, que representa el número entero de años futuros vividos. Su distribución de probabilidad viene dada por P (K = k) = P (k ≤ T < k + 1) = k px · qx+k , k = 0, 1, 2 . . . y su valor esperado, la esperanza de vida abreviada, ex = ∞ X kP (K = k) = k=1 o, alternativamente, ex = ∞ X kk ·k px · qx+k , k=1 ∞ X k=1 P (K ≥ k) = ∞ X k px . k=1 Si S representa la fracción del año de muerte durante la cual el individuo de edad x sobrevive, se tiene T = K + S. Esta nueva variable, S, es continua y toma valores en [0, 1[. Suponiendo su distribución uniforme, podemos aproximar su valor esperado por 1/2, y 1 ėx = E[T ] ≈ ex + . 2 La distribución de probabilidad del tiempo de vida futuro puede ser construida a partir de lo que denominamos una tabla de mortalidad. Se trata, esencialmente, de una tabla que recoge las probabilidades de morir en el año siguiente a la edad que se ha sobrevivido, qx , y que definen completamente la distribución de K. La distribución de T puede obtenerse a partir de una tabla de mortalidad mediante interpolación, para lo cual son necesarias hipótesis sobre el comportamiento probabilı́stico de u qx , o de la fuerza de mortalidad, µx+u , para edades intermedias x + u, con x entero positivo y 0 < u < 1. Veamos alguna de estas hipótesis. 10 Capı́tulo 1. Tablas de mortalidad A) Linealidad de u qx Si suponemos que u qx es una función lineal de u, la interpolación entre u = 0 y u = 1 conduce a u qx = uqx , luego u px = 1 − uqx , y µx+u = qx . 1 − uqx B) µx+u constante Si µx+u = µx+ 1 ∀u ∈]0, 1[, de (1.3) se sigue 2 u px uµx+ 1 =e 2 µx+ 1 u 2 ] = (px )u . = [e Se deduce de aquı́ que la distribución de S, dado K = k, es una distribución exponencial truncada que depende de k, P (S ≤ u|K = k) = 1 − pux+k . 1 − px+k (1.4) Las variables S y K no son independientes en este caso. C) Linealidad de 1−u qx+u Esta hipótesis se conoce como la hipótesis de Balducci. A semejanza de lo que ocurre en A), 1−u qx+u = (1 − u)qx . De forma que, u px = 1 − qx px = 1 − (1 − u)qx 1−u px+u y µx+u = qx . 1 − (1 − u)qx Finalmente, P (S ≤ u|K = k) = u , 1 − (1 − u)qx+k (1.5) muestra que tampoco ahora las variables aleatorias S y K son independientes. 1.3 Estimación de las curvas de supervivencia 11 Observemos que en los tres supuestos considerados la fuerza de mortalidad es discontinua en los valores enteros, pero lo más llamativo y poco creı́ble es que bajo la hipótesis de Balducci la fuerza de mortalidad decrece entre dos enteros consecutivos. Cuando las probabilidades de muerte son muy pequeñas, en las hipótesis B) y C) las expresiones (1.4) y (1.5) conducen a una distribución uniforme para S independiente de K. La problemática de los tantos interanuales, según las tres hipótesis consideradas, la resume Betzuen (1995) en el siguiente cuadro, en el que t ∈ [0, 1] y lx es el número de supervivientes con edad x. Hipótesis A t qx = a + bt t qx = tqx lx+t = lx − tqx 1−h qx+t Hipótesis B = (1 − h)qx 1 − tqx µx+t = µ t qx = 1 − exp(−µt) lx+t = lx exp(−µt) Hipótesis C 1−t qx 1−t qx+t lx+t = 1−h qx+t = = a + bt = (1 − t)qx lx lx+t lx+1 + tdx (1 − h)qx 1 − (h − t)qx Señalemos por último que la asignación de la edad de un individuo incide en los resultados del estudio, tal como señala Betzuen (1995). El problema surge porque existen diferentes criterios para llevar a cabo dicha asignación. Los dos más utilizados en la práctica dan lugar a los conceptos de edad actuarial y edad entera alcanzada. Edad actuarial.- Se trata de un método muy popular entre los actuarios y consiste en atribuir como edad de fallecimiento la edad entera más próxima al cumpleaños. Se asigna la edad x a todos los individuos con edad comprendida en el intervalo [x − 1/2, x + 1/2[. Edad entera alcanzada.- Consiste en atribuir la edad como número de años enteros vividos, es decir, la forma habitual de asignar la edad a un individuo. Se asigna la edad x a todos los individuos con edad comprendida en el intervalo [x, x + 1[. 12 Capı́tulo 1. Tablas de mortalidad 1.4. Estructura y clasificación de las tablas de mortalidad Las tablas de mortalidad surgen de la necesidad de establecer reservas apropiadas con las que hacer frente a las obligaciones derivadas de los contratos de seguros de larga duración. El problema exige establecer una distriución de probabilidad, una estadı́stica de la mortalidad y un instrumento matemático adecuados. Detalles acerca de los orı́genes de las tablas y su evolución pueden consultarse en el libro de Nieto y Vegas (1993), quién atribuye a Halley (1693) el primer trabajo conocido de tablas de mortalidad completas construidas a partir de la hipótesis de estacionariedad, de la que más tarde nos ocuparemos. Posteriormente, Nicolás Titens, Jorge Barret y F. Bayly introdujeron los llamados sı́mbolos de conmutación que permitieron agilizar el cálculo de las operaciones de seguro. 1.4.1. Estructura Palacios (1996) define la tabla de mortalidad como una serie temporal que indica la reducción paulatina de un grupo inicial de individuos debido a los fallecimientos. Ası́ pues, lo que realmente contiene la tabla es el número de individuos que sobreviven. La tabla de mortalidad es una abstracción matemática que representa un modelo del comportamiento de la evolución y constante decrecimiento de un colectivo, construida a partir de las observaciones de un colectivo real. Su estructura básica, como nos describe Villalón (1994), debe estar constituida, al menos, por cinco columnas, encabezadas por los sı́mbolos x, lx , dx , qx y px . La primera, x, representa la edad del individuo en el rango , 0 ≤ x ≤ ω, siendo ω la edad lı́mite. La segunda, lx , representa el número de individuos que sobreviven a la edad x. La tercera, dx , representa el número de los individuos que fallecen entre las edades x y x + 1, dx = lx − lx+1 . La cuarta, qx , es el tanto anual de fallecimiento a la edad x, proporción de los individuos que fallecen entre las edades x y x + 1, qx = dx . lx 1.4 Estructura y clasificación de las tablas de mortalidad 13 La quinta, px , es el tanto anual de supervivencia a la edad x, px = lx+1 . lx Una tabla básica como la descrita permite la obtención de algunas caracterı́sticas de interés, como por ejemplo la esperanza de vida residual a la edad x, que representa los años que le restan por vivir a un individuo que ha cumplido x años. Su expresión es Tx (1.6) ex = , lx donde Tx es el totalP de años que todos los individuos que sobreviven a la edad x esperan vivir, Tx = i≥x Li , siendo Lx = l(x+1) + dx /2 el correspondiente número de personas-años. Las tablas pueden completarse, y habitualmente lo hacen, con los sı́mbolos de conmutación: Dx , Nx , Sx , Cx , Mx y Rx . Estos sı́mbolos son relaciones que facilitan los cálculos de primas, reservas y otras operaciones de seguros. Están calculados para un determinado tipo de interés, denominado tipo de interés técnico i, a partir del cual se obtiene el llamado factor de actualización, v x , o factor de descuento compuesto. Éste factor permite convertir un capital futuro a n años en un capital inicial, al eliminar el efecto de los intereses, vx = 1 . (1 + i)x Las expresiones de los sı́mbolos de conmutación son las siguientes: Dx Nx Sx Cx Mx Rx 1.4.2. = = = = = = lx v x Dx + Dx+1 + . . . + Dω Nx + Nx+1 + . . . + Nω dx v x+1 Cx + Cx+1 + . . . + Cω Mx + Mx+1 + . . . + Mω . Clasificación: tablas estáticas y tablas dinámicas El fenómeno de la supervivencia viene caracterizado porque sus sucesos hacen referencia al hecho de que un individuo cualquiera perteneciente a un grupo especı́fico, alcance y supere una edad concreta. Al intentar modelizarlo aparece la edad como como parámetro fundamental. A la edad se la denomina también en ocasiones tiempo biológico, para diferenciarla del tiempo cronológico que es el tiempo fı́sico o del 14 Capı́tulo 1. Tablas de mortalidad calendario. Esta distinción es necesaria cuando, por ejemplo, se quiere comparar la mortalidad de individuos de la misma edad en periodos distintos. Los hipótesis básicas, que constituyen la base fundamental de las deducciones que han de conducirnos a la construcción de una tabla de mortalidad (Vegas, 1982), son: Principio de homogeneidad.- Los individuos del grupo son equivalentes en lo que se refiere a mortalidad, en el sentido de que tienen la misma función de distribución de probabilidad para la variable edad de muerte ξ. El grupo es homogéneo. Principio de independencia.- Los individuos que integran el grupo se definen con variables estocásticamente independientes. Esto equivale a decir que las variables asociadas la supervivencia de los individuos del grupo son mutuamente independientes. Principio de estacionariedad.- La probabilidad de que un individuo de no sobreviva a una edad concreta es independiente del año de su cálculo. Con estas hipótesis la probabilidad de que n individuos no sobrevivan a las edades x1 , x2 ,. . . , xn , respectivamente, viene dada por P (ξ1 < x1 , ξ2 < x2 , . . . , ξn < xn ) = Gx1 (x1 − ξ1 ) · Gx2 (x2 − ξ1 ) . . . · Gxn (xn − ξn ) = x1 −ξ1 qx1 · x2 −ξ2 qx2 · . . . · xn −ξn qxn Es evidente que si el estudio del fenómeno de la supervivencia se refiere sólo al tiempo biológico es porque se admite implı́citamente la hipótesis de estacionariedad del fenómeno. Si todas las consideraciones y formulaciones que se hacen vienen referidas al tiempo biológico o edad, con exclusión de toda referencia al tiempo cronológico, la tabla de mortalidad resultante es una tabla de mortalidad estática o de momento. Un estudio completo deberı́a abarcar ambos conceptos temporales, puesto que en su formulación más general la estacionariedad puede estar ausente y la expresión matemática del fenómeno de la supervivencia depende entonces de ambos tiempos. Se obtiene entonces una tabla de mortalidad dinámica. Como reflexión a la comparación teórica de las tablas estáticas y dinámicas, hemos de añadir que las primeras nacen con una fecha de caducidad implı́cita, puesto que la mortalidad desciende y la esperanza de vida aumenta con el paso de los años, de forma que necesitarı́amos pedirle al asegurado una dotación adicional cuando pasaran un número determinado de años, mientras que con las segundas las posibles modificaciones son menores. 1.5 Evolución de la mortalidad 1.5. 15 Evolución de la mortalidad −1 −2 −3 −4 −6 −5 log(qx) −4 −6 −5 log(qx) −3 −2 −1 Antes de introducir y desarrollar los diferentes modelos dinámicos de tablas de mortalidad, consideramos importante poner de relieve las diferencias existentes entre las experiencias de mortalidad correspondientes a diferentes periodos. Esta sección esta dedicada a ilustrar dichas diferencia mediante un ejemplo concreto. Se pretende con ello justificar la necesidad de introducir modelos dinámicos que permitan una mejor predicción de la mortalidad futura. Los datos utilizados en el ejemplo corresponden a la mortalidad observada en España durante el periodo de 1908-2002 para un rango de edades de 0 a 110, y han sido obtenidos de H.D.M. (2005). La Figura 1.1 permite observar como, en general, las probabilidades de muerte han descendido en el transcurso del tiempo, aunque con diferente comportamiento para los distintos grupos de edad. Al igual que otros paı́ses desarrollados, en España han sido especialmente llamativos el descenso que que ha sufrido la mortalidad infantil, el aumento de mortalidad en la última década para edades intermedias y la estabilidad, e incluso ligero aumento, para las edades elevadas debido al aumento de población longeva que se ha producido en los últimos años. −7 edats 0 30 50 70 95 −8 −8 −7 edats 0 30 50 70 95 1920 1940 1960 any (a) Hombres 1980 2000 1920 1940 1960 1980 2000 any (b) Mujeres Figura 1.1: Gráfico de descenso de la mortalidad para algunas edades Las tendencias recientes de la mortalidad han sido descritas entre otros por Olivieri (2001), quien define al respecto dos procesos: el de expansión y el de rectangularización de la curva de supervivientes, Figuras 1.2 (a) y 1.3 (a) para hombres y mujeres, respectivamente. La curva de supervivientes se desplaza hacia edades muy elevadas, aspecto que se ha denominado expansión y que se traduce también en un desplazamiento de las moda de la curva de muertes, Figuras 1.2 (b) y 1.3 (b), hacia esas mismas edades. Un incremento de la concentración de muertes en torno a la moda de la curva de muertes implica a su vez, que la curva de supervivientes se 16 Capı́tulo 1. Tablas de mortalidad 1 e+00 qx dx 0 20 40 60 80 100 1 e−03 1908 1938 1958 1978 2002 1 e−04 0 0 e+00 2 e+04 5000 4 e+04 lx 1908 1938 1958 1978 2002 1 e−02 10000 6 e+04 1 e−01 8 e+04 15000 1 e+05 transforme adoptando la forma de un rectángulo, de ahı́ el nombre de rectangularización que Olivieri (2001) da al fenómeno. Todo este proceso va acompañado de un incremento de las esperanzas de vida que puede observarse en la Figura 1.4. Adicionalmente aparecen niveles de mortalidad altos y gran dispersión en las edades jóvenes e intermedias particularmente para los hombres, veánse en las Figuras 1.2 (c) y 1.3 (c). Este fenómeno, observado también en otros paı́ses, se conoce como joroba de los accidentes porque algunos autores lo asocian a los accidentes de tráfico. 0 20 40 edat 60 80 100 0 20 40 edat (a) lx 60 80 100 edat (b) dx (c) qx 1 e+00 1 e−01 qx dx 0 1 e−04 2 e+04 0 e+00 0 20 40 60 edat (a) lx 80 100 1908 1938 1958 1978 2002 1 e−03 5000 4 e+04 lx 1908 1938 1958 1978 2002 1 e−02 6 e+04 10000 8 e+04 1 e+05 15000 Figura 1.2: Rectangularización y expansión para los hombres. 0 20 40 60 edat (b) dx 80 100 0 20 40 60 edat (c) qx Figura 1.3: Rectangularización y expansión para las mujeres. 80 100 80 60 40 Esperança de vida 60 40 e0 e65 20 e0 e65 20 Esperança de vida 80 1.5 Evolución de la mortalidad 1920 1940 1960 any (a) hombres 1980 2000 1920 1940 1960 any (b) mujeres Figura 1.4: Evolución de la esperanza de vida. 1980 2000 17 18 Capı́tulo 1. Tablas de mortalidad Capı́tulo 2 Revisión de los modelos dinámicos para la graduación de la mortalidad 2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.2. Modelos paramétricos . . . . . . . . . . . . . . . . . . . . . 22 2.2.1. Modelos estructurales . . . . . . . . . . . . . . . . . . . . 23 2.2.2. Modelos no estructurales 31 . . . . . . . . . . . . . . . . . . 2.3. Modelos no paramétricos . . . . . . . . . . . . . . . . . . . 35 2.3.1. Suavizado con p-splines . . . . . . . . . . . . . . . . . . . 36 2.3.2. Algoritmo Median-polish . . . . . . . . . . . . . . . . . . 37 2.4. Últimas propuestas para la graduación de tablas dinámicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.4.1. Modelización de los residuos . . . . . . . . . . . . . . . . . 38 2.4.2. Modelos frágiles (Frailty models) . . . . . . . . . . . . . . 39 2.4.3. Riesgo de la longevidad . . . . . . . . . . . . . . . . . . . 39 2.5. La esperanza de vida residual . . . . . . . . . . . . . . . . 39 2.6. Intervalos de confianza para la predicción . . . . . . . . . 40 19 2.1 Introducción 2.1. 21 Introducción Históricamente la ciencia actuarial y la demografı́a se han preocupado por la modelización y predicción de la mortalidad. El primer paso, y quizás una de las partes fundamentales en las que interviene la Estadı́stica, es la graduación de los datos de mortalidad. Haberman y Renshaw (1996) definen la graduación como “el conjunto de principios y métodos por los que las probabilidades de muerte observadas (o brutas) se ajustan para proporcionar una base suavizada que permita hacer inferencias y cálculos prácticos de primas y reservas”. La graduación es necesaria (London, 1985) porque la secuencia de estimaciones iniciales de las probabilidades de muerte presenta en la mayorı́a de las ocasiones cambios bruscos, lo que no se corresponde con la hipótesis plausible de que la diferencia entre las probabilidades de muerte de dos edades consecutivas no debe de ser excesivamente grande. La graduación mediante métodos paramétricos ha sido tratada, entre otros, por Forfar, McCutcheon y Wilkie (1988), Renshaw (1991) y Debón, Montes y Sala (2005), y mediante métodos no paramétricos en Gavin, Haberman y Verrall (1993, 1994, 1995) y Debón, Montes y Sala (2006b), entre otros. Todos estos trabajos fijan su atención solamente en la influencia que la edad tiene sobre qx , analizando datos correspondientes a un año determinado, o acumulados a lo largo de un cierto periodo, y construyendo en consecuencia tablas de mortalidad estáticas. Un hecho reconocido por la literatura actuarial más reciente es la evolución de la mortalidad con el transcurrir de los años, el ejemplo de la Sección 1.5 del Capı́tulo 1 corrobora esta afirmación. Por esta razón, la literatura actuarial más actual analiza el fenómeno de la mortalidad desde una perspectiva dinámica, incorporando también la influencia del tiempo del calendario en su análisis. Una tabla de mortalidad dinámica persigue la obtención de estimaciones sin cambios bruscos, q̂xt , de las desconocidas verdaderas probabilidades de muerte, qxt , a partir del conjunto de estimaciones brutas, q̇xt , para cada edad x y año t. La estimación bruta para cada par (x, t) está basada en el número de muertes observadas, dxt , y el número de individuos inicialmente expuestos al riesgo, Ext . Una recopilación de la técnicas de análisis y construcción de tablas de mortalidad dinámicas puede encontrarse en Benjamin y Pollard (1992); Tuljapurkar y Boe (1998); Felipe y Guillén (1999); Tabeau, van den Berg Jeths y Heathcote (Eds) (2001); Pitacco (2004b); Debón, Montes y Sala (2006a). Especial atención al riesgo que la longevidad tiene para el asegurador se presta en Pitacco (2004b), que recopila las contribuciones más recientes como también lo hace Booth (2006). Los modelos para la graduación de tablas de mortalidad dinámicas pueden clasificarse, atendiendo a los métodos empleados, en dos grandes grupos: 1. Modelos paramétricos.- Son modelos que ajustan a las medidas de la mortalidad una función f dependiente de unos parámetros. Para ello son dos, básicamente, los tratamientos, 22 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad a) considerar que la influencia del tiempo del calendario sólo afecta a los parámetros, lo que constituyen los modelos que denominaremos estructurales, o bien, b) incorporar el tiempo cronológico como variable t en la función, que es lo que hacen los modelos que denominaremos no estructurales. 2. Modelos no paramétricos.- Son generalizaciones de las técnicas de smoothing, de forma que dependen de la edad y el tiempo. La mayorı́a de los modelos desarrollados son paramétricos, porque como señala Congdon (1993) este tipo de modelos facilitan la comparación a lo largo del tiempo. Los modelos no paramétricos se utilizan en cambio como análisis exploratorio de los datos, previamente a la graduación mediante cualquier ley de mortalidad. Esta situación está cambiando debido, entre otras razones, a la ventaja que representa no necesitar ninguna hipótesis inicial acerca de la distribución de las observaciones. Un ejemplo de modelización no paramétrica previa es el artı́culo de Felipe, Guillen y Nielsen (2001), en el que se combinan ideas básicas de procesos estocásticos (Macdonald, 1996a,b,c) con el uso de un kernel de suavizado ya descrito para el caso univariante en Gavin, Haberman y Verrall (1993, 1994, 1995). Una publicación del CMI Bureau (CMI, 2005) recomienda la utilización de métodos semiparamétricos basados en p-splines (Currie, Durban y Eilers, 2004) para analizar la mortalidad en el Reino Unido. El contenido de este capı́tulo está estructurado de la siguiente forma. La Sección 2.2 se dedica a la descripción de los modelos paramétricos. En su apartado 2.2.1 se describen los modelos estructurales: el modelo de Heligman y Pollard (1980), el modelo de Lee-Carter (1992), el modelo edad-periodo-cohorte (APC) y el modelo de Lee-Carter con cohorte (APC). El apartado 2.2.2 se ocupa de los modelos no estructurales: las funciones Gompertz-Makeham ajustadas mediante modelos lineales generalizados, GLM (McCullagh y Nelder, 1989), y los factores de reducción de la mortalidad. En la Sección 2.3 se describen algunos modelos no paramétricos, entre ellos el suavizado mediante un kernel, mediante p-splines y mediante el algoritmo de suavización de las medianas (median polish). La Sección 2.4 es una revisión de las propuestas más recientes que permite al lector conocer el estado actual de la investigación en este campo. El capı́tulo concluye con las Secciones 2.5 y 2.6 dedicas al concepto de esperanza de vida residual y a la obtención de intervalos de confianza para las predicciones. 2.2. Modelos paramétricos La graduación mediante modelos paramétricos persigue alcanzar un equilibrio entre el número de parámetros y la bondad de ajuste. Como advierte Congdon 2.2 Modelos paramétricos 23 (1993) este objetivo no es fàcil de conseguir. Señala el autor que muchos estudios de graduación demográfica han enfatizado la bondad de ajuste sin considerar la estabilidad estadı́stica de los parámetros implicados en la regresión, lo que suele conducir a una sobreparametrización del modelo, que puede ponerse de manifiesto cuando se observan errores estándar demasiado grandes para los parámetros estimados, altas correlaciones entre ellos y fallos de la convergencia en las rutinas iterativas de ajuste no lineal. La sobreparametrización tiene además implicaciones prácticas sobre el uso de la graduación. Por ejemplo, en la comparación de las series temporales de los parámetros obtenidas al ajustar datos de mortalidad correspondientes a diferentes años, la predicción de valores para años futuros pueden mostrar fluctuaciones erráticas irregulares que dificulten la predicción. Existen pues sobradas razones para preferir funciones parsimoniosas, con pocos parámetros, aún a costa de ligeras pérdidas de bondad de ajuste. La forma de las funciones que se ajustan a los datos son diversas y vienen sugeridas fundamentalmente por el perfil que presentan las estimaciones brutas de la medida de mortalidad utilizada. Señalemos, no obstante, que la graduación de tablas dinámicas mediante modelos paramétricos consiste, con alguna notable excepción (Lee y Carter, 1992) que luego estudiaremos, en la adaptación de los modelos construidos para el caso estático con el fin de que captar la evolución de la mortalidad a lo largo del tiempo del calendario. Se trata de modelos propuestos por autores clásicos que dieron buenos resultados para datos de finales del siglo XIX y principios del siglo XX, el de Gompertz-Makeham serı́a un ejemplo o el de Heligman y Pollard (1980) que surge ante la dificultad que aquél muestra a la hora de recoger la evolución de la mortalidad. Todos ellos se hallan recogidos y detalladamente descritos en Gerber (1997) y Benjamin y Pollard (1992). 2.2.1. Modelos estructurales Los modelos estructurales consideran que el tiempo del calendario afecta sólo a los parámetros. Consecuentemente con ello, se aplican a través de los dos pasos siguientes: 1. ajustan el mismo modelo o ley a la medida de mortalidad elegida para los distintos años, obteniendo ası́ una secuencia temporal de parámetros estimados, y a continuación 2. analizan la serie temporal resultante para cada parámetro. Las series temporales ajustadas se utilizan para obtener estimaciones futuras de los parámetros, que sustituidas en la ley de mortalidad nos permite realizar predicciones de la medida de mortalidad elegida. Un modelo de estas caracterı́sticas es el modelo logit propuesto por Brass (1969), cuya descripción y aplicación puede 24 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad encontrarse en Benjamin y Soliman (1993). Se trata de un modelo empı́rico (Felipe y Guillén, 1999) del que nos ocuparemos. Sı́ lo haremos de propuestas más depuradas como las que siguen. Modelo de Heligman y Pollard Las leyes de Heligman y Pollard (1980) han sido ampliamente utilizadas por diferentes paı́ses de nuestro entorno europeo (Inglaterra, Suecia, Alemania y España) y por otros paı́ses desarrollados (Estados Unidos de América y Australia), desde que la ONU promovió el ajuste de la mortalidad a través de la primera de estas leyes. Los autores, inspirándose en Thiele (1972), ajustan una nueva ley de mortalidad en la Australia de la posguerra, cuya expresión genérica es n X qx Ai exp −Bi (fi (x) − Ci )Di , = 1 − qx i=1 donde Ai , Bi , Ci , Di , i = 1, 2, . . . , n, son los parámetros a estimar, y donde para fi (x) suele utilizarse x o ln(x). Normalmente con n = 3 se obtienen buenos ajustes. Las tres expresiones que realmente se ajustaron a la mortalidad australiana fueron Primera ley de Heligman y Pollard • Versión 1 qx C = A(x+B) + D exp(−E(ln x − ln F )2 ) + GH (x−x0 ) , 1 − qx o su equivalente, • Versión 2 (x+B)C qx = A GH x + D exp(−E(ln x − ln F ) ) + . 1 + GH x 2 Segunda ley de Heligman y Pollard C qx = A(x+B) + D exp(−E(ln x − ln F )2 ) + GH x . 1 + KGH x Tercera ley de Heligman y Pollard k (x+B)C qx = A GH x . + D exp(−E(ln x − ln F ) ) + 1 + GH xk 2 (2.1) 2.2 Modelos paramétricos 25 -2 0 Cada uno de los tres términos de la ecuación básica representa una componente distinta de la mortalidad, el primer término la mortalidad infantil, el segundo la joroba de los accidentes y el tercero la mortalidad natural causada por senectud (Heligman y Pollard, 1980). El gráfico de la Figura 2.1 muestra esta descomposición. El número de parámetros puede parecer excesivo, pero como se señala en la página 8 al introducir por primera vez la ley de Heligman y Pollard, todos ellos están asociados a un aspecto concreto de la mortalidad. A representa la ratio de mortalidad infantil; B representa la probabilidad de muerte para un niño de un año de edad; C está relacionado con la adaptación de los individuos a su entorno. Los tres toman valores en el intervalo (0,1). D, E y F se refieren a la joroba de los accidentes, D indica la severidad de la joroba y toma valores en (0,1), E con valores elevados, entre (0,∞), indica la concentración de la joroba y F de indica la edad de localización del máximo de la joroba y toma valores de 15 en adelante. Finalmente, G indica el nivel base de la mortalidad senil, y H es la tasa de crecimiento de dicha mortalidad senil y sus valores varı́an en (0,1) y (0,∞), respectivamente. -12 -10 -8 log(qx) -6 -4 Infantil Adult Senil 0 20 40 60 80 edat Figura 2.1: Descomposición de la Ley de Heligman y Pollard Los parámetros se estiman para cada uno de los años mediante mı́nimos cuadrados ponderados no lineales para todo el rango de edades, X ωx (qx − F (x))2 , x donde ωx−1 es proporcional a la varianza de la observación a la edad x, F (x) es la ley de Heligman y Pollard elegida para el ajuste, habitualmente la segunda (2.1), 26 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad y qx son las probabilidades de muerte observadas. La necesidad de introducir pesos en el ajuste es debida a la desigualdad de varianzas, puesto que siendo Binomial el qx (1 − qx ) . De aquı́ que los pesos propuestos sean 1/qx modelo elegido var(qx ) = Ex o alguna potencia suya, como por ejemplo hacen Felipe y Guillén (1999); Felipe, Guillén y Pérez-Marı́n (2002) y ya hicieron Heligman y Pollard. El último paso para la predicción es ajustar una serie temporal para cada una de las series de los parámetros que el ajuste para los distintos años proporciona. La utilización que del modelo de Heligman y Pollard se hace en Mcnown y Rogers (1989) ha sido adaptada al modelo español por Felipe y Guillén (1999) y Felipe, Guillén y Pérez-Marı́n (2002) que emplean en dicha adaptación sólo la segunda ley. En la aplicación de este modelo a datos de la Comunidad Valenciana, Debón, Montes y Sala (2006a) han encontrado algunos problemas achacables a la sobreparametrización a la que antes se aludı́a y a la ausencia de joroba de los accidentes entre las mujeres. Los detalles y la solución aplicada pueden consultarse en el artı́culo citado. El problema de la sobreparametrización puede surgir en este tipo de modelos con mayor frecuencia de la deseada. Su presencia puede afectar a la estabilidad de los parámetros a lo largo del tiempo (Congdon, 1993), y suponer una limitación del modelo para las potenciales proyecciones (Booth, Maindonald y Smith, 2002). A señalar, por ultimo, que los métodos clásicos de ajuste presentan en ocasiones problemas numéricos, para evitarlos Dellaportas, Smith y Stavropoulos (2001) propone una aproximación Bayesiana para las leyes de Heligman y Pollard utilizando métodos MCMC. Modelo de Lee-Carter A diferencia del modelo de Heligman y Pollard, el modelo de Lee-Carter fue desarrollado exclusivamente para la graduación de tablas dinámicas. Ha disfrutado, desde su publicación (Lee y Carter, 1992), de gran aceptación en el mundo actuarial por su sencillez y por la bondad de sus resultados. El modelo consiste en expresar la medida de mortalidad elegida como una función exponencial que depende de la edad y del tiempo. En concreto, mxt = exp(ax + bx kt + ǫxt ), (2.2) ln(mxt ) = ax + bx kt + ǫxt . (2.3) o de forma equivalente Respecto de los parámetros cabe decir que, 1. la sucesión de valores ax describe el perfil general del esquema de mortalidad a lo largo de la edad, 2.2 Modelos paramétricos 27 2. la sucesión bx nos informa de cómo responde la medida de mortalidad a los dkt d ln mxt , = bx cambios en kt dt dt 3. los valores kt representan la tendencia de la mortalidad a lo largo del periodo t Los errores ǫxt , con media cero y varianza σǫ2 , reflejan influencias históricas que no son capturadas por el modelo. Las expresiones (2.2) y (2.3) son en realidad versiones reducidas del modelo de Lee-Carter. Su forma más general, aplicada a las probabilidades de muerte qxt , es ln(qxt ) = ax + r X bix kti + ǫxt , (2.4) i=1 donde r es el rango de la matriz ln(qxt ) − ax . Algunos autores, véase Debón, Montes y Puig (2008), prefieren modelizar el logit(qxt ) en lugar de su neperiano, logit(qxt ) = ln qxt 1 − qxt = ax + r X bix kti + ǫxt . (2.5) i=1 Existe una doble razón para este cambio, la primera la proporciona el propio Lee (2000) cuando advierte que (2.3) puede conducir a estimaciones de qxt que superen el valor 1, este problema puede evitarse modelizando su logit. La segunda, como indican Booth, Maindonald y Smith (2002) y Renshaw y Haberman (2003b), es que la interacción entre la edad y el tiempo puede ser capturada mejor agregando términos a (2.2) o (2.3). La estructura del modelo es invariante bajo cualquiera de las siguientes transformaciones de los parámetros, (ax , bx /c, ckt ) o (ax + cbx , bx , kt − c), ∀c, por lo que los X X i parámetros han de ser normalizados, bx = 1 y kti = 0, para que el modelo tenx t ga una única solución. El modelo no puede ser ajustado por las técnicas habituales de regresión puesto que los valores del ı́ndice kt no son observables. La estimación de los parámetros en (2.5) se puede llevar mediante la descomposición en a cabo qxt valores singulares (SVD) de la matriz ln 1−qxt − âx (Lee y Carter, 1992), modelos lineales generalizados (GLM) condicionales (Currie et al., 2004) o el método de máxima verosimilitud, tal como proponen Brouhns, Denuit y Vermunt (2002). Es este caso es de gran ayuda el paquete gnm, de reciente creación en el código R (R Development Core Team, 2005), desarrollado por Turner y Firth (2006). Detalles sobre la estimación de los parámetros según estos tres métodos pueden encontrarse en Debón, Montes y Puig (2008). 28 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad El último paso del método de Lee-Carter consiste en ajustar una serie temporal a los valores de los ı́ndices de mortalidad, {k̂t }. En muchas de las aplicaciones se obtiene un buen resultado con el modelo k̂t = p + k̂t−1 + ut , con p constante y ut un ruido blanco. La predicción para los años tn +s, s = 1, 2, . . . , posteriores al último tn , se realiza sustituyendo en el modelo de Lee-Carter la predicción k̂tn +s obtenida a partir de la serie temporal ajustada, q̂x,tn +s = ax + b̂x k̂tn +s , s > 0. ln 1 − q̂x,tn +s Un método alternativo de predicción es el propuesto en Lee (2000) y Renshaw y Haberman (2003b) haciendo uso de los últimos datos como punto de partida. Sugieren obtener los ratios de mortalidad proyectados alineándolos con los últimos ratios brutos de mortalidad estimados mediante la expresión (Renshaw y Haberman, 2006), q̂x,tn +s q̇xtn ln = ln + b̂x (k̂tn +s − k̂tn ), s > 0. 1 − q̂x,tn +s 1 − q̇xtn Algunos autores han aportado sugerencias y modificaciones al método. Entre ellos Carter y Lee (1992), Wilmoth (1993), el propio Lee (2000) en un artı́culo en el que compara su método con otras alternativas como la de McNown y Rogers (1989, 1992), Booth, Maindonald y Smith (2002) y Li y Lee (2005) que proponen modificaciones al método de Lee-Carter con el fin de poder predecir la mortalidad para paı́ses que forman parte de un grupo, en lugar de considerarlos individualmente. Más recientemente, Czado, Delwarde y Denuit (2005) y Pedroza (2006) introducen una estimación Bayesiana de los parámetros, esta última mediante modelos statespace. La principal crı́tica al modelo de Lee-Carter es que los parámetros ax y bx dependen sólo de la edad y que la predicción de futuros valores de la mortalidad se basa sólo en kt , lo que supone admitir que no existe interacción entre la edad y el tiempo. Sus ventajas son, entre otras, la fácil interpretación de sus parámetros y su parsimonia (Lee, 2000; Booth, Maindonald y Smith, 2002). El modelo goza actualmente de mucha popularidad debido a sus buenos resultados y a su simplicidad, por lo que hay una amplia literatura de su tratamiento y mejora. Modelo edad-periodo-cohorte (APC) Tabeau, van den Berg Jeths y Heathcote (Eds) (2001) describen en su libro los modelos de graduación y predicción recientemente desarrollados y concluyen con la 2.2 Modelos paramétricos 29 necesidad de integrar técnicas de distintas disciplinas con el objetivo de conseguir predicciones satisfactorias. En uno de sus documentos de trabajo (CMI, 2004) el CMI Bureau aconseja adoptar por parte de los actuarios los modelos edad-periodocohorte (en adelante APC), insistiendo en ello en un documento posterior (CMI, 2007) en el que se analiza detenidamente el modelo de Lee-Carter. Los modelos APC han mostrado buenos resultados en el campo de la epidemiologı́a (Clayton y Schifflers, 1987a,b; Holford, 1983) y constituyen una evolución natural de los modelos dinámicos al incorporar el efecto del año de nacimiento (cohorte), y la extensión natural de los modelos edad-periodo, AP, y edad-cohorte, AC. La edad, el periodo y la cohorte están ligados por la relación1 a = p − c. Esta relación implica que el número total de parámetros del modelo APC es 1 + (A − 1) + (P − 1) + (C − 2), una unidad inferior al que cabrı́a esperar. La exacta dependencia lineal entre los tres factores que la relación supone es el mayor problema que se plantea en los modelos APC. Hay diferentes soluciones a dicho problema, la que propone Holford (1983) consiste en ajustar primero el modelo con cualquier parametrización de los efectos, y llevar luego a cabo una regresión de cada conjunto de estimaciones sobre su correspondiente factor. Veamos como proceder. Si se ajusta un modelo con un cierto conjunto de parámetros logit[q(a, p)] = αa + βp + γc , (2.6) la ecuación es equivalente si se añade a cada parámetro cualquier valor, µa , µp y µc de forma que µa + µp + µc = 0. Dada la relación existente entre a, p y c, para cualquier constante δ se verifica δ(a − p + c) = 0. Incorporando ambas igualdades a (2.6) se obtiene logit[q(a, p)] = αa − µp − µc + δa + βp + µp − δp + γc + µc + δc (2.7) Esta expresión sugiere una descomposición de los efectos en una parte lineal y otra no lineal. De acuerdo con Holford (1983) se efectua una regresión de las estimaciones de cada efecto sobre su factor para, una vez sustituidas en (2.6) las regresiones calculadas, obtener una nueva expresión semejante a (2.7), logit[q(a, p)] = α̃a + µ̂a + δ̂a a + β̃p + µ̂p + δ̂p p + γ̃c + µ̂c + δ̂c c. (2.8) Todas las pendientes deben ser iguales y estimar la pendiente teórica común δ. Este problema puede resolverse haciendo alguna hipótesis sobre la importancia relativa 1 Observará el lector un cambio en la notación hasta ahora utilizada, x y t han sido reemplazadas por a y p. Hemos querido con ello seguir la notación habitual en la literatura de los modelos APC. 30 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad de los efectos. Por ejemplo, si se considera a la edad como el efecto más importante y al periodo como el menos importante, se puede elegir una reparametrización basada en las siguientes hipótesis: los efectos periodo deben tener media cero, los efectos cohorte deben ser un riesgo relativo a alguna cohorte central, y los efectos edad deben representar las probabilidades de muerte para cada edad en la cohorte central de referencia, previa corrección de los efectos periodo para que tengan media cero. Comenzando por el primer punto, a partir de la ecuación (2.8) se puede utilizar como efecto periodo, g(p) = β̃p = βp − µ̂p − δ̂p p, precisamente porque los residuos tiene de media cero. Al sustituir en (2.8) logit[q(a, p)] = α̃a + µ̂a + δ̂a a + g(p) + µ̂p + δ̂p p + γ̃c + µ̂c + δ̂c c = αa + g(p) + µ̂p + δ̂p p + γc , (2.9) sumando y restando la cohorte de referencia, c0 , y su efecto, γc0 , y teniendo en cuenta que p = c + a, tendremos logit[q(a, p)] = [αa + µ̂p + δ̂p (a + c0 ) + γc0 ] + g(p) + [γc − γc0 + δ̂p (c − c0 )] = f (a) + g(p) + h(c), (2.10) donde h(c) = γc − γc0 + δ̂p (c − c0 ), representa el efecto de la cohorte, que vale cero para c0 y tiene la pendiente correcta, y f (a) = αa + µ̂p + δ̂p (a + c0 ) + γc0 , representa el efecto de la edad. Otra solución al problema de la identificabilidad es la que propone el método secuencial. Supone ajustar primero el modelo AC y, a continuación, ajustar a los residuos un modelo que depende únicamente del periodo. A diferencia de la propuesta de Holford (1983), este método secuencial permite construir intervalos de confianza para los efectos estimados. Detalles acerca de ambos métodos pueden encontrarse en Carstensen y Keiding (2005). La predicción de los ratios de mortalidad más allá de los años ajustados puede llevarse acabo de diferentes formas. La forma más simple y robusta (Carstensen y Keiding, 2005; Osmond, 1992) es predecir a través de una regresión lineal ajustada a las últimas estimaciones de los efectos correspondientes al periodo y la cohorte, la 2.2 Modelos paramétricos 31 extrapolación de la edad es innecesaria pues no se desea ampliar el rango de edad. El número de estimaciones y el tipo de regresión son las únicas decisiones a tomar. Un punto débil de los modelos APC presentados en la expresión (2.6) es que asumen efectos independientes para la edad y el periodo, algunos autores (Pitacco y Olivieri, 2005) opinan, sin embargo, que el impacto de la mejoras en la mortalidad a lo largo del tiempo pueden ser variables con la edad. Modelo de Lee-Carter con efecto cohorte En uno de sus últimos documentos de trabajo (CMI, 2007), el CMI Bureau aconseja el uso del modelo Lee-Carter con efecto cohorte añadido (Lee-Carter APC), propuesto por Renshaw y Haberman (2006), para la graduación de tablas dinámicas. Dicho modelo, aplicado a los logit de la probabilidades de muerte a la edad x en el año t, se expresa qxt = ax + b1x kt + b2x ιc + ǫxt , (2.11) ln 1 − qxt P P con las restricciones x b1x = 1, x b2x = 1 y ιt1 −xk = 0 (o kt1 = 0). El subı́ndice c en (2.11) hace referencia a la cohorte. El significado de los coeficientes en (2.11) es el que ya dimos en la página 26, con la salvedad que supone la inclusión de dos nuevos conjuntos de parámetros, b2x y ιc , cuyos significados respecto de la cohorte c son análogos a los b1x y kt respecto del periodo t. El ajuste del modelo presenta dificultades debido a la relación existente entre los tres factores, a = p − c, por ello Renshaw y Haberman (2006) proponen llevar a cabo la estimación de forma secuencial, en un primer paso se ajusta ax según el modelo original de Lee-Carter mediante el método SV D, X qxt ln 1 − qxt t , âx = T los restantes parámetros se ajustan en un segundo paso utilizando el algoritmo que describen en su trabajo basado en un GLM con distribución Poisson para las muertes, fijando los valores de âx mediante un término offset, y que en el caso de la ecuación 2.11 puede modificarse a un GLM con distribución Binomial. Las futuras predicciones con el nuevo modelo requieren la modelización de las series temporales kt y ιc . 2.2.2. Modelos no estructurales Los modelos no estructurales incluyen explı́citamente el tiempo en la expresión de su función de mortalidad. Algunos de ellos, como ya ocurrı́a en el caso de los 32 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad modelos estructurales, son adaptaciones de modelos originalmente pensados para la graduación de tablas estáticas. Funciones Gompertz-Makeham con respecto a la edad y el tiempo Las funciones originales de Gompertz-Makeham de tipo (r,s) son funciones con r + s parámetros, dependientes de la edad x, que tienen por expresión ! r r+s X X αi xj−r−1 , αi xi−1 + exp GMαr,s (x) = i=1 j=r+1 en las que se conviene que si r = 0 sólo poseen parte exponencial y si s = 0 sólo está presente el término polinómico. Derivadas de las anteriores podemos considerar los Logit Gompertz-Makeham de tipo (r,s) (LGM(r,s)) cuya la expresión es LGMαr,s (x) = GMαr,s (x) . 1 + GMαr,s (x) Estas funciones han sido adaptadas por Renshaw, Haberman y Hatzopoulos (1996) al caso dinámico, mediante la inclusión del tiempo como variable. El modelo propuesto para el logit de qxt es, ln qxt 1 − qxt = β0 + s X j=1 ′ βj Lj (x ) + r X i=1 ′i αi t + s r X X ′ γij Lj (x′ )t i , (2.12) i=1 j=1 sujeto a la convención que algunos de los términos γij pueden ser cero. En (2.12) x′ y t′ son transformaciones de la edad y el tiempo, respectivamente, de forma que sus valores estén dentro de intervalo [−1, 1] y Lj (x′ ) son los polinomios de Legendre generados por Ln+1 (x) = xLn (x) − nLn−1 (x), donde n ≥ 1, L0 (x) = 1 y L1 (x) = x. Reescribiendo la ecuación(2.12) de la forma " # " r ! # s s X X X qxt ′ = exp β0 + βj Lj (x′ ) exp αi + γij Lj (x′ ) t i , (2.13) 1 − qxt j=1 i=1 j=1 el primer término de esta expresión puede interpretarse como una función GompertzMakeham LGM (0, s + 1) correspondiente a la graduación en función de la edad. El segundo término puede ser interpretado como término de ajuste del efecto del año del calendario, de forma que cuando al menos uno de los γij es no nulo la edad también está presente en este término e interacciona con el tiempo. Un ejemplo de esta interacción se produce con el incremento de muertes de hombres adultos y jóvenes debido al SIDA. 2.2 Modelos paramétricos 33 Bajo la hipótesis que Dxt , número de muertes a edad x en el año t, sigue una distribución Binomial, Dxt ∼ Bi(Ext , qxt ), con valores observados dxt , la forma de proceder para determinar los parámetros αi , βj y γij , es considerar el esquema de modelo lineal generalizado (GLM ) con familia Binomial y link logit. Para ello, 1. los valores elegidos para r y s son aquellos máximos a partir de los cuales los incrementos de la Deviance no resultan estadı́sticamente significativos, a continuación, 2. los coeficientes γij se eligen de forma que el incremento de la Deviance resulte significativo, 3. paralelamente, se determinan los errores estándar de la estimaciones de los parámetros y su significación mediante la prueba usual t-Student. Sithole, Haberman y Verrall (2000) aplican este modelo, pero el objetivo principal de su trabajo no sólo es encontrar un modelo que proporcione un buen ajuste de los datos, sino que se comporte adecuadamente con las proyecciones. Consideran adecuado el modelo para realizar proyecciones si todas las medidas de mortalidad predichas progresan suavemente con respecto a la edad y el tiempo, y se observa una reducción en los tantos de mejora en la mortalidad a edades muy avanzadas. En definitiva, se trata de alcanzar un equilibrio entre el ajuste y la predicción. Como señalan Wong-Fupuy y Haberman (2004), las dos principales conclusiones a extraer de del trabajo anterior son: 1. los valores óptimos de r y s para el ajuste no generan tendencias plausibles para las proyecciones, lo que obliga a rebajar los órdenes de los polinomios sacrificando la bondad de ajuste, 2. para todos los conjuntos de datos analizados los resultados más satisfactorios se obtuvieron con r = 1 y s = 3 y con una interacción de orden 1. Existe también una versión estructural para las funciones Gompertz-Makeham que consiste en ajustar el modelo para cada año y después predecir a partir de las series temporales ajustadas para los parámetros, esta versión puede consultarse en Sithole (2004). También existe una versión bayesiana de dicha función cuyos detalles pueden encontrarse en Khalaf-Allah y Haberman (2006). Modelos basados en factores de reducción de la mortalidad Los factores de mejora de la mortalidad, RF (x, t) son valores que permiten proyectar las tablas de mortalidad a lo largo del tiempo al tener en cuenta los cambios que la medida de mortalidad considerada ha sufrido en el transcurrir de los años. El procedimiento se lleva a cabo en dos pasos. 34 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad 1. Los datos de un determinado periodo son graduados mediante alguno de los modelos diseñados para tablas estáticas con el fin de obtener una tablas base, la práctica habitual es graduar según los procedimientos expuestos en Forfar, McCutcheon y Wilkie (1988) y Renshaw (1991). 2. A continuación se construyen las tablas de mortalidad proyectadas aplicando para ello los factores de reducción, RF (x, t), para un individuo que ha alcanzado la edad x en el tiempo t, estando t medido en años a partir de un origen apropiado, t = 0, situado en el centro del periodo base. La probabilidad de mortalidad proyectada al tiempo t viene dada por qxt = qx0 RF (x, t), (2.14) donde qx0 es el tanto de mortalidad de la tabla base correspondiente a la edad x. Los factores de reducción en (2.14) están sujetos a las restricciones RF (x, 0) = 1 ∀x ≥ 0, 0 < RF (x, t) ≤ 1 ∀x ≥ 0, ∀t ≥ 0. Los modelos utilizados para representar el comportamiento de los factores de reducción, que permiten también su estimación y predicción para años futuros, han sido recopilados en varios trabajos, entre ellos la Sección 4 del Informe 10 del CMI Bureau Bureau (1990) que contiene una descripción completa de este método. Posteriormente el CMI Bureau ha propuesto un nuevo modelo para la proyección de la mortalidad para pensionistas y anualidades (Informe 17, 1999) con tablas de mortalidad basadas en experiencias del periodo 1991-1994. Sithole, Haberman y Verrall (2000) asimilan el segundo factor del segundo término de la ecuación (2.13) a un factor de reducción, RFGLM (x, t), y lo comparan con los RFCM I (x, t), obtenidos mediante el método habitual del CMI Bureau, para analizar la consistencia de ambos tipos de factores. Los trabajos de Renshaw y Haberman (2003a,b,c) proponen métodos alternativos para la estimación de los factores de reducción. El primero utiliza el GLM con un modelo binomial y link logit para ajustar a qxt el predictor, ηxt = g(qx0 ) + βx t, (2.15) qx0 se calcula aplicando el link a los valores graduados donde g(qx0 ) = log 1 − qx0 del periodo base. En los otros dos trabajos se adapta la metodologı́a de Lee-Carter a la construcción de los factores de reducción de la siguiente forma, qxt log = ax + log(RF (x, t)) 1 − qxt = ax + bx kt . (2.16) 2.3 Modelos no paramétricos 35 En una de sus últimas aportaciones, los mismos autores (Renshaw y Haberman, 2006) utilizan el modelo de Lee-Carter para estudiar la posibilidad para extender los modelos basados en factores de reducción a la modelización y proyección de efectos históricos de la edad, el periodo y la cohorte. Lo hacen con un modelo de la forma, qxt = ax + log(RF (x, t)) log 1 − qxt = ax + b1x kt + b2x ιc + ǫxt . (2.17) Los principales problemas de los modelos basados en factores de reducción de la mortalidad son dos. 1. Para aquellas edades en las los valores de la graduación del periodo base difieren de los valores brutos porque la función no ajusta adecuadamente, los factores de mejora, que necesariamente han de pasar por los graduados, no representan bien la tendencia y se alejan claramente de los valores brutos. 2. Cuando la tendencia varı́a de un año a otro de forma no lineal, por ejemplo primero crece y luego decrece, el factor de mejora tampoco será adecuado pues se ajustará a la tendencia predominante o mostrará una estabilidad inexistente. En Debón, Montes y Sala (2006a) se muestran gráficamente estos dos problemas al aplicar los factores de reducción a datos de mortalidad de la Comunidad Valenciana. 2.3. Modelos no paramétricos La representación de datos de mortalidad mediante modelos no paramétricos ha atraı́do la atención de actuarios, demógrafos y estadı́sticos a lo largo del pasado siglo XX. La diferencia fundamental con los modelos paramétricos es que no necesitan suponer una función dependiente de la edad, lo cual supone una ventaja cuando no se tiene información del modelo subyacente Entre los métodos no paramétricos de graduación ocupan un lugar importante las técnicas de smoothing, que suavizan las probabilidades brutas obtenidas directamente de los datos. Una revisión de los métodos de smoothing aplicados a tablas de mortalidad puede encontrarse en Wang, Müller y Capra (1998) y Wang (2005). En Nielsen (2003) se revisan artı́culos sobre smoothing y predicción, la mayorı́a de ellos con consideraciones teóricas, y se discuten aplicaciones a la ciencia actuarial, a la bioestadı́stica y a las finanzas. Los trabajos de Felipe, Guillen y Nielsen (2001) y Fledelius et al. (2004) aplican métodos no paramétricos a la graduación de tablas dinámicas usando un kernel bivariante. Algunos autores, (Guillen, Nielsen y Pérez-Marı́n, 2006) han utilizado los métodos no paramétricos, en concreto un kernel bivariante, como una técnica de análisis 36 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad exploratorio de los datos previa a su graduación mediante cualquier ley de mortalidad. No obstante, tanto la graduación como la predicción de las tablas dinámicas puede llevarse a cabo con diferentes métodos no paramétricos. A continuación describimos dos de ellos, el primero basado en una técnica de suavizado mediante splines penalizados (p-splines) y el segundo en un algoritmo de suavizado de las medianas. 2.3.1. Suavizado con p-splines La breve descripción que aquı́ realizamos del método por p-splines puede consultarse en Richards et al. (2007), quiénes lo utilizan para ajustar el modelo edadcohorte y edad-periodo y analizar la importancia del efecto cohorte frente al efecto periodo en diferentes paı́ses. En un modelo de p-splines se asume que Dxt , número de muertes a edad x en el c c año t, sigue una distribución Poisson, Dxt ∼ P o(Ext µxt ), donde Ext son los expuestos centrales al riesgo y µxt es la fuerza de mortalidad. El subı́ndice t puede denotar tanto el año de muerte como el año de nacimiento, según que se considere un modelo edad-periodo o un modelo edad-cohorte, respectivamente. El modelo es log µxt = K X Bk (xt)θk k=1 siendo θk los coeficientes de regresión a estimar y Bk (t) los splines pertenecientes a una base de splines cúbicos. Se trata de un GLM que puede ajustarse con cualquier software standard (R Development Core Team, 2005) mediante máxima verosimilitud. Para evitar que el ajuste sea demasiado flexible se introduce una penalización, P (θ), que se incorpora a la función de log-verosimilitud L(θ) dando lugar a la función de veromilitud penalizada, 1 P L(θ) = L(θ) − λP (θ). 2 El parámetro λ es la constante de suavización y juega el mismo papel que el bandwidth en la suavización kernel. En Currie, Durban y Eilers (2004), donde originalmente se proponen los p-splines para suavizar la mortalidad, se utiliza el criterio de información Bayesiano (BIC) para la elección de λ. Otras posibilidades son el criterio de información de Akaike (AIC ) y la validación cruzada generalizada (GVC), pero hay evidencia que AIC y GVC tienden a suavizar poco los datos. BIC penaliza la complejidad del modelo de forma más acusada que el criterio de información de Akaike (AIC) particularmente cuando el número de datos es elevado. El efecto de la penalización puede observarse en la Figura 2.2, tomada de Richards et al. (2007). La ausencia de ésta produce un linea de regresión poco suave (izquierda) que se suaviza al penalizar la curvatura (derecha). 2.3 Modelos no paramétricos 37 Figura 2.2: Regresión con B-splines (izquierda) y con p-splines (derecha) 2.3.2. Algoritmo Median-polish La tabla de mortalidad dinámica puede ser considerada como un conjunto de datos sobre una rejilla igualmente espaciada en la dirección vertical (edad) y horizontal (año). En este contexto, la tendencia determinista de los ratios de mortalidad puede ser descompuesto en suma de tres efectos qxt = µ + rx + ct , (2.18) un efecto general, µ, un efecto fila debido a la edad, rx , y un efecto columna, ct , debido al año. El algoritmo de suavización de medianas, median-polish (Tukey, 1977), se usa para estimar el efecto general µ̃, los efectos fila, r̃x , y los efectos columna, c̃t . Las propiedades generales del ajuste mediante este algoritmo pueden consultarse en Cressie (1993), a destacar en todo caso que se trata de un método no paramétrico, poco sensible a los outliers y con menor sesgo del que produce la estimación de los efectos mediante las medias. Para la predicción q̂xt de qxt , para un tiempo t más allá del máximo del periodo observado, tn , se utiliza la expresión q̂xt = µ̃ + r̃x + c̃tn + (t − tn )(c̃tn − c̃tn −1 ), ∀x ∈ D, t > tn , (2.19) donde D es el rango de edades. Este algoritmo ha sido utilizado en Debón et al. (2008) para suavizar datos españoles, dando mejores resultados en la predicción a corto plazo que el modelo de Lee-Carter con uno y dos términos. El algoritmo puede ejecutarse con la función medpolish que forma parte del paquete stats del software R (R Development Core Team, 2005). 38 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad 2.4. 2.4.1. Últimas propuestas para la graduación de tablas dinámicas Modelización de los residuos Los métodos de graduación expuestos hasta ahora, particularmente los paramétricos, adolecen de un defecto común a todos ellos, no estudian la estructura de los residuos en coherencia con la hipótesis inicial de independencia de las observaciones que todos ellos asumen. Esta es una hipótesis difı́cil de mantener cuando se lleva a cabo una representación gráfica de los residuos como en la Figura 2.3, que muestra una gráfica de los residuos obtenidos para un ajuste dinámico de datos de mortalidad españoles mediante un modelo de Lee-Carter (Debón et al., 2008), junto con la gráfica de residuos normales independientes con igual media y varianza. La gráfica de los residuos de Lee-Carter muestran un estructura difı́cilmente compatible con la hipótesis de independencia, que entre otras cosas pone de manifiesto la existencia de un efecto cohorte (diagonales con valores similares), lo que a su vez implica, de forma más general, la existencia de una estructura de dependencia entre los residuos. Este fenómeno ha llevado a algunos autores (Booth, Maindonald y Smith, 2002; Renshaw y Haberman, 2003b) a plantearse la necesidad de estudiarla y modelizarla. 80 residuos normales 80 residuos 0.0 40 −0.4 20 −0.4 0 40 −0.2 0 −0.2 20 edad 0.0 edad 0.2 60 60 0.2 1980 1985 1990 año 1995 1980 1985 1990 1995 año Figura 2.3: Residuos para un ajuste de Lee-Carter (izquierda) y residuos independientes (derecha) La solución al problema ha abierto la posibilidad de introducir nuevos modelos. En Debón et al. (2008) se estudia la solución que la Geoestadı́stica puede aportar al problema, en la medida que las técnicas geoestadı́sticas fueron concebidas para modelizar estructuras de dependencia espacial o espacio-temporal entre las observaciones (Matheron, 1962, 1963, 1971; Huijbregts, 1978). Los resultados obtenidos para el ajuste y la predicción para años futuros se han mostrado mejores que los obtenidos con un modelo de Lee-Carter con 1 y 2 términos, este último sugerido por 2.5 La esperanza de vida residual 39 algunos autores (Booth, Maindonald y Smith, 2002; Renshaw y Haberman, 2003b) para mejor capturar la interacción entre la edad y el tiempo. 2.4.2. Modelos frágiles (Frailty models) Una fuente de incertidumbre en el estudio y predicción de la mortalidad es la heterogeneidad de las poblaciones. De la influencia de la heterogeneidad en la modelización de la supervivencia y en problemas actuariales se tiene conciencia desde hace largo tiempo Pitacco (2004a). Ya en Gini (1924) se hace referencia a ella en relación a los ratios de embarazo, y en Blumen, Kogan y McCarthy (1955) se estudia su efecto sobre la migración. En Vaupel, Manton y Stallard (1979) los autores analizan dicha influencia sobre la mortalidad e introducen el concepto de frailty, representado como una variable no observable, y describen sus implicaciones para los métodos estándar de tablas de mortalidad. En Butt y Haberman (2004) se consideran aspectos prácticos para seleccionar la familia de modelos frágiles aplicable a seguros basados en datos de mortalidad, ası́ como la posible interpretación de dichos modelos. 2.4.3. Riesgo de la longevidad Un aspecto clave en el cambio reciente y la evolución futura de la mortalidad es su comportamiento en edades avanzadas, 85 y más años, (Tuljapurkar y Boe, 1998). Las principales dificultades a la hora de mejorar la modelización para este grupo de edad son las inexactitudes en los datos disponibles y la variabilidad debida a los valores pequeños de los expuestos al riesgo para dichas edades, tal como señalan Wong-Fupuy y Haberman (2004) en un trabajo que recoge también las soluciones propuestas más interesantes. La tendencia de la mortalidad en las edades avanzadas introduce un riesgo importante para el asegurador que es conocido como riesgo de la longevidad, al que se presta especial atención en Pitacco (2004b). En un trabajo de revisión más reciente, Pitacco y Olivieri (2006), los autores presentan una extensa introducción a algunos temas de gran interés concernientes al riesgo de la longevidad en el área de las anualidades vida. 2.5. La esperanza de vida residual La longevidad cada vez mayor de los habitantes de los paı́ses más desarrollados hace necesario que las investigaciones en este campo presten especial atención a la mortalidad en edades elevadas, por cuanto suponen un grave riesgo para el asegurador ante la eventualidad de no poder hacer frente al pago de las contraprestaciones, y también para el asegurado que puede ver en peligro el cobro de las mismas. 40 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad Pero si una buena modelización de las medidas de mortalidad es importante, como las anteriores consideraciones ponen de manifiesto, existen otros indicadores relacionados con la mortalidad que podrı́amos calificar de imprescindibles en el mundo actuarial. Un indicador ampliamente utilizado por los demógrafos y actuarios es la esperanza de vida cuyo valor resume la evolución de la mortalidad para los diferentes años. Sus representantes más utilizados son la esperanza de vida al nacer e0t y la esperanza de vida residual a partir de los 65, e65t , valores que indican los años que espera vivir una persona que en el año t tenga una edad de 0 y 65 años, respectivamente. El interés de e65t reside en que los 65 años es la edad más frecuente de jubilación. Este indicador proporciona, además, información sobre la capacidad de supervivencia de una sociedad y su incremento a lo largo de los años supone, como ya se dijo anteriormente, una mejora de las condiciones de vida de una sociedad en todos los aspectos. El modelo de Lee-Carter está diseñado para proyectar la esperanza de vida residual a diferentes edades. Para un año t, el hipotético número de personas vivas al principio de cada intervalo de edad [x, x + 1) está dado por la fórmula iterativa l(x+1)t = lxt (1 − qxt ), con arbitrario valor l0 . Esto nos permite calcular el número de muertes dxt = lxt − l(x+1)t , y el correspondiente número de personas-años Lxt = l(x+1)t + 1/2dxt . El futuro tiempo de vida residual total de Lxt personas que P han alcanzado la edad x es Txt = i≥x Lit . El futuro tiempo de vida residual para los individuos del grupo de edad x viene dado por ext = Txt . lxt Los indicadores demográficos pueden obtenerse utilizando los ratios de mortalidad correspondientes a una edad x en un año t, o bien, recorriendo la diagonal correspondiente a su cohorte t − x, es lo que ha venido a denominarse indicadores periodo o cohorte respectivamente. En los trabajos de Denuit (2007) y Renshaw y Haberman (2008) se analizan los efectos de las predicciones de los ratios de mortalidad sobre la esperanza de vida. En el primero, se analiza la distribución de dichos indicadores en el esquema de Lee-Carter y con modelo ARIMA(0,1,0) para la predicción de kt . En el segundo se revisan las técnicas de simulación para obtener intervalos de confianza y las recomienda frente a la anterior porque estas son mucho más versátiles. 2.6. Intervalos de confianza para la predicción Todas las medidas de mortalidad y los indicadores a los que hemos aludido con anterioridad pueden calcularse a partir de las tablas de mortalidad ya graduadas, no 2.6 Intervalos de confianza para la predicción 41 obstante su valor numérico no deja de ser aproximado y por ello es conveniente una valoración de su error y la obtención de un intervalo de confianza para la estimación obtenida. Recientemente se ha sugerido en la literatura actuarial la utilización de métodos bootstrap que permiten tener en cuenta en la estimación todas las fuentes de incertidumbre. Una recopilación de dichos métodos puede consultarse en Renshaw y Haberman (2008). Los modelos de predicción habitualmente no utilizan medidas de sensibilidad e incertidumbre. Pedroza (2006), entre otros, argumenta que las medidas de incertidumbre en la predicción de la mortalidad son necesarias y puntualiza que deben llevarse a cabo mediante la construcción de intervalos de confianza para las estimaciones obtenidas. Un intento de subsanar esta deficiencia consiste en obtener intervalos de confianza para las probabilidades de muerte proyectadas con el modelo de Lee-Carter y para la correspondiente esperanza de vida residual e65t , utilizando en ambos casos técnicas bootstrap. En su articulo original, Lee y Carter obtienen intervalos de confianza para la esperanza de vida teniendo en cuenta sólo el error en la predicción del ı́ndice de mortalidad kt obtenido a partir del modelo ARIM A ajustado a su serie temporal, obviando otras fuentes de error, como por ejemplo la que introducen las estimaciones de los otros parámetros del modelo. Una forma de combinar estas dos fuentes de incertidumbre es utilizar procedimientos de bootstrap como se hace en Brouhns, Denuit y Keilegom (2005) y Koissi, Shapiro y Högnäs (2006). En el primer trabajo los autores utilizan bootstrap paramétrico, mientras que en el segundo se utiliza el no paramétrico. En el caso español esta metodologı́a ha sido utilizada por Debón, Montes y Puig (2008), obteniendo intervalos de confianza para las predicciones proporcionadas por el modelo de Lee-Carter con uno y dos términos. Se obtuvieron dos tipos de intervalos, resultado de aplicar bootstrap paramétrico y no paramétrico. En ambos casos se utiliza la distribución binomial, a diferencia de los trabajos de Brouhns, Denuit y Keilegom (2005) y Koissi, Shapiro y Högnäs (2006) que utilizan la distribución de Poisson. Además, en el caso de bootstrap no paramétrico se muestrea sobre los residuos dados en la expresión (2.20) y no sobre los deviance, como hacen Koissi, Shapiro y Högnäs (2006). El procedimiento utilizado para el caso paramétrico es el siguiente. Partiendo de las observaciones (Ext , dxt ), se simulan N muestras bootstrap (Ext , dnxt ), n = 1, 2, . . . , N , donde dnxt son realizaciones de una Binomial de parámetros (Ext , q̇xt ). Para cada muestra bootstrap, se estiman los âx , b̂x y k̂t a continuación se proyectan los kt mediante el correspondiente modelo ARIM A seleccionado de los datos originales. Esto proporciona N realizaciones de ânx , b̂nx , k̂tn y k̂tn proyectados que se usan para proyectar los qxt y calcular la esperanza de vida. El intervalo de confianza se obtiene a partir de los percentiles 2,5 y 97,5, IC95 = [p0,025 , p0,975 ]. 42 Capı́tulo 2. Revisión de los modelos dinámicos para la graduación de la mortalidad Para el caso no paramétrico, las N muestras bootstrap se simulan a partir de los residuos \xt ), ǫ̂xt = logit(q̇xt ) − logit(q (2.20) obtenidos con los datos originales. Cada muestra proporciona unas estimaciones n \xt ) a partir de la fórmula inversa logit(q n \xt ) = logit(q̇xt ) − ǫ̂n , logit(q xt donde los logit(q̇xt ) se obtienen de las observaciones iniciales (Ext , dxt ). Desde este punto se procede igual que en el caso paramétrico. La extensión de los métodos bootstrap a otros modelos , a la esperanza de vida residual y a otros indicadores actuariales, es inmediata. Sorprende a muchos autores la escasa amplitud de los intervalos confianza obtenidos. Entre ellos, Lee y Carter (1992), Lee (2000), Booth, Maindonald y Smith (2002) y Koissi, Shapiro y Högnäs (2006), que proporcionan algunas explicaciones a este hecho. En el trabajo de Li, Hardy y Tan (2006) se achaca el fenómeno a la rigidez de la estructura del modelo de Lee-Carter, y para evitarlo relajan dicha estructura incorporando la heterogeneidad propia de cada celda edad-periodo. Capı́tulo 3 Análisis y predicción de la mortalidad española. Periodo 1980-2025 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.2. Descripción de los datos y análisis preliminar . . . . . . 45 3.2.1. Tratamiento de las edades superiores a 85 años . . . . . . 46 3.3. Aplicación del modelo de Lee-Carter . . . . . . . . . . . . 47 3.3.1. Resultados del ajuste . . . . . . . . . . . . . . . . . . . . 50 3.3.2. Bondad de ajuste . . . . . . . . . . . . . . . . . . . . . . . 51 3.4. Predicción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.4.1. Predicción de qxt para el periodo 2006-2025 . . . . . . . . 53 3.4.2. Predicción de ext para el periodo 2006-2025 . . . . . . . . 55 43 3.1 Introducción 3.1. 45 Introducción Lee y Carter proponen en 1992 (Lee y Carter, 1992) su famoso modelo para graduar las tablas de mortalidad dinámicas y estudiar y proyectar con él los ratios de mortalidad en USA. Desde entonces han sido muchos los artı́culos publicados que, haciendo uso de dicho modelo, estudian la mortalidad en otros paı́ses desarrollados tales como Canada (Lee y Nault, 1993), Chile (Lee y Rofman, 1994), Japón (Wilmoth, 1996), Bélgica (Brouhns, Denuit y Vermunt, 2002), Austria (Carter y Prkawetz, 2001), Inglaterra y Gales (Renshaw y Haberman, 2003a), Australia (Booth y Tickle, 2003) y España (Guillen y Vidiella-i-Anguera, 2005; Debón, Montes y Puig, 2008). Los demógrafos han centrado tradicionalmente su trabajo en el estudio de la esperanza de vida, pero como señala Booth et al. (2006) es difı́cil de establecer una relación directa entre la precisión con la que se predice o estima esta medida de mortalidad y la precisión relativa a los ratios de mortalidad, que es la medida realmente modelizada. Por ello, este autor pone especial énfasis en señalar que con ser importante lograr predicciones precisas de la esperanza de vida, la evaluación del error en los ratios de mortalidad estimados o predichos es esencial. Por otra parte, la longevidad cada vez mayor de los habitantes de los paı́ses más desarrollados, hace necesario que las investigaciones en este campo presten especial atención a la mortalidad en edades elevadas, por cuanto puede llegar a suponer un grave riesgo para el asegurador, ante la eventualidad de no poder hacer frente al pago de las contraprestaciones, y también para el asegurado que puede ver en peligro el cobro de las mismas. Por todo ello, este capı́tulo tiene un doble objetivo, de una parte aplicar el modelo de Lee-Carter al estudio de la mortalidad española modelizando su comportamiento durante el periodo 1980-2005, y de otra llevar a cabo predicciones de las probabilidades de muerte y de la esperanza de vida residual para años futuros, todo ello en un rango de edades lo suficientemente grande como para incluir las edades elevadas. El análisis depara especial atención al estudio de los errores en las predicciones de ambas medidas de mortalidad, obteniendo intervalos de confianza para las mismas. En aras de simplificar el procedimiento y reducir al máximo los tiempos de computación los intervalos de confianza se han obtenido, siguiendo la sugerencia de Lee y Carter (1992), a partir de la incertidumbre que provoca la predicción del ı́ndice de mortalidad, kt , de su modelo. 3.2. Descripción de los datos y análisis preliminar Los datos de mortalidad de hombres y mujeres en España, correspondientes al periodo comprendido entre 1980 y 2005 y un rango de edades de 0 hasta 125, son lo analizados es en este capı́tulo. Como se ha señalado en el apartado anterior, el 46 Capı́tulo 3. Análisis y predicción de la mortalidad española. Periodo 1980-2025 especial interés que tienen las edades superiores a 99 años justifica un rango de edades tan extenso, aun a riesgo de parecer excesivo. Las estimaciones brutas de la ratio de mortalidad, qxt , que constituyen el input necesario para los modelos dinámicos, se han obtenido con el procedimiento utilizado por el Instituto Nacional de Estadı́stica (INE), 1/2(dxt + dx(t+1) ) , (3.1) Pxt + 1/2dxt donde dxt son los fallecidos en el año t a la edad x, dx(t+1) son los fallecidos en el año t + 1 a la edad x, y Pxt población que a 31 de diciembre del año t tiene edad x. La fórmula (3.1) puede ser aplicada para todas las edades comprendidas entre 1 y 99 años, pero la edad 0, debido a la concentración de defunciones en los primeros meses de vida, requiere esta otra expresión, q̇xt = q̇0t = 0,85d0t + 0,15d0(t+1) . P0t + 0,85d0t (3.2) Obsérvese que tanto en (3.1) como en (3.2), el denominador es una estimación de los inicialmentes expuestos al riesgo, Ext . Los datos necesarios, tanto de población como de defunciones, son los datos oficiales elaborados por el INE. Para el periodo 1991-2005, las cifras de población están publicadas en la página web del INE (www.ine.es) en edades simples de 0 hasta 100 y más años, para las del periodo previo, 1980-1991, el rango de dades finaliza en 85 o más años, razón por la que hubo de solicitarse al INE los datos faltantes. 3.2.1. Tratamiento de las edades superiores a 85 años Los ratios brutos de mortalidad para edades avanzadas producen resultados muy poco fiables a causa del pequeño número de expuestos al riesgo. El patrón para edades elevadas y muy elevadas está altamente influenciado por fluctuaciones aleatorias debido a la escasez de datos. Cossette et al. (2007) recogen un gran número de trabajos en los que demógrafos y actuarios sugieren diversas técnicas para calcular y completar las medidads de mortalidad en edades elevadas. Merecen ser citados por su influencia, los trabajos de Coale y Guo (1989), Coale y Kisker (1990), Thatcher, Kannisto y Vaupel (1998), Lindbergson (2001) y Thatcher, Kannisto y Andreev (2002). Un extensa y completa lista de trabajos referidos a esta cuestión puede consultarse en Booth (2006). Se ha utilizado aquı́ una adaptación del modelo que sugieren Denuit y Goderniaux (2004) variando únicamente el ajuste de dicho modelo. El punto de partida del método original es un modelo de regresión log-cuadrática de la forma ln(qxt ) = at + bt x + ct x2 + ǫxt , (3.3) 3.3 Aplicación del modelo de Lee-Carter 47 con ǫxt independientes e idénticamente distribuidos, N (0, σ 2 ). El modelo es ajustado separadamente para cada año de calendario t y para edades superiores a 75 años. Se imponen dos restricciones, la primera que q130t = 1, ∀t, y la segunda que ∂qx (t) |x=130 = 0. Estas dos restricciones llevan a la siguiente relación entre los coefi∂x cientes, at + bt x + ct x2 = ct (130 − x)2 , ∀t. (3.4) Sustituyendo 3.4 en 3.3 se obtiene la ecuación ln(qxt ) = ct (130 − x)2 . La adaptación propuesta consiste en ajustar la ecuación anterior mediante un modelo lineal generalizado con link log, dado que se asume una distribución Binomial para las defunciones. El conjunto de datos con el que se llevará a cabo cualquier análisis posterior está formado, finalmente, por los valores originales de q̇xt para x = {0, 1, . . . , 85}, y para x = {86, . . . , 125} por los q̇xt procedentes del ajuste de la regresión cuadrática. La comparación de ambos conjuntos de valores puede observarse en las Figuras 3.1 y 3.2, en las que el efecto de suavizado en la edades avanzadas es evidente. Una vez completados los datos, se ajustará un modelo que permita obtener una superficie de mortalidad lo suficientemente suave y, además, pueda ser utilizada para proyectar las probabilidades de muerte a largo plazo. A partir del modelo ajustado hemos obtenido proyecciones de los ratios de mortalidad para los 20 años siguientes, es decir, de 2006 a 2025. 3.3. Aplicación del modelo de Lee-Carter Varios autores han estudiado la mortalidad española con modelos dinámicos. Felipe, Guillén y Pérez-Marı́n (2002), utilizan la ley de Heligman-Pollard (Heligman y Pollard, 1980) para evaluar la influencia del tiempo (1975-1993) en los patrones de mortalidad de la población española para un rango de edades de 0 a 90. Guillen y Vidiella-i-Anguera (2005), recurren a la version log-bilinear Poisson del modelo de Lee-Carter, propuesta por Wilmoth (1993) y Brouhns, Denuit y Vermunt (2002), para analizar los datos españoles de mortalidad correspondientes al periodo 1975-1998 y un rango de edades de 0 a 105 años. En Debón, Montes y Puig (2008) los autores aplican el modelo de Lee-Carter con dos términos a datos del periodo 1980-1999 y edades en el rango de 0 a 96 años, consiguiendo mejorar los resultados obtenidos por los anteriores autores debido a la mejor adaptabilidad del modelo a la mortalidad observada en las edades intermedias. Por último, en Debón et al. (2008) se analiza la mortalidad desde una nueva perspectiva al introducir técnicas geoestadı́sticas, diseñadas en principio para datos con implantación espacio-temporal, que mejoran 48 Capı́tulo 3. Análisis y predicción de la mortalidad española. Periodo 1980-2025 Originales Suavizadas 0 −2 −2 es Hombr −4 −4 −6 −6 −8 −8 2005 2005 2000 2000 1995 1995 80 1990 40 1985 100 1990 60 1985 50 20 1980 0 1980 0 Figura 3.1: Probabilidades de muerte para los hombres. Originales Suavizadas 0 −2 −2 Mujeres −4 −4 −6 −6 −8 −8 2005 2005 2000 2000 1995 1995 80 1990 60 40 1985 100 1990 1985 50 20 1980 0 1980 0 Figura 3.2: Probabilidades de muerte para las mujeres. todos los resultados anteriormente obtenidos si bien al precio de sofisticar el modelo y aumentar el tiempo de computación. Es, sin duda, una nueva aproximación prometedora que, estando en ciernes, no parece adecuada para ser utilizada en el contexto de un trabajo con fines prácticos y divulgadores como es el presente texto. Son estas razones las que han llevado a elegir el más sencillo de los modelos de Lee-Carter, aquél con un sólo término, para desarrollar el análisis cuyos resultados se describen con detalle a continuación. La expresión del modelo viene dada por la ecuación (2.5) que a continuación recordamos, qxt = ax + bx kt + ǫxt . (3.5) ln 1 − qxt y su elección ha venido también motivada por la sencillez de su cálculo y por la fácil 3.3 Aplicación del modelo de Lee-Carter 49 interpretación de sus parámetros. Como se dijo anteriormente, el ajuste se efectúa con los datos completos obtenidos después de las trasformaciones previas descritas en la Sección 3.2, que comprenden el periodo temporal 1980-2005 y un rango de edades de 0 a 125 años. Recordemos (ver Sección 2.2.1) que el modelo (3.5) no puede ser ajustado por las técnicas habituales de regresión puesto que los valores del ı́ndice kt no son observables. La librerı́a gnm de R Development Core Team (2005), desarrollada por Turner y Firth (2006), permite el ajuste por máxima verosimilitud que es el que mejores resultados proporciona según Debón, Montes y Puig (2008). El código escrito por Turner y Firth (2006) ajusta la fuerza de mortalidad, µxt , bajo la distribución Poisson y link log, por lo que ha sido necesario adaptarlo para ajustar la probabilidad de muerte, qxt , bajo la distribución Binomial y link logit. En particular, su función gnm permite utilizar modelo lineales generalizados con términos multilineales a través de la opción Mult. Una segunda dificultad del modelo de Lee-Carter la suponen los problemas de identificabilidad, porque recordemos que una dada una solución de (3.5), (ax , bx , kt ), cualquier transformación del tipo (ax , bx /c, ckt ) o (ax + cbx , bx , kt − c), ∀c, es también solución. Para evitar el problema, y conseguir una única solución, algunas restricciones deben ser impuestas a los parámetros. Lee y Carter (1992) proponen la normalización X X bx = 1 y kt = 0, x t (a′x , b′x , kt′ ) de forma que dada una solución cualquiera puede conseguirse una solución (ǎx , b̌x , ǩt ) que cumpla las restricciones, con las siguientes transformaciones, X ǎx = a′x − b′ kt′ P x − X b′x x b′ b̌x = P x ! ′ x bx ǩt = X x b′x ! kt′ ′ x bx x b′x ! kt′ , donde Ā denota la media aritmética de A. Por último hay que señalar que debido a la estructura de los datos, series anuales para un mismo rango de edades, los valores de bx presentan un patrón irregular que hace necesaria un suavizado que evite ciertas anomalı́as localizadas en grupos concretos de edad (Renshaw y Haberman, 2003c,b), efecto indeseable desde un punto de vista actuarial. Para el suavizado se han utilizado splines cúbicos. El código R utilizado para los ajustes puede consultarse en el Apéndice B. 50 Capı́tulo 3. Análisis y predicción de la mortalidad española. Periodo 1980-2025 3.3.1. Resultados del ajuste 30 −10 0.010 −4 0 0.015 −2 10 0.020 0 20 0.025 2 4 0.030 Debido al elevado número de parámetros estimados en este modelo, 126×2+26 = 278 para cada sexo, su presentación numérica exigirı́a largas y tediosas tablas, por lo que se ha preferido su presentación en forma de gráfico en la Figura 3.3, que tiene además la ventaja de permitir comprender con facilidad su evolución a lo largo del tiempo, para kt , o de la edad en el caso de ax y bx . −6 Hombres −20 −8 0.005 Mujeres Hombres Hombres Mujeres 0 20 40 60 (a) ax 80 100 120 −30 −10 0.000 Mujeres 0 20 40 60 (b) bx 80 100 120 1980 1985 1990 1995 2000 2005 (c) kt Figura 3.3: Valores estimados para el modelo de Lee-Carter. Un primer comentario general concierne al distinto comportamiento de ax según el sexo, que en el caso de las mujeres muestra que su mortalidad es más baja que la de los hombres. Por otra parte, la elevación en forma joroba que el gráfico de los hombres muestra entre las edades 15 y 40 revela un incremento en la mortalidad para este rango de edades, que posiblemente se explica por las muertes debidas a accidentes y que algunos autores denominan, por esta razón, joroba de los accidentes. Los valores positivos de bx (Figura 3.3(b)) para todas las edades indican que la mortalidad disminuye con el tiempo. No obstante, algunos autores (Debón, Montes y Puig, 2008) han encontrado valores negativos de bx para edades intermedias y avanzadas, lo que indicarı́a un incremento de la mortalidad a medida que avanza el calendario. Para el rango de edades de 24 a 40 años este incremento se explicarı́a (Felipe, Guillén y Pérez-Marı́n, 2002; Guillen y Vidiella-i-Anguera, 2005) por el efecto de la epidemia del SIDA en el periodo de tiempo estudiado. Sin embargo, la inclusión de un segundo término en el modelo de Lee-Carter mejora el ajuste especı́ficamente para esas edades y el efecto observado es mucho menos menor (Debón, Montes y Puig, 2008). El ı́ndice de mortalidad, kt , (Figura3.3(c)) muestra una clara tendencia decreciente, más pronunciada en las mujeres que en los hombres. 3.3 Aplicación del modelo de Lee-Carter 3.3.2. 51 Bondad de ajuste 2 −2 −6 residuos 6 Para realizar un diagnóstico del modelo ajustado se han representado en las Figuras 3.4 y 3.5 los residuos Deviance para ambos sexos frente a la edad, año de calendario y la cohorte. 0 20 40 60 80 100 120 2 −2 −6 residuos 6 edad 1980 1985 1990 1995 2000 2005 2 −2 −6 residuos 6 periodo 1850 1900 1950 2000 cohorte 2 0 −4 residuos 4 Figura 3.4: Residuos Deviance para el modelo de los hombres. 0 20 40 60 80 100 120 2 0 −4 residuos 4 edad 1980 1985 1990 1995 2000 2005 2 0 −4 residuos 4 periodo 1850 1900 1950 2000 cohorte Figura 3.5: Residuos Deviance para el modelo de los mujeres. Los residuos tendrı́an un comportamiento realmente satisfactorio si variaran en el intervalo [−2, 2], cosa que no sucede, como se observa en ambas figuras, entre las 52 Capı́tulo 3. Análisis y predicción de la mortalidad española. Periodo 1980-2025 edades de 20 a 40 años, durante el periodo 1990-1995 y las cohortes correspondientes a los nacidos entre 1950 y 1975. En estos intervalos los residuos son mucho mayores que en el resto. También es claramente notable la mejor calidad del ajuste para las mujeres, ello es debido a que los logit de sus ratios de mortalidad tienen menor variabilidad y un comportamiento mas lineal. 3.4. Predicción La predicción de los ratios de mortalidad con los modelos de Lee-Carter se efectua a partir de los ı́ndices de mortalidad, lo que requiere ajustar una serie temporal a la sucesión estimada de dichos ı́ndices. Las funciones auto.arima y forecast, de la librerı́a forecast (Hyndman, 2008) de R, proporcionan de manera automática el ajuste del correspondiente modelo ARIMA y la predicción de futuros valores. Los modelos más apropiados han resultado ser una ARIM A(2, 1, 1) para hombres y una ARIM A(0, 1, 0) para las mujeres. Con la series temporal ajustada, {k̂t }, para los tiempos t = 1980, . . . , 2005, se predicen los futuros valores para t = 2006, . . . , 2025, que sustituidos en (3.5) proporcionan las proyecciones de logit(qxt ) para dichos años. La superficie de las proyecciones obtenidas para hombres y mujeres se muestra en la Figura 3.6. Hombres Mujeres −2 −2 −4 −4 −6 −6 −8 −8 2005 2005 2000 2000 1995 1995 100 1990 50 1985 1980 0 100 1990 1985 50 1980 0 Figura 3.6: Proyecciones para el periodo 2006-2025. Para cada predicción hemos obtenido un intervalo de confianza como forma de medir la incertidumbre asociada (Pedroza, 2006). En la Sección 2.6 se describen dos posibles métodos de obtención de intervalos de confianza, uno de ellos mediante 3.4 Predicción 53 técnicas bootstrap paramétricas (Koissi, Shapiro y Högnäs, 2006) y el otro mediante técnicas no paramétricas (Brouhns, Denuit y Keilegom, 2005). Sin embargo el originalmente propuesto por Lee y Carter (Lee y Carter, 1992), y que aquı́ se utiliza, entre otras razones porque los intervalos de confianza obtenidos mediante técnicas bootstrap son computacionalmente más costosos, propone obtener dichos intervalos a partir de los errores de predicción en los parámetros kt proyectados por los modelos ARIM A. El procedimiento es muy sencillo, basta con sustituir los valores del intervalo de confianza según la serie ARIM A, [ktinf , ktsup ] en la fórmulas de qxt y ext para obtener los extremos respectivos de sus intervalos de confianza. Esta aproximación supone asumir que la principal fuente de incertidumbre es kt y permite obviar los errores debidos a ax y bx . 3.4.1. Predicción de qxt para el periodo 2006-2025 El ajuste del modelo para los años 1980 a 2005 y la predicción de las probabilidades de muerte de 2006 a 2025 con él obtenidas se muestran en la Figura 3.7. Para facilitar su interpretación sólo se han representado algunas las edades, las cinco decenas de 10 a 50. Se observa en la figura que el modelo presenta tendencias futuras razonables sin inconsistencias, entendiendo por tales que la tendencia decreciente que se predice para algunas edades no llega a cruzarse con las predicciones para edades mayores. En parte este buen comportamiento es debido al suavizado, antes aludido, de los valores estimados de bx (Renshaw y Haberman, 2003c). Conviene señalar aquı́ que Delwarde, Denuit y Eilers (2007) proponen una versión de Lee-Carter cuyos parámetros se estiman mediante una log-verosimilitud penalizada, consiguiendo directamente estimaciones suaves para bx . En la Figura 3.7 se han representado también los intervalos de confianza de logit(qxt ) para las predicciones más allá de 2005. En el caso de la edades elevadas, que por las razones antes expuestas son las de mayor interés, se han representado los quinquenios comprendidos entre 70 y 95 años, ambos inclusive. Se observa en la Figura 3.8 que todas ellas presentan tendencias futuras poco pronunciadas. La desaceleración en la probabilidad de muerte a medida que transcurren los años, puede explicarse porque de manera natural se produce una selección de los individuos más saludables en edades elevadas (Horiuchi y Wilmoth, 1998). Hemos de insistir una vez más en la reducida amplitud de los intervalos de confianza, aún cuando los que se muestran aquı́ han sido obtenidos siguiendo el método propuesto por Lee y Carter. Este hecho es más evidente en el caso de los hombres, debido a que las fluctuaciones de la mortalidad de los varones para las edades de la joroba de los accidentes en el perı́odo de tiempo considerado son difı́ciles de captar, de forma que los parámetros bx reflejan poca disminución de los ratios de mortalidad, reduciendo ası́ la amplitud de los intervalos cuya expresión para todos 54 Capı́tulo 3. Análisis y predicción de la mortalidad española. Periodo 1980-2025 −8 −9 logit(qx) −7 −6 −5 Hombres −10 Ages 10 20 30 40 50 1980 1990 2000 2010 2020 2010 2020 periodo −8 −9 logit(qx) −7 −6 −5 Mujeres −10 Ages 10 20 30 40 50 1980 1990 2000 periodo Figura 3.7: Predicciones para algunas edades. los casos es bx ·(ktsup −ktinf ). En el caso de las mujeres la evolución de la mortalidad es más lineal y homogénea, lo que implica valores mayores para bx (véase Figura 3.3(b)) e intervalos más amplios. Esto, que parece contrario a la lógica, es consecuencia de no haber incorporado la incertidumbre de las estimaciones de los bx en el cálculo de los intervalos de confianza, lo que constituye una debilidad del método y exige la búsqueda de alternativas. Un razón adicional para explicar la escasa amplitud de los intervalos de confianza, habrı́a que buscarla en el proceso de suavizado seguido para las edades superiores a 85 años, cuyo resultado elimina fluctuaciones que repercuten, 3.4 Predicción 55 −4 logit(qx) −3 −2 −1 Hombres −6 −5 Ages 70 75 80 85 90 1980 1990 2000 2010 2020 2010 2020 periodo −4 logit(qx) −3 −2 −1 Mujeres −6 −5 Ages 70 75 80 85 90 1980 1990 2000 year Figura 3.8: Predicciones para edades avanzadas. como hemos dicho, en bajos valores para bx . 3.4.2. Predicción de ext para el periodo 2006-2025 Un indicador de la evolución de la mortalidad a lo largo del tiempo, ampliamente utilizado por los actuarios, es la esperanza de vida residual a la edad x en el año t, 56 Capı́tulo 3. Análisis y predicción de la mortalidad española. Periodo 1980-2025 ext . Cuya expresión, recordemos, viene dada por ext = Txt , lxt donde lxt y Txt representan, respectivamente, el total de personas que han cumplido x años en el año del calendario t y la suma de los años que todas ellas esperan vivir. Su interés es evidente en todas aquellas operaciones financieras y actuariales cuya duración depende, en mayor o menor medida, de la edad residual del causante de las mismas. El caso de la hipoteca inversa, de la que nos ocupamos en el siguiente capı́tulo, es un ejemplo paradigmático de este tipo de operaciones. La Figura 3.9 muestra la esperanza de vida residual para las edades 70, 75, 80, 85 y 90, estimadas en el periodo 1980-2005 y proyectadas para el periodo 2006-2025, ası́ como los intervalos de confianza de estas últimas. El incremento de la esperanza de vida a lo largo del tiempo, evidente para ambos sexos, es mayor para las mujeres. También ahora llama la atención la reducida amplitud de los intervalos de confianza, que es mayor para las mujeres por las razones expuestas en el apartado anterior. En Debón, Montes y Puig (2008) se han calculado los intervalos de confianza aplicando técnicas bootstrap paramétrico y no paramétrico. Los valores medios obtenidos son muy similares, particularmente el correspondiente x = 65, de especial importancia por ser la edad de jubilación mayoritaria. En lo que a precisión se refiere, los intervalos que se obtuvieron por medio de bootstrap paramétrico muestran amplitudes similares a las que aquı́ se muestran, el caso no paramétrico proporciona mayores amplitudes quizás porque recoge la influencia de todos los factores presentes en el fenómeno de la mortalidad. 3.4 Predicción 5 logit(qx) Ages 70 75 80 85 90 10 15 20 Hombres 1980 1990 2000 2010 2020 2010 2020 periodo 5 logit(qx) Ages 70 75 80 85 90 10 15 20 Mujeres 1980 1990 2000 periodo Figura 3.9: Esperanza de vida residual para edades elevadas. 57 58 Capı́tulo 3. Análisis y predicción de la mortalidad española. Periodo 1980-2025 Capı́tulo 4 Cálculo de la hipoteca inversa 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 61 4.2. Rentas vitalicias . . . . . . . . . . . . . . . . . . . . . . . . 62 4.2.1. Determinación del valor de las rentas vitalicias anuales . . 63 4.2.2. Determinación del valor de las rentas vitalicias fraccionadas 67 4.3. Perspectiva general de la hipoteca inversa . . . . . . . . 69 4.4. El planteamiento de la hipoteca inversa del ICO . . . . . 70 59 4.1 Introducción 4.1. 61 Introducción La hipoteca inversa es una operación consistente en la obtención de un préstamo sobre la vivienda habitual con el objetivo de generar al beneficiario una renta durante el periodo de tiempo prefijado. Está regulada de forma genérica en la Ley 41/2007. El modelo de hipoteca inversa que se describe a continuación es más restrictivo que el genérico regulado por la ley antes citada, porque se trata de un modelo diseñado para discapacitados o personas mayores de 70 años que perciban rentas mensuales bajas. Esta modalidad de hipoteca inversa es un complemento a Ley 39/2006 conocida como Ley de Dependencia. La hipoteca inversa no es el único producto financiero que permite trasformar los activos inmobiliarios en rentas, existen otras fórmulas y negocios que pueden facilitar a las personas mayores una renta adicional, como es el caso de la denominada vivienda pensión, hipoteca pensión o la cesión para alquiler de la vivienda a una entidad tercera. Detalles acerca de estas alternativas pueden consultarse en Herranz-Gonzalez (2006) quien se ocupa también de productos similares existentes en otros paı́ses, la home-equity reversion en el Reino Unido o la Home Equity Conversion Mortgage(HECM) en los Estados Unidos, más detalladamente comentados en Taffin (2006). Para una revisión en profundidad de la principales fórmulas y variables utilizadas en la HECM los lectores interesados pueden consultar Skarr (2008), quién además compara varias posibilidades para su cálculo. Aunque pueda ser menos representativos, existen también productos similares en otros paı́ses desarrollados, Australia, Canadá, Dinamarca, Finlandia, Irlanda, Japón, Paı́ses Bajos, Noruega y Suecia. La hipoteca inversa es un crédito con garantı́a inmobiliaria, es decir, un producto por el cual una persona que posee un inmueble recibe cada mes una renta, determinada por varios factores, y a su fallecimiento los herederos deberán frente al pago del préstamo o la entidad, en último caso, procederá a ejecutar la garantı́a, lo que puede traducirse en la venta del inmueble para satisfacer la deuda y la entrega a los herederos del dinero restante de la venta, si lo hubiera. La esperanza de vida residual a la edad de contratación y las rentas temporales son factores determinantes a la hora de valorar la renta a percibir (Herranz-Gonzalez, 2006). De aquı́ que la hipoteca inversa pueda verse como una aplicación de las tablas de mortalidad obtenidas en el Capı́tulo anterior. En efecto, su utilidad es doble. Por un lado la esperanza de vida residual estimada para cada edad limitará la duración teórica de la percepción de la renta financiera. Por otra parte, el cálculo de una renta vitalicia que ha de establecerse complementariamente a la renta financiera requiere la obtención de los sı́mbolos de conmutación necesarios para determinar los valores actuales de las rentas actuariales. Las rentas actuariales, a diferencia de las rentas financieras, incorporan el elemento de supervivencia como clave en su operativa. La correcta valoración de todas estas cantidades exige tablas de mortalidad bien 62 Capı́tulo 4. Cálculo de la hipoteca inversa calibradas, entendiendo por tal que recojan adecuadamente la evolución de la mortalidad el transcurso del tiempo, lo que nos sitúa nuevamente en el interés de las tablas dinámicas de mortalidad. El objetivo primordial del presente Capı́tulo, la hipoteca inversa, es una interesante y actual aplicación que muestra el uso de las tablas dinámicas de mortalidad para el cálculo de operaciones actuariales. En la Sección 4.2 se explica cómo calcular las rentas vitalicias anuales y las fraccionadas en distintas periodicidades: trimestral, mensual, . . . . A continuación se presenta, resumidamente, una revisión de diferentes trabajos internacionales sobre la hipoteca inversa. La última sección está dedicada al procedimiento utilizado para el cálculo de la hipoteca inversa según las bases establecidas por del Instituto de Crédito Oficial (ICO). 4.2. Rentas vitalicias En esta sección se resumirá brevemente una parte de la extensa bibliografı́a que recoge los conceptos básicos para analizar las operaciones demográfico-financieras, que son necesarios a lo largo de todo este capı́tulo. Para estos conceptos básicos se usará el texto de Levi (1973) y Villalón (1997). Las rentas vitalicias es el nombre que reciben las rentas actuariales cuando se aplican al caso de vida y se denominan anualidades si las cuotas son anuales. Cuando dichas cuotas se hacen efectivas al principio de cada periodo se llaman prepagables, y si es al final del mismo, pospagables. Una clasificación muy general de estas rentas es, Vitalicia Temporal, cuando las cuotas tiene una duración fija de un determinado número de periodos. Vitalicia de Vida Entera, cuando las cuotas se extienden hasta el fallecimiento de la persona, es decir, hasta la edad ω. Cada una de las cuales se clasifica a su vez en, Inmediata, cuando las cuotas comienzan al principio de la contratación. Diferida, cuando ha de pasar un determinado tiempo hasta que comiencen a hacerse efectivas las cuotas. Existen dos etapas, una primera de m periodos, llamada plazo del aplazamiento, y una segunda de n periodos, denominada etapa de pagos. Toda operación de rentas supone la consideración del tiempo, y por tanto de un tipo de interés i para la operación. 4.2 Rentas vitalicias 4.2.1. 63 Determinación del valor de las rentas vitalicias anuales Cuotas constantes Comenzaremos con el caso más sencillo, que consiste en obtener lo que se denomina capital diferido. Se trata de que una persona de edad x perciba un capital K al cabo de n años. Es por tanto un suceso aleatorio en la medida que depende de n px , probabilidad de supervivencia introducida en el Capı́tulo 1 según la expresión (1.1), aplicada para t = n. El precio, U , que el individuo deberá pagar en el momento presente vendrá dado por, U = K(1 + i)−n n px , (4.1) donde i es el denominado interés técnico, y el factor (1 + i)−n evalúa en el momento presente (0 ) el capital a percibir al cabo de los n años. Se le suele denotar v = (1 + i)−1 , de forma que la expresión (4.1) se reduce a, U = Kv n n px . Supuesto que K = 1, aparece el denominado factor de actualización demográfico financiero −n −n lx+n . n Ex = (1 + i) n px = (1 + i) lx Es muy importante señalar que esta operación, y en general todas las operaciones actuariales, solamente tienen sentido desde el punto de vista técnico si se realizan para una colectividad grande de personas, que en aplicación de la teorı́a de los grandes números producen la compensación de las desviaciones, positivas y negativas, sobre estos sucesos. Este factor de actualización permite deducir su inverso, el factor de capitalización demográfico financiero, que permite calcular un capital futuro después de n años n Ix = (1 + i)n lx lx+n . Para facilitar los cálculos, como ya avanzábamos en el Capı́tulo 1, se utilizan los sı́mbolos de conmutación, que incluyen los dos factores de forma simultanea, el demográfico y el financiero. Los sı́mbolos de conmutación aparecieron a finales del siglo XIX en la obra de Titens, Barret y Bayly (Nieto y Vegas, 1993), para facilitar la labor del cálculo de los valores actuariales. El primer sı́mbolo a considerar es Dx cuya expresión viene dada por Dx = lx v x = lx (1 + i)−x , 64 Capı́tulo 4. Cálculo de la hipoteca inversa que representa el numero de supervivientes lx descontados al tipo de interés por un tiempo equivalente a su edad, v x . Con este sı́mbolo podremos expresar el factor de actualización como n Ex = (1 + i)−n lx+n v x lx v x lx+n v x+n lx vx Dx+n = . Dx = El cálculo del valor actual de una renta vitalicia consiste en trasladar hasta el momento presente el valor de cada una de las cuotas anuales utilizando para ello el factor de actualización demográfico financiero. Si denotamos mediante äx una renta de vida entera, inmediata y prepagable, su valor actual se obtiene a partir de äx = 0 Ex + 1 Ex + . . . + ω−x Ex Dx + Dx+1 + . . . + Dω . = Dx Para simplificar estos cálculos se introduce el sı́mbolo, Nx = Dx + Dx+1 + . . . + Dω , (4.2) de forma que la expresión queda como äx = Nx Dx (4.3) Análogamente se pueden obtener las expresiones para el resto de rentas en función de los sı́mbolos de conmutación, que aparecen en la Tabla 4.1. Cuotas variables Si se considera el caso de capitales variables, también es sencillo obtener las expresiones de las rentas. Concretamente dos son los casos comunes, rentas cuyos términos varı́an periodo a periodo en progresión aritmética y aquellas que lo hacen en progresión geométrica. Si las cuotas a partir de la edad x varı́an en progresión aritmética definida por, α + tr, donde t = 0, 1, . . . , ω − x, introducimos un nuevo sı́mbolo, Sx , para la simplificación de las expresiones de las rentas, Sx = Nx + Nx+1 + . . . + Nω . 4.2 Rentas vitalicias prepagable Nx Dx äx = inmediata pospagable De vida entera ax = m/ äx prepagable = diferida pospagable m/ ax prepagable äx:n| = inmediata pospagable ax:n| = Temporal prepagable m/n äx diferida pospagable m/n ax = = Nx+1 Dx = Nx+m Dx Nx+m+1 Dx Nx − Nx+n Dx Nx+1 − Nx+n+1 Dx Nx+m − Nx+m+n Dx Nx+m+1 − Nx+m+n+1 Dx Tabla 4.1: Expresiones para las rentas vitalicias con cuotas constantes 65 66 Capı́tulo 4. Cálculo de la hipoteca inversa prepagable (V ä)x = α inmediata pospagable De vida entera (V a)x = α m/ (V prepagable Nx+1 Sx+2 +r Dx Dx ä)x = α diferida pospagable m/ (V prepagable a)x = α Sx+1 Nx +r Dx Dx Sm+1 Nx+m +r Dx Dx Nx+m+1 Sm+2 +r Dx Dx (V ä)x:n| = α +r inmediata pospagable Sx+1 − Sx+n (n − 1)Nx+n − Dx Dx (V a)x:n| = α +r Temporal prepagable diferida pospagable ä)x = α Nx+m − Nx+m+n Dx Sx+m+1 − Sx+m+n (n − 1)Nx+m+n − Dx Dx m/n (V +r Nx+1 − Nx+n+1 Dx Sx+2 − Sx+n+1 (n − 1)Nx+n+1 − Dx Dx m/n (V +r Nx − Nx+n Dx a)x = α Nx+m+1 − Nx+m+n+1 Dx Sx+m+2 − Sx+m+n+1 (n − 1)Nx+m+n+1 − Dx Dx Tabla 4.2: Expresiones para las rentas vitalicias con cuotas en progresión aritmética 4.2 Rentas vitalicias 67 Las rentas correspondientes son las que se muestran en la Tabla 4.2. Si consideramos α = r = 1 en la renta de vida entera inmediata, tenemos que (Iä)x = Sx Nx Sx+1 + = Dx Dx Dx Nx+1 Sx+2 Sx+1 + = . Dx Dx Dx En el caso en que las cuotas a partir de la edad x varı́en en en progresión geométrica definida por, αrt , donde t = 0, 1, . . . , ω − x, (Ia)x = considerando α = 1 y r = 1 + β, las rentas se pueden calcular a partir de la Tabla 4.1 sustituyendo los sı́mbolos Nx y Dx por Nx∗ y Dx∗ , calculados con un nuevo interés cuya expresión es, 1+i − 1, (4.4) j= 1+β porque el valor actual de las rentas actuariales de términos variables en progresión geométrica equivale al de una renta actuarial constante calculado con un tanto de interés diferente (Levi, 1973). 4.2.2. Determinación del valor de las rentas vitalicias fraccionadas Hasta este momento solamente se han considerado las rentas con periodo anual, pero en el mercado del seguro se utilizan también otras fracciones de tiempo. Si las bases de cálculo coinciden con dicho periodo, no habrá problema, pero cuando no coinciden se presenta el problema de su adaptación puesto que las tablas actuariales vienen en bases anuales. La solución técnica, sin necesidad de volver a calcular la tabla, es la de reducir la operación o el valor fraccionario a operaciones o valores equivalentes. Por ejemplo, si se consideran h periodos en el año podemos obtener las expresiones de las rentas fraccionadas de manera aproximada a partir de las anuales, en función de los sı́mbolos de conmutación tal y como se muestra en la Tabla 4.3. Otra solución para aproximar la renta fraccionaria pospagable de vida entera a partir de la anual, es la conocida como fórmula de Woolhouse cuya expresión es ä(h) x ≃ äx − h − 1 h2 − 1 − (µx + δ) 2h 12h2 si bien se utiliza una simplificación de la misma, ä(h) x ≃ äx − h−1 . 2h 68 Capı́tulo 4. Cálculo de la hipoteca inversa Nx h − 1 − Dx 2h (h) prepagable äx = inmediata prepagable ax = (h) m/ äx = diferida pospagable prepagable Nx+1 h − 1 + Dx 2h (h) pospagable De vida entera (h) m/ ax = Nx+m (h − 1) Dx+m − Dx 2h Dx Nx+m+1 (h − 1) Dx+m + Dx 2h Dx (h) äx:n| = Nx − Nx+n Dx Dx −Dx+n − (h−1) 2h Dx inmediata pospagable (h) ax:n| = Nx+1 − Nx+n+1 Dx Dx −Dx+n + (h−1) 2h Dx Temporal prepagable (h) m/n äx = Nx+m − Nx+m+n Dx Dx −Dx+m+n − (h−1) 2h Dx diferida pospagable (h) m/n ax = Nx+m+1 − Nx+m+n+1 Dx Dx −Dx+m+n + (h−1) 2h Dx Tabla 4.3: Expresiones para las rentas vitalicias fraccionas con cuotas constantes 4.3 Perspectiva general de la hipoteca inversa 69 En el caso de cuotas variables en progresión geométrica las rentas se pueden calcular a partir de la Tabla 4.3 sustituyendo los sı́mbolos Nx y Dx por Nx∗ y Dx∗ calculado a partir del interés (4.4). 4.3. Perspectiva general de la hipoteca inversa La hipoteca inversa, de la que hemos dado una breve definición en la Introducción, es objeto de estudio en el trabajo de Costa-Font, Gil y Mascarilla (2006) que la consideran una opción interesante para la población española. Los autores estudian las preferencias de la población en relación a instrumentos complementarios de financiación de los cuidados personales asociados, como la vivienda pensión, la hipoteca inversa o los seguros de rentas vitalicias. Concluyen que la hipoteca inversa es esencialmente útil para aquellos que desean envejecer en casa (la opción preferida de los españoles), solos o con la asistencia de alguien externo contratado en caso de dependencia, y necesitan complementar una pensión de jubilación modesta, aumentar su calidad de vida y/o porque no tienen hijos a quienes dejar sus propiedades. En otro trabajo (Blay-Berrueta, 2007) se analiza la población española dependiente y se propone la hipoteca inversa como alternativa al seguro privado de dependencia. En general, este instrumento combina dos tipos de riesgos tradicionales: el riesgo de la longevidad del prestatario, gestionado por aseguradoras, y el riesgo de tipos de interés, que resulta muy familiar para las entidades de crédito. Existe también un tercer riesgo, probablemente el menos identificado y entendido (Taffin, 2006), asociado al valor de la propiedad una vez el préstamo es amortizado. El capital prestado depende, principalmente, de la edad del prestatario, los tipos de interés y las predicciones sobre el crecimiento de los precios de la vivienda. Dada la naturaleza vitalicia de la hipoteca inversa, cuanta menor edad tenga el prestatario, menor será el capital concedido, la consecuencia es que esta clase de préstamos van preferentemente dirigidos a personas de edad avanzada. La edad media del prestatario se estima alrededor de los 75 años. Existe un umbral teórico que en Estados Unidos se fija en los 62 años, mientras que en el Reino Unido se sitúa en los 60 años, a veces incluso en los 55. El artı́culo de Wang, Valdez y Piggott (2007) propone un método para transferir y financiar la gran variedad de riesgos, que desde el punto de vista del proveedor tiene la hipoteca inversa. Es de particular interés el que en la literatura se denomina riesgo crossover , aquél que ocurre cuando el saldo pendiente del préstamo supera el valor de la vivienda. Según los autores, este riesgo es la combinación de otros riesgos, como por ejemplo, 1. Riesgo de ocupación y riesgo de longevidad . El riesgo de ocupación es el riesgo de que el contratante de la hipoteca inversa pueda vivir en la casa hipotecada demasiado tiempo, de forma que el valor acumulado del préstamo llegue a 70 Capı́tulo 4. Cálculo de la hipoteca inversa exceder el valor de la vivienda. Debido al aumento de la esperanza de vida, el riesgo de longevidad tiene un papel crucial en el producto hipoteca inversa. 2. Ratio de interés y riesgo del precio de la vivienda. Puesto que el pago del préstamo debe ser cubierto por el precio de la vivienda, un entorno con ratio de interés elevado y un mercado real en crisis con interés elevado puede exacerbar el riesgo de crossover. Un estudio en profundidad del riesgo de crossover puede consultarse en Chiloy y Megbolugbe (1994). Además de los riesgos citados, otros importantes riesgos son el riesgo de mantenimiento. Este riesgo, también llamado moral hazard, es debido a que los contratantes de una hipoteca inversa pueden no hacer las reparaciones necesarias de la vivienda para su mantenimiento, y se encuentra bien tratado en Miceli y Sirmans (1994), Shiller y Weiss (2000) y Davidoff y Welke (2007). En el trabajo de Rasmunssen, Megbolugbe y Morgan (1997) se discute que las hipotecas inversas son una buena herramienta financiera fundamentalmente para tres tipos de segmento de mercado bien identificados: personas mayores que viven solas, otros propietarios mayores y propietarios no mayores. Dado además el desarrollo del producto, la tendencia demográfica a largo plazo y realidades polı́ticas, el mercado de la hipoteca inversa parece preparado para un crecimiento sostenido. Un contribución importante a la literatura sobre hipoteca inversa es la de Kutty (1998), que enfoca dicho producto como una forma de aliviar la pobreza, dado que la población mayor es pobre en ingresos pero propietaria de su casa y, por tanto, rica en ese sentido. En el caso español ya hemos citado anteriormente el trabajo de Blay-Berrueta (2007), que presenta la hipoteca inversa como una alternativa al seguro privado para la cofinanciación de la dependencia en España. Tras un estudio detallado de la dependencia en España, incluso un cálculo de su coste, el autor hace una revisión comparativa de la hipoteca inversa en Estados Unidos, Reino Unido y en España. Por lo que respecta a la hipoteca inversa en España describe y calcula las hipotecas inversas lanzadas ya en nuestro pais por tres entidades financieras: Caixa Terrasa, la Caixa e Ibercaja, comparando sus resultados. Por nuestra parte, a continuación describimos con detalle la hipoteca inversa que ha diseñado el Instituto Crédito Oficial y el método para su cálculo. 4.4. El planteamiento de la hipoteca inversa del ICO La hipoteca inversa que se describe en este apartado es más restrictiva que la regulada por la Ley 41/2007 y ha sido propuesta por el ICO a través de una Lı́nea de Mediación. Su finalidad es complementar, mediante una renta mensual, los ingresos 4.4 El planteamiento de la hipoteca inversa del ICO 71 que, bien de la Seguridad Social o de cualquier otro origen, perciben las personas con residencia en España y de edad igual o superior a los 70 años, que sean propietarios de una vivienda de primera residencia localizada en cualquier municipio español. Sus caracterı́sticas principales son: Prestatarios finales.- Residentes en España durante al menos los últimos 5 años, con edad igual o superior a 70 años, que sean propietarios de una vivienda que constituya su vivienda habitual, localizada en cualquier municipio español, susceptible de ser hipotecada, con independencia de su estado civil. Lı́mite máximo de financiación por préstamo final.- El lı́mite máximo de la lı́nea de crédito del Prestatario Final no superará el 70 % del valor actual de tasación de la vivienda más el coste de la prima única correspondiente al seguro de supervivencia. Renta mensual del prestatario final.- La renta mensual máxima se calculará igualando el valor actual neto de las rentas mensuales durante la vida esperada del beneficiario final con el 70 % del valor actual de tasación, con un lı́mite de 2.000 euros mensuales. Dicha renta mensual se incrementará cada año en un porcentaje aproximado del 3 %. Duración esperada de la operación.- Será la esperanza de vida del Prestatario Final en el momento de formalizar la operación más un margen de 5 años. Seguros.- Será obligatoria la contratación por el prestatario final de los siguientes seguros: 1. Seguro en la modalidad de prima única, que cubra la recepción de la renta mensual en caso de supervivencia más allá de la fecha lı́mite de vencimiento prevista para la operación, ası́ como los intereses que se devenguen a favor de la entidad financiera por el saldo vivo de la cuenta. 2. Seguro de la vivienda objeto de garantı́a (multirriesgo hogar ). Para planteamiento matemático de la operación hay de calcular todos los términos que intervienen en ella y recurrir después al principio de equivalencia, que supone que el préstamo concedido ha de ser igual a todas las rentas percibidas valorados ambos en el mismo momento, en este caso al principio de la operación. A continuación se detalla la obtención de estos términos. El Valor Actual de la Vivienda, VAV, es el valor presente o descontado del Valor Tasado de la Vivienda, VTV, que a un tipo de interés i y para un periodo de n años vale V AV = V T V (1 + i)−n . 72 Capı́tulo 4. Cálculo de la hipoteca inversa Hay que tener en cuenta los gastos de de la operación, G. Dadas las caracterı́sticas exigibles al prestatario, habrá exención del Impuesto de Actos Jurı́dicos Documentados, IAJD, y existirá también una reducción en los gastos de Notarı́a y Registro. Todo ello permite una estimación del porcentaje de los mismos que se muestra en la Tabla 4.4. Concepto Notaria Registro Gestoria Apertura Total Porcentaje 0.30 % 0.25 % 0.18 % 0.33 % 1.06 % Tabla 4.4: Estimación de los gastos de formalización y gestión En consecuencia, G = 0,0106 · V T V. La Prima Única de los Intereses a favor del banco, en caso de supervivencia del prestatario, es una renta mensual constante y diferida, PUI, cuyo valor se obtiene mediante la expresión P U I = 12 · V T V · im · n /ax = 12 · V T V · im Nx+n+1 11 Dx+n + Dx 24 Dx , donde im es el tipo de interés financiero mensual, im = (1 + i)1/12 − 1. El importe del Préstamo Real Concedido, PRC, a partir del cual se determina el valor de la renta mensual a percibir tanto en la parte financera operación (años de duración de la operación) como la parte actuarial de la misma (renta vitalicia si se supera la duración), es P RC = V AV − G − P U I. (4.5) Al PRC debiera descontársele la Prima Única del seguro de supervivencia, PUR, pero como ésta depende de la renta mensual obtenida, su valor se deducirá posteriormente cuando se conozca dicha renta. A cambio de este importe el propietario recibe una renta mensual de cuantı́a a, durante el plazo estipulado, renta que de acuerdo con las caracterı́sticas fijadas por el ICO debe actualizarse cada año en un porcentaje aproximado del 3 %. La Tabla 4.5 muestra las rentas percibidas a lo largo de los n años. 4.4 El planteamiento de la hipoteca inversa del ICO año mes Renta Valor actual 1 1 a a(1 + im )−1 1 2 a a(1 + im )−2 1 ··· ··· ··· 1 12 a a(1 + im )−12 ··· ··· ··· ··· j 1 aq j−1 aq j−1 (1 + im )−1 j 2 aq j−1 aq j−1 (1 + im )−2 j ··· ··· ··· j 12 aq j−1 aq j−1 (1 + im )−12 ··· ··· ··· ··· n 1 aq n−1 aq n−1 (1 + im )−1 n 2 aq n−1 aq n−1 (1 + im )−2 n ··· ··· ··· n 12 aq n−1 aq n−1 (1 + im )−12 Tabla 4.5: Rentas percibidas a lo largo de los n años 73 74 Capı́tulo 4. Cálculo de la hipoteca inversa El valor total de las rentas percibidas el año j, valorado a principio de dicho año, es Tj = aq j−1 (1 + im )−1 + aq j−1 (1 + im )−2 + . . . + a(1 + im )−12 = aq j−1 [(1 + im )−1 + (1 + im )−2 + . . . + (1 + im )−12 ] 1 − (1 + im )−12 = aq j−1 im j−1 = aq a12|im , donde 1 − (1 + im )−12 , im denota una renta financiera, que se diferencia de las vitalicia en que no está ligada a la supervivencia del individuo. Sumando ahora para j = 0, 1, . . . , n − 1, se obtiene a12|im = T = a · a12|im 1 + q(1 + i)−1 + q 2 (1 + i)−2 + . . . + q n−1 (1 + i)−(n−1) , (4.6) donde la expresión entre corchetes es la suma de los términos de una progresión geométrica de razón, r = q(1 + i)−1 , cuyo valor es S= (1 + i)[1 − q n (1 + i)−n ] . 1+i−q (4.7) Sustituyendo (4.7) en (4.6) el valor actual de T será T = a · a12|im (1 + i)[1 − q n (1 + i)−n ] . 1+i−q (4.8) La Prima Única correspondiente al seguro de supervivencia, PUR, ha de valorarse a partir del valor de a, pues representa lo que debe pagarse al principio de la operación para seguir cobrando la renta revalorizada al final del año n, caso de sobrevivir al periodo estipulado. Su expresión es P U R = 12 · a · q n−1 · n /ax = 12 · a · q n−1 ∗ ∗ Nx+n+1 11 Dx+n + Dx∗ 24 Dx∗ , (4.9) donde, al igual que en la expresión (4.10), los sı́mbolos con * están calculados con el interés técnico i2 que es 1+i−q i2 = . q 4.4 El planteamiento de la hipoteca inversa del ICO 75 La ecuación de equivalencia resultante de la operación se obtiene al igualar el préstamo, (4.5), al valor total de la renta de todos los años valorado al principio de los n periodos (4.8) más el pago único del seguro para seguir percibiendo la prima actualizada en caso de supervivencia (4.9). Es decir, (1 + i)[1 − q n (1 + i)−n ] + 12 · a · q n−1 P RC = a · a12|im 1+i−q ∗ ∗ Nx+n+1 11 Dx+n + Dx∗ 24 Dx∗ . Despejando a, P RC a= a12|im (1+i)[1−q n (1+i)−n ] 1+i−q + 12q n−1 ∗ Nx+n+1 Dx∗ + ∗ 11 Dx+n 24 Dx∗ , que es el importe a percibir el primer año, y se actualiza cada año de acuerdo con q. El último valor a obtener es el importe mensual de la prima prepagable del seguro multiriesgo hogar, P Mm , que obligatoriamente ha de suscribir el prestatario. Fijando la prima en un p por mil y actualizándola en la misma proporción que la renta, su valor se obtiene de la igualdad p 12 · P Mm · ä(12) = V T V ax x 1000 ∗ Nx 11 Nx∗ p 12 · P Mm · − V T V , = Dx∗ 24 1000 Dx∗ y de aquı́ N∗ p · V T V x∗ D ∗ x . P Mm = Nx 11 12000 − ∗ Dx 24 (4.10) 76 Capı́tulo 4. Cálculo de la hipoteca inversa Apéndice A Aplicación E-VITA Como complemento a la exposición teórica y práctica contenida en los anteriores Capı́tulos, se ha desarrollado la aplicación on-line, E-VITA, cuyo objetivo es proporcionar una herramienta de cálculo que permite obtener: 1. Los datos más relevantes de una Hipoteca Inversa, según la modalidad desarrolla por el ICO, a partir de las caracterı́sticas personales de un supuesto prestatario. 2. Tablas dinámicas para la mortalidad española graduadas a partir de los datos correspondientes al periodo 1980-2005 y para un rango de edad de 0 a 125 años. 3. Tablas de mortalidad española proyectadas para un periodo de 20 años, del 2006 al 2025. La aplicación es accesible en la dirección http://www.uv.es/evita y tanto el periodo de los datos de mortalidad graduados como de los proyectados se irán actualizando a medida que los datos de población y defunciones sean publicados por el Instituto Nacional de Estadı́stica. La aplicación consta de cinco ventana, una primera de presentación y otras cuatro que acceden a las utilidades que se describen e ilustran a continuación. A.1. Ventana Presentación Al acceder a la dirección mencionada aparece por defecto la ventana Presentación que contiene una descripción detallada del resto de ventana y enlaces a la mismas, a las que también puede accederse mediante pestañas situadas en el marco superior de la ventana. La descripción de cada una de las restantes ventanas consiste en los datos requeridos como entrada y la salida que proporcionan, con algunas expresiones y fórmulas cuando se requieren. 77 78 Apéndice A. Aplicación E-VITA La Figura A.1 muestra un fragmento de la ventanas. El desplazamiento por el resto se lleva a cabo mediante el ascensor situado en su margen derecho. Figura A.1: La ventana Presentación A.2. Ventana Hipoteca Inversa Esta ventana, como se observa en la Figura A.2, consta de dos partes claramente diferenciadas. La parte superior recoge los datos de entrada que debe proporcionar el interesado y, tras pulsar el botón Calcular, muestra en su parte izquierda los datos de la hipoteca resultante. Se trata de una hipoteca inversa calculada de acuerdo con lo establecido por el ICO y descrito en el Capı́tulo 4. A señalar que al desplazar el cursor sobre cada item se despliega un bocadillo que lo define brevemente. La parte inferior es una tabla que recoge, para todos los años del periodo de duración de la hipoteca, el valor de la renta a percibir cada mes, la prima del seguro multirriesgo y, por diferencia, la renta neta resultante. Renta y prima se actualizan de año a año según la tasa de crecimiento que se haya fijado. A.3 Ventana Ajustes Lee-Carter 79 Figura A.2: La ventana Hipoteca Inversa A.3. Ventana Ajustes Lee-Carter Esta ventana muestra los resultados de la graduación de los datos de mortalidad españoles del modelo de Lee-Carter con un sólo término. Es un complemento al Capı́tulo 3 en el que se describe con detalle la aplicación del modelo a los datos de mortalidad españoles correspondientes al periodo 1980-2005. En la parte superior de la ventana se eligen sexo y año y se genera automáticamente una tabla de mortalidad para el año elegido y el siguiente y para un rango de edades de 0 a 125. La tabla se muestra en la parte inferior y existe la opción de obtener la tabla en formato Excelr pulsando sobre el icono que aparece al final de la misma. A.4. Ventana Parámetros del modelo Los parámetros del modelo ajustado mediante la ventana anterior son accesibles en esta ventana. La elección del parámetro y del sexo genera automáticamente la gráfica del parámetro elegido, cuyos valores numéricos en forma de tabla se obtienen al pulsar sobre el icono de Excelr . La Figuras A.4, A.5 y A.6 reproducen la ventana de cada uno de los tres parámetro. Cuando se solicitan los parámetros ax o bx la tabla que se obtiene es la misma y contiene los valores de ambos parámetros para el conjunto de edades, no ası́ las 80 Apéndice A. Aplicación E-VITA Figura A.3: La ventana Ajuste de Lee-Carter gráficas que corresponde sólo al parámetro elegido. Figura A.4: Gráfica de los parámetros ax que muestra la ventana Parámetros del modelo A.5 Ventana Proyección 81 En la Figura A.5, que muestra una ventana en la que se eligió el parámetro bx , se observa que la gráfica recoge tanto los valores originales como los suavizados, que son los que se utilizarán posteriormente en la proyección de la mortalidad futura. La tabla de valores también contiene los suavizados. Figura A.5: Gráfica de los parámetros bx que muestra la ventana Parámetros del modelo A.5. Ventana Proyección La estructura de la ventana es semejante a la de los Ajustes de Lee-Carter, entrada del sexo y año y como salida una tabla. La de esta ventana contiene las proyecciones de la probabilidad de muertes, qx , y la esperanza de vida residual, ex , con los extremos de los respectivos intervalos de confianza. Tanto las proyecciones como los extremos de los intervalos de confianza se obtienen a partir de las proyecciones de las kt aplicando la metodologı́a de Lee y Carter (1992). Los detalles se pueden consultar en la Sección 3.4 del Capı́tulo 3. Como antes, también ahora puede generarse la correspondiente tabla Excelr pulsando el icono situado al final de la tabla que muestra la ventana. 82 Apéndice A. Aplicación E-VITA Figura A.6: Gráfica de los parámetros kt que muestra la ventana Parámetros del modelo Figura A.7: La ventana Proyección Apéndice B Código en R #l e e m o s l o s d a t o s de España #en e l d i r e c t o r i o de t r a b a j o setwd ( ”F : / ana debon / p r o y e c t o s /ICO/ s o f w a r e t c f i n a l ” ) d a t o s . f i n a l <−r e a d . t a b l e ( ” d a t o s q e s i c o . t x t ” , h e a d e r=T) #4 columnas : edad , #tiempo , p r o b a b i l i d a d e s de muerte ( qx ) , #i n i c i a l m e n t e e x p u e s t o s a l r i e s g o ( ex ) summary ( d a t o s . f i n a l ) ##################################################################### #COMPLETAR LA TABLA CON EL MÉTODOD DE DENUIT Y GORDENIAUX ( 2 0 0 4 ) ##################################################################### #obtenemos c t a j u s t a n d o de i n i t . a j u s t en a d e l a n t e #s e completa l a t a b l a reemplazando l o s qx de i n i . emp h a s t a 130 i n i . a j u s t <−75 i n i . emp<−86 o l d . ages<−d a t o s . f i n a l [ ( d a t o s . f i n a l $ e d a d >=i n i . a j u s t ) , ] t r a n s <−(130−( i n i . a j u s t : 9 9 ) ) ˆ 2 v i e j o s <−(130−( i n i . emp : 1 3 0 ) ) ˆ 2 #s i creamos l o s r a t i o s c o m p l e t o s h a s t a 130 v i e j o s . a j u s t <−matrix ( 0 , n c o l =26 , nrow=131− i n i . emp) o l d . r a t i o s <−matrix ( o l d . ages$qx , nrow=100− i n i . a j u s t , n c o l =26) o l d . p e s o s <−matrix ( o l d . ages$ex , nrow=100− i n i . a j u s t , n c o l =26) #hacemos un a j u s t e para cada año , cada columna de l a s m a t r i c e s a n t e r i o r e s ct<−NULL f o r ( i i n 1 : 2 6 ) { f i t 3 <−glm ( o l d . r a t i o s [ , i ] ˜−1+t r a n s , f a m i l y = b i n o m i a l ( l i n k=l o g ) , w e i g h t s=o l d . p e s o s [ , i ] ) v i e j o s . a j u s t [ , i ]<−exp ( c o e f ( f i t 3 ) ∗ v i e j o s ) } 83 84 Apéndice B. Código en R #creamos l o s r a t i o s c o m p l e t o s r a t i o s <−matrix ( d a t o s . f i n a l $ q x , nrow =100 , n c o l =26) r a t i o s . completos <−r a t i o s [ 1 : i n i . emp , ] r a t i o s . completos <−r b i n d ( r a t i o s . completos , v i e j o s . a j u s t ) #creamos l o s e x p u e s t o s a l r i e s g o c o m p l e t o s p o b l a . completa<−matrix ( 0 , nrow =131 , n c o l =26) p o b l a . completa [1 ,] < − r e p ( 1 0 0 0 0 0 , 2 6 ) #c o n t i e n e l x de l a edad c e r o f o r ( i in 1 : 130) { p o b l a . completa [ i +1,]<− p o b l a . completa [ i , ] ∗ ( 1 − r a t i o s . c o m p l e t o s [ i , ] ) } #creamos l o s d a t o s c o m p l e t o s d a t o s . completos <−data . frame ( edad=r e p ( 0 : 1 3 0 , 2 6 ) , tiempo=r e p ( 1 9 8 0 : 2 0 0 5 , each =131) , qx=matrix ( r a t i o s . completos , n c o l =1) , ex=matrix ( p o b l a . completa , n c o l =1)) ########################################## #AJUSTE DEL MODELO DE LEE−CARTER PERIODO # ########################################## l i b r a r y (gnm) #vamos a r e a l i z a r e l a j u s t e s o l o para e d a d e s de h a s t a 125 d a t o s . completos <−d a t o s . c o m p l e t o s [ d a t o s . completos$edad <126 ,] #para e n c o n t r a r puntos i n i c i a l e s de l o s que p a r t i r y c o n v e r j a s i e m p r e emptymodel<−gnm( qx˜−1+ f a c t o r ( edad ) , w e i g h t s=ex , f a m i l y=q u a s i b i n o m i a l , data=d a t o s . c o m p l e t o s ) b i p l o t S t a r t <−residSVD ( emptymodel , f a c t o r ( d a t o s . c o m p l e t o s $ e d a d ) , f a c t o r ( datos . completos$tiempo ) , 1 ) #para que cumpla l a s r e s t r i c c i o n e s e l punto i n i c i a l bx [ 1 ] = 1 y kt [ 1 ] = 0 #dos r e s t i c c i o n e s para que l a s o l u c i ó n s e a ú n i c a a i n i <−c o e f ( emptymodel)+ b i p l o t S t a r t [ 1 ] ∗ b i p l o t S t a r t [ 1 2 7 ] ∗ biplotStart [1:126]/ biplotStart [1] b i n i <−b i p l o t S t a r t [ 1 : 1 2 6 ] / b i p l o t S t a r t [ 1 ] k i n i <−b i p l o t S t a r t [ 1 ] ∗ b i p l o t S t a r t [ 1 2 7 : 1 5 2 ] − b i p l o t S t a r t [ 1 ] ∗ b i p l o t S t a r t [ 1 2 7 ] a j u s t e . l c 1 <−gnm( qx˜−1+ f a c t o r ( edad)+Mult ( f a c t o r ( edad ) , f a c t o r ( tiempo ) ) , w e i g h t s=ex , c o n s t r a i n=c ( 1 2 7 , 2 5 3 ) , c o n s t r a i n T o=c ( 1 , 0 ) , f a m i l y=q u a s i b i n o m i a l , data=d a t o s . c o m p l e t o s , s t a r t=c ( a i n i , b i n i , k i n i ) ) summary ( a j u s t e . l c 1 ) #para que cumpla l a s r e s t r i c c i o n e s h a b i t u a l e s sum ( bx)=1 y sum ( kt )=0 a x a j u s t e . l c 1 <−a s . numeric ( c o e f ( a j u s t e . l c 1 ) [ 1 : 1 2 6 ] +mean ( c ( 0 , c o e f ( a j u s t e . l c 1 ) [ 2 5 4 : 2 7 8 ] ) ∗ sum ( c ( 1 , c o e f ( a j u s t e . l c 1 ) [ 1 2 8 : 2 5 2 ] ) ) ) ∗ c ( 1 , c o e f ( a j u s t e . l c 1 ) [ 1 2 8 : 2 5 2 ] ) / sum ( c ( 1 , c o e f ( a j u s t e . l c 1 ) [ 1 2 8 : 2 5 2 ] ) ) ) #bx s i n s u a v i z a r b x a j u s t e . l c 1 . ns<−a s . numeric ( c ( 1 , c o e f ( a j u s t e . l c 1 ) [ 1 2 8 : 2 5 2 ] ) 85 /sum ( c ( 1 , c o e f ( a j u s t e . l c 1 ) [ 1 2 8 : 2 5 2 ] ) ) ) k t a j u s t e . l c 1 <−a s . numeric ( c ( 0 , c o e f ( a j u s t e . l c 1 ) [ 2 5 4 : 2 7 8 ] ) ∗sum ( c ( 1 , c o e f ( a j u s t e . l c 1 ) [ 1 2 8 : 2 5 2 ] ) ) −mean ( c ( 0 , c o e f ( a j u s t e . l c 1 ) [ 2 5 4 : 2 7 8 ] ) ∗sum ( c ( 1 , c o e f ( a j u s t e . l c 1 ) [ 1 2 8 : 2 5 2 ] ) ) ) ) #comprobación que l a s t r a n s f o r m a c i o n e s e s t á n b i e n i n v . l o g i t <−f u n c t i o n ( x ) { exp ( x )/(1+ exp ( x ) ) } cbind ( f i t t e d ( a j u s t e . l c 1 ) , inv . l o g i t ( rep ( axajuste . lc1 , 2 6 ) +( r e p ( k t a j u s t e . l c 1 , each =126)∗ r e p ( b x a j u s t e . l c 1 . ns , 2 6 ) ) ) ) #s u a v i z a d o s , l a s u a v i z a c i ó n debe e l e g i r s e para que no haya #f l u c t u a c i o n e s r a r a s en l o s v a l o r e s p r o b a r con v a r i o s b x a j u s t e . l c 1 <−smooth . s p l i n e ( s e q ( 0 , 1 2 5 , 1 ) , b x a j u s t e . l c 1 . ns , a l l . k n o t s=FALSE, nknots =9)$y #################################### #RESULTADOS QUE QUEREMOS MOSTRAR # #################################### qx<−matrix ( d a t o s . completos$qx , n c o l =26 , nrow =126) tablamort <−f u n c t i o n ( x , l i f e t a b l e ) { lx <− v e c t o r ( ” numeric ” , l e n g t h ( l i f e t a b l e ) ) dx<− v e c t o r ( ” numeric ” , l e n g t h ( l i f e t a b l e ) ) Lx<− v e c t o r ( ” numeric ” , l e n g t h ( l i f e t a b l e ) ) Tx<− v e c t o r ( ” numeric ” , l e n g t h ( l i f e t a b l e ) ) ex<− v e c t o r ( ” numeric ” , l e n g t h ( l i f e t a b l e ) ) l x [1] < −100000 #c o n t i e n e l x de l a edad c e r o f o r ( i i n 1 : ( l e n g t h ( l i f e t a b l e ) −1)) { l x [ i +1]<− l x [ i ]∗(1 − l i f e t a b l e [ i ] ) } f o r ( i i n 1 : ( l e n g t h ( l i f e t a b l e ) ) ) {dx [ i ]<− l x [ i ] ∗ l i f e t a b l e [ i ] } f o r ( i i n 1 : ( l e n g t h ( l i f e t a b l e ) −1)) {Lx [ i ]<− l x [ i +1]+0.5∗ dx [ i ] Lx [ l e n g t h ( l i f e t a b l e ) ] = 0 . 5 ∗ dx [ l e n g t h ( l i f e t a b l e ) ] } f o r ( i i n 1 : ( l e n g t h ( x ) ) ) {Tx [ i ]<−sum ( Lx [ ( x [ i ] + 1 ) : l e n g t h ( l i f e t a b l e ) ] ) } # l x [ x+1] c o n t i e n e l x de l a edad x f o r ( i i n 1 : ( l e n g t h ( x ) ) ) { ex [ i ]<−Tx [ i ] / l x [ x [ i ] + 1 ] } d e v u e l v e <−c b i n d ( x=x , l x=lx , dx=dx , qx=l i f e t a b l e , ex=ex ) devuelve } t a b l a <−NULL for ( i in 1:26){ any<−r e p (1979+ i , 1 2 6 ) tabl aaux <−c b i n d ( any , t a b l a m o r t ( s e q ( 0 , 1 2 5 ) , matrix ( f i t t e d ( a j u s t e . l c 1 ) , n c o l =26 , nrow = 1 2 6 ) [ , i ] ) ) t a b l a <−r b i n d ( t a b l a , t a b l a a u x ) } #f i c h e r o que guarda para l o s a ños de 1980 −2005 l a s t a b l a s de m o r t a l i d a d w r i t e ( t ( t a b l a ) , ” a j u s t e h o m b r e s . t x t ” , n c o l=n c o l ( t a b l a ) ) 86 Apéndice B. Código en R ablc hombres <−c b i n d ( s e q ( 0 , 1 2 5 ) , a x a j u s t e . l c 1 , b x a j u s t e . l c 1 . ns , b x a j u s t e . l c 1 ) #f i c h e r o que guarda para l o s par áme tr os ax y bx a j u s t a d o s w r i t e ( t ( a b l c h o m b r e s ) , f i l e =”a b l c h o m b r e s . t x t ” , n c o l=n c o l ( a b l c h o m b r e s ) ) #f i c h e r o que guarda para l o s par áme tr os kt a j u s t a d o s klchombres<− c b i n d ( s e q ( 1 9 8 0 , 2 0 0 5 ) , k t a j u s t e . l c 1 ) w r i t e ( t ( klchombres ) , f i l e =”k l c h o m b r e s . t x t ” , n c o l=n c o l ( klchombres ) ) ########################################## # PROYECCIONES E INTERVALOS DE CONFIANZA # ########################################## library ( tseries ) library ( forecast ) #f u n c i o n e s n e c e s a r i a s l o g i t <−f u n c t i o n ( x ) { l o g ( x/(1−x ) ) } #f u n c i o n que o b t i e n e l a s p r e d i c c i o n e s f u n c i o n . p r e d i c t <−f u n c t i o n ( t , n , ax , bx , kt ){ #t número de a ños para l o s que queremos p r e d i c c i o n e s #n numero de e d a d e s para l a s que s e p r e d i c e #c a l c u l o de l a s p r e d i c c i o n e s l e e <−matrix ( r e p ( ax , t ) , nrow=n , n c o l= t )+( matrix ( bx , nrow=n , n c o l= 1 ) %∗ %matrix ( kt , nrow=1, n c o l= t ) ) p r e d i c c i o n e s <−i n v . l o g i t ( l e e ) prueba<− l i s t ( pred=p r e d i c c i o n e s ) prueba } #f u n c i o n que o b t i e n e l a s e s p e r a n z a s espe <−f u n c t i o n ( x , l i f e t a b l e ) { lx <− v e c t o r ( ” numeric ” , nrow ( l i f e t a b l e ) ) dx<− v e c t o r ( ” numeric ” , nrow ( l i f e t a b l e ) ) Lx<− v e c t o r ( ” numeric ” , nrow ( l i f e t a b l e ) ) Tx<− v e c t o r ( ” numeric ” , nrow ( l i f e t a b l e ) ) ex<− matrix ( 0 , nrow=nrow ( l i f e t a b l e ) , n c o l=n c o l ( l i f e t a b l e ) ) for ( j in 1: ncol ( l i f e t a b l e )){ l x [1] < −100000 #c o n t i e n e l x de l a edad c e r o f o r ( i i n 1 : ( nrow ( l i f e t a b l e ) −1)) { l x [ i +1]<− l x [ i ]∗(1 − l i f e t a b l e [ i , j ] ) } f o r ( i i n 1 : ( nrow ( l i f e t a b l e ) ) ) {dx [ i ]<− l x [ i ] ∗ l i f e t a b l e [ i , j ] } f o r ( i i n 1 : ( nrow ( l i f e t a b l e ) −1)) {Lx [ i ]<− l x [ i +1]+0.5∗ dx [ i ] Lx [ nrow ( l i f e t a b l e ) ] = 0 . 5 ∗ dx [ nrow ( l i f e t a b l e ) ] } f o r ( i i n 1 : ( l e n g t h ( x ) ) ) {Tx [ i ]<−sum ( Lx [ ( x [ i ] + 1 ) : nrow ( l i f e t a b l e ) ] ) } # l x [ x+1] c o n t i e n e l x de l a edad x f o r ( i i n 1 : ( l e n g t h ( x ) ) ) { ex [ i , j ]<−Tx [ i ] / l x [ x [ i ] + 1 ] } } ex 87 } kthomlo<−f o r e c a s t ( auto . arima ( k t a j u s t e . l c 1 ) , 2 0 ) $ l o w e r [ , 2 ] kthomme<−f o r e c a s t ( auto . arima ( k t a j u s t e . l c 1 ) , 2 0 ) $mean [ 1 : 2 0 ] kthomup<−f o r e c a s t ( auto . arima ( k t a j u s t e . l c 1 ) , 2 0 ) $upper [ , 2 ] #o b s e r v a r que e l extremo s u p e r i o r de l a k c o r r e s p o n d e a l i n f e r i o r de l a q qxhomlo<− f u n c i o n . p r e d i c t ( 2 0 , 1 2 6 , a x a j u s t e . l c 1 , b x a j u s t e . l c 1 , kthomup ) $pred qxhomme<− f u n c i o n . p r e d i c t ( 2 0 , 1 2 6 , a x a j u s t e . l c 1 , b x a j u s t e . l c 1 , kthomme ) $pred qxhomup<− f u n c i o n . p r e d i c t ( 2 0 , 1 2 6 , a x a j u s t e . l c 1 , b x a j u s t e . l c 1 , kthomlo ) $pred exhomlo<−e s p e ( s e q ( 0 , 1 2 5 ) , qxhomlo ) exhomme<−e s p e ( s e q ( 0 , 1 2 5 ) , qxhomme ) exhomup<−e s p e ( s e q ( 0 , 1 2 5 ) , qxhomup ) esp<−NULL f o r ( i i n 1 : 2 0 ) esp<−c b i n d ( esp , exhomlo [ , i ] , exhomme [ , i ] , exhomup [ , i ] ) qus<−NULL f o r ( i i n 1 : 2 0 ) qus<−c b i n d ( qus , qxhomlo [ , i ] , qxhomme [ , i ] , qxhomup [ , i ] ) p r o y e c c i o n e s c o n k <−c b i n d ( esp , qus ) #f i c h e r o que c o n t i e n e p r e d i c c i o n e s de l o s r a t i o s y l a s e s p e r a n z a s # de 2006 a 2025 write ( t ( proyecciones conk ) , ” proyecciones hombres conk . txt ” , n c o l=n c o l ( p r o y e c c i o n e s c o n k ) ) 88 Apéndice B. Código en R Bibliografı́a Benjamin, B. y Pollard, J. (1992). The Analysis of Mortality and Other Actuarial Statistics. Butterworth-Heinemann, London, 6a edición. Benjamin, B. y Soliman, A. (1993). Mortality on the Move. Actuarial Education Service, Oxford. Betzuen, A. (1995). La problematica de los tantos interanuales, la asignación del rango de la edad y del intervalo de exposición al riesgo en un colectivo de activos. Anales del Instituto de Actuarios, 3a Epoca(1):51–97. Blay-Berrueta, D. (2007). Sistemas de cofinaciaciación de la dependencia: seguro privado frente a hipoteca inversa. Cuadernos de la Fundación, Fundación Mapfre Estudios, Madrid. Blumen, I., Kogan, M., y McCarthy, P. (1955). The industrial mobility of labour as a probability process. Ithaca, N.Y. : Cornell University Press. Booth, H. (2006). Demographic forecasting: 1980 to 2005 in review. International Journal of Forecasting, 22(3):547–582. Booth, H., Hyndman, R., Tickle, L., y de Jong, P. (2006). Lee-Carter mortality forecasting: a multi-country comparison of variants and extensions. Demographic Research, 15(9):289–310. Booth, H., Maindonald, J., y Smith, L. (2002). Applying Lee-Carter under conditions of variable mortality decline. Population Studies, 56(3):325–336. Booth, H. y Tickle, L. (2003). The future aged: new projections of Australia’s ederly population. Population Studies, 22(4):38–44. Brass, W. (1969). Population Growth and the Brain Drain, capı́tulo A generation method for projecting death rates, páginas 75–91. University Press, Edinburgh. Brouhns, N., Denuit, M., y Keilegom, I. V. (2005). Bootstrapping Poisson log-bilinear model for mortality forecasting. Scandinavian Actuarial Journal, 2005(3):212–224. 89 90 BIBLIOGRAFÍA Brouhns, N., Denuit, M., y Vermunt, J. (2002). A Poisson log-bilinear regression approach to the construction of projected lifetables. Insurance: Mathematics & Economics, 31(3):373–393. Bureau, C. M. I. (1990). Continuous Mortality Investigation Reports CMIR 10. The Institute of Actuaries and Faculty of Actuaries, UK. Bureau, C. M. I. (1999). Continuous Mortality Investigation Reports CMIR 17. The Institute of Actuaries and Faculty of Actuaries, UK. Butt, Z. y Haberman, S. (2004). Application of frailty-based mortality models using generalized linear models. Astin Bulletin, 34(1):175–197. Carstensen, B. y Keiding, N. (2005). Age-Period-Cohort models: Statistical inference in the Lexis diagram. Carter, L. y Lee, R. (1992). Modeling and forecasting U. S. sex differentials in mortality. International Journal of Forecasting, 8(3):393–411. Carter, L. y Prkawetz, A. (2001). Examining structural shifs in mortality using the Lee-Carter method. Mpidr wp 2001-007, Center for Demography and Ecology Information, University of Wisconsin-Madison. Chiloy, P. y Megbolugbe, I. (1994). Reverse mortgages: contracting and crossover. Journal of the American Real Estate and Urban Economics Association, 22(2):367–386. Clayton, D. y Schifflers, E. (1987a). Models for temporal variation in cancer rates. I: Age-period and age-cohort models. Statistics in medicine, 6(4):449–467. Clayton, D. y Schifflers, E. (1987b). Models for temporal variation in cancer rates. II: Age-period-cohort models. Statistics in medicine, 6(4):469–481. CMI (2004). Projecting future mortality: A discusion paper. Working Paper 3, The faculty of Actuaries and Institute of Actuaries. CMI (2005). Projecting future mortality: Towards a proposal for a stochastic methodology. Working Paper 15, The faculty of Actuaries and Institute of Actuaries. CMI (2007). Stocastic projection methodologies: Lee-Carter model features, example results and implications. Working Paper 25, The faculty of Actuaries and Institute of Actuaries. Coale, A. y Guo, G. (1989). Revisited regional model life tables at very low levels of mortality. Population Index, 55:613–643. BIBLIOGRAFÍA 91 Coale, A. y Kisker, E. (1990). Defects in data old age mortality in the United States: New procedures for calculating approximately accurate mortality schedules and lifes tables at the highest ages. Asian and Pacific Population Forum, 4:1–31. Congdon, P. (1993). Statistical graduation in local demographic analysis and projection. Journal of the Royal Statistical Society A, 156(2):237–270. Cossette, H., Delwarde, A., Denuit, M., Guillot, F., y Étienne Marceau (2007). Pension plan valuation and mortality projection: A case study with mortality data. North American Actuarial Journal, 11(2):1–34. Costa-Font, J., Gil, J., y Mascarilla, O. (2006). Preferencias de la población ante la financiación de la dependéncia: La hipoteca inversa en españa. Estudios sobre economı́a española 230, Fundación de Estudios de Ecomı́a Aplicada. Cressie, N. (1993). Statistics for Spatial Data, Revised Edition. John Wiley, New York. Currie, I., Durban, M., y Eilers, P. (2004). Smoothing and forecasting mortality rates. Statistical Modelling, 32(4):279–298. Currie, I., Kirkby, J., Durban, M., y Eilers, P. (2004). Smooth Lee-Carter models and beyond. En Workshop on Lee-Carter Methods, www.ma.hw.ac.uk iain/workshop/workshop.html (4th March 2005). Czado, C., Delwarde, A., y Denuit, M. (2005). Bayesian Poisson log-bilinear mortality projections. Insurance: Mathematics & Economics, 36(3):260–284. Davidoff, T. y Welke, G. (2007). Selection and moral hazard in the reverse mortgage market. Technical report, Haas School of Business, UC Berkeley. Debón, A., Montes, F., Mateu, J., Porcu, E., y Bevilacqua, M. (2008). Modelling residuals dependence in dymanic life tables. Computational Statistics and Data Analysis, 52(3):3128–3147. Debón, A., Montes, F., y Puig, F. (2008). Modelling and forecasting mortality in Spain. European Journal of Operation Research, 189(3):624–637. Debón, A., Montes, F., y Sala, R. (2005). A comparison of parametric models for mortality graduation. Application to mortality data of the Valencia region (Spain). Statistics and Operations Research Transactions, 29(2):269–287. Debón, A., Montes, F., y Sala, R. (2006a). A comparison of models for dinamical life tables. Application to mortality data of the Valencia region (Spain). Lifetime data analysis, 12(2):223–244. 92 BIBLIOGRAFÍA Debón, A., Montes, F., y Sala, R. (2006b). A comparison of nonparametric methods in the graduation of mortality: application to data from the Valencia region (Spain). International Statistical Review, 74(2):215–233. Dellaportas, P., Smith, A., y Stavropoulos, P. (2001). Bayesian analysis of mortality data. Journal of the Royal Statistical Society A, 164(2):275–291. Delwarde, A., Denuit, M., y Eilers, P. (2007). Smoothing the Lee-Carter and poisson log-bilinear models for mortality forecasting: a penalized log-likelihood approach. Statistical Modelling, 7(1):29–48. Denuit, M. (2007). Distribution of the random future life expectancies in log-bilinear mortality projections models. Lifetime Data Analysis, 13(3):381–397. Denuit, M. y Goderniaux, A. (2004). Closing and projecting lifetables using loglinear models. Mitteilungen. der Schweizerischen Aktuarvereingung, 1:29–49. Felipe, A., Guillen, M., y Nielsen, J. (2001). Longevity studies based on kernel hazard estimation. Insurance: Mathematics & Economics, 28(2):191–204. Felipe, A., Guillén, M., y Pérez-Marı́n, A. (2002). Recent mortality trends in the Spanish population. British Actuarial Journal, 8(4):757–786. Felipe, M. y Guillén, M. (1999). Evolución y Predicción de las Tablas de Mortalidad Dinámicas para la Población Española. Cuadernos de la Fundación, Fundación Mapfre Estudios, Madrid. Fledelius, P., Guillen, M., Nielsen, J., y Petersen, K. (2004). A comparative study of parametric and nonparametric estimators of old-age mortality in Sweden. Journal of Actuarial Practice, 11:101–126. Forfar, D., McCutcheon, J., y Wilkie, A. (1988). On graduation by mathematical formula. Journal of the Institute of Actuaries, 115 part I(459):1–149. Gavin, J., Haberman, S., y Verrall, R. (1993). Moving weighted average graduation using kernel estimation. Insurance: Mathematics & Economics, 12(2):113–126. Gavin, J., Haberman, S., y Verrall, R. (1994). On the choice of bandwidth for kernel graduation. Journal of the Institute of Actuaries, 121:119–134. Gavin, J., Haberman, S., y Verrall, R. (1995). Graduation by kernel and adaptive kernel methods with a boundary correction. Transactions. Society of Actuaries, XLVII:173–209. Gerber, H. (1997). Life Insurance Mathematics. Springer-Verlag, Berlı́n. BIBLIOGRAFÍA 93 Gini, C. (1924). Premières recherches sur la fécondabilité de la femme. Proceedings of the International Mathematical Congress, 2(2):889–892. Gompertz, B. (1825). On the nature of the function of the law of human mortality and on a new mode of determining the value of life contingencies. Philosophical Transactions of The Royal Society, 115:513–585. Guillen, M., Nielsen, J., y Pérez-Marı́n, A. (2006). Multiplicative hazard models for studying the evolution of mortality. The Annals of Actuarial Science, 1. Guillen, M. y Vidiella-i-Anguera, A. (2005). Forecasting Spanish natural life expectancy. Risk Analysis, 25(5):1161–1170. Haberman, S. y Renshaw, A. (1996). Generalized linear models and actuarial science. The Statistician, 45(4):407–436. H.D.M. (2005). Human Mortality Database University of California, Berkeley (USA), and Max Planck Institute for Demographic Research (Germany). www.mortality.org or www.humanmortality.de. Heligman, L. y Pollard, J. (1980). The age pattern of mortality. Journal of the Institute of Actuaries, 107:49–80. Herranz-Gonzalez, R. (2006). Hipoteca inversa y figuras afines. Informes Portal Mayores 49, IMSERSO, Madrid, http://www.imsersomayores.csic.es/documentos/documentos/herranz-hipoteca01.pdf. Holford, T. (1983). The estimation of age, period and cohort effects for vital rates. Biometrics, 39:311–324. Horiuchi, S. y Wilmoth, J. (1998). Decelaration in the age pattern of mortality at older ages. Demography, 35:391–412. Huijbregts, A. J. . C. J. (1978). Mining Geoestatistics. Academic Press, New York. Hyndman, R. J. (2008). forecast: Forecasting functions for time series. R package version 1.11. Khalaf-Allah, M. y Haberman, S. (2006). Measuring the effect of mortality improvements on the cost of annuties. Insurance: Mathematics & Economics, 39(2):195– 214. Koissi, M., Shapiro, A., y Högnäs, G. (2006). Evaluating and extending the LeeCarter model for mortality forecasting confidence interval. Insurance: Mathematics & Economics, 38(1):1–20. 94 BIBLIOGRAFÍA Kutty, N. (1998). The scope for poverty alleviation among elderly home-owners in the United States through reverse mortgages. Urban studies, 35(1):113–129. Lee, R. (2000). The Lee-Carter method for forecasting mortality, with various extensions and applications. North American Actuarial Journal, 4(1):80–91. Lee, R. y Carter, L. (1992). Modelling and forecasting U. S. mortality. Journal of the American Statistical Association, 87(419):659–671. Lee, R. y Nault, F. (1993). Modeling and forecasting provincial mortality in Canada. Montreal. World Congress of the International Union for Scientific Study of Population. Lee, R. y Rofman, R. (1994). Modelación y proyección de la mortalidad en Chile. Notas Población, 22(59):182–213. Levi, E. (1973). Curso de matemática financiera y actuarial, volumen II Matemática Actuarial. Bosch, Barcelona. Li, N. y Lee, R. (2005). Coherent mortality forecast for a group of populations: an extension of the Lee-Carter method. Demography, 42(3):575–593. Li, S.-H., Hardy, M., y Tan, K. (2006). Uncertainty in mortality forecasting: an extensión to the classical Lee-Carter approach. Technical report, Waterloo University. Lindbergson, M. (2001). Mortality among the elderly in Sweden. Scandinavian Actuarial Journal, (1):79–94. London, D. (1985). Graduation: the Revision of Estimates. Actex Publication, Winsted, Cunnecticud. Macdonald, A. (1996a). An actuarial survey of statistical models for decrement and transition data I: Multiple state, Poisson and Binomial models. British Actuarial Journal, 2(1):129–155. Macdonald, A. (1996b). An actuarial survey of statistical models for decrement and transition data II: Competing risks, non-parametric and regression models. British Actuarial Journal, 2(2):429–448. Macdonald, A. (1996c). An actuarial survey of statistical models for decrement and transition data III: counting process models. British Actuarial Journal, 2(3):703– 726. Makeham, W. (1860). On the law of mortality. Journal of the Institute of Actuaries, 13:325–358. BIBLIOGRAFÍA 95 Matheron, G. (1962). Traité de géostatistique appliquée. Editions Technip, Paris. Matheron, G. (1963). Principles of geostatistics. Economic Geology, 58:1246–1266. Matheron, G. (1971). The theory of regionalized variables and its applications. Cahiers du Centre de Morphologie Mathematique, Fontainebleau, 5. McCullagh, P. y Nelder, J. (1989). Generalized Linear Models. Chapman and Hall, London. Mcnown, R. y Rogers, A. (1989). Advances in Regional Demography: Forecasts, Information, Models, capı́tulo Time series Analysis Forecasts of a Parameterised Mortality Schedule, páginas 107–123. Belhaven Press, London. McNown, R. y Rogers, A. (1989). Forecasting mortality: A parametrized time series aproach. Demography, 26(4):645–660. McNown, R. y Rogers, A. (1992). Forecasting cause-specific mortality using time series methods. International Journal of Forecasting, 8(3):413–432. Miceli, T. y Sirmans, C. (1994). Reverse mortgages and borrower maintenance risk. Journal of the American Real Estate and Urban Economics Association, 22(2):433–450. Nielsen, J. (2003). Smoothing and prediction with a view to actuarial science, biostatistics and finance. Scandinavian Actuarial Journal, (1):51–74. Nieto, U. y Vegas, J. (1993). Matemática Actuarial. Mapfre, Madrid. Olivieri, A. (2001). Uncertainly in mortality projections: an actuarial perspective. Insurance: Mathematics & Economics, 29(4):231–245. Osmond, C. (1992). Using age, period and cohort models to estimate future mortality rates. International Journal of Epidemiology, 129(1):124–129. Palacios, H. (1996). Introducción al Cálculo Actuarial. Mapfre, Madrid. Pedroza, C. (2006). A bayesian forecasting model: predicting U.S. male mortality. Biostatistics, 7(4):530–550. Perks, W. (1825). On some experiments in the graduation of mortality statistics. Journal of the Institute of Actuaries, 63:12–40. Pitacco, E. (2004a). From Halley to “frailty”: a review of survival models for actuarial calculations. Giornale dell’Istituto Italiano degli Attuari, 67:17–48. 96 BIBLIOGRAFÍA Pitacco, E. (2004b). Survival models in dynamic context: a survey. Insurance: Mathematics & Economics, 35(2):279–298. Pitacco, E. y Olivieri, A. (2005). Forecasting mortality: an introduction. Working paper 35, Università Bocconi, Milano. Pitacco, E. y Olivieri, A. (2006). Life anuities dynamics. Working paper 36, Università Bocconi, Milano. R Development Core Team (2005). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. Rasmunssen, D., Megbolugbe, I., y Morgan, B. (1997). The reverse mortgages as an asset. Housing Policy Debate, 8(1):173–193. Renshaw, A. (1991). Actuarial graduation practice and generalised linear models. Journal of the Institute of Actuaries, 118(II):295–312. Renshaw, A. y Haberman, S. (2003a). Lee-Carter mortality forecasting: a parallel generalized linear modelling aproach for England and Wales mortality projections. Journal of the Royal Statistical Society C, 52(1):119–137. Renshaw, A. y Haberman, S. (2003b). Lee-Carter mortality forecasting with age specific enhancement. Insurance: Mathematics & Economics, 33(2):255–272. Renshaw, A. y Haberman, S. (2003c). On the forecasting of mortality reduction factors. Insurance: Mathematics & Economics, 32(3):379–401. Renshaw, A. y Haberman, S. (2006). A cohort-based extension to the Lee-Carter model for mortality reduction factors. Insurance: Mathematics & Economics, 38(3):556–570. Renshaw, A. y Haberman, S. (2008). On simulation-based approaches to risk measurement in mortality with specific reference to poisson Lee-Carter modelling. Insurance: Mathematics & Economics, 42(2):797–816. Renshaw, A., Haberman, S., y Hatzopoulos, P. (1996). The modelling of recent mortality in United Kingdom male assured lives. British Actuarial Journal, 2(II):449– 477. Richards, S., Ellam, J., Hubbard, J., Lu, J., Makin, S., y K.A., M. (2007). Twodimensional mortality data: patterns and projections. British. Actuarial Journal, 6(I):5–61. BIBLIOGRAFÍA 97 Shiller, R. y Weiss, A. (2000). Moral hazard in home equity conversion. Real Estate Economics, 28(1):1–31. Sithole, T. (2004). Projection of mortality rates with specific reference to immediate annuititants and life office pensioners. Tesis doctoral, City University, London. Sithole, T., Haberman, S., y Verrall, R. (2000). An investigation into parametric models for mortality projections, with applications to immediate annuitants’ and life office pensioners’ data. Insurance: Mathematics & Economics, 27(3):285–312. Skarr, D. (2008). Financial planner’s guide to the FHA insured home equity conversion mortgage. Journal of Financial Planning, 21(5):68–75. Tabeau, E., van den Berg Jeths, A., y Heathcote (Eds), C. (2001). A Review of Demographic Forecasting Models for Mortality. Forecasting in Developed Countries: From description to explanation. Kluwer Academic Publishers. Taffin, C. (2006). La hipoteca inversa o vitalicia. Informes externos, Asociación Hipotecaria Española. Thatcher, A., Kannisto, V., y Andreev, K. (2002). The survivor ratio method for estimating numbers at high ages. Demographic Research, 6(1):1–18. Thatcher, A., Kannisto, V., y Vaupel, J. (1998). The force of mortality at agex 80 to 120. Odense, Denmark: Odense University Press. Thiele, P. (1972). On a mathematical formula to express the rate of mortality throughout the whole of life. Journal of the Institute of Actuaries, 16:313–329. Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley, Reading Massachusetts. Tuljapurkar, S. y Boe, C. (1998). Mortality change and forecasting: How much and how little do we know. North American Actuarial Journal, 2(4):13–47. Turner, H. y Firth, D. (2006). Generalized nonlinear models in R: An overview of the gnm package. R package version 0.9-1. Vaupel, J., Manton, K., y Stallard, E. (1979). The impact of heterogeneity in individual frailty on the dynamics of mortality. Demography, 16:439–454. Vegas, A. (1982). Estadı́stica, Aplicaciones Económicas y Actuariales. Piramide, Madrid. Villalón, J. G. (1994). Manual de Matemáticas Financiero-Actuariales. Fernández Ciudad, S L, Madrid. 98 BIBLIOGRAFÍA Villalón, J. G. (1997). Operaciones de seguros clásicas y modernas. Pirámide, Madrid. Wang, J. (2005). Encyclopedia of Biostatistics, capı́tulo Smoothing Hazard Rates. Willey, 2nd edición. Wang, J., Müller, H., y Capra, W. (1998). Analysis of oldest-old mortality lifetables revisited. The Annals of Statistics, 26(1):126–163. Wang, L., Valdez, E., y Piggott, J. (2007). Securization of longevity risk in reverse mortgages. Stockholm, Sweden. 1st Life Section Colloquium. Wilmoth, J. (1993). Computational methods for fitting and extrapolating the LeeCarter model of mortality change. Technical report, Departament of Demography, University of California, Berkeley. Wilmoth, J. (1996). Health and Mortality among Elderly Populations, capı́tulo Mortality projections for Japan: A comparison of four methods, páginas 266–287. Oxford University Press. Wong-Fupuy, C. y Haberman, S. (2004). Projecting mortality trens: Recent developents in the United Kingdom and the United States. North American Actuarial Journal, 8(2):56–83. Índice alfabético algoritmo de median-polish, 37 anualidades, 62 hipótesis de estacionariedad, 12, 14 hipoteca inversa, 61, 62, 69, 70 bondad de ajuste, 22, 23, 33 bondad del ajuste, 51 identificabilidad, 49 inicialmente expuestos al riesgo, 21, 46 interés técnico, 63 intervalos de confianza, 22, 30, 40, 41, 45, 52, 53 capital diferido, 63 cohort, 51, 52 cohorte, 22, 28–30, 35 cuotas constantes, 63 cuotas variables, 64 joroba de los accidentes, 8, 9, 16, 25, 50, 53 edad actuarial, 11 edad de fallecimiento, 5, 11 edad entera alcanzada, 11 edad máxima, 7 efecto cohorte, 31, 36, 38 esperanza de vida abreviada, 9 esperanza de vida residual, 13, 22, 39–41, 45, 55, 56, 61 estimaciones brutas, 21, 23, 46 expansión, 15 factor de actualización, 13, 63, 64 factor de capitalización demográfico financiero, 63 factores de mejora de la mortalidad, 33 factores de reducción, 22, 33–35 fuerza de mortalidad, 6–9, 11, 36 función de riesgo, 6 función de supervivencia, 6 graduación, 21–23, 28, 32, 36 hipótesis de Balducci, 10, 11 kernel, 22, 35 lı́mite superior de supervivencia, 5 longevidad, 21, 39, 45 mı́nimos cuadrados ponderados, 25 median polish, 22 modelo lineal generalizado, 33 modelos frágiles, 39 modelos lineales generalizados, 22, 27 modelos no paramétricos, 22, 35 modelos paramétricos, 21, 22 p-splines, 22, 36 Principio de estacionariedad, 14 Principio de homogeneidad, 14 Principio de independencia, 14 probabilidad de morir, 6, 25 probabilidades de muerte, 15, 21, 26, 27, 31, 41, 45 rectangularización, 15 rentas, 61 rentas vitalicias, 5, 62, 63 99 100 ÍNDICE ALFABÉTICO rentas vitalicias fraccionadas, 67 riesgo crossover, 69 riesgo de la longevidad, 39, 69 riesgo de ocupación, 69 sı́mbolos de conmutación, 12, 13, 61, 63, 64, 67 seguro multirriesgo, 71 seguros, 5, 13, 39 sobreparametrización, 23 tabla de mortalidad, 5, 7, 9, 12, 14, 34, 39, 40, 45, 61 tabla de mortalidad dinámica, 14, 21 tabla de mortalidad estática, 14, 21 tabla de vida, 5 tanto anual de fallecimiento, 12 tanto anual de supervivencia, 13 tantos interanuales, 11 tiempo biológico, 13, 14 tiempo cronológico, 13, 14, 22 tiempo futuro de supervivencia, 5