Simulación de Montecarlo La simulación de montecarlo aplicada a un caso de la vida real para simular la evolución de un portafolio de inversión Alejandro Bianchi,CFA abianchi@ahorraronline.com Bullet Points del Workshop Repaso de números aleatorios – Ejemplo simple Repaso de probabilidad Ejemplo en excel de simulación de dos CF con Variables aleatorias de distribución uniforme Confección de un portafolio eficiente y uso de la herramienta de Montecarlo para simular los escenarios de rendimiento futuro -2- Universidad del CEMA Aplicaciones -3- Universidad del CEMA Ejemplo – Planificación de Inversiones usando Simulación Cuando planificamos, manejamos factores sobre los que no tenemos certidumbre respecto del valor que tendrán a futuro. Un número aleatorio es aquel obtenido al azar, es decir, que todo número tenga la misma probabilidad de ser elegido y que la elección de uno no dependa de la elección del otro. El ejemplo clásico más utilizado para generarlos es el lanzamiento repetitivo de una moneda o dado ideal no trucado. -4- Universidad del CEMA Métodos de generación de números aleatorios o Métodos manuales, lanzamiento de monedas, lanzamientos de dados, dispositivos mecánicos, dispositivos electrónicos o Métodos de computación analógica, son métodos que dependen de ciertos procesos físicos aleatorios, por ejemplo, el comportamiento de una corriente eléctrica. o Métodos de computación digital, cuando se usa el ordenador digital. o Tablas de bibliotecas, son números aleatorios que se han publicado; de los cuales podemos encontrar listas en los libros de probabilidad y tablas de matemáticas. Estos números fueron generados por alguno de los métodos de computación analógica. -5- Universidad del CEMA Cómo obtenemos un número aleatorio con una pc pc… … En las computadoras es fácil simular la generación de números aleatorios, mediante mecanismos de generación de números pseudoaleatorios, que, sin ser aleatorios (siguen una fórmula), lo aparentan. ¿QUÉ SON LOS NÚMEROS PSEUDOALEATORIOS? Son unos números generados por medio de una función (determinista, no aleatoria) y que aparentan ser aleatorios. Estos números pseudoaleatorios se generan a partir de un valor inicial aplicando iterativamente la función. La sucesión de números pseudoaleatorios es sometida a diversos tests para medir hasta qué punto se asemeja a una sucesión aleatoria . -6- Universidad del CEMA Ejemplo – Generación de un número pseudoaleatorio con Excel Lineal Congruential Generator (LCG): – Responde a la siguiente función: =RESIDUO DE (B* semilla + A) DIVIDIDO POR m – Semilla: del que parto para iniciar la serie de números aleatorios – B: multiplicador – A: incremento – m: número divisor Problema: son pseudoaleatorios, ya que, al responder a una fórmula son fácilmente pronosticables. Ejemplo en excel de confección de un número aleatorio -7- Universidad del CEMA Limitantes del cálculo de aleatorios LCG La limitante de LCG, es que existe correlación lineal entre los sucesivos números aleatorios por eso es que si uno los grafica en 3D, aparecen en vectores hyperplanos (líneas) -8- Universidad del CEMA Tres formas de cálculos de números pseudoaleatorios Random de VBA Usando fórmula Random() del excel 97 Excel's RAND Visual Basic's Rnd 1 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0.8 0.6 0.4 0.2 0 0.7 0.70002 0.70004 0.70006 0.70008 0.7 0.7001 0.70002 0.70004 0.70006 0.70008 0.7001 Barreto Random Barreto/Howland's Random (FMRG) 1 Si bien el sistema de Barreto-Holwland mantiene la aleatoriedad, no significa que sea perfecto. Sino que exhibirá una estructura de dependencia a grandes dimensiones. 0.8 0.6 0.4 0.2 0 0.7 0.70002 0.70004 0.70006 -9- 0.70008 0.7001 Universidad del CEMA Ejemplo – Planificación de Inversiones usando Simulación Los seres humanos vivimos en un medio aleatorio y nuestro comportamiento lo es también. Si deseamos predecir el comportamiento de un material, de un fenómeno climatológico o de un grupo humano podemos inferir a partir de datos estadísticos. Para lograr una mejor aproximación a la realidad nuestra herramienta predictiva debe funcionar de manera similar: aleatoriamente. De esa necesidad surgieron los modelos de simulación. - 10 - Universidad del CEMA Funciones de distribución Un número aleatorio es un resultado de una variable al azar especificada por una función de distribución. Cuando no se especifica ninguna distribución, se presupone que se utiliza la distribución uniforme continua en el intervalo [0,1). Ejemplo en excel de simulación de dos CF con Variables aleatorias de distribución uniforme - 11 - Universidad del CEMA DISTRIBUCIONES DE PROBABILIDAD - 12 - Universidad del CEMA Puedo definir 1 o más variables en cada momento del tiempo Variable a predecir Impacto en un Cash Flow a futuro HOY 0 1 2 3 4 5 6 7 8 9 10 11 12 Variables a predecir HOY 0 1 2 3 4 5 6 7 8 9 10 11 12 Impacto en un Cash Flow a futuro en función de lo que valga la variable mes a mes - 13 - Universidad del CEMA En este escenario deberíamos pensar si quisiéramos simular el comportamiento de un portafolio a futuro Múltiples variables Variables a predecir HOY 0 1 2 3 4 5 6 7 8 9 10 11 12 En cada momento del tiempo Con una distribución para cada variable Y una correlación con las otras variables - 14 - Universidad del CEMA Aplicación a un portafolio de inversión - 15 - Universidad del CEMA Un modelo empírico… Elección del portafolio: •Un cliente nos ha solicitado la construcción de un portafolio. En base a las características del cliente y de los parámetros de retorno esperado, varianza y correlación del universo de activos se han seleccionado los siguientes: •Cada uno de estos activos tendrá un porcentaje de participación determinado por el portfolio manager en la cartera. Con las series de estos activos construiremos la posible evolución de los fondos de nuestro cliente en el tiempo. - 16 - Universidad del CEMA Un modelo empírico… Formato de las series: * La compresión de los datos que fue utilizada es de carácter mensual. Se optó por dicho período para evitar problemas en el cálculo de las correlaciones con otras series por feriados distintos entre países y para tener suficiente confianza estadística por el tamaño de las series. A su vez la elección desde el punto de vista empírico estuvo basada en la inexistencia de series homogéneas de largo plazo de compresión semanal. * De acuerdo a datos obtenidos de la Reserva Federal es posible medir la distancia entre los picos de los ciclos económicos norteamericanos. La misma, en los últimos 40 años, ha durado aproximadamente 10 años (del 60 al 70 - del 70 al 80 (con interrupciones) - del 81 al 91 - del 90 al 01 - 01 a 07). En función al ciclo americano es que el modelo buscará en la práctica incrementar las series hasta alcanzar 3 ciclos para dar sustentabilidad al modelo (30 años de datos). * El modelo es de naturaleza empírica, con lo cual, las series del estudio se actualizarán todos los años para seguir teniendo vigencia. La actualización debe correr antes de la fecha de rebalanceo del portafolio de los clientes. Las series tendrán siempre 30 años de datos, de manera que al pasar un año se elimina el primer dato de la serie y se agrega el dato del año más reciente. Sin embargo, por una restricción puramente empírica el modelo comenzará con 20 años de datos históricos e irá sumando año a año datos a la serie hasta alcanzar los 30 años de datos. - 17 - Universidad del CEMA Algunas consideraciones preliminares… * Uno de los supuestos más fuertes del modelo es que los rendimientos futuros de los activos a futuro tendrán una distribución similar al rendimiento rolling anual de los últimos 20 años. * Desde el punto de vista empírico está demostrado que el S&P 500 no ha dado rendimientos negativos por más de dos años consecutivos. Esto determinará el mínimo plazo de inversión para diversificar una cartera en acciones. El portafolio del cliente estará invertido a no menos de 3 años de plazo. - 18 - Universidad del CEMA Las acciones en Estados Unidos subieron 2 de cada 3 días de operatoria en los últimos 100 años - 19 - Universidad del CEMA Construcción de las series del modelo *Cada una de las series consideradas en el modelo es "Net Total Return", es decir, tiene en cuenta los dividendos que se hubieran obtenido así como las ganancias de capital y los gastos de administración e impuestos incurridos. •*Las series de precios de los activos considerados en el modelo son convertidas a series de rendimiento logarítmico rolling anuales. •* Ajustamiento de las series. A cada serie, en base a su rendimiento histórico se le asigna una distribución de probabilidades. Dicha distribución surge de la función “Fitting” del programa “@Risk” - 20 - Universidad del CEMA Por qué usar series logarítmicas? Aplicando una tranformación logarítmica (LOG(SP500)) obtenemos un patrón de crecimiento más lineal. S&P500 stock index, valores mensuales desde 1971 hasta 1995. Al calcular la primera diferencia de la serie DIFF(LOG(SP500)), se logra una estabilización de la varianza. Calculando la primera diferencia de la serie, se obtiene un serie cuya varianza crece a medida que aumenta el nivel de la variable original mientras pasa el tiempo (serie heteroscedástica). - 21 - Universidad del CEMA Se busca la distribución de cada una de las series con @Risk @Risk - 22 - Universidad del CEMA El programa hace el best fit de la serie y nos arroja una distribución…. - 23 - Universidad del CEMA Para cada valor simulado en base a la distribución le agregamos que además tenga en cuenta la correlación con otros activos para que no arroje valores de laboratorio… Matriz de Correlaciones: El objetivo de esta matriz es captar la correlación (que indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias) existente entre los distintos índices de manera que al simular los rendimientos, los mismos no sean generados solo en base a su distribución de probabilidades sino que también tenga en cuenta la relación con otros activos. - 24 - Universidad del CEMA Evolución de los fondos en base a la simulación de montecarlo Simulación de Montecarlo: Basados en la series ajustadas, las distribuciones obtenidas con el programa "@Risk" y las correlaciones de los activos entre si se realizó una simulación de montecarlo para obtener distintas rentabilidades aleatorias, generando así como outputs del modelo 500 caminos de rendimientos. - 25 - Universidad del CEMA