Kandinsky, Composición VIH, Óleo sobre lienzo, 1923. LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACION EN PROBABILIDAD Carmen Batanero LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACION EN PROBABILIDAD La probabilidad es un campo donde los modelos simples se componen entre sí de una forma muy potente, partiendo de unas pocas ideas estocásticas fundamentales. Aún así, la matemática de la probabilidad es muy compleja, más allá de unos pocos desarrollos elementales y sus resultados son bastante contraintuitivos. La simulación o sustitución de un experimento aleatorio por otro equivalente, como modelo pseudo concreto de la situación modelizada, permite prescindir del aparato matemático para analizar situaciones estocásticas. Como recurso didáctico, puede ayudar a comprender la diferencia entre modelo y realidad y a mejorar las intuiciones sobre la aleatoriedad. Como contrapartida, la simulación no nos proporciona justificaciones ni demostraciones, que debemos buscar de nuevo en el modelo matemático. LA SIMULATION, EN TANT QUINSTRUMENT DE MODELISATION EN PROBABILITE La probabilité constitue un domaine dans lequel les modeles simples se composent entre eux aune maniere assez puissante, en partan! de quelques idees hasardeuses fundamentales. Néanmoins, les mathématiques de la probabilité sont tres complexes, au-delá de quelques développements élémentaires et leurs résultats sont assez contre intuitifs. La simulation ou substitution d'une expérience aléatoire pour une autre equivalente, en tant que modele pseudo-concret de la situation modélisée, permet de ne pas teñir compte du systéme mathématique pour analyser des situations hasardeuses. En tant que ressource didactique, la probabilité peut aider á comprendre la différence entre modele et réalité et á améliorer les intuitions autour de Taléatoire. En contrepartie, la simulation ne nous fournit ni justificalions ni demonstrations. Celles-ci, nous devons les chercher á nouveau dans le modele mathématique. SIMULATION AS AN INSTRUMENT OF MODELLING IN PROPABILITY Probability is a field where simple models are conformed themselves in a very powerful way, starting from few stochastic fundamental ideas. Even though, Mathematics of probability is very complex, farther than a few bask developments, and its results are contraintuitive enough. Simulation or replacement of a random experiment for an equivalent one as a pseudo-concrete model of a modeled situation, allozos to disregard the mathematical apparatus to analyze stochastic situations, ^s a teaching resource, it can help to understand the différence between model and reality and also to improve intuitions at random, ^s a compensation, simulation does not provide justifications ñor demonstrations which we have to lookfor again in the mathematical model. Matemática de la probabilidad, simulación, didáctica de las matemáticas Mathematics of probability, simulation, teaching of Mathematics LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACION EN PROBABILIDAD Carmen Batanero* Estadística y modelización ran parte de la actividad matemática (y particularmente la estadística) puede ser descrita como proceso de modelización. En términos de Henry, "un modelo es una interpretación abstracta, simplificada e idealizada de un objeto del mundo real, de un sistema de relaciones o de un proceso evolutivo que surge de una descripción de la realidad" (1997, 78). G La construcción de modelos, su comparación con la realidad y su perfeccionamiento progresivo intervienen en cada fase de la resolución de problemas estadísticos, no sólo en el análisis de datos en situaciones prácticas, sino también en el trabajo de desarrollo teórico. Un ejemplo notable de modelización estadística a partir de un problema práctico son las distribuciones de probabilidad, que permiten describir en forma sintética el comportamiento de las distribuciones empíricas de datos estadísticos y hacer predicciones sobre su comportamiento. Por ejemplo, el modelo de la curva normal de media cero describe con notable precisión la distribución empírica de los errores al realizar medidas repetidas de una misma cantidad (o al tratar de fabricar un cierto producto con una medida fija). Una vez aceptado este modelo como una buena descripción de nuestros datos, basta obtener una estimación de la dispersión en los errores de medida (una esti­ mación de la desviación típica a en la población de los posibles errores) para tener el modelo completamente determinado. Las aplicaciones prácticas que podemos deducir seguidamente son muy variadas: previsión del número de defectos (piezas que se saldrán de los límites considerados como "normales"); decisión sobre límites de garantías; coste de la política de garantía; criterios para considerar que el proceso de producción está "controlado", etc. Otro modelo muy potente, deducido esta vez a partir de un problema teórico en análisis multivariante, es representar una unidad es­ tadística (por ejemplo, un alumno al que hemos dado un cuestionario) por un punto de un espacio vectorial, cuyas coordenadas son los valores de las diferentes variables incluidas en el estudio (las respuestas dadas a los diferentes ítems del cuestionario). Considerados los sujetos como "puntos" y las variables como "ejes" en dicho espacio vectorial, esta "metáfora" nos permite definir distancias para estudiar la proximidad entre dos puntos Departamento de Didáctica de la Matemática, Universidad de Granada. Dirección electrónica: batanero@ugr.es REVISTA EDUCACIÓN Y PEDAGOGÍA VOL. XVNo. 35 39 LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACIÓN EN PROBABILIDAD I (análisis de aglomerados) o analizar la dimensión del espacio vectorial, tratando de reducirla (análisis factorial). Estos dos ejemplos muestras que la modeli-zadón forma parte inseparable de la actividad estadística. Como indica McLean (2001), en este sentido, el razonamiento estadístico no es muy diferente del razonamiento científico o incluso del razonamiento "cotidiano". Constantemente usamos modelos, aunque no seamos conscientes de ello, y así nos formamos modelos de las personas de acuerdo a su raza, sexo, condición social o aspecto. Sin embargo, es poco habitual que la enseñanza de la estadística en secundaria o incluso en la universidad enfatice en la modelización. Esto puede explicar el hecho de que los alumnos tengan dificultad en reconocer el modo particular de razonamiento estadístico, en el cual la modelización juega un papel muy importante. Modelización y enseñanza de LA PROBABILIDAD Enseñar la probabilidad como una actividad de modelización y no como un conjunto de teoremas matemáticos que se deducen de una serie de axiomas no es una tarea sencilla. Para facilitar este trabajo a los profesores, la Comisión ínterIREM1 para la enseñanza de la estadística y probabilidad organizó hace unos años un proceso de reflexión sobre el trabajo de modelización en la enseñanza de las probabilidades, produciendo algunas sugerencias que trataremos de reflejar a lo largo de este trabajo. Dentro de ellas, Dantal (1997) señala los si­ guientes pasos para la enseñanza de la pro­ ACIÓN EN PROBABILIDAD habilidad en secundaria con el enfoque reco­ mendado en los nuevos currículos franceses: 1. 2. 3. 4. 5. Observación de la realidad Descripción simplificada de la realidad Construcción de un modelo Trabajo matemático con el modelo Interpretación de resultados en la realidad Indica también que los profesores solemos tener prisa por llegar a los pasos 3 y 4 (los que podrían parecer "verdaderas matemáticas"), puesto que son los más sencillos de enseñar a nuestros alumnos. Sin embargo, todas las etapas son igualmente importantes en el aprendizaje si queremos que realmente ellos lleguen a comprender la utilidad y la razón de ser de las matemáticas. Estas etapas son cuidadosamente analizadas por Coutinho (2001) en una experiencia de enseñanza de la actividad de modelización de situaciones aleatorias ele­ mentales. En el paso 1, una primera dificultad es dife­ renciar, dentro de los fenómenos en los que el azar está presente, entre situación aleatoria y contingente. Una situación aleatoria es, por lo menos potencialmente, reproductible. Tiene diferentes resultados posibles, sin que sepamos con seguridad cuál será el que ocurrirá en una experiencia particular (por ejemplo, no sé con seguridad el tiempo que debo esperar en la parada a que aparezca el autobús). Pero puedo reproducir la situación en las mismas condiciones para analizar los diferentes resultados que se producen (puedo hacer un recuento del tiempo de espera al autobús). En una situación contingente (por ejemplo, el hecho de que yo me haya casado con una cierta persona) también hay una presencia del azar, pero no es reproductible en las mismas con­ diciones. 1. Los IREM (Instituts de Recherche sur ¡'Enseignement des Mathématiques) son centros de investigación y desarrollo en didáctica de las matemáticas en diversas localidades francesas. Hay un total de 15 comisiones ínter - IREM, que agrupan investigadores interesados en un mismo tema, para realizar un trabajo cooperativo. 40 REVISTA EDUCACIÓN Y PEDAGOGÍA V O L . X V N o . 3 5 ENSEÑANZA DE LAS MATEMÁTICAS Una vez aceptada la aleatoriedad de la situación, en el paso 2 debemos realizar una descripción simplificada de la misma que nos permita pasar de la realidad observada (paso 1) a la construcción del modelo (paso 3). Para ello tomamos unos aspectos de ésta y prescindimos de otros. En el ejemplo del autobús, deberemos decidir qué parada elegimos, si esperamos un autobús dado (el número 1) o si contamos el tiempo hasta que aparezca en la parada cualquier autobús. También si diferenciamos la hora del día o el día de la semana, o no. Todos estos puntos serán importantes para tratar de encontrar un modelo que nos describa el tiempo de espera, y se requiere del juicio personal y del análisis cuidadoso de la situación para decidir cuáles de los aspectos de la realidad son los que realmente nos parecen necesarios para resolver el problema que tengamos entre manos y de cuáles podemos prescindir. Surge así la idea de experimento aleatorio y como en todo experimento científico, Countinho (2001) sugiere que es importante establecer las condiciones de realización u observación, es decir, describir con detalle el protocolo experimental. Al comenzar la construcción del modelo (punto 3), de nuevo se precisan una serie de decisiones: ¿aceptamos que el tiempo de llegada del próximo autobús es independiente del que acaba de llegar? ¿Trataremos los tiempos como variable continua? ¿Cuáles son otras variables, además del tiempo de espera, que me podrían interesar en el trabajo con el modelo? Una vez que hemos construido un modelo matemático para la situación (por ejemplo, aceptamos que los tiempos de espera siguen una distribución uniforme entre un autobús y otro) y obtenidas las conclusiones a partir del modelo, queda todavía la parte más importante: comparar estas conclusiones con el comportamiento real de la situación analiza­ REVISTA EDUCACIÓN Y PEDAGOGÍA VOL. XVNo. 35 da y decidir si el modelo matemático nos pro­ porciona una buena descripción de la realidad. En esta breve descripción de los pasos esenciales en la actividad de modelización reconocemos el funcionamiento de la actividad de investigación y también de la forma en que aprendemos en la vida diaria. Nuestro conocimiento científico (y también el obtenido en la vida diaria) se compone de datos o hechos (la parte observable de nuestro universo) y teorías o modelos (que tratan de explicar y relacionar estos hechos entre sí). El propósito de construir un modelo es obtener una mejor comprensión de una parte de nuestro universo y, así, poder predecirla y, si es posible, controlarla. Un modelo no es "real", ni tampoco "verdadero"; en el mejor de los casos es consistente y concordante con las observaciones. Esto se olvida con facilidad y se suele confundir "modelo" y "realidad". Es importante resaltar que el mejor modelo no es aquél que se aproxima más a los datos, sino que muchas veces es uno que, siendo simple, nos proporcione una buena aproximación. Por ello mismo, incluso fenómenos que tienen naturaleza determinista y no siempre pueden medirse con precisión, se describen a veces mejor con un modelo probabilístico. En otros casos (Cabria, 1997), el fenómeno tiene una naturaleza de azar absoluto, como ocurre con la mecánica cuántica, por lo que las leyes que lo gobiernan tienen naturaleza aleatoria y el cálculo de probabilidades se convierte en un instrumento esencial para analizarlos. La aleatoriedad como MODELO MATEMÁTICO Una característica particular de la estadística y de la probabilidad es la existencia de problemas filosóficos ligados a la definición e interpretación de algunos de sus conceptos bási41 LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACIÓN EN PROBABILIDAD cos. Aunque la teoría matemática correspon­ diente no presenta ninguna contradicción y está bien asentada a partir de la axiomática de Kolmogorov, al intentar aplicar en situacio­ nes prácticas las ideas estocásticas fundamen­ tales, nos encontramos con frecuencia dificul­ tades y paradojas. Esto ocurre precisamente porque olvidamos la diferencia entre el mo­ delo y la realidad, y porque no podemos en­ contrar en la matemática un criterio que apli­ cado mecánicamente nos lleve a la decisión de aceptar o rechazar un modelo para descri­ bir una cierta parcela de la realidad. ducida debe ajustarse a una serie de modelos deducidos del mismo. Consideremos el si­ guiente ítem propuesto a los niños por Green: Se pidió a algunos niños lanzar una moneda 150 veces. Algunos lo hicieron correctamen­ te. Otros hicieron trampas. Anotaron con la letra c la aparición de una cara y con + una cruz. Estos son los resultados de Clara y Lui­ sa: Clara: C+C+ +CC+ +CC+C+C+ +C+ +C+CCC+ + +CCC+ C+ +C+C+C+ +CC+CCC+C+C+CC+ + +CC+ +C+C+ Como argumentamos en Batanero y Serrano (1995), la misma idea de aleatoriedad no tiene una definición simple y es difícil de aplicar en las situaciones prácticas. A lo largo de la histo­ ria ha recibido diferentes interpretaciones, ninguna satisfactoria y la definición estadísti­ ca no siempre resulta convincente. Zabell (1992) diferencia dos aspectos distintos que, a veces, pueden no coincidir, en la idea de alea­ toriedad: C+C+ +CC + C+C+CC+C+ C+ +CC+CC+C+ +CC+C+C+ + +CCC+CC+ +C+ +CC+ +C+ +CC+ +C+C+ + + +c + + C+ + +C + C+ +CCC+ + Luisa: +CC+ + C+ C + + + +C+ + + + + + +C+CC+ +C+C+C CCCCC + CCC + + CCC + + + +CCCC+ + + + +CCCC+ + +CC+CCC+ + + C+ C + + +CCCCCC+CCC+C+C + ccccccccc +C+C+CC+CC+CC+ + + + + + c + + ccccccc +C+CC + +CCC+ +CCC • el proceso de generación, que es lo que ma­ temáticamente se conoce como experimen­ to aleatorio; ¿Hicieron trampas Clara o Luisa? ¿Por qué? (1983, 768). • Resolver este problema implica asumir un modelo de comportamiento de un proceso aleatorio y comparar los resultados de Daniel y Diana con los que esperaríamos si el mode­ lo fuese cierto. Una idea intuitiva que aplican los alumnos a los que se proporciona este ítem es contar la frecuencia de caras y cruces. Pues­ to que las secuencias tienen una longitud de 150 lanzamientos, teóricamente esperaríamos una frecuencia aproximada de 75 caras y 75 cruces. En la tabla 1 mostramos las frecuen­ cias de caras y cruces obtenidas para Clara y Luisa. En principio, nos parece que Luisa se desvía más de lo esperado en una secuencia aleatoria, pero quizás no tanto para poder acu­ sarla de hacer trampa. el patrón de la secuencia aleatoria produ­ cida como consecuencia del experimento. Una paradoja es que, por un lado, en la acep­ ción de Kolmogorov (Fine, 1971), una secuen­ cia sería aleatoria si no se puede codificar en forma más abreviada, por lo que la ausencia de patrones periódicos sería su característica esencial. Por otro, la visión estadística esta­ blece que un fenómeno es aleatorio si se ajus­ ta al cálculo de probabilidades. Pero, aceptar incluso el modelo aleatorio más simple posi­ ble: experimento realizado repetida e indepen­ dientemente, con sólo dos posibles resultados (sucesión de ensayos de Bernoulli), tiene como consecuencia que la secuencia aleatoria pro­ 42 REVISTA EDUCACIÓN Y PEDAGOGÍA VOL.XVNo.35 ENSEÑANZA DE LAS MATEMÁTICAS En lugar de contar en las secuencias los resul­ tados del experimento simple consistente en lanzar una moneda, podríamos considerar que las niñas lanzan las monedas de 2 en 2 (por tanto, hay 75 repeticiones del experimento). Hay cuatro resultados equiprobables al lanzar una moneda, por lo que, redondeando un poco, podemos esperar que aparezcan aproxi­ madamente 18 veces cada uno de los posibles resultados. En la tabla 2 mostramos los resultados obtenidos para Clara y Luisa, y ahora parece que es REVISTA EDUCACIÓN Y PEDAGOGÍA VOL. XVNo. 35 Clara la que más se aparta de lo esperado. Esto se confirma en la tabla 3, cuando hacemos una prueba de todos los resultados en el experimento consistente en lanzar tres monedas. Ahora nuestras sospechas indican que es Clara la que hacía trampa (una prueba formal de contraste de Chi-cuadrado daría un valor significativo de la prueba de pares y triples para el caso de Clara, mientras que el resultado no sería significativo en ninguna de las tres pruebas para Luisa). 43 LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACIÓN EN PROBABILIDAD Tabla 3 Frecuencias de los diferentes resultados al lanzar las monedas 3 a 3 CCC CC+ C+C C++ +CC +C+ ++C +++ Clara 0 2 14 9 6 7 10 1 Luisa 8 11 6 4 6 4 5 6 Teórica 6 6 6 6 6 6 6 6 El ejemplo que hemos analizado nos muestra, por un lado, la dificultad de aplicar la idea de aleatoriedad en una situación práctica, por lo engañoso de nuestras intuiciones, incluso a pesar de haber estudiado estadística. Suelo proponer este problema a mis alumnos del curso Didáctica de la estadística (en la Licenciatura de Ciencias y Técnicas Estadística) y desde luego es frecuente que, al dar una primera solución al problema, muchos piensen que es Luisa la que hace trampa, ya que la frecuencia de caras y cruces difiere más en ella que en Clara, respecto a lo esperado. Por otro, el ejemplo nos muestra que la alea­ toriedad no admite una definición simple y ni siquiera puede describirse por un único modelo. En la situación propuesta, necesitamos varios para decidir sobre la aleatoriedad de las dos secuencias. En realidad, la secuencia de Bernoulli contiene muchos modelos de probabilidad asociados, como la distribución binomial o geométrica. Aunque ya tenemos la sospecha de que Clara hace trampa, serían necesarias todavía nuevas pruebas para dejar a Luisa libre de sospechas. El ejemplo también muestra con claridad la diferencia entre modelo y realidad. De hecho, no esperamos que la sucesión de Clara o Luisa sean "exactamente iguales al modelo" y admitimos como "razonables" unas desviaciones respecto a lo esperado en el modelo, siempre que sean pequeñas. 44 Una cuarta consecuencia es la dualidad esta­ dística-probabilidad. Sólo con la recogida y análisis de datos (análisis de los patrones en las secuencias de Clara y Luisa) podemos poner a prueba si el modelo probabilístico es adecuado para describir la situación (para decidir si las niñas hacen trampa o no). Por último, observamos que la matemática no nos da ninguna regla inamovible para decidir si aceptamos o no el modelo como bueno. Incluso cuando llegásemos a realizar formalmente los contrastes de Chi-cuadrado, lo más que obtendríamos es un valor de probabilidad p (la probabilidad de obtener el resultado dado) para cada una de las tres pruebas. Pero, decidir cuan pequeña debe ser esta probabilidad para asegurar que Clara hace trampa, es el riesgo que tengo que asumir, fruto de una decisión personal. Y puesto que esta probabilidad nunca será igual a cero, siempre puedo equivocarme, incluso aunque el riesgo sea pequeño. Esta es precisamente una característica importante del razonamiento estadístico. La estadística nos proporciona unos modelos para controlar la incertidumbre y conocer los riesgos que asumimos de antemano, pero nunca puede anular la incertidumbre, que es una característica del mundo en el que nos desenvolvemos. REVISTA EDUCACIÓN Y PEDAGOGÍA V O L . X V N o . 3 5 ENSEÑANZA DE LAS MATEMÁTICAS La simulación: entre modelo MATEMÁTICO Y REALIDAD En la sección anterior hemos resuelto el pro­ blema de decidir cuál de las dos niñas hace trampa, con recursos matemáticos sencillos. En concreto, hemos empleado las ideas de experimento y suceso aleatorio, equiprobabilidad de resultados, la regla de construcción del espacio muestral en un experimento compuesto de dos y tres experimentos simples, frecuencias esperadas y observadas en la repetición de un experimento. Un estudio más completo de la actividad im­ plicaría una matemática más compleja. Por ejemplo, el estudio del número de caras en n lanzamientos de la moneda llevaría a la distri­ bución binomial B(n, p). El efecto que sobre ella tendría sobre la secuencia el introducir un sesgo en la moneda, requeriría el estudio de la variación de los coeficientes binomiales en función de p. Los casos de p muy pequeña (distribución de Poisson) o n muy grande (teo­ remas de límite) quedaría seguramente fuera del alcance de un alumno de secundaria. No obstante, la exploración de estas posibilidades y de sus aplicaciones a casos reales son los que dan mayor interés al estudio de la probabilidad. Una pregunta que sin duda se plantea el profesor es si sería disponible realizar un estudio intuitivo de estos temas con ayuda del material concreto, calculadoras u ordenadores. Afortunadamente, contamos con la simulación, que para Heitele (1975) es, en estadística, algo parecido a lo que constituye el iso-morfismo en otras ramas de las matemáticas. En la simulación ponemos en correspondencia dos experimentos aleatorios diferentes, de modo que a cada suceso elemental del primer experimento le corresponda un suceso elemental del segundo y sólo uno, y los sucesos puestos en correspondencia en ambos experimentos sean equiprobables. Como indica Girard (1997), al trabajar mediante simulación REVISTA EDUCACIÓN Y PEDAGOGÍA VOL XVNo.35 estamos ya modelizando, porque debemos no sólo simplificar la realidad, sino fijar los aspectos de la misma que queremos simular y especificar unas hipótesis matemáticas sobre el fenómeno estudiado. Por ejemplo, podemos simular el experimento aleatorio consistente en observar el sexo de un recién nacido mediante el experimento también aleatorio de lanzar una moneda al aire. Ahora bien, son muchos los aspectos que podríamos estudiar sobre un recién nacido, como el grupo sanguíneo, su peso o su raza, que no podrían simularse con el lanzamiento de la moneda. También hacemos una hipótesis (matemática) sobre equiprobabilidad para los dos sexos, independientemente de la raza, sexo y antecedentes familiares. Sólo una vez que hemos hecho estos supuestos, podremos comenzar el trabajo con la simulación. Lo importante de ésta es que podemos operar y observar resultados del segundo experimento y utilizarlos para obtener información del primero. Por ejemplo, si queremos saber cuál es la probabilidad de que entre cien recién nacidos haya más de un 60% de varones, podemos lanzar, por ejemplo, mil veces cien monedas al aire, estudiar en cada uno de los mil experimentos si hubo o no más de un 60% de nacimientos y obtener una estimación para la probabilidad pedida. La ventaja de la simulación es obvia, incluso en este ejemplo tan sencillo, pues permite condensar el experimento en un tiempo y espacio concreto. Vemos, además, que la simulación es, en sí misma, un modelo de la realidad simulada, puesto que simplifica la propia realidad y supone un trabajo de abstracción sobre ella. Es además un modelo material (o bien algorítmico, si usamos un simulador de una calculadora u ordenador), que nos permite reproducir físi­ camente el experimento y observarlo, y, por tanto, permite un trabajo intuitivo sobre el modelo sin necesidad del aparato matemático. Entre el dominio de la realidad en que se en­ cuentra la situación que queremos analizar y en la que interviene el azar, y el dominio teóri­ 45 LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACIÓN EN PROBABILIDAD co donde, con ayuda de la matemática, cons­ truimos un modelo teórico de probabilidad que debe, por un lado, simplificar la realidad y abstraer sólo sus aspectos esenciales y, por otro, ser útil para interpretar los caracteres retenidos en la modelizadón, Coutinho (2001) sitúa el dominio pseudo-concreto, en el que podríamos trabajar con los alumnos por medio de la simulación. Mientras que en el dominio de la realidad se efectúa una acción o experiencia concreta y en el dominio teórico es característico la re­ presentación formal o simbólica, en el dominio pseudo-concreto se opera mentalmente. En este dominio, el alumno ya ha salido de la realidad y trabaja con una situación abstracta idealizada. Por ejemplo, se imagina que está trabajando con dados perfectos y prescinde de las condiciones del lanzamiento. Al mismo tiempo conserva la denominación de las caras del dado real para nombrar los resultados del dado idealizado. El papel didáctico del modelo pseudo-concreto es inducir implícitamente el modelo teórico a los alumnos, incluso aunque su formulación matemática formalizada no sea posible (Henry, 1997). Para presentar un modelo se pueden utilizar diversos tipos de lenguajes o representaciones. Incluso podemos usar palabras de la vida común, a las que atribuimos nuevos significados más precisos (como el caso que hemos descrito), usando la analogía. Un caso muy interesante son los modelos de urna. Si queremos prever el sexo de un recién nacido podríamos simularlo sustituyéndolo por el experimento que consiste en elegir al azar una bola de una urna en la que introducimos dos bolas de diferente color para representar los dos sexos y en la que volvemos a colocar cada bola en la urna antes de una nueva extracción (muestreo con reemplazamiento). Si queremos simular otro experimento aleatorio con dos sucesos en forma que sus probabilidades sean p y q (p+q=1), basta usar una urna en que se mantengan las proporciones p y q para los dos colores de bolas. Simular un experimento con r sucesos diferen­ 46 tes sólo requiere usar bolas de r colores distintos, respetando las probabilidades correspondientes. Cualquier problema probabilístico implica una serie de experimentos aleatorios compuestos de una determinada manera. Cada uno de estos experimentos puede ser simulado con un modelo de urnas convenientemente escogido (de una forma algo más compleja y usando una transformación inversa de la función de distribución, incluso los modelos continuos de probabilidad podrían simularse indirectamente, mediante este procedimiento). Es decir, es posible asignar el experimento consistente en extraer al azar una bola de una urna con una cierta composición de bolas de colores. El experimento, constituido por varios experimentos simples, se obtiene componiendo las urnas correspondientes a los experimentos simples (obteniendo una hiperurna) y la repetición del experimento global, junto con el análisis de los datos producidos permite una solución aproximada del problema. En este sentido, la urna con bolas de colores (fichas, tarjetas) es un material universal, válido para estudiar cualquier problema o concepto probabilístico. La simulación proporciona un método universal para obtener una estimación de la solución de los problemas probabilísticos, que no tiene paralelo en otras ramas de la matemática. Además de la simulación con modelos de urnas y otros materiales manipulativos, las tablas de números aleatorios son también un instrumento de simulación universal, como hemos mostrado con algunos ejemplos presentados en nuestro libro Azar y probabilidad (Godino, Batanero y Cañizares, 1997). Software para la simulación EN INTERNET Aunque es importante que los alumnos realicen algunas actividades de simulación con apoyo de material manipulativo, como mo­ REVISTA EDUCACIÓN Y PEDAGOGÍA V O L . X V N o . 3 5 ENSEÑANZA DE LAS MATEMÁTICAS nedas, dados o ruletas, con tablas de números aleatorios y calculadoras, es realmente el ordenador el que proporciona una mayor potencia de simulación, construcción de modelos y exploración de los mismos. Las hojas electrónicas proporcionan generadores de números aleatorios, así como de valores de diferentes distribuciones de probabilidad, que pueden, una vez generados, ser analizados con ayuda de los recursos de cálculo y representación gráfica de la hoja. Las posibilidades son todavía mayores con los programa estadísticos que suelen incluir módulos de estudio de las diferentes distribuciones de probabilidad con representación gráfica y cálculo de valores críticos y áreas bajo la función de densidad. Unido esto a la posibilidad de extracción de muestras de valores de estas distribuciones de tamaño dado y al almacenamiento de las mismas en nuevos fi­ cheros de datos que pueden ser analizados, proporcionan una herramienta muy interesante para la introducción de ideas de probabilidad y particularmente de inferencia. Finalmente, existen en internet programas didácticos específicos para explorar conceptos probabilísticos, desde los más elementales a los más avanzados. En lo que sigue mostramos algunos ejemplos de cómo podrían usarse algunos de los simuladores disponibles en internet para complementar el estudio de la actividad que hemos analizado en la segunda sección. La versatilidad de estos programas hace que sean los mismos alumnos los que puedan formular y explorar sus propios problemas e introducirse de forma experimental en la modelización estocástica de un gran número de situaciones reales. Para comenzar, es posible que la solución dada en la sección 2 al problema sobre Clara y Luisa no haya convencido a algunos alumnos, quienes piensen que las rachas de Luisa eran demasiado largas y en una moneda real debiera haber más alternancias entre caras y cruces. Podemos dar a los alumnos la oportunidad de experimentar con el simulador de lanzamientos de monedas de Virtual Laboratories in Pmtabmty and Statistics (htlp/Avvvvvmath.uah.edu/ stat/bernoulli/indexj anl) que hemos reproducido en la figura 1. Figura 1. Simulación de experimentos con monedas Fuente: Virtual Laboratories in Probability and Statistics. Basic Coin Experiment (http: //www .math .uah.edu/stat/bemoulli/index.xml) REVISTA EDUCACIÓN Y PEDAGOGÍA VOL.XVNo.35 47 LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACIÓN EN PROBABILIDAD El programa permite elegir la longitud de la serie de monedas que queremos simular, y el número de simulaciones. Por ejemplo, podríamos simular diez, cien o mil secuencias aleatorias de longitud dada, que quedan almacenadas en la ventana y se pueden analizar posteriormente para estudiar la longitud de las rachas. Podríamos también observar el efecto de cambiar la probabilidad de cara, es decir, introducir un sesgo en la moneda. En las tablas 2 y 3 hemos analizado los lanza­ mientos de monedas de 2 en 2 o de 3 en 3. Podríamos, en general, interesarnos por el lan­ zamiento de n monedas y estudiar la distribución del número de caras en n lanzamientos (modelo binomial). En la figura 2 hemos reproducido los resultados producidos por otro de los programas del mismo laboratorio (Bernouilli triáis: http:// www.math.uah.edu/stat/bernoulli/ index.html). En este caso podemos experimentar tanto con los valores de p como de n para ver el efecto sobre la forma de la distribución, los valores más probables, o la dispersión. Figura 2. Simulación de experimentos binomiales Fuente: Virtual Laboratories in Probability and Statistics, Bernouilli triáis (http: //www .math .uah.edu/stat/bernoulli/index.htmD Un experimento relacionado con el del lanza­ miento de monedas es el aparato de Galton (véase figura 3). Al dejar caer una bola por dicho dispositivo, en cada uno de los pasos la bola puede ir a derecha o izquierda con igual probabilidad. Podemos, entonces sustituir una serie de diez lanzamientos de una moneda por la trayectoria de una bola en un aparato de Galton de diez filas. 48 REVISTA EDUCACIÓN Y PEDAGOGÍA VOL. XV No. 35 ENSEÑANZA DE LAS MATEMÁTICAS Figura 3. Simulación del aparato de Galton Fuente: Virtual Laboratories in Probability and Statistics (http: //www .math .uah.edu/stat/bernoulli/index.html) Nuestra intuición nos indica que en los orificios centrales llegarán más bolas y que la distribución obtenida será aproximadamente simétrica. Sin embargo, nuestra intuición nos juega malas pasadas en algunos otros puntos. Esperamos, por ejemplo, que la trayectoria que sigue la bola al caer corte con frecuencia el eje imaginario que pasa por el centro del dispositivo. Podemos utilizar el simulador disponible en (http: //www .math .uah.edu/stat/ bernoulMndex.htm 1) que reproducimos en la figura 3, para comprobar que esta intuición es errónea. Lo más probable es que la trayectoria esté a uno de los dos lados del eje casi todo el tiempo. Asimismo, podemos experimentar el efecto de añadir más o menos filas de canales, cambiar el valor de p (probabilidad de que la bola vaya a la derecha cada paso) y preguntarnos por qué la distribución que REVISTA EDUCACIÓN Y PEDAGOGÍA VOL. XVNo. 35 obtenemos se parece tanto a la obtenida en el punto anterior (distribución binomial). Y, ¿qué relación tienen estos dos modelos con los co­ eficientes binomiales? ¿Cómo intervienen las combinaciones de m elementos tomados n a n en el cálculo de estas probabilidades y por qué? La trayectoria seguida por una bola en el aparato de Galton nos remite a la caminata aleatoria sobre un plano (véase figura 4). En vez de dejar caer una bola por un canal, imaginamos que avanzamos de izquierda a derecha a lo largo de un eje horizontal. En cada paso, lanzamos una moneda para decidir si subimos o bajamos a lo largo de un eje vertical. Después de n pasos, ¿a qué distancia nos encontramos del eje horizontal? ¿Cuántos cortes habremos dado al eje horizontal? ¿Cuán­ 49 LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACIÓN EN PROBABILIDAD Figura 4. Simulador de la caminata aleatoria Fuente: Virtual Laboratories in Probability and Statistics (http: //www .math .uah.edu/stat/bemoulli/index.htmD tos pasos habrá que recorrer entre dos cortes sucesivos? Estas y otras preguntas similares con probabilidades iguales o diferentes de ir hacia arriba o hacia abajo en cada paso pueden explorarse en el simulador que hemos tomado del mismo laboratorio anterior. Del problema de la caminata aleatoria podemos pasar al de la ruina del jugador. Si los valores positivos y negativos en el eje vertical representan las pérdidas y ganancias en un juego equitativo, la observación de la caminata nos indica que, en contra de nuestras expectativas, es más probable que la mayor parte del tiempo de juego un jugador se mantenga ganando (y el otro perdiendo). Ahora bien, si la cantidad de dinero que uno de los jugadores quiere apostar es limitada (ponemos una cota a los valores negativos), ¿cuál es la probabilidad de ruina del jugador? 50 En algunas situaciones estamos interesados por distribuciones aleatorias espaciales, por ejemplo, la distribución de conchas en la arena de la playa, de erratas en las páginas de un texto, de nidos o árboles en el campo. Si queremos explorar las distribuciones aleatorias de puntos en el espacio (modelo de Poisson), podemos utilizar el simulador que reproducimos en la figura 5 que hemos obtenido del simulador disponible en (http://www.dart mouth.edu/~chance/teaching aids/ books articles/probability book/bookapplets/ chapter5/LondonBombs/LondonBombs.html)y analizar de nuevo el efecto de aumentar el número de puntos y la relación con la distribución binomial. Tanto en este caso como en los dos anteriores, para valores de n grandes aparecerá la característica forma de campana de la distribución normal y llevará a la pregunta de si es posible aproximar distribucio­ REVISTA EDUCACIÓN Y PEDAGOGÍA VOL. XVNo. 35 ENSEÑANZA DE LAS MATEMÁTICAS Figura 5. Simulación del modelo De Poisson en el plano Fuente: Project Chance, Teaching Aids (http://www.dartmouth.edu/~chance/teaching aids/books articles/probability book/ bookapplets/chapter5/LondonBombs/LondonBombs.html) nes discretas con una función continua y en qué sentido es posible usar esta aproximación. Otros programas disponibles en algunas de las direcciones que incluimos al finalizar este artículo proporcionan simuladores de la dis­ tribución normal, así como de la aproximación de las distribuciones binomial y Poisson mediante la misma. Algunas precauciones En este trabajo hemos tratado de mostrar el interés de la simulación en la enseñanza de la REVISTA EDUCACIÓN Y PEDAGOGÍA VOL. XVNo. 35 estadística y de la probabilidad, que es destacada, entre otros, en los trabajos de Biehler (1997). Como describe este último autor, hay fenómenos que, por sus características espacio-temporales o de otra índole, son difíciles de observar. Por medio de la simulación se construye, con el ordenador, un modelo simplificado de dicho fenómeno, eliminando las variables irrelevantes a su estructura, conden-sado en el tiempo y manipulable por el alumno. El uso de programas de simulación permite poner en manos del alumno un nuevo instrumento que hace posible la exploración y el descubrimiento de conceptos y princi­ 51 LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACIÓN EN PROBABILIDAD pios que de otro modo serían mucho más abs­ tractos, contribuyendo a paliar el problema de la falta de experiencia estocástica y a la mejora de la intuición probabilística que, en general, no se desarrollan espontáneamente (Fischbein, 1975). Muchos problemas complejos se resuelven hoy día mediante simulación y mostrar a los alumnos ejemplos sencillos de esta técnica puede servir para ilustrar su aplicabilidad a campos y problemas reales. En la enseñanza de la estocástica en secundaria, la simulación cobra papel importante, ya que ayuda al alumno a conocer las diferencias entre la probabilidad experimental y la teórica. No hay, sin embargo, que ser demasiado op­ timista respecto a la sencillez de la actividad de simulación. En el trabajo que hemos citado de Countinho (2001), se observaron diferentes dificultades de los alumnos al proponérseles situaciones en que debían construir un modelo de urnas para simular ciertas experiencias concretas o juegos probabilísticos: • Dificultades de manejo del software si el alumno no está familiarizado, por lo que se recomienda usar programas fácilmente manipulables que no añadan complejidad innecesaria a la actividad de simulación. • Resistencia a usar la simulación y la aproxi­ mación experimental para resolver un pro­ blema de probabilidad en los casos en que es posible resolver el problema mediante cálculo directo. • Dificultad en aceptar datos de simulaciones que no han llevado a cabo personalmente para obtener estimaciones de la probabilidad. • Dificultad en diferenciar la estimación de la probabilidad que proporciona la simu­ 52 lación del verdadero valor teórico de la pro­ babilidad (que sólo es accesible por cálculo en los casos que sea posible). Nosotros añadiríamos que la simulación y el enfoque frecuencial a la probabilidad, aunque proporciona una solución al problema, no nos da la razón por la cual la solución es válida y, por tanto, carece de valor explicativo, que sólo puede obtenerse en el enfoque clásico y el cálculo formal de probabilidades. No podemos contentarnos con que el alumno logre el paso del dominio de experiencia real al dominio pseudo-concreto, aunque este paso cumple una función didáctica importante y prepara al alumno para la comprensión del dominio formal en el que puede finalmente llevar a cabo una actividad matemática de formalización. Referencias bibliográficas BATANERO, C. y SERRANO, L. (1995). "La aleatoriedad, sus significados e implicaciones educativas". UNO. No. 5. pp. 15-28. BIEHLER, R. (1997). "Software for learning and for doing statistics". En: International Statistical Review. Vol. 65, No. 2. pp. 167-190. CABRIA, S. (1997). Filosofía de ¡a estadística. Valencia: Tirant lo Blanc. COUNTINHO, C. (2001). Introduction aus situations aléatoires des le Collège: de la modé­ lisation a la simulation d’experiences de Bernoulli dans l'environment informatique Cabri-géométreII. Tesis Doctoral. Universidad de Grénoble. DANTAL, B. (1997). "Les enjeux de la modélisation en probabilité". En: Enseigner les probabilités au lycée. Reims: Commission InterIREM. pp. 57-59. REVISTA EDUCACIÓN Y PEDAGOGÍA VOL. XVNo. 35 ENSEÑANZA DE LAS MATEMÁTICAS ENSEÑANZA DE LAS MATEMÁTICAS FINE, T. L. (1973). Theories of Probabüiry: An examination of foundations. New York: Aca­ demic Press. FISCHBEIN (1975). The intuitive sources of probabilistic thinking in children. Dordrecht: Reidel. GIRARD, J. C. (1997). "Modéüsatíon, simula­ tion et expérience aléatoire". En: Enseigner les probabilités au lycée. Reims: Commission InterIREM. pp. 73-76. GREEN, D. R (1983). "A Survey of probabilistic concepts in 3.000 pupils aged 11 -16 years". In: GREY, D. R. et al. (eds.). Proceedings of the ICOTS1. University of Sheffield. No. 2. pp. 766­ 783. GODINO, J. D., BATANERO, C. y CAÑIZA­ RES (1987). M. J. Azar y probabilidad. Funda­ mentos didácticos y propuestas curriculares. Madrid: Síntesis. HEITELE, D. (1975). "An epistemological view on fundamental stochastic ideas". In: Educational Studies in Mathematics, 6, pp. 187 205. HENRY, M. (1997). "Notion de modele et modélization en l'enseignement". En: Enseig-ner les probabilités au lycée. Reims: Commission Inter-IREM. pp. 77-84. MCLEAN, A. (2001). "Statistics in the catwalk. The importance of models in training researchers in statistics". In: BATANERO, C. (ed.). Training Researchers in the Use of Statistics. Granada, Spain: International Association for Statistics Education and International Statistical Institute. ZABELL, S. L. (1992). "Randomness and statistical applications". En: GORDON, F. and GORDON, S. (eds.). Statistics for the XXI Century. The Mathematical Association of America. Bibliografía BATANERO, C; SERRANO, L. y Green, D. R. "Randomness, its meanings and implications for teaching probability". In: International Journal of Mathematics Education in Science and Technology. Vol. 29, No. 1. pp. 113-123. RECURSOS EN INTERNET PARA LA SIMU­ LACIÓN CAST Computer Assisted Statistics Teaching: http://www-ist.massey.ac.nz/CAST/CAST/ CASTprog/HstartFiles/startCASThtml Elementary Statistical Java Applets and Tools: http://www.stat.uiuc.edu/~statlOO/cuwu/ GASP: The Globally Accessible Statistical Procedures, http: //www. stat.sc.edu/rsrch/gasp/ Java Applets for Visualization of Statistical Concepts: http: //www.kuleuven. ac.be/ucs/j ava/ index.htm Rice Virtual Lab in Statistics: http://www. r uf. rice ,edu/~ lane/rvls.html Statiscope: http: //www. df. lth. se/~mikae lb/ statiscope/statiscope -enu. shtml. Statistics Applet made for the WISE Project: http://www.grad.cgs.edu/wise/appletsf. shtml. Statistics textbook/ UCLA: http://www.stat.ucla.edu/ STEPS - STatistical Education through Problem Solving: http: //www. stats .gla. ac.uk/steps/ home.html SticiGui: Statistical Tools for Internet and Classroom Instruction with a Graphical User Interface: http://www.stat.berkeley.edu/ — stark/SticiGui/index.htm REVISTA EDUCACIÓN Y PEDAGOGÍA VOL. XVNo.35 53 53 LA SIMULACIÓN COMO INSTRUMENTO DE MODELIZACIÓN EN PROBABILIDAD Virtual Laboratories in Probability and Statistics, WebStat: http://www.stat.sc.edu/webstat/ Alabama http://www.math.uah.edu/stat/ ZIELMAN, B. Statistical Page: http:// Vista The Visual Statsistical System: http:// huizen.dds.nl/~berrie/ forrest.psvch.unc.edu/research/index.html Referencia BATANERO, Carmen. "La simulación como instrumento de modelización en probabilidad". En: Revista Educación y Pedagogía. Medellín: Universidad de Antioquia, Facultad de Educación. Vol. XV, No. 35, (enero-abril), 2003. pp. 39 -54. Original recibido: julio 2002 Aceptado: agosto 2002 Se autoriza la reproducción del artículo citando la fuente y los créditos de los autores. 54 REVISTA EDUCACIÓN Y PEDAGOGÍA VOL. XV No. 35