MATERIA: DATA MINING PARA LA INDUSTRIA PETROLERA PROYECTO No. 4 OBJETIVO: Reducción de la dimensionalidad y visualización de datos para la caracterización de patrones de flujo multifásico en tuberías verticales usando los métodos de componentes principales, escalamiento multidimensional y mapas auto-organizativos. CONTENIDO 1. Proyecte los datos en el espacio de 3 dimensiones y calcule la pérdida de información asociada, utilice el método de componentes principales. 2. Proyecte los datos en el espacio de 2 dimensiones y calcule la pérdida de información asociada, utilice el método de componentes principales. 3. Use escalamiento multidimensional para proyectar los datos a dos dimensiones. 4. Reduzca la dimensión de los datos utilizando un mapa de Kohonen de dimensiones 15x10, con una topología hexagonal. Fecha de entrega: Jueves 20 de Noviembre, 2008 DESCRIPCIÓN DE LOS DATOS: Cuando fluyen dos o más fases en una tubería, estas se organizan de manera particular, dependiendo de las densidades y velocidades de cada fase, dando origen a distintos patrones de flujo. Para un flujo de dos fases (líquido y gas) en una tubería vertical se pueden formar cuatro tipos de patrones de flujo: Burbuja, Tapón, Transición y Anular; estos patrones corresponden a crecientes valores de la fase de gas (ver Figura 1). Es posible determinar el tipo de patrón de flujo en un tramo de tubería, analizando la función de densidad de las caídas de presión. Haiqing et al. (1992) caracterizan la función de densidad de la caída de presión relativa a la de una sola fase por los siguientes cuatro parámetros: media, desviación estándar, máximo de la función de densidad entre el mínimo valor muestral y 0.5, máximo de la función de densidad entre 0.5 y el máximo valor de la muestra. Se dispone de datos de patrones de flujo multifásico en tubería vertical correspondientes a las cuatro variables que caracterizan la función de densidad de la caída de presión. Burbuja Tapón Transición Anular Figura 1. Patrones de flujo en tubería vertical Comandos de Matlab: Componentes principales: princomp (Statistics Toolbox). Escalamiento Multidimensional: mdscale, cmdscale (Statistics Toolbox). SOM: http://www.cis.hut.fi/projects/somtoolbox/.