UTILIZACIÓN DE REDES NEURONALES PARA LA GENERACIÓN

Anuncio
UTILIZACIÓN DE REDES NEURONALES
PARA LA GENERACIÓN
DE ANALIZADORES VIRTUALES 1
Carlos Lago
YPF S.A.
Centro de Tecnología Aplicada
C.C.Nro. 7, 1925 Ensenada, Pcia. de Buenos Aires, Argentina
e-mail: clago@email.ypf.com.ar
Carlos Ruiz
2
SOTEICA S.R.L.
Alvarez Thomas 796, 3 C, 1427 Buenos Aires, Argentina
e-mail: carlos@soteica.com.ar
INTRODUCCIÓN
El modelado mediante el uso de redes neuronales ha demostrado ser una herramienta valiosa
para obtener en forma rápida y precisa mediciones de calidad de productos en línea y ofrecer
una alternativa de bajo costo a los analizadores de proceso reales o modelos matemáticos
rigurosos.
TÉCNICAS DE MODELADO
En general, se pueden aplicar tres enfoques para la construcción de modelos que describan las
relaciones causa - efecto en procesos industriales. Estos son:
1. modelos mecaniísticos,
2. regresiones lineales y no lineales
3. modelado del tipo “caja negra”.
Modelos mecanísticos: Están basados en las leyes físicas, planteando balances de masa y
energía en estado estacionario o transitorio y tienen la forma de ecuaciones diferenciales y
algebraicas. Estos modelos, también llamados de “Primeros Principios” permiten calcular las
salidas de un sistema, dado un determinado conjunto de entradas.
Se trata de un enfoque riguroso, requiere un buen conocimiento del proceso que se está
modelando y el desarrollo de modelos relativamente complejos.
1
Trabajo presentado al II Congreso de Ingeniería de Procesos del Mercosur (ENPROMER '99),
Florianópolis, Brasil, Septiembre de 1999.
2
Autor a quien debe dirigirse la correspondencia
1
Regresiones Lineales y no Lineales: En este caso, el enfoque es ajustar datos experimentales
de entrada - salida a modelos empíricos. Por modelo empírico se entiende aquel que tiene una
estructura definida, pero la forma de la estructura del modelo no provee una relación
fundamental de la física del proceso.
En el modelado empírico hay que considerar que se requiere seleccionar una estructura interna
del modelo y determinar los parámetros del mismo. Una vez que la estructura es establecida,
los parámetros del modelo son determinados utilizando una estrategia que busca minimizar
una adecuada función del error de predicción.
Modelado del tipo “caja negra”: El caso anterior requiere que la estructura del modelo sea
especificada previamente. En el modelado del tipo “caja negra”, como es el caso de las redes
neuronales, se obtienen modelos de estructura libre. Acá la premisa es que un sistema
interconectado en paralelo, de simples elementos de procesamiento puede aprender las
interrelaciones complejas que existen entre un número suficientemente grande de entradas
(causas) y salidas (efectos). Una vez entrenada (esto es, ajustada), una red neuronal puede
predecir salidas para un conjunto de entradas que nunca antes habían sido vistas por la red
durante el proceso de entrenamiento.
REDES NEURONALES
Una red neuronal es una estructura computacional capaz de representar las relaciones
funcionales no lineales entre variables de entrada y salida. Como se mencionaba más arriba,
las redes neuronales son modelos de estructura libre, pero existen diferentes configuraciones
posibles para las mismas y pueden emplearse diversos algoritmos de entrenamiento.
Las redes consisten, básicamente, de un determinado número de elementos de cálculo,
llamados neuronas, las cuales pueden ser dispuestas en varias capas.
La primer capa, es donde se alimentan las entradas. La última capa, es donde las salidas
predichas son obtenidas. Pueden existir un dado número de capas entre estas dos, llamadas
capas ocultas. Típicamente se ha encontrado que una sola capa oculta es suficiente para la
mayoría de las aplicaciones.
Cada neurona en la capa de entrada es conectada a todas las neuronas de la capa oculta y estas
a su vez son conectadas a todas las neuronas de la capa de salida por medio de una cierta
función matemátíca conocida como "función de transferencia". Existe un parámetro llamado
“peso de la conexión” que está asociado con cada una de estas conexiones. También se
emplea para las neuronas un corrimiento o bias sobre la salida, en las capas ocultas y de
entrada.
Las neuronas en la capa de entrada no están asociadas con cálculos. Ellas actúan como nodos
de distribución y transfieren las entradas a la capa oculta. Las neuronas en las capas oculta y
de salida realizan cálculos del siguiente tipo:
2
Si Ii es la entrada desde la neurona i-th en la capa previa, Wi es el peso asociado con esta
conexión particular y ? i es el bias, entonces la salida Oj, desde esta neurona en la capa de
salida está dada por:
Sj = ? (Wi Ii) + ? i
(1)
Oj = 1 / 1 + exp(-Sj)
(2)
En este caso se utilizó una relación sigmoidal para expresar la función de transferencia de la
neurona, también podrían haberse usado otras funciones continuas como por ejemplo tangente
hiperbólica.
Esta es la función de transferencia de la neurona, acoplada con los pesos Wi y bias ? i, que le
dan a la red neuronal la capacidad de representar un comportamiento funcional entre
variables.
Las entradas son alimentadas a la primer capa, las salidas de la última capa representan las
salidas predichas de la red.
La primer etapa en la modelización con redes neuronales es “entrenar” la misma. Durante este
entrenamiento la red “aprende” adaptando los factores de peso en función de las muestras
dadas en este set de datos. El aprendizaje o entrenamiento puede llevarse a cabo por diferentes
medios, como ser los algoritmos de “backpropagation” (BPN) y del gradiente conjugado. Por
lo general, estos algoritmos modifican los factores de peso de la red y los biases, tratando de
minimizar una función del error de predicción.
En la Figura 1 se muestra en forma esquemática la estructura de una neurona constituyente de
la red.
I1
W1
I2
W2
W3
I3
Sj
? Ii W i + B j
Wn
In
Bj
Figura 1
3
Oj
f
En la Figura 2 se muestra esquemáticamente la estructura de la red neuronal, indicando las
capas de neuronas de entrada, ocultas y de salida.
Salidas
Entradas
. . . . .
.
.
.
.
. . . . . .
.
.
.
.
.
.
.
. . . . .
Neuronas de
Entrada
Neuronas Ocultas
Neuronas de
Salida
Figura 2
POR QUÉ EMPLEARLAS?
Las Refinerías de Petróleo e Industrias Petroquímicas utilizan analizadores en línea en las
corrientes importantes de planta, proveyendo datos para monitoreo y operación segura y
óptima de las Unidades de Proceso. Estos analizadores son costosos, tanto desde su
adquisición inicial como así también desde el punto de vista de mantenimiento. Además su
confiabilidad es moderada o incluso baja en algunos casos. La mayoría de las aplicaciones de
Control Avanzado y Optimización en Línea utilizan datos de calidad en sus modelos. En
varias referencias de la literatura se encuentra mención a que los analizadores virtuales,
generados mediante el uso de redes neuronales resultan mas confiables que los reales y
pueden llegar a reemplazarlos con la consiguiente reducción en los costos de capital y de
mantenimiento.
CARACTERÍSTICAS
Las redes neuronales extienden el análisis de regresión a casos donde el modelo no es
conocido a priori.
La forma adecuada del modelo es determinada automáticamente.
Se requiere un conocimiento básico del proceso para seleccionar la estructura
adecuada de entrada - salida pero:
No se necesitan ni reglas ni ecuaciones.
El usuario especifica las relaciones causa/efecto suministrando datos de
comportamiento.
Encuentra las soluciones que están implícitas en los datos:
Diagnósticos en un dispositivo.
Mejor condición operativa.
4
La ejecución en tiempo real es mucho mas rápida que su equivalente basado en
modelos de primeros principios.
CASO DE ESTUDIO
Con el objetivo de evaluar la tecnología de redes neuronales, la empresa SOTEICA S.R.L.
realizó un trabajo de modelado para la inferencia de la temperatura del 90 % de Destilación de
la Nafta de la Unidad de Cracking Catalítico “A” de la Refinería La Plata de YPF S.A.
Para ello utilizó el producto de software “NeurOnline Studio” de la firma Gensym.
Los datos de planta se obtuvieron del PI Plant Historian (Excel Data Link).
Inicialmente se recolectó información de 63 variables de procesos pertenecientes al período
Junio-Octubre de 1998.
El número de variables utilizado para el modelo inicial de la red fue de 29 pero finalmente
pudo reducirse a 18 sin perder mucha fidelidad en la predicción.
VARIABLES SELECCIONADAS
Las siguientes variables de proceso, son las que se utilizaron para la modelización
del Analizador Virtual:
1
2
3
4
5
6
7
8
9
10
Tag
AI3302
FC180
FC181
FI182
FI235
FI880
FIC128
FIC183
FIC191
FIC193
Descripción
MAX. NAFTA
Nafta Pes . Quenc h Ris B
Nafta Pes . Quenc h Ris A
GOD A TK
CARGA A PLANTA
NAFTA A GASC
VAP STRIP RX
RECIC SLURRY
SLUR A C403A
SLUR A C403B
Unidades
C
M3/H
M3/H
M3/H
M3/H
M3/H
TN/H
M3/H
M3/H
M3/H
11
12
13
14
15
16
17
18
19
20
Tag
FIC242
FIC261
FIC264
FIC414
FIC592
FIC644
FIC679
FIC72
FIC854
FIC859
Descripción
REFL INT GO P
GOL A TK
REFLUJO E401
VAP NOR CA2B
Q GOL A SEC
SLUR A C465A
GOP A C-468
VAP EME CA2A
CAUDAL 1 ET
GOL A C-462
U nidades
M3/H
M3/H
M3/H
TN/H
M3/H
M3/H
M3/H
TN/H
NM3/H
M3/H
5
21
22
23
24
25
26
27
28
29
Tag
FIC 863
P114
PI214
PIC291
TI208
TI313
TIC 116
TIC 130
TIC 206
Descripción
SLUR A C 465B
Pres Reactor
P MEDIO E401
PRESION F405
GOL D E E-401
NAFTA A F405
Temp.Riser A
T Riser B
T CAB EZ E401
Unidades
M3/H
KG/CM2
KG/CM2
KG/CM2
C
C
C
C
C
Los set points y salidas a válvulas no fueron utilizados, sino que se inspeccionaron durante la
fase de análisis de datos. Algunas variables recolectadas fueron descartadas por estar fuera de
rango o por mal funcionamiento de ciertos instrumentos.
PERÍODO DE ENTRENAMIENTO SELECCIONADO
De los 3 meses de datos recolectados, se seleccionó un período de 8 días para cubrir un rango
adecuado de entrenamiento para el punto de destilación del 90 % (180 - 190 °C)
Se configuraron 2 conjuntos de datos:
Entrenamiento
Validación
El set de datos de entrenamiento fue depurado de datos no válidos o de períodos de
inestabilidad (por ejemplo, período de inestabilidad en la presión de la fraccionadora o
cualquier otra condición alejada de la correspondiente operación normal de la unidad de
procesos).
PREDICCIONES DEL MODELO VS. DATOS REALES
6
BENEFICIOS
Medición en tiempo real de calidad de producto, emisiones y otra información
importante para control y toma de decisiones.
Mejorada calidad y rendimiento debido al control en tiempo real (no tiene los tiempos
muertos asociados a resultados de laboratorio y Analizadores en línea reales).
Reducida variabilidad durante la operación normal.
Mas rápida estabilización después de cambios operacionales.
Reducción en carga de trabajo del personal debido a una menor dependencia en
muestreos periódicos del Laboratorio.
Reducción en costos de capital y mantenimiento en Analizadores de Procesos.
CONCLUSIONES
Los paquetes de software comerciales, como el NeurOn-Line Studio, simplifican mucho el
problema de definición y entrenamiento de la red.
La obtención de un conjunto de datos apropiados para entrenamiento es la clave en un
ambiente industrial debido a :
Problemas operativos y ruido de procesos.
Eliminación de datos no representativos (Ej. transitorios).
Datos con suficiente riqueza para cubrir el espectro operativo.
El conocimiento real de las operaciones es importante:
Qué variables se espera que influencien el Objetivo.
Dinámicas presentes en el proceso.
El modelo debe ser tan simple como sea posible para reducir su dependencia de variables en
falla.
REFERENCIAS
“Improve control with software monitoring technologies” P. B. Deshpande - S.
Yerrapragada and E.F. Jacob, Hydrocarbon Processing - September 1996.
“Neural Network model predicts naphtha cut point” Issam Wadi, Oil & Gas Journal Nov. 25 - 1996.
“Artificial Intelligence: Starting to Realize Its Practical Promise” E. Crowe - C.
Vassiliadis, Chemical Engineering Progress - January 1995.
“Consider neural networks for process identification” S. Ramasamy - P. B. Deshpande
- G.E. Paxton - R.P. Hajare, Hydrocarbon Processing - June - 1995.
7
Descargar