11. Intérprete de bytecodes.

Anuncio
11. Intérprete de bytecodes.
En los primeros capítulos se han introducido conceptos básicos relacionados con
la tecnología Java y en particular con la tecnología móvil J2ME. Uno de estos conceptos
es la maquina virtual que es precisamente el objeto principal de estudio de este
proyecto.
De entre los distintos módulos que integran la KVM (maquina virtual de la
plataforma J2ME) se han analizado dos de ellos. Por un lado se ha visto como
representa internamente la maquina virtual los elementos Java y por otro al do se ha
estudiado la gestión que se hace de la memoria que emplea.
En este capítulo se abordará uno de los módulos mas importantes de la KVM, el
intérprete de bytecodes. El intérprete de bytecodes se puede ver como el motor de
ejecución de la maquina virtual pues es el módulo que ejecuta las instrucciones que
componen los programas Java. Dichas instrucciones se denominan bytecodes y son
generados en el proceso de compilación de los archivos Java.
De esta forma, el intérprete de bytecodes ejecuta de forma secuencial los
bytecodes que forman los archivos de clases empleando para ello un registro
denominado contador de programas. Dicho registro apunta al siguiente bytecode en ser
ejecutado.
La KVM dispone de un juego de bytecodes y cada uno de ellos ejecuta una serie
de tareas de distinta naturaleza. Así por ejemplo el bytecode de salto condicional (una
instrucción if) comprueba si se ha cumplido una condición y en caso de que así fuera
incrementa el contador de programas el número de posiciones necesarias.
11.1. Introducción.
Dentro de este capítulo vamos a tratar de explicar el funcionamiento y la
solución que la KVM aporta a uno de los pilares de funcionamiento de los denominados
lenguajes interpretados y es precisamente la interpretación del código que se ge nera tras
el proceso de compilación.
Comentaremos brevemente las diferencias existentes entre los lenguajes
compilados e interpretados para tomar contacto con el contenido del capítulo sin
profundizar en discusiones acerca de la diferencia de rendimiento entre ambos puesto
que dicha discusión queda totalmente fuera del objetivo de esta documentación.
También se introducirá el concepto de compilación Just-In-Time que es una
técnica híbrida que combina compilación e interpretación en el propio terminal que
ejecuta las aplicaciones Java.
El intérprete de bytecodes de la maquina virtual se podría ver como el motor de
ejecución de la misma, puesto que es el módulo que se encarga de ejecutar las
instrucciones que el programador le indica en el código que genera. Así el intérprete
recorre secuencialmente la lista de bytecodes presentes en el archivo .class
correspondiente al hilo activo en ese momento.
Pasado un cierto tiempo o si el hilo se detiene por un bytecode introducido por
el usuario al realizar el programa Java, se salvaguarda el entorno de ejecución y se pasa
a ejecutar los bytecodes de otro hilo con su propio entorno de ejecución.
El entorno de ejecución lo forman una serie de registros de la maquina virtual.
Dichos registros son diferentes dependiendo del hilo que este ejecutando puesto que
cada hilo ejecuta un subconjunto de bytecodes diferentes.
El intérprete de bytecodes en la KVM se ejecuta mediante un flujo principal que
recorre y ejecuta los bytecodes del hilo principal activo en ese momento. Superado un
tiempo máximo de ejecución del hilo, se invoca al planificador de hilos para que el
intérprete ejecute los bytecodes de otro de los hilos y ese otro hilo pase a estar activo.
En cada tiempo de ejecución de bytecodes, el algoritmo del intérprete va
ejecutando cada uno de los bytecodes. Para cada uno de ellos analiza el tipo del
bytecode y actúa en consecuencia según este.
11.1.1.
Lenguajes compilados e interpretados.
Un lenguaje compilado es término un tanto impreciso para referirse a un
lenguaje de programación que típicamente se implementa mediante un compilador. Esto
implica que una vez escrito el programa, éste se traduce a partir de su código fuente por
medio de un compilador en un archivo ejecutable para una determinada plataforma (por
ejemplo Solaris para Sparc, Windows NT para Intel, etc.).
Los lenguajes compilados son lenguajes de alto nivel en los que las instrucciones
se traducen del lenguaje utilizado a código máquina para una ejecución rápida. Por el
contrario un lenguaje interpretado es aquel en el que las instrucciones se traducen o
interpretan una a una siendo típicamente unas 10 veces más lentos que los programas
compilados.
Es teóricamente posible escribir un compilador o un intérprete para cualquier
lenguaje, sin embargo en algunos lenguajes una u otra implementación es más sencilla
porque se diseñaron con una implementación en particular en mente.
Algunos entornos de programación incluyen los dos mecanismos, primero el
código fuente se traduce a un código intermedio que luego se interpreta en una máquina
virtual, pero que también puede compilarse justo antes de ejecutarse. La máquina virtual
y los compiladores Just in Time de Java son un ejemplo de ello.
Algunos ejemplos típicos de lenguajes compilados:
•
•
•
•
Fortran
La familia de lenguajes de C, incluyendo C++ y Objective C pero no Java.
Ada, Pascal (incluyendo su dialecto Delphi)
Algol
Los lenguajes interpretados (o lenguajes de script) forman un subconjunto de
los lenguajes de programación, que incluye a aquellos lenguajes cuyos programas son
habitualmente ejecutados en un intérprete en vez de compilados. Sin embargo, la
definición de un lenguaje de programación es independiente de cómo se ejecuten los
programas en él escritos, ya sea mediante una compilación previa o a través de un
intérprete.
Figura 11.1: Lenguajes compilados vs interpretados.
11.1.2.
Just in Time Compiler.
Las aplicaciones que se crean en grandes empresas deben ser más efectivas que
eficientes; es decir, conseguir que el programa funcione y el trabajo salga adelante es
más importante que el que lo haga eficientemente. Esto no es una crítica, es una realidad
de la programación corporativa. Al ser un lenguaje más simple que cualquiera de los
que ahora están en el cajón de los programadores, Java permite a éstos concentrarse en
la mecánica de la aplicación, en vez de pasarse horas y horas incorporando APIs para el
control de las ventanas, controlando minuciosamente la memoria, sincronizando los
ficheros de cabecera y corrigiendo los agónicos mensajes del linker. Java tiene su
propio toolkit para interfaces, maneja por sí mismo la memoria que utilice la aplicación,
no permite ficheros de cabecera separados (en aplicaciones puramente Java) y
solamente usa enlace dinámico.
Muchas de las implementaciones de Java actuales son puros intérpretes. Los
byte-codes son interpretados por el sistema run-time de Java, la Máquina Virtual Java
(JVM), sobre el ordenador del usuario. Aunque ya hay ciertos proveedores que ofrecen
compiladores nativos Just-In-Time (JIT). Si la Máquina Virtual Java dispone de un
compilador instalado, las secciones (clases) del byte-code de la aplicación se compilarán
hacia la arquitectura nativa del ordenador del usuario.
La integración de los compiladores JIT con la maquina virtual Java se puede
representar mediante la siguiente figura:
Figura 11.2: Just-In-Time Compiler.
Los programas Java en ese momento rivalizarán con el rendimiento de
programas en C++. Los compiladores JIT no se utilizan en la forma tradicional de un
compilador; los programadores no compilan y distribuyen binarios Java a los usuarios.
La compilación JIT tiene lugar a partir del byte-code Java, en el sistema del usuario,
como una parte (opcional) del entorno run-time local de Java.
Muchas veces, los programadores corporativos, ansiosos por exprimir al máximo
la eficiencia de su aplicación, empiezan a hacerlo demasiado pronto en el ciclo de vida
de la aplicación. Java permite algunas técnicas innovadoras de optimización. Por
ejemplo, Java es inherentemente multithreaded, a la vez que ofrece posibilidades de
multithread como la clase Thread y mecanismos muy sencillos de usar de
sincronización; Java en sí utiliza threads. Los desarrolladores de compiladores
inteligentes pueden utilizar esta característica de Java para lanzar un thread que
compruebe la forma en que se está utilizando la aplicación. Más específicamente, este
thread podría detectar qué métodos de una clase se están usando con más frecuencia e
invocar a sucesivos niveles de optimización en tiempo de ejecución de la aplicación.
Cuanto más tiempo esté corriendo la aplicación o el applet, los métodos estarán cada
vez más optimizados (Guava de Softway es de este tipo).
Si un compilador JIT está embebido en el entorno run-time de Java, el
programador no se preocupa de hacer que la aplicación se ejecute óptimamente.
Siempre he pensado que en los Sistemas Operativos tendría que aplicarse esta filosofía;
un optimizador progresivo es un paso más hacia esta idea.
Podemos ver la diferencia que existe entre el modo Java de interpretación:
Figura 11.3: Ejecución lenguaje interpretado.
Donde cada uno de los elementos son:
1.
2.
3.
Java Virtual Machine (JVM)
Run-time bytecode interpretation
Java bytecode
Y el modo JIT:
Figura 11.4: modo JIT de ejecución.
Donde cada uno de los elementos son:
1.
2.
3.
4.
Java bytecode
Run-time JIT compilation
Native RISC instructions
Java Virtual Machine (JVM)
11.2. Entorno del lenguaje de programación Java.
El entorno del lenguaje de programación Java al ser un leguaje mixto entre un
lenguaje puramente compilado y uno puramente interpretado presenta el siguiente
entorno de ejecución:
Figura 11.5: Entorno del lenguaje Java.
Java es un lenguaje de programación creado por Sun Microsystems para poder
funcionar en distintos tipos de procesadores. Es un lenguaje orientado a objetos. Su
sintaxis es muy parecida a la de C o C++, e incorpora como propias algunas
características que en otros lenguajes son extensiones: gestión de hilos, ejecución
remota, etc.
El código Java, una vez compilado, puede llevarse sin modificación alguna sobre
cualquier sistema operativo (Windows, Linux, Mac OS X, IBM, ...), y ejecutarlo allí.
Esto se debe a que el código se compila a un lenguaje intermedio (llamado bytecodes)
independiente de la máquina. Este lenguaje intermedio es interpretado por el intérprete
Java, denominado Java Virtual Machine (JVM), que deberá existir en la plataforma en
la que queramos ejecutar el código. La siguiente figura ilustra el proceso.
El código fuente se "compila" a un código de bytes de alto nivel independiente
de la máquina. Este código (byte-codes) está diseñado para ejecutarse en una máquina
hipotética que es implementada por un sistema run-time, que sí es dependiente de la
máquina.
El hecho de que la ejecución de los programas Java sea realizada por un
intérprete, en lugar de ser código nativo, ha generado la suposición de que los
programas Java son más lentos que programas escritos en otros lenguajes compilados
(como C o C++). Aunque esto es cierto en algunos casos, se ha avanzado mucho en la
tecnología de interpretación de bytecodes y en cada nueva versión de Java se introducen
optimizaciones en este funcionamiento. En la última versión de Java, 1.5 (ahora todavía
en beta), se introduce una nueva JVM servidora que queda residente en el sistema. Esta
máquina virtual permite ejecutar más de un programa Java al mismo tiempo, mejorando
mucho el manejo de la memoria. Por último, es posible encontrar bastantes benchmarks
en donde los programas Java son más rápidos que programas C++ en algunos aspectos.
11.3. Funcionamiento de la maquina virtual.
Vamos a comentar a continuación de forma breve cual es el funcionamiento de
la maquina virtual si bien dicha explicación se puede encontrar con un mayor nivel de
detalle en capítulo 4 Modelo de funcionamiento de la maquina virtual. La estructura de
la maquina virtual se puede simplificar como sigue:
Figura 11.6: Funcionamiento maquina virtual KVM.
A partir de los archivos .class ya compilados el cargador de clases (loader) es
encarga como su propio nombre indica de cargar las clases en la maquina virtual
reservando para ello la memoria necesaria para los datos en las áreas destinadas a tal
efecto (runtime data areas). Cada hilo creado durante la ejecución de la maquina virtual
comparte este área con el resto de los hilos pero cada hilo tiene sus propios registros de
funcionamiento. Es decir cada hilo tiene su propio registro IP o contador de
instrucciones que indica cual es la instrucción a nivel de bytecodes que debe ser
ejecutada y por supuesto su propia pila de ejecución (accesible por el registro SP).
La pila de ejecución del hilo mantiene la información de ejecución de dicho hilo
tal como los métodos que se han de ejecutar junto son sus parámetros y sus valores de
retorno si lo tienen, parámetros relacionados con el sincronismo entre hilos, etc.…
Precisamente existen una serie de registros que son empleados por el interprete
para poder completar el flujo de bytecodes correspondientes a un hilo (.class):
•
•
•
•
•
IP (instruction pointer): es el puntero que indica la instrucción que se esta
ejecutando.
SP (stack pointer): puntero a la pila de ejecución del hilo.
LP (locals pointers): punteros locales necesarios para parámetros auxiliares del
hilo.
FR (frame pointer): puntero a la lista de marcos de ejecución de los métodos del
hilo.
CP (constant pool pointer): puntero a la constante de almacenaje de datos del
hilo.
Estos registros al ser propios de cada hilo Java que se ejecuta en la maquina
virtual. Por ello en aplicaciones multihilo cada vez que un hilo que se estaba ejecutando
pasa a estar suspendido debe mantener una copia del valor de los registros antes de ser
suspendido para volver a cárgalos en la maquina virtual cuando vuelva a ejecutarse.
11.4. Implementación del intérprete de bytecodes en la KVM.
11.4.1.
Introducción.
El interprete de bytecodes que emplea la KVM es muy similar al que emplea la
maquina virtual Java al igual que ocurre con el resto de los módulos. Sin embargo
mantiene una serie de diferencias que aumentan su rendimiento parámetro que como ya
hemos comentado en mas de una ocasión resulta esencial en los dispositivos autónomos.
El intérprete que empleaba la versión de la KVM hasta la versión 1.0 ha sido
completamente reestructurado y modificado para aumentar sin aún cabe más su
rendimiento sin que por ello se vea afectada la portabilidad, otro de los aspectos
también muy influyentes en los dispositivos a los cuales va dirigida la KVM. En el
último apartado de este capítulo se comentara brevemente estas diferencias.
En cuanto a la estructura que mantiene la implementación de SUN del interpréte
de la KVM se encuentra recogida en tres ficheros cada uno con un contenido claramente
diferenciado:
•
•
•
Execute.c: en este fichero se encuentra el código correspondiente el bucle de
ejecución principal del intérprete.
Interpret.c: almacena el código de las distintas funciones auxiliares de relativa
complejidad que el intérprete necesita en su ejecución.
Bytecode.c: este fichero es en realidad un listado de todos los bytecodes
disponibles en esta versión de la KVM junto con las operaciones que implican
cada uno de ellos.
Esta estructura permite separar la definición de bytecodes de lo que es el
interprete lo cual facilita el emp leo de otras técnicas de interpretación alternativas
usando el mismo conjunto de bytecodes o bien modificar el conjunto de bytecodes
(añadiendo nuevos o modificando los existentes).
El intérprete de bytecodes se ejecuta mediante un flujo principal que recorre y
ejecuta los bytecodes del hilo principal activo en ese momento. Superado un tiempo
máximo de ejecución del hilo se invoca al planificador de hilos para que el intérprete
ejecute los bytecodes de otro de los hilos.
En cada tiempo de ejecución de bytecodes, el algoritmo del intérprete va
ejecutando cada uno de los bytecodes. Para cada uno de ellos analiza el tipo del
bytecode y actúa en consecuencia según este.
Advertir al lector que este módulo esta muy relacionado con la ejecución a bajo
nivel de los programas Java en los sistemas con la complejidad que ello conlleva. Gran
parte del módulo son configuraciones de registros del sistema y otros parámetros.
11.4.2.
Registros empleados por el intérprete de
bytecodes.
Antes de explicar el funcionamiento del intérprete en la KVM es conveniente
explicar o al menos comentar de forma breve una seria de conceptos y terminologías
que se van a usar frecuentemente. Estos conceptos están relacionados con la ejecución
genérica de programas en las computadoras y más en particular con la visión que SUN
emplea para representarlos.
Existen una serie de registros que se emplean a menudo en el intérprete para
controlar el flujo del mismo y que son propios de cada hilo de ejecución:
•
•
•
•
•
IP (instruction pointer): es el puntero que indica la instrucción que se esta
ejecutando.
SP (stack pointer): puntero a la pila de ejecución del hilo.
LP (locals pointers): punteros locales necesarios para el hilo.
FR (frame pointer): puntero al marco de ejecución de los métodos.
CP (constant pool pointer): puntero a la constante de almacenaje de datos del
hilo.
Estos registros son propios de cada hilo Java que se ejecuta en la maquina
virtual. Por ello en aplicaciones multihilo cada vez que un hilo que se estaba ejecutando
pasa a estar suspendido debe mantener una copia del valor de los registros antes de ser
suspendido para volver a cárgalos en la maquina virtual cuando vuelva a ejecutarse.
11.4.3.
Conjunto de bytecodes de la KVM.
Como ya se ha comentado anteriormente el conjunto de bytecodes disponibles en
la versión de Sun del intérprete que se esta estudiando se encuentra recogido en el
fichero bytecodes.c. Un listado de los distintos bytecodes de que se dispone se encuentra
recogido en un enumerador denominado bytecodes:
typedef enum {
NOP
ACONST_NULL
ICONST_M1
ICONST_0
ICONST_1
ICONST_2
ICONST_3
ICONST_4
=
=
=
=
=
=
=
=
0x00,
0x01,
0x02,
0x03,
0x04,
0x05,
0x06,
0x07,
ICONST_5
LCONST_0
LCONST_1
FCONST_0
FCONST_1
FCONST_2
DCONST_0
DCONST_1
=
=
=
=
=
=
=
=
0x08,
0x09,
0x0A,
0x0B,
0x0C,
0x0D,
0x0E,
0x0F,
BIPUSH
SIPUSH
LDC
LDC_W
LDC2_W
ILOAD
LLOAD
FLOAD
=
=
=
=
=
=
=
=
0x10,
0x11,
0x12,
0x13,
0x14,
0x15,
0x16,
0x17,
DLOAD
ALOAD
ILOAD_0
ILOAD_1
ILOAD_2
ILOAD_3
LLOAD_0
LLOAD_1
=
=
=
=
=
=
=
=
0x18,
0x19,
0x1A,
0x1B,
0x1C,
0x1D,
0x1E,
0x1F,
LLOAD_2
LLOAD_3
FLOAD_0
FLOAD_1
FLOAD_2
FLOAD_3
DLOAD_0
DLOAD_1
=
=
=
=
=
=
=
=
0x20,
0x21,
0x22,
0x23,
0x24,
0x25,
0x26,
0x27,
DLOAD_2
DLOAD_3
ALOAD_0
ALOAD_1
ALOAD_2
ALOAD_3
IALOAD
LALOAD
=
=
=
=
=
=
=
=
0x28,
0x29,
0x2A,
0x2B,
0x2C,
0x2D,
0x2E,
0x2F,
FALOAD
DALOAD
AALOAD
BALOAD
CALOAD
SALOAD
ISTORE
=
=
=
=
=
=
=
0x30,
0x31,
0x32,
0x33,
0x34,
0x35,
0x36,
LSTORE
= 0x37,
FSTORE
DSTORE
ASTORE
ISTORE_0
ISTORE_1
ISTORE_2
ISTORE_3
LSTORE_0
=
=
=
=
=
=
=
=
0x38,
0x39,
0x3A,
0x3B,
0x3C,
0x3D,
0x3E,
0x3F,
LSTORE_1
LSTORE_2
LSTORE_3
FSTORE_0
FSTORE_1
FSTORE_2
FSTORE_3
DSTORE_0
=
=
=
=
=
=
=
=
0x40,
0x41,
0x42,
0x43,
0x44,
0x45,
0x46,
0x47,
DSTORE_1
DSTORE_2
DSTORE_3
ASTORE_0
ASTORE_1
ASTORE_2
ASTORE_3
IASTORE
=
=
=
=
=
=
=
=
0x48,
0x49,
0x4A,
0x4B,
0x4C,
0x4D,
0x4E,
0x4F,
LASTORE
FASTORE
DASTORE
AASTORE
BASTORE
CASTORE
SASTORE
POP
=
=
=
=
=
=
=
=
0x50,
0x51,
0x52,
0x53,
0x54,
0x55,
0x56,
0x57,
POP2
DUP
DUP_X1
DUP_X2
DUP2
DUP2_X1
DUP2_X2
SWAP
=
=
=
=
=
=
=
=
0x58,
0x59,
0x5A,
0x5B,
0x5C,
0x5D,
0x5E,
0x5F,
IADD
LADD
FADD
DADD
ISUB
LSUB
FSUB
DSUB
=
=
=
=
=
=
=
=
0x60,
0x61,
0x62,
0x63,
0x64,
0x65,
0x66,
0x67,
IMUL
LMUL
FMUL
DMUL
IDIV
=
=
=
=
=
0x68,
0x69,
0x6A,
0x6B,
0x6C,
LDIV
FDIV
DDIV
= 0x6D,
= 0x6E,
= 0x6F,
IREM
LREM
FREM
DREM
INEG
LNEG
FNEG
DNEG
=
=
=
=
=
=
=
=
0x70,
0x71,
0x72,
0x73,
0x74,
0x75,
0x76,
0x77,
ISHL
LSHL
ISHR
LSHR
IUSHR
LUSHR
IAND
LAND
=
=
=
=
=
=
=
=
0x78,
0x79,
0x7A,
0x7B,
0x7C,
0x7D,
0x7E,
0x7F,
IOR
LOR
IXOR
LXOR
IINC
I2L
I2F
I2D
=
=
=
=
=
=
=
=
0x80,
0x81,
0x82,
0x83,
0x84,
0x85,
0x86,
0x87,
L2I
L2F
L2D
F2I
F2L
F2D
D2I
D2L
=
=
=
=
=
=
=
=
0x88,
0x89,
0x8A,
0x8B,
0x8C,
0x8D,
0x8E,
0x8F,
D2F
I2B
I2C
I2S
LCMP
FCMPL
FCMPG
DCMPL
=
=
=
=
=
=
=
=
0x90,
0x91,
0x92,
0x93,
0x94,
0x95,
0x96,
0x97,
DCMPG
IFEQ
IFNE
IFLT
IFGE
IFGT
IFLE
IF_ICMPEQ
=
=
=
=
=
=
=
=
0x98,
0x99,
0x9A,
0x9B,
0x9C,
0x9D,
0x9E,
0x9F,
IF_ICMPNE
IF_ICMPLT
IF_ICMPGE
= 0xA0,
= 0xA1,
= 0xA2,
IF_ICMPGT
IF_ICMPLE
IF_ACMPEQ
IF_ACMPNE
GOTO
=
=
=
=
=
JSR
RET
TABLESWITCH
LOOKUPSWITCH
IRETURN
LRETURN
FRETURN
DRETURN
0xA3,
0xA4,
0xA5,
0xA6,
0xA7,
=
=
=
=
=
=
=
=
ARETURN
RETURN
GETSTATIC
PUTSTATIC
GETFIELD
PUTFIELD
INVOKEVIRTUAL
INVOKESPECIAL
0xA8,
0xA9,
0xAA,
0xAB,
0xAC,
0xAD,
0xAE,
0xAF,
=
=
=
=
=
=
=
=
0xB0,
0xB1,
0xB2,
0xB3,
0xB4,
0xB5,
0xB6,
0xB7,P
INVOKESTATIC
INVOKEINTERFACE
UNUSED_BA
NEW
NEWARRAY
ANEWARRAY
ARRAYLENGTH
ATHROW
=
=
=
=
=
=
=
=
0xB8,
0xB9,
0xBA,
0xBB,
0xBC,
0xBD,
0xBE,
0xBF,
CHECKCAST
INSTANCEOF
MONITORENTER
MONITOREXIT
WIDE
MULTIANEWARRAY
IFNULL
IFNONNULL
=
=
=
=
=
=
=
=
0xC0,
0xC1,
0xC2,
0xC3,
0xC4,
0xC5,
0xC6,
0xC7,
GOTO_W
JSR_W
BREAKPOINT
= 0xC8,
= 0xC9,
= 0xCA,
/*=========================================================
================
* Fast bytecodes (used internally by the system
*
only if FASTBYTECODES flag is on)
*==========================================================
=============*/
GETFIELD_FAST
GETFIELDP_FAST
GETFIELD2_FAST
PUTFIELD_FAST
PUTFIELD2_FAST
GETSTATIC_FAST
GETSTATICP_FAST
=
=
=
=
=
=
=
0xCB,
0xCC,
0xCD,
0xCE,
0xCF,
0xD0,
0xD1,
GETSTATIC2_FAST
PUTSTATIC_FAST
PUTSTATIC2_FAST
UNUSED_D5
INVOKEVIRTUAL_FAST
INVOKESPECIAL_FAST
=
=
=
=
=
=
0xD2,
0xD3,
0xD4,
0xD5,
0xD6,
0xD7,
INVOKESTATIC_FAST
INVOKEINTERFACE_FAST
NEW_FAST
ANEWARRAY_FAST
MULTIANEWARRAY_FAST
CHECKCAST_FAST
INSTANCEOF_FAST
=
=
=
=
=
=
=
0xD8,
0xD9,
0xDA,
0xDB,
0xDC,
0xDD,
0xDE,
CUSTOMCODE
= 0xDF,
LASTBYTECODE
} ByteCode ;
= 0xDF
No se van a comentar el funcionamiento de cada uno de los bytecodes que
figuran en esta versión de la KVM porque dicha documentación quedaría fuera de los
objetivos de este proyecto. Simplemente veremos algunos bytecodes a modo de
ejemplo.
El bytecode de nombre FCMPL es el que realiza la comparación de dos numeros
en coma flotante y su implementación es la siguiente:
#if FLOATBYTECODES
SELECT(FCMPL)
/* Compare float */
double rvalue = *(float*)sp;
double lvalue = *(float*)(sp-1);
oneLess;
*(long*)sp = (lvalue < rvalue) ? -1 :
(lvalue == rvalue) ? 0 :
(lvalue > rvalue) ? 1 :
(TOKEN & 01)
? -1 : 1;
DONE(1)
#endif
Como se puede ve r toma los dos números a compara de la pila de ejecución
referenciada por el registro SP. La operación oneLess es una operación de manipulación
rápida de la pila de ejecución decrementando en uno su tamaño. Mediante instrucciones
condicionales ternarias guarda en pila de ejecución el entero simbólico de resultado de
la comparación de los números. Finaliza el bytecode llamando a la macro DONE cuya
explicación se encuentra recogida en apartado 9.3.5.
Otro ejemplo podrían ser los bytecodes que se emplean cuando se ejecuta la
instrucción return en un método y cuya implementación es la siguiente:
#if STANDARDBYTECODES
SELECT6(IRETURN, LRETURN, FRETURN, DRETURN, ARETURN, RETURN)
/* Return from method */
BYTE* previousIp
OBJECT synchronized
= fp->previousIp;
= fp->syncObject;
TRACE_METHOD_EXIT(fp->thisMethod);
if (synchronized != NULL) {
char* exitError;
if (monitorExit(synchronized, &exitError) ==
MonitorStatusError) {
exception = exitError;
goto handleException;
}
}
/* Special case where we are killing a thread */
if (previousIp == KILLTHREAD) {
VMSAVE
stopThread();
VMRESTORE
if (areAliveThreads()) {
goto reschedulePoint;
} else {
return; /* Must be the end of the program */
}
}
/* Regular case where we pop the stack frame and return data
*/
if ((TOKEN & 1) == 0) {
/* The even ones are all the return of a single value */
cell data = topStack;
POP_FRAME
pushStack(data);
} else if (TOKEN == RETURN) {
POP_FRAME
} else {
/* We don't care whether it's little or big endian. . . */
long t2 = sp[0];
long t1 = sp[-1];
POP_FRAME
pushStack(t1);
pushStack(t2);
}
goto reschedulePoint;
DONEX
#endif
Lo primero que se hace es guardar en previousIp el valor del contador de
programas o instrucción que se ejecuto antes de llamar al método y que se encontraba
almacenada en el marco de ejecución del método (FP). Además se obtiene el objeto
sincronizado en el caso en el cual el método sea declarado así a nivel Java:
BYTE* previousIp
OBJECT synchronized
= fp->previousIp;
= fp->syncObject;
Seguidamente se genera la traza correspondiente de salida del método:
TRACE_METHOD_EXIT(fp->thisMethod);
Si el método es sincronizado libera el monitor asociado al objeto para que este
método pueda se accedido desde otros hilos de ejecución y genera la excepción
correspondiente si se produce algún error:
if (synchronized != NULL) {
char* exitError;
if (monitorExit(synchronized, &exitError) ==
MonitorStatusError) {
exception = exitError;
goto handleException;
}
}
Si el método que se ejecuta es el de finalización de un hilo, caso en el cual la
instrucción de retorno del método es del tipo KILLTHREAD, se invoca al función
stopThread que desde el módulo de gestión de hilos finaliza adecuadamente el hilo. Si
aún quedan hilos activos se llama al planificador de hilos:
if (previousIp == KILLTHREAD) {
VMSAVE
stopThread();
VMRESTORE
if (areAliveThreads()) {
goto reschedulePoint;
} else {
return; /* Must be the end of the program */
}
}
Ahora bien el caso más común consistiría en eliminar el marco de ejecución que
se ha creado para el método en cuestión (mediante la macro POPFRAME) y añadir a la
pila de ejecución el resultado del método (data) si hay resultados a devolver:
if ((TOKEN & 1) == 0) {
/* The even ones are all the return of a single value */
cell data = topStack;
POP_FRAME
pushStack(data);
} else if (TOKEN == RETURN) {
POP_FRAME
} else {
/* We don't care whether it's little or big endian. . . */
long t2 = sp[0];
long t1 = sp[-1];
POP_FRAME
pushStack(t1);
pushStack(t2);
}
goto reschedulePoint;
11.4.4.
Implementación de SUN del flujo principal del
intérprete.
Se recomienda la lectura del apartado anterior para conocer los distintos
registros y parámetros que emplea el intérprete de la KVM para ejecutar los distintos
bytecodes.
Como ya se ha comentado en el apartado anterior el flujo principal del intérprete
se encuentra recogido en el fichero execute.c y en particular mediante el método
siguiente:
void Interpret()
Mediante este método se realiza una invocación simple al intérprete del cual
dispone la KVM. Esté método en realidad actúa como una interfaz para el algoritmo
real de interpretación de bytecodes que esta contenido en el método FastInterpret():
CurrentNativeMethod = NULL;
START_TEMPORARY_ROOTS
IS_TEMPORARY_ROOT(thisObjectGCSafe, NULL);
FastInterpret();
END_TEMPORARY_ROOTS
Como vemos la invocación al intérprete se realiza tras haber inicializado la lista
de raíces temporales del sistema mediante las macros START_TEMPORARY_ROOTS.
Posteriormente se presentan por la salida estándar los resultados obtenidos, estos
resultados incluyen:
•
•
•
•
•
Bytecodes: número de bytecodes que se han ejecutado.
Slowcodes : porcentaje de slowcodes encontrados.
Calls : llamadas a métodos realizadas.
Branches : saltos en memoria realizados.
Rescheduled : replanificaciones realizadas.
Iremos viendo cada uno de estos parámetros conforme vayamos avanzando en la
documentación de este complejo proceso de interpretación que lleva a cabo la maquina
virtual. Tener en cuenta que estos presentación de resultados solo se lleva a cabo cuando
esta activa la macro INSTRUMENT lo cual es útil para depuración de cambios llevados
a cabo en el intérprete.
Veamos a continuación cada una de las fases que se ejecutan en el intérprete.
La primera tarea que se realiza es redefinir como variables locales al interprete
los registros IP, SP, LP, FP de la maquina virtual. En realidad solo es necesario hacer
locales el IP y el SP pero siempre es mejor acceder a todos de la misma forma y en el
mismo estado y por ello se registran las siguientes variables locales a todo el intérprete:
#if IPISLOCAL
#undef ip
register BYTE* ip; /*
#endif
Instruction pointer (program counter) */
#if SPISLOCAL
#undef sp
register cell* sp; /*
#endif
#if LPISLOCAL
#undef lp
register cell* lp; /*
#endif
#if FPISLOCAL
#undef fp
register FRAME fp; /*
#endif
#if CPISLOCAL
#undef cp
register CONSTANTPOOL
#endif
Execution stack pointer */
Local variable pointer */
Current frame pointer */
cp; /*
Constant pool pointer */
#if ENABLE_JAVA_DEBUGGER
register BYTE token;
#endif
Se puede comprobar como este volcado de los registros solo se realiza si las
macros XXXSLOCAL están activas opción derivada de la configuración de una
directiva superior LOCALVMREGISTER dentro del fichero main.h. En realidad no es
necesario la copia local de los registros para el funcionamiento pero si mejora el
rendimiento del intérprete.
Se definen en esta fase otras variables globales como una estructura especial que
se emplea para representar los tipos long y double en aquellos sistemas cuyo proceso de
compilación obliga a emplear registros de 8 bits alineados de manera adecuada (macros
NEED_LONG_ALIGNMENT y NEED_LONG_ALIGNMENT).
Para finalizar esta fase se actualizan las variables locales de los registros de la
maquina virtual (que se habían registrado anteriormente) con los valores actuales de
dichos registros mediante la macro VMRESTORE:
#define VMRESTORE {
RESTOREIP
RESTOREFP
RESTORESP
RESTORELP
RESTORECP
}
\
\
\
\
\
\
Las macros que se encargan precisamente de tomar el valor de los registros de la
maquina virtual o modificarlos si es necesario se encuentran en fichero execute.h y son:
/*====================================================================
=====
* SAVEIP/RESTOREIP
*=====================================================================
==*/
#if IPISLOCAL
#define
#define
#else
#define
#define
#endif
SAVEIP
ip_global = ip; CLEAR(ip);
RESTOREIP ip = ip_global; CLEAR(ip_global);
SAVEIP
/**/
RESTOREIP /**/
/*====================================================================
=====
* SAVEFP/RESTOREFP
*=====================================================================
==*/
#if FPISLOCAL
#define SAVEFP
#define RESTOREFP
#else
#define SAVEFP
#define RESTOREFP
#endif
fp_global = fp; CLEAR(fp);
fp = fp_global; CLEAR(fp_global);
/**/
/**/
/*====================================================================
=====
* SAVESP/RESTORESP
*=====================================================================
==*/
#if SPISLOCAL
#define SAVESP
#define RESTORESP
#else
#define SAVESP
#define RESTORESP
#endif
sp_global = sp; CLEAR(sp);
sp = sp_global; CLEAR(sp_global);
/**/
/**/
/*====================================================================
=====
* SAVELP/RESTORELP
*=====================================================================
==*/
#if LPISLOCAL
#define SAVELP
#define RESTORELP
#else
#define SAVELP
#define RESTORELP
#endif
lp_global = lp; CLEAR(lp);
lp = lp_global; CLEAR(lp_global);
/**/
/**/
/*====================================================================
=====
* SAVECP/RESTORECP
*=====================================================================
==*/
#if CPISLOCAL
#define SAVECP
cp_global = cp; CLEAR(cp);
#define RESTORECP cp = cp_global; CLEAR(cp_global);
#else
#define SAVECP
/**/
#define RESTORECP /**/
#endif
Donde las variables xx_global tienen el valor actualizado del registro y las
variables xx son la copia local del mismo donde xx serían las siglas del registro en
cuestión (sp,fp,…). Las variables xx_global forman parte de la estructura global
GlobalState:
struct GlobalStateStruct
BYTE*
gs_ip;
cell*
gs_sp;
cell*
gs_lp;
CONSTANTPOOL gs_cp;
FRAME
gs_fp;
};
{
/*
/*
/*
/*
/*
Instruction pointer (program counter) */
Execution stack pointer */
Local variable pointer */
Constant pool pointer */
Current frame pointer */
extern struct GlobalStateStruct GlobalState;
#define
#define
#define
#define
#define
ip_global
sp_global
lp_global
cp_global
fp_global
GlobalState.gs_ip
GlobalState.gs_sp
GlobalState.gs_lp
GlobalState.gs_cp
GlobalState.gs_fp
Tener en cuenta que el código correspondiente al interprete es un código
fuertemente no estructurado que hace uso de etiquetas a nivel de código para ir saltando
de una parte a otra del algoritmo. De esta forma la ejecución comienza por el estado 0 o
la replanificación del hilo si la opción de depuración ENABLE_JAVA_DEBUGGER esta
activada (lo cual no se da en entornos de producción):
#if ENABLE_JAVA_DEBUGGER
goto reschedulePoint;
#else
goto next0;
#endif
El siguiente paso en la ejecución del intérprete depende de uno de los parámetros
de configuración que es RESCHEDULEATBRANCH. Si esta opción no esta activada
como sucedía por defecto en la versión 1.0 de la KVM se fuerza a una replanificación
del hilo de ejecución cada vez que se ejecuta un bytecode del mismo:
#if !RESCHEDULEATBRANCH
next3: ip++;
next2: ip++;
next1: ip++;
next0:
reschedulePoint:
RESCHEDULE
#endif
En cambio si la opción comentada esta activada solo se replanifica el hilo si se
activa el punto reschedulePoint :
#if RESCHEDULEATBRANCH
reschedulePoint:
RESCHEDULE
#if ENABLE_JAVA_DEBUGGER
goto next0a;
#else
goto next0;
#endif
Como se puede observar la invocación del módulo de threading se lleva a cabo a
través de la macro RESCHEDULE. Esta macro realiza las siguientes comprobaciones:
•
Comprueba si hay una situación de intercambio de hilo de ejecución mediante la
función isTimeToResechedule:
•
Se salva el estado de los registros de la maquina virtual.
•
Se lanza el evento que invoca al planificador de hilos
•
Se restaura el valor salvado de los registros de la maquina virtual.
Para obtener una descripción detallada de cómo se lleva a cabo la replanificación de
los hilos de ejecución se recomienda la lectura del capítulo correspondiente al
análisis de la gestión de hilos de ejecución en la maquina virtual.
La siguiente fase sigue siendo una fase de configuración previa a la ejecución
real del bytecode. Esta fase consta de una serie de operaciones encapsuladas en unas
macros específicas. Estas macros realizan una salvaguarda del estado actual de los
registros de la maquina virtual (operación que ya hemos comentado en este mismo
apartado), seguidamente llaman a la operación concreta y vuelve a restaurar los
registros de la maquina virtual:
#define OPERACIONESPECIFICA
VMSAVE
OperacionEspecifica();
VMRESTORE
}
{
\
\
\
\
Veamos a continuación estas operaciones de configuración:
•
mediante esta operación se invoca al método
InstructionProfile que realiza una comprobación del estado correcto de la
máquina virtual (si esta activada la opción de INCLUDEDEBUGCODE) e incrementa
el contador de instrucciones.
INSTRUCTIONPROFILE:
void InstructionProfile() {
#if INCLUDEDEBUGCODE
/* Check that the VM is doing ok */
checkVMstatus();
#endif /*INCLUDEDEBUGCODE*/
/* Increment the instruction counter */
/* for profiling purposes */
InstructionCounter++;
}
Esta operación es útil para mantener estadísticas acerca de las instrucciones a
nivel maquina ejecutadas. Para obtener una descripción detallada del checkeo de la
maquina virtual ejecutado mediante la operación checkVMStatus() se recomienda la
lectura del apartado 9.3.5 Métodos auxiliares de ayuda al intérprete.
•
INSTRUCTIONTRACE :
•
INC_BYTECODE :
•
DO_VERY_EXCESSIVE_GARBAGE_COLLECTION
mediante esta operación se invoca al método
InstructionTrace() (para una descripción más amplia de este método consultar
apartado 9.3.4) que va actualizando y mostrando la traza de los bytecodes que se
están ejecutando si las opciones tracebytecodes y INCLUDEDEBUGCODE
están activas.
esta operación activa cuando la opción INSTRUMENT de
configuración de la maquina virtual lo esta incrementa el contador de bytecodes
ejecutados.
: si se encuentra activada la opción
VERY_EXCESSIVE_GARBAGE_COLLECTION de configuración de la maquina
virtual (empleada para fines de depuración principalmente) se fuerza a ejecutar
el recolector de basura por cada bytecode ejecutado:
#if VERY_EXCESSIVE_GARBAGE_COLLECTION
#define DO_VERY_EXCESSIVE_GARBAGE_COLLECTION { \
VMSAVE
\
garbageCollect(0);
\
VMRESTORE
\
}
#else
#if ASYNCHRONOUS_NATIVE_FUNCTIONS &&
EXCESSIVE_GARBAGE_COLLECTION
#define DO_VERY_EXCESSIVE_GARBAGE_COLLECTION { \
extern bool_t veryExcessiveGCrequested;
\
if (veryExcessiveGCrequested) {
\
VMSAVE
\
garbageCollect(0);
\
VMRESTORE
\
veryExcessiveGCrequested = FALSE;
\
}
\
}
#else
#define DO_VERY_EXCESSIVE_GARBAGE_COLLECTION /**/
#endif
#endif
La invocación al recolector de basura se hace a través del método
garbageCollect. Puede obtenerse documentación detallada del funcionamiento de la
gestión de memoria de la KVM incluido el recolector de basura en el capítulo 8.
Con este último conjunto de operaciones se ha configurado el entorno para poder
servir de manera correcta al sistema el bytecode y todas las operaciones que se hagan
internamente en él. Para ello se usa un selector tipo switch en base al contenido de del
registro IP en este punto de ejecución del interprete. Es llegado a este punto cuando se
incluyen la definición de todos los bytecodes de que dispone el sistema:
#define STANDARDBYTECODES 1
#define FLOATBYTECODES
IMPLEMENTS_FLOAT
#define FASTBYTECODES
ENABLEFASTBYTECODES
#if SPLITINFREQUENTBYTECODES
#define INFREQUENTSTANDARDBYTECODES 0
#else
#define INFREQUENTSTANDARDBYTECODES 1
#endif
#include "bytecodes.c"
#undef STANDARDBYTECODES
#undef FLOATBYTECODES
#undef FASTBYTECODES
#undef INFREQUENTSTANDARDBYTECODES
El conjunto de bytecodes se encuentra recogido como ya se ha comentado en un
apartado anterior en el fichero bytecode.c y se configura dicho conjunto en base a los
valores de las opciones FLOATBYTECODES (para configurar la alineación de los
numeros en coma flotante), FASTBYTECODES (para permitir bytecodes reducidos de
ejecución rápida), INFREQUENTSTANDARDBYTECODES (para permitir que los
bytecodes mas comunes se carguen mas rápidamente). En el apartado 4 de este capítulo
se hará un breve resumen de todos los parámetros de configuración de que se dispone en
la maquina virtual para controlar la ejecución del interprete y como el usuario puede
modificarlos a su gusto para adaptar la implementación de la maquina virtual a su
sistema final específico.
El conjunto de operaciones a realizar en base al tipo de bytecode que se este
ejecutando es limitado y esta incluido en el selector switch antes comentado:
•
branchPoint : esta operación solo se encuentra disponible si la configuración
COMMONBRANCHING esta activa. En este caso se incrementa el registro IP
en una unidad para ejecutar el siguiente bytecode y se ejecuta el planificador de
hilos (reschedulePoint):
#if COMMONBRANCHING
branchPoint: {
INC_BRANCHES
ip += getShort(ip + 1);
goto reschedulePoint;
}
#endif
Tener en cuenta que se llega a este punto de ejecución en el ciclo de
interpretación del bytecode si se ha producido un salto condicional a lo largo de
la memoria (por ejemplo una sentencia if). Estos saltos en las instrucciones a
ejecutar se realizan a nivel de intérprete mediante la siguiente macro:
#if COMMONBRANCHING
#define BRANCHIF(cond) { if(cond) { goto branchPoint; } else {
goto next3; } }
#else
#define BRANCHIF(cond) { ip += (cond) ? getShort(ip + 1) : 3;
goto reschedulePoint; }
#endif
De esta manera el salto condicional se realiza si se cumple la condición cond en
cuyo caso se ejecutan las dos siguientes instrucciones a la indicada por el
registro IP actual. Estas dos instrucciones en realidad son punteros a otros
grupos de instrucciones. Si no se cumple la condición de salto se incrementa en
3 el registro IP continuando la ejecución normal.
•
callMethod_interface: este operación como su propio nombre indica se ejecuta
al realizarse la invocación de un método genérico:
invokerSize = 5;
goto callMethod_general;
Esta operación lo que hace es fijar el tamaño del bytecode que se va a ejecutar a
través de la variable invokerSize y desplazarnos a la operación
callMethod_general que es la que implementa la invocación del método.
•
callMethod_virtual, callMethod_static,callMethod_special: estas operación son
ejecutadas al invocar métodos Java afectados por algún modificador de
visibilidad tales como static o final. Al igual que en callMehod_interface
simplemente se especifica el tamaño del bytecode y se llama a
callMethod_general.
•
callMethod_general: esta operación es ejecutada cuando se realiza una
invocación de un método. Lo primero que se realiza es incrementar el contador
de llamadas a métodos mediante la macro INC_CALL. Si el método es nativo
del sistema se invoca dicho método a través de la función auxiliar
invokeNativeFunction pasándole como parámetro el método a invocar que se
encuentra almacenado en el puntero thisMethod:
if (thisMethod->accessFlags & ACC_NATIVE) {
ip += invokerSize;
VMSAVE
invokeNativeFunction(thisMethod);
VMRESTORE
TRACE_METHOD_EXIT(thisMethod);
goto reschedulePoint;
}
Como vemos el registro IP se incrementa tantas veces como indique el tamaño
del bytecode que se esta ejecutando. Además se añade a la traza de ejecución la
salida del método cuando se produzca mediante la macro
TRACE_METHOD_EXIT. Tras haber ejecutado la traza correspondiente se
procede a invocar nuevamente al planificador de hilos de ejecución saltando al
punto reschedulePoint. Para obtener una explicación detallada de cómo funciona
el método invokeNativeFunction se recomienda la lectura del capítulo 13 Uso y
gestión de funciones nativas.
Si el método no es nativo se comprueba si es abstracto en cuyo caso se genera un
error fatal indicando que se esta tratando de ejecutar un método abstracto:
if (thisMethod->accessFlags & ACC_ABSTRACT) {
fatalError(KVM_MSG_ABSTRACT_METHOD_INVOKED);
}
Si el método no es abstracto ni es nativo se guarda una copia de la referencia al
objeto en otro objeto thisObjectGCSafe para que no sea eliminado por el
recolector de basura. Además se añade la referencia al método que se desea
ejecutar thisMethod al marco de ejecución del hilo mediante el método auxiliar
pushFrame:
thisObjectGCSafe = thisObject;
VMSAVE
res = pushFrame(thisMethod);
VMRESTORE
En el caso en el que método se haya añadido de forma correcta la pila de
ejecución se marca cual sería la siguiente instrucción a ejecutar cuando se llegara
a la instrucción return dentro del método:
if (res) {
/* Advance to next inst on return */
fp->previousIp += invokerSize;
}
Además si el método ha sido añadido a la pila correctamente y se trata de un
método sincronizado (usado como ya es sabido en la gestión de hilos de Java) ha
de grabar el monitor del objeto en cuestión para que el resto de los hilos sepan
que esta accediendo al método en cuestión y se guarda en el campo syncObject
del registro FP una referencia al objeto. Este campo es empleado por el módulo
de gestión de hilos que es tratado en profundidad en el capítulo 11:
if (res) {
if (thisMethod->accessFlags & ACC_SYNCHRONIZED) {
VMSAVE
monitorEnter(thisObjectGCSafe);
VMRESTORE
fp->syncObject = thisObjectGCSafe;
}
}
Finalmente se invoca al planificador de hilos.
•
handleXXXXXException: se tienen una serie de opciones en el selector del tipo
de bytecode que se refieren a los distintos tipos de excepciones que se pueden
producir. Simplemente asocian al objeto excepción un objeto del tipo de
excepción en concreto que se ha producido y se invoca a la operación
handleException que se encarga de gestionar todas las excepciones. Las
excepciones que se producen a nivel de ejecución de los bytecodes son:
o
o
o
o
o
o
•
NullPointerException.
ArrayIndexOutOfBoundException.
ArithmetycException.
ArrayStoreException.
ClassCastException.
JavaLangError.
handleException: con esta operación se recogen las distintas excepciones que se
hayan producido durante la ejecución del bytecode y mediante el método
raiseException (encuadrado dentro del módulo de gestión de logs y errores de la
maquina virtual) se eleva la excepción para que llegue al usuario y quede
registrada donde sea necesaria:
VMSAVE
raiseException(exception);
VMRESTORE
goto reschedulePoint;
Al elevar la excepción se produce una llamada al planificador de hilos para que
este pueda seguir ejecutando otro hilo que este a la espera.
•
callSlowInterpret: esta opción solo esta disponible si esta activo la bandera de
SPLITINFREQUENCEBYTECODES y la operación que realiza es tomar el
bytecode y ejecutar para este bytecode una versión especial del interprete, el
SlowInterpret:
int __token = TOKEN;
VMSAVE
SlowInterpret(__token);
VMRESTORE
goto reschedulePoint;
Este intérprete lento se emplea para la ejecución de los bytecodes que se usan
con menor frecuencia y es similar en funcionamiento al FastInterpret salvo en
que son más lentos pues no usan en su ejecución copias locales de los registros
de la maquina virtual (opción por defecto para el FastInterpret) sino que emplea
y accede directamente a los registros y además solo ejecuta el bytecode que le es
pasado como parámetro.
•
default: si el bytecode no es válido se ejecuta esta operación que genera un error
fatal dando como mensaje el bytecode que ha provocado el error:
sprintf(str_buffer, KVM_MSG_ILLEGAL_BYTECODE_1LONGPARAM,
(long)TOKEN);
fatalError(str_buffer);
break;
11.4.5.
Métodos auxiliares de ayuda al intérprete.
En este apartado se pretender comentar de forma breve pero suficientemente
aclarativa los distintos métodos auxiliares que el intérprete necesita en su
funcionamiento. Estos métodos se encuentran recogidos en el fichero interpret.c.
11.4.5.1.
Método checkVMStatus().
Este método como su propio nombre indica realiza una comprobación acerca del
estado de la maquina virtual al menos en los parámetros que afectan directamente al
intérprete. Básicamente realiza una comprobación de dos cosas:
•
•
Los registros o sus copias locales si estas han sido habilitadas están apuntando a
posiciones en memoria validas:.
Las pilas de ejecución no esta infradesbordadas o superdesbordadas.
Primero se recorre la pila de ejecución del hilo actual en el cual se ejecutan los
bytecodes y se comprueba si el registro sp (SP: snack pointer) se encuentra dentro de la
pila marcando como superada la comprobación (valid) si esto es así y sino se genera un
error fatal informando al usuario con el correspondiente mensaje:
for (valid = 0, stack = CurrentThread->stack; stack; stack =
stack->next) {
if (STACK_CONTAINS(stack, sp)) {
valid = 1;
break;
}
}
if (!valid) {
fatalVMError(KVM_MSG_STACK_POINTER_CORRUPTED);
}
Para el registro FP que es el que almacena la información relativa al entorno de
ejecución del hilo se realiza una comprobación similar a la anterior solo que esta vez se
comprueba que dicho registro no se encuentre dentro de la pila de ejecución del hilo y
que el puntero al marco de ejecución de hilo no se encuentre por detrás del registro SP:
for (valid = 0, stack = CurrentThread->stack; stack; stack =
stack->next) {
if (STACK_CONTAINS(stack, (cell*)fp) && (cell*)fp <= sp) {
valid = 1;
break;
}
}
if (!valid) {
fatalVMError(KVM_MSG_FRAME_POINTER_CORRUPTED);
}
Para el registro SP que es el que registra en una lista las distintas variables
locales que esta usando el hilo se hace exactamente la misma comprobación que para el
registro FP:
for (valid = 0, stack = CurrentThread->stack; stack; stack =
stack->next) {
if (STACK_CONTAINS(stack, lp) && lp <= sp) {
valid = 1;
break;
}
}
if (!valid) {
fatalVMError(KVM_MSG_LOCALS_POINTER_CORRUPTED);
}
Finalmente se comprueba que hay más de un hilo de ejecución activo en la
maquina virtual, si no es así se genera el correspondiente error fatal:
if (!areActiveThreads()) {
fatalVMError(KVM_MSG_ACTIVE_THREAD_COUNT_CORRUPTED);
}
Esta última comprobación se basa simplemente en comprobar que los objetos
CurrentThread y RunnableThreads referencian al algún hilo real(es decir no tienen
valor nulo).
11.4.5.2.
Método getByteCodeName().
Como su propio nombre indica mediante este método se obtiene el nombre del
bytecode que le es pasado como parámetro:
if (token >= 0 && token <= LASTBYTECODE)
return byteCodeNames[token];
else return "<INVALID>";
Dicho nombre lo obtiene consultando el listado de bytecodes disponibles
(byteCodeNames).
11.4.5.3.
Método printRegisterStatus().
Este método muestra por la salida estándar información referente al estado de la
maquina virtual y sus registros. La información que muestra por orden es:
•
•
•
•
•
•
Valor actual del contador de programa (IP).
Offset entre el contador de programas actual y el método a ejecutar dentro del
marco de ejecución (FP).
Valor siguiente del contador de programa (IP).
Valores de los registros FP y LP.
Tamaño de la pila de ejecución actual y contenido de la misma (SP).
Contenido del marco de ejecución completo apuntado por el registro FP.
11.4.5.4.
Método printVMStatus().
Mediante este método se muestra por pantalla un estado completo de la maquina
virtual en el momento de ejecución invocando a una serie de funciones auxiliares que
muestra información de distintos parámetros de la KVM:
printStackTrace();
printRegisterStatus();
printExecutionStack();
printProfileInfo();
Como se puede observar muestra información acerca de la traza de ejecución del
hilo actual, el estado de los registros de la KVM, la pila de ejecución e información
estadística variada.
11.4.5.5.
Método fatalSlotError().
Esta función es empleado por algunos de los bytecodes para realizar la
comprobación previa a la invocación del método de que se han pasado todos los
parámetros que se indican en la definición Java de dicho método tanto si el método esta
en la caché como si no.
Esta función emplea la información de la clase CONSTANT POOL para hacer
las siguientes comprobaciones:
•
•
Que los parámetros pasados al método son correctos en número.
Que el método invocado existe para esa clase.
Para obtener una descripción detallada acerca de las estructuras que la KVM
emplea para representar los distintos elementos Java ya sean clases, objetos, métodos se
recomienda una lectura paciente del capítulo 7 Estructuras de ejecución internas.
11.4.5.6.
Macros adicionales.
Además de los métodos auxiliares anteriormente comentados existen una serie
de macros que se emplean a lo largo de la ejecución del intérprete y que encapsulan
cierto código que es accedido de forma recurrente. Conforme se ha ido explicando el
funcionamiento del intérprete se han explicado algunas de estas macros. En este
apartado explicaremos algunas de estas macros que se emplean sobre todo desde el
código interno de los bytecodes.
•
•
•
•
•
SELECT: las macros select son las que se emplean para definir los bytecodes y
simplemente encapsulan un cláusula múltiple del tipo swtich-case en su interior:
DONE: para terminar la definición de un bytecode incrementando el registro IP.
DONEX: para terminar la definición de un bytecode con un goto.
DONE_R: para terminar la definición de un bytecode e invocar al planificador de
hilos.
CHECKARRAY: para comprobar si el índice con el que se esta accediendo a un
array están dentro de la longitud del array.
•
•
•
•
•
•
•
ENDCHECKARRAY: continuación de la macro anterior donde en base al
resultado obtenido de CHECKARRAY se eleva a excepción de
ArrayIndexOutOfBoundException o no.
CALL_VIRTUALMETHOD,
CALL_STATICMETHOD,
CALL_SPECIALMETHOD, CALL_INTERFACEMETHOD: simplemente son un
conjunto de goto a las distintas opciones del selector principal de bytecodes del
cual hacía uso el FastInterpret.
CHECK_NOT_NULL: para detectar y elevar la excepción NullPointerException.
TRACE_METHOD_ENTRY: igual que la macro ya comentada con anterioridad
TRACE_METHOD_EXIT solo que esta es invocada al entrar en el método en
cuestión que se esta invocando en ese momento.
POP_FRAME : realiza una invocación al método popFrame() del módulo de
gestión de marcos de ejecución de la maquina virtual para obtener un marco de
ejecución de un hilo.
INFREQUENTROUTINE: si la opción de división de bytecodes esta activa esta
macro realiza la invocación del SlowInterpret para un bytecode específico.
CLEAR: para poner a cero una variable. Esta macro se emplea en determinados
bytecodes para impedir errores debidos a la no inicialización de las variables.
11.5. Parámetros de configuración del intérprete.
Una vez que se ha estudiado en profundidad el funcionamiento del intérprete al
menos en la versión de la KVM que estamos estudiando podemos hacer un balance de
los distintos parámetros o puntos de control que se pueden aplicar sobre dicho
intérprete.
Como ya hemos comentado en el apartado 9.3 el intérprete de la KVM sufrió
una reestructuración importante en la versión 1.0.2 orientada a mejorar el rendimiento
del mismo sin que por ello afectase a su portabilidad. De esta forma se han mantenido
una serie de parámetros de configuración que son:
El intérprete de la KVM ha sufrido bastantes cambios y mejoras en cada nueva
versión de la KVM. Es por ello que algunas de las opciones que figuran en main.h
provienen de distintas versiones de la KVM. Así desde la versión 1.0 tenemos las
siguientes opciones de configuración:
•
ENABLEFASTBYTECODES
o Valores: 0,1(por defecto).
o Descripción: habilita o no el método de cache y reemplazo de
byetecodes. Esta opción mejora el rendimiento de maquina virtual en un
10-20%, pero incrementa el tamaño de la maquina virtual en unos pocos
kilobytes. A destacar que el reemplazo de bytecodes no puede ser llevado
a cabo en aquellas plataformas en la cuales los bytecodes son
almacenados en memoria no volátil (como por ejemplo una memoria
ROM). Es por ello que esta opción no funciona por ejemplo en una Palm
porque en estas es necesario emplear memoria estática.
•
VERIFYCONSTANTPOOLINTEGRITY
o Valores: 0,1(por defecto).
o Descripción: indica a la maquina virtual si ha de realizar verificación de
tipos de las entradas de estructuras de constantes en tiempo de ejecución
cuando se realiza actualización o búsqueda de estructuras complejas de
constantes. Como se puede intuir esta opción cuando esta activa (valor
por defecto) reduce la velocidad de ejecución de los programas Java, si
bien es recomendable dejarla activa por razones se seguridad.
Algunas definiciones y macros adicionales que pueden o no estar presentes son:
•
•
BASETIMESLICE
o Valores: numero de bytecodes por segundo.
o Descripción: Este valor determina la frecuencia con la cual la maquina
virtual realiza la conmutación de hilos, notificación de eventos y otras
operaciones periódicas necesarias. Un valor pequeño reduce la latencia
de manejo de eventos y conmutación de hilos, pero causa un
funcionamiento mas lento del interprete.
DOUBLE_REMAINDER (x,y) fmod(x,y)
o Valores: macro de código.
o Descripción: macro definida en el fichero interpret.h y empleada para
búsqueda del módulo de dos números en coma flotante.
Por ultimo y todavía dentro de las opciones de la KVM desde la versión 1.0
tenemos la siguiente macro:
#ifndef SLEEP_UNTIL
#
define SLEEP_UNTIL(wakeupTime)
for(;;) {
ulong64 now=CurrentTime_md();
if(11_compare_ge(now, wakeupTime)) {
break;
}
}
#endif
/
/
/
/
/
/
/
/
Esta macro es bastante importante pues provoca que la maquina virtual se
duerma cuando no tiene tareas que realizas dejando de consumir de esta manera
recursos de la plataforma sobra la que se ejecuta. La implementación por defecto es una
espera activa, sin embargo la mayor parte de las plataformas requieren una
implementación más eficiente de este mecanismo que permita a la KVM emplear las
características específicas de conservación de alimentación del dispositivo en concreto.
A continuación procedemos a comentar las opciones de compilación relativas al
intérprete de la KVM a partir de la versión 1.0.2, la cual mejoro el rendimiento del
intérprete en un 15-30% respecto de la versión 1.0 sin que por ello afecte a la
portabilidad del código. Esta mejora depende de la plataforma objetivo y de las
capacidades de que disponga el compilador de C que se emplee, y se debe
principalmente al uso de 4 técnicas específicas:
•
•
•
•
Reestructuración del código del intérprete por el cual los registros de la
maquina virtual se colocan en variables de C locales en tiempo de
ejecución del intérprete.
Separación de los bytecodes de Java menos comunes en una subrutina de
interpretación de estos bytecodes independiente de la que se emplea para
los bytecodes más comunes. Esto permite al compilador de C realizar un
mejor trabajo de optimización de código para los bytecodes mas
frecuentemente empleados.
Desplazar el test para programación de hilos de Java desde el inicio del
bucle de interpretación a la zona donde se interpretan los bytecodes.
Rellenar el espacio entre bytecodes para permitir al compilador producir
mejor código para la mayor parte de las sentencias de transformación del
intérprete.
Estas técnicas no son dependientes de las características específicas de un
compilador y son portables a un gran número de compiladores C. Veamos en
profundidad como afectan cada una de estas nuevas técnicas al rendimiento del
intérprete.
11.5.1.
Copia de los registros de la maquina virtual a
variables locales en tiempo de ejecución.
Las distintas opciones que podemos configurar relativas a esta aspecto son:
•
LOCALVMREGISTER
o Valores: 0, 1(por defecto).
o Descripción: Los registros de la KVM (ip,sp,lp,fp,cp) son
accedidos frecuentemente cuando los bytecodes son ejecutados.
En la versión 1.0 de la KVM estos registros se definían como
variables globales en C. Desde la versión 1.0.2 estos registros se
definen aún como variables globales, pero si la opción
LOCALVMREGISTER esta activa, estos registros son copiados
a variables locales cuando el intérprete se esta ejecutando lo que
permite a un buen compilador de C optimizar el tiempo de
ejecución del interprete de la maquina virtual.
•
IPISLOCAL,SPISLOCAL,LPISLOCAL,CPISLOCAL
o Valores:0,1
o Descripción: estas macros permiten controlar de forma específica
cual de los registros de la maquina virtual debe ser copiado a
local. Es útil para aquellas plataformas con muy poco memoria
que no dispongan de registros suficientes dándosele la
oportunidad en este caso de que puedan elegir que registros van a
ser copiados.
Elegir adecuadamente estas opciones requiere un análisis exhaustivo del código
maquina que genera el compilador, por defecto el orden de criticidad es el siguiente:
1. IP (Punteros de instrucción),
2. SP (Punteros de pila).
3. LP (Punteros locales).
4. FP (Punteros de estructura).
5. CP (Punteros de almacén de constantes).
Un aspecto importante y que reseñaremos más adelante es que si se emplea el
copiado de registros a variables locales y se desea realizar más cambios en el código
encargado de implementar los Java bytecodes es muy importante asegurarse de que las
copias locales de los registros son cargadas de nuevo en las correspondientes variables
globales antes de llamar a funciones que esperen un valor de estas variables globales.
Los registros de la maquina virtual pueden ser salvaguardados a la
correspondiente variables global mediante el uso de una macro especial y que
estudiaremos mas adelante denominada VMSAVE. Para realizar el volcado a las
variables locales se emplea la macro VMRESTORE previa llamada a la función
monitorExit ().
11.5.2.
Separación bytecodes poco frecuentes en un
algoritmo de interpretación independiente.
El intérprete de la versión 1.0 de la KVM tiene el código para el procesado de
todos los bytecodes en una única y larga sentencia de tipo switch. Sin embargo, un gran
número de Java bytecodes son ejecutados raramente. Si el código para los más
frecuentes y para los menos frecuentes bytecodes son alojados en rutinas separadas, el
compilador de C puede ofrecer un mejor trabajo optimizando pequeños interpretes por
separado. Además esto facilita al compilador encontrar registros hardware para los
registros de la maquina virtual mas fácilmente cuando la opción
LOCALVMREGISTER esta activa. La opción de configuración de este aspecto es:
•
SPLITINFREQUENCEBYTECODES
o Valores: 0, 1(por defecto).
o Descripción: hablita la opción para separar los interpretes de bytecodes
tal y como se ha comentado.
El código para el procesado de los bytecodes se encuentra contenido en el
archivo bytecodes.c y se compila de forma selectiva mediante el empleo de una serie de
macros internas: STANDARDBYTECODES, INFREQUENTSTANDARDBYTECODES,
FLOATBYTECODES, FASTBYTECODES). Estas 4 macros son empleadas para
controlar el desarrollo de los bytecodes apropiados en las subrutinas correctas.
El código contenido en bytecodes.c es ejecutado desde el archivo execute.c, Si la
opción SPLITINFREQUENCYBYTECODES esta activa, el archivo bytecode.c es
incluido dos veces en execute.c: la primera de ellas por la rutina SlowInterpret() y otra
mas por la rutina Interpret().
11.5.3.
Migración de la invocación del planificador de hilos
a los puntos de bifurcación del código.
El antiguo interprete de la KVM 1.0 testaba la necesidad de reprogramación de
hilos de ejecución(es decir, la conmutación entre hilos) después de la ejecución de cada
bytecode. El rendimiento del intérprete fue mejorado en un 5% cambiando este test de
forma que el test es ejecutado después de la ejecución cada bifurcación, goto, o retorno
de bytecode.
La reprogramación de hilos en el viejo intérprete se producía cuando un cierto
número de bytecodes son ejecutados, numero que por defecto eran 100 veces la
prioridad del hilo. En el intérprete de la versión 1.0.2 se produce 1000 veces por cada
llamada, puntos de bifurcación o bytecodes de retorno son ejecutados.
Las opciones que configuran esta característica de la KVM es:
•
RESCHEDULEATBRANCH
o Valores: 0,1(por defecto).
o Descripción: activa o desactiva el mecanismo de programación de hilos
en los puntos de bifurcación.
•
TIMESLICEFACTOR
o Valores: numero entero. El valor que toma por defecto es 1000 cuando
RESCHEDULEATBRANCH esta activo y 10000 en caso contrario.
o Descripción: factor de multiplicación para el calculo del tiempo entre
reprogramaciones del calendario de conmutación de hilos.
•
BASETIMESLICE.
o Valores: se fija a el valor de TIMESLICEFACTOR
o Descripción: determina la velocidad a la cual la KVM realiza la
conmutación, notificación y otras operaciones periódicas de
mantenimiento de hilos de ejecución. Un numero pequeño reduce la
latencia en el manejo de eventos y la conmutación de hilos pero reduce la
velocidad de ejecución del interprete.
11.5.4.
Configuración del espacio de bytecodes.
La especificación de la maquina virtual de Java define 200 bytecodes Standard,
mas 4 reservados para futuros usos inmediatos. Sin embargo, muchos compiladores de
C producen un código ejecutable mejor cuando el tamaño de la tabla de bytecodes es
256. Para poder aprovechar esta circunstancia en el archivo main.h se incluye la
siguiente bandera:
•
PADTABLE
o Valores: 1, 0(por defecto).
o Descripción: fija el tamaño total de la tabla de bytecodes en 200 o 256.
11.6. Conclusiones.
En este capítulo se ha examinado el funcionamiento del intérprete de bytecodes.
El intérprete conforma el núcleo de ejecución de la maquina virtual puesto que los
bytecodes es el resultado que se obtiene de compilar los programas Java. Cabe reseñar
como este módulo esta íntimamente relacionado con el planificador de hilos puesto que
es este último quien se encarga de configurar el entorno de ejecución de la maquina
virtual.
De esta forma el intérprete de bytecodes mediante un algoritmo principal ejecuta
de forma secuencial los bytecodes que conforman la clase correspondiente al hilo que se
esta ejecutando en ese momento. Cuando se supera el tiempo máximo de ejecución para
el hilo o bien se fuerza una conmutación de hilos se detiene la ejecución del flujo
principal del intérprete y se realiza la siguiente operación:
•
•
•
•
Salvaguardan los valores de los registros de la maquina virtual.
Se invoca al planificador de hilos.
Se restauran los valores de los registros correspondientes al hilo que se ejecuta
ahora.
Se vuelve a ejecutar el intérprete con los bytecodes del nuevo hilo.
A lo largo de capítulo se ha reseñado el uso que el intérprete hace de una serie de
registros de la KVM. Estos registros tienen un conjunto de valores específicos para cada
conjunto de bytecodes, es decir para cada hilo. Estos registros mantienen información
como por ejemplo que bytecode ha de ser ejecutado o los punteros a la pila de ejecución
de métodos del hilo:
•
•
•
•
•
IP (instruction pointer): es el puntero que indica la instrucción que se esta
ejecutando.
SP (stack pointer): puntero a la pila de ejecución del hilo.
LP (locals pointers): punteros locales necesarios para el hilo.
FR (frame pointer): puntero al marco de ejecución de los métodos.
CP (constant pool pointer): puntero a la constante de almacenaje de datos del
hilo.
El flujo principal de ejecución del intérprete contenido en slowInterpret lee de
forma secuencial cada uno de los bytecodes correspondientes al hilo activo y para cada
uno de ellos opera de la siguiente forma:
•
•
•
Se analiza de forma secuencial cada uno de los bytecodes y para cada uno de
ellos se realizan las siguientes operaciones.
Se realizan tareas de logging y generación de información estadística. Se invoca
al recolector de basura si se ha configurado para ello.
En base al tipo de bytecode a ejecutar se contemplan diferentes opciones:
o Punto de salto: se ejecuta cuando se produce una bifurcación en el
código Java.
o Invocación de un método que es ejecutado cuando nos encontramos con
un bytecode de invocación de un método.
o Gestión de excepciones que es invocada cuando se produce una
excepción no controlada.
o Normal: ejecución por defecto del bytecode.
A lo largo del capítulo se ha podido observar como se ejecutan los bytecodes que
componen los archivos de clases previamente cargados por el módulo loader. Al final
del mismo se da también una descripción acerca de cómo se puede configurar.
Descargar