IBM i: OmniFind Text Search Server for DB2 for i

Anuncio
IBM i
Versión 7.2
Negocio electrónico y servicio Web
OmniFind Text Search Server for DB2
for i
IBM i
Versión 7.2
Negocio electrónico y servicio Web
OmniFind Text Search Server for DB2
for i
Aviso
Antes de utilizar esta información y el producto al que hace referencia, lea la información del apartado “Avisos” en la
página 157.
Este documento puede contener referencias al código interno bajo licencia. El código interno bajo licencia es código
de máquina cuya licencia se obtiene bajo los términos del Acuerdo de licencia de IBM para código de máquina.
© Copyright IBM Corporation 2002, 2014.
Contenido
OmniFind Text Search Server for DB2
for i . . . . . . . . . . . . . . . . 1
Novedades de IBM i 7.2 . . . . . . . . . . 1
Archivo PDF para OmniFind Text Search Server for
DB2 for i . . . . . . . . . . . . . . . 1
Introducción a OmniFind Text Search Server for DB2
for i . . . . . . . . . . . . . . . . . 2
Visión general de OmniFind Text Search Server for
DB2 for i . . . . . . . . . . . . . . 2
Requisitos del sistema para la instalación de
OmniFind Text Search Server for DB2 for i . . . 4
Conceptos clave . . . . . . . . . . . . . 4
Crear y actualizar un índice de búsqueda de texto 4
Indexación asíncrona y desencadenantes . . . . 5
Formatos de documento soportados . . . . . 6
Tipos de datos soportados . . . . . . . . . 7
Puntuación de texto y soporte de sinónimos . . . 7
Proceso lingüístico . . . . . . . . . . . 8
Idiomas soportados . . . . . . . . . . 8
Proceso lingüístico de documentos en chino,
japonés y coreano. . . . . . . . . . . 9
Nombre de alias de servidor. . . . . . . . 11
Instalar y configurar funciones de búsqueda de
texto. . . . . . . . . . . . . . . . . 12
Instalar OmniFind Text Search Server for DB2 for
i . . . . . . . . . . . . . . . . . 12
Iniciar funciones de búsqueda de texto . . . . 13
Crear un índice de búsqueda de texto . . . . 14
Actualizar un índice de búsqueda de texto . . . 14
Buscar en un índice de búsqueda de texto . . . 14
Recorte de documentos . . . . . . . . . 15
Procedimientos almacenados de administración para
búsqueda de texto . . . . . . . . . . . . 15
SYSPROC.SYSTS_START . . . . . . . . . 15
SYSPROC.SYSTS_STOP . . . . . . . . . 17
SYSPROC.SYSTS_CREATE . . . . . . . . 19
SYSPROC.SYSTS_ALTER . . . . . . . . . 28
SYSPROC.SYSTS_DROP . . . . . . . . . 34
SYSPROC.SYSTS_UPDATE . . . . . . . . 36
SYSPROC.SYSTS_SHUTDOWN. . . . . . . 39
Buscar con un índice de búsqueda de texto . . . . 40
CONTAINS . . . . . . . . . . . . . 40
SCORE . . . . . . . . . . . . . . . 43
Sintaxis de argumentos de búsqueda . . . . . 45
Ejemplos de consulta simple. . . . . . . 47
Operadores de búsqueda avanzada . . . . 48
Búsqueda de caracteres especiales . . . . . 50
Ejemplo de utilización de las funciones
CONTAINS y SCORE . . . . . . . . . 53
Búsqueda XML . . . . . . . . . . . . 53
Soporte de espacio de nombres en búsquedas
XML. . . . . . . . . . . . . . . 59
Utilizar espacios de nombres en una búsqueda 61
Ejemplo de búsqueda XML . . . . . . . 65
Gramática de consultas de búsqueda XML . . 68
© Copyright IBM Corp. 2002, 2014
Administrar un OmniFind(r) Text Search Server for
DB2(r) for i . . . . . . . . . . . . . . 69
Iniciar OmniFind Text Search Server for DB2 for i 70
Detener OmniFind Text Search Server for DB2 for
i . . . . . . . . . . . . . . . . . 70
Salvar y restaurar índices de búsqueda de texto
71
Salvar y restaurar un índice de búsqueda de
texto sin datos . . . . . . . . . . . 71
Salvar y restaurar un índice de búsqueda de
texto con datos . . . . . . . . . . . 73
Determinación de problemas . . . . . . . 74
Visualizar y guardar registros del servidor . . . 75
Herramientas de administración . . . . . . 76
Herramienta de configuración . . . . . . 76
SYSPROC.SYSTS_REMOVE . . . . . . . 78
SYSPROC.SYSTS_REPRIMEINDEX . . . . 80
SYSTS_CLEAR_INDEXES . . . . . . . 81
SYSPROC.SYSTS_VALIDITYCHECK . . . . 82
QDBTSLIB.QDBTS_ROWS_STATUS . . . . 83
Diccionarios de sinónimos . . . . . . . 85
Añadir un diccionario de sinónimos a una
colección . . . . . . . . . . . . 85
Eliminar un diccionario de sinónimos de
una colección . . . . . . . . . . . 86
Buscar índices huérfanos y ausentes . . . . 87
Administración avanzada. . . . . . . . 88
Herramienta ServerInstance . . . . . . . . 90
Health Checker . . . . . . . . . . . . 91
Consideraciones relativas a las ASP
independientes para OmniFind Text Search
Server for DB2 for i. . . . . . . . . . . 92
Alta disponibilidad . . . . . . . . . . . 93
Análisis del rendimiento . . . . . . . . . 94
Consideraciones relativas a las transacciones . . 98
Utilización de IBM Navigator for i. . . . . . 99
Trabajar con servidores de búsqueda de texto 99
Trabajar con índices de búsqueda de texto
101
Visualizar construcciones de índice de
búsqueda de texto . . . . . . . . . 103
Utilizar System i Navigator. . . . . . . . 104
Trabajar con servidores de búsqueda de texto 105
Trabajar con índices de búsqueda de texto
107
Visualizar construcciones de índice de
búsqueda de texto . . . . . . . . . 110
Tablas de administración de búsqueda de texto . . 111
Tabla de administración
QSYS2.SYSTEXTDEFAULTS . . . . . . . 111
Tabla de administración
QSYS2.SYSTEXTINDEXES . . . . . . . . 112
Tabla de administración
QSYS2.SYSTEXTCOLUMNS . . . . . . . 114
Tabla de administración
QSYS2.SYSTEXTSERVERS . . . . . . . . 115
Tabla de administración
QSYS2.SYSTEXTCONFIGURATION . . . . . 116
iii
Tabla de administración
QSYS2.SYSTEXTSERVERHISTORY . . . . .
Vista Índice de búsqueda de texto . . . . .
Ampliaciones para indexar y buscar datos no DB2
Visión general de las ampliaciones . . . . .
Crear una colección de búsqueda de texto . . .
Añadir un conjunto de objetos de datos de
archivo spool . . . . . . . . . . . .
Eliminar un conjunto de objetos de datos de
archivo spool . . . . . . . . . . . .
Añadir un conjunto de objetos de datos de
archivo continuo . . . . . . . . . . .
Eliminar un conjunto de objetos de datos de
archivo continuo . . . . . . . . . . .
Añadir un conjunto de objetos de archivo físico
de origen multimiembro. . . . . . . . .
Eliminar un conjunto de objetos de archivo
físico de origen multimiembro. . . . . . .
Eliminar un conjunto de objetos . . . . . .
Actualizar la colección . . . . . . . . .
Volver a llenar la colección de búsqueda de
texto . . . . . . . . . . . . . . .
iv
IBM i: OmniFind Text Search Server for DB2 for i
133
Buscar en la colección . . . . . . . .
Consultar información de conjunto de objetos
Recuperar estado de objetos de índices . . .
Obtener objetos no indexados . . . . . .
Recuperar estado de colección . . . . . .
Eliminar una colección de búsqueda de texto
Modificar una colección de búsqueda de texto
Consideraciones sobre las ASP independientes
para las colecciones de búsqueda de texto . .
Consideraciones sobre la copia de seguridad y
restauración de colecciones de búsqueda de
texto . . . . . . . . . . . . . .
Mensajes y códigos . . . . . . . . . .
Mensajes de OmniFind . . . . . . . .
135
Avisos . . . . . . . . . . . . . . 157
116
117
118
118
119
124
128
131
137
138
139
140
Información de la interfaz de programación .
Marcas registradas. . . . . . . . . .
.
.
. 141
143
. 144
. 145
. 146
148
149
. 152
. 152
. 153
. 153
. 159
. 159
Índice. . . . . . . . . . . . . . . 161
OmniFind Text Search Server for DB2 for i
OmniFind Text Search Server for DB2 for i permite emitir sentencias SQL que satisfagan las consultas de
búsqueda de texto habituales en documentos almacenados en una base de datos DB2.
Nota: Al utilizar los ejemplos de código, acepta los términos del apartado “Información sobre licencia de
código y exención de responsabilidad” en la página 156.
Novedades de IBM i 7.2
Información relativa a las novedades o cambios significativos realizados en el temario de OmniFind Text
Search Server for DB2 for i.
Las principales características nuevas son las siguientes:
v “Ampliaciones para indexar y buscar datos no DB2” en la página 118
– “Añadir un conjunto de objetos de archivo físico de origen multimiembro” en la página 135
– “Añadir un conjunto de objetos de datos de archivo continuo” en la página 131
– “Modificar una colección de búsqueda de texto” en la página 149
– Eliminar conjunto de objetos por atributo
- “Eliminar un conjunto de objetos de datos de archivo spool” en la página 128
- “Eliminar un conjunto de objetos de datos de archivo continuo” en la página 133
- “Eliminar un conjunto de objetos de archivo físico de origen multimiembro” en la página 137
v “Búsqueda de caracteres especiales” en la página 50
v Eliminar índices huérfanos
v Concluir servidor
v Comprobar el estado y el código de retorno para cada fila en estado de aviso o de error
v Soporte de RCAC
– Crear índice de búsqueda de texto protegido
– Modificar índice de búsqueda de texto a índice protegido
Cómo visualizar las novedades o cambios
Para facilitar la visualización de los cambios técnicos, el Information Center utiliza:
v La imagen de
para marcar el inicio de información nueva o modificada.
para marcar el final de la información nueva o modificada.
v La imagen de
En los archivos PDF, puede que observe barras de revisión (|) en el margen izquierdo de la información
nueva o modificada.
Para buscar otra información relativa a las novedades o cambios de este release, consulte el
Memorándum para los usuarios.
Archivo PDF para OmniFind Text Search Server for DB2 for i
Utilice esta página para visualizar e imprimir un PDF de esta información.
Para visualizar o descargar el archivo PDF de este documento, seleccione OmniFind Text Search Server
for DB2 for i (aproximadamente 1192 KB).
© Copyright IBM Corp. 2002, 2014
1
Otra información
También puede visualizar o imprimir cualquiera de estos archivos PDF:
v Preparing for and Tuning the SQL Query Engine on DB2 for i5/OS
v SQL Performance Diagnosis on IBM® DB2 Universal Database for iSeries
.
Guardar archivos PDF
Para guardar un PDF en la estación de trabajo a fin de visualizarlo o imprimirlo:
1. Pulse con el botón derecho del ratón el PDF en el navegador (pulse con el botón derecho del ratón el
enlace precedente).
2. Pulse la opción que guarda el PDF localmente.
3. Vaya al directorio en el que desee guardar el PDF.
4. Pulse Guardar.
Descargar Adobe Reader
Es necesario tener instalado Adobe Reader en el sistema para visualizar o imprimir estos archivos PDF.
Puede descargar una copia gratuita desde Adobe (http://get.adobe.com/reader/)
.
Introducción a OmniFind Text Search Server for DB2 for i
DB2 for i utiliza OmniFind(r) Text Search Server como motor de indexación y búsqueda de los
documentos almacenados en una base de datos DB2.
OMNIFIND es un producto de búsqueda de texto que permite a los usuarios de IBM i realizar búsquedas
en texto no estructurado almacenado en una columna de una tabla de DB2 for i. El texto almacenado en
la columna puede ser texto simple de tipo carácter, un documento XML o alguno de los diversos tipos de
documentos de texto enriquecido, como por ejemplo un archivo PDF o DOC. El producto permite a los
usuarios indexar datos no estructurados sin necesidad de analizarlos en un formato estructurado, como
por ejemplo una tabla SQL.
OmniFind Text Search Server es un motor de búsqueda según contexto. Da soporte a la prestación de
búsquedas aproximadas. Por ejemplo, la búsqueda de 'mice' (ratón, en inglés) descubrirá los documentos
que contienen 'mice' (ratones, en inglés) o 'mouse'. El motor de búsqueda también da soporte al contexto
idiomático. Por ejemplo, comprende los equivalentes de búsqueda aproximada de 'mice' y 'mouse' tanto
en inglés como en español.
Muchas aplicaciones pueden aprovechar esta prestación. Un buen ejemplo de ello es una base de datos
de Recursos humanos. Los currículos de los candidatos pueden almacenarse en la base de datos en
cualquier formato que permita someterlos. Pueden utilizarse búsquedas subsiguientes mediante
OmniFind para buscar candidatos potenciales con determinadas habilidades clave.
Visión general de OmniFind Text Search Server for DB2 for i
OmniFind Text Search Server for DB2 for i suministra un conjunto de procedimientos almacenados
administrativos y dos funciones incorporadas: CONTAINS y SCORE. Estas funciones se utilizan para
realizar búsquedas en los índices de texto creados a partir de los documentos almacenados en una tabla
de DB2. Los procedimientos almacenados administrativos se utilizan para habilitar e inhabilitar la
búsqueda de texto y para crear, actualizar y eliminar índices de texto.
2
IBM i: OmniFind Text Search Server for DB2 for i
Un índice de texto puede crearse a partir de cualquier columna de los tipos de datos siguientes:
v CHAR
v VARCHAR
v CLOB
v BLOB
v
v
v
v
v
v
DBCLOB
GRAPHIC
VARGRAPHIC
BINARY
VARBINARY
XML
Los datos pueden contener texto sin formato, HTML, XML o diversos tipos de documentos enriquecidos,
como por ejemplo archivos PDF. Los datos se leen de la columna de texto y se convierten a Unicode
(CCSID 1208) antes de indexarlos.
Los índices de texto no son índices DB2 típicos. No se mantienen automáticamente, no pueden registrarse
por diario ni puede realizarse una copia de seguridad de los mismos mediante los métodos típicos de
copia de seguridad y restauración. Los índices de texto se crean y almacenan en un servidor de búsqueda
de texto.
Por omisión, el servidor de búsqueda de texto se crea en el mismo sistema que los datos almacenados en
la base de datos DB2. Sin embargo, un servidor de búsqueda de texto puede crearse en otro servidor que
ejecute IBM i, Linux, UNIX, AIX o Windows.
El servidor de búsqueda de texto contiene una colección de términos significativos extraídos de cada fila
de la columna. Para la comunicación con el servidor de búsqueda de texto, se utiliza una conexión
TCP/IP.
CONTAINS y SCORE son funciones incorporadas integradas en DB2 for i.
DB2 for i utiliza OmniFind(r) Text Search Server como motor de indexación y búsqueda de los
documentos almacenados en una base de datos DB2.
OMNIFIND admite varias colecciones. Una colección contiene un índice de búsqueda de texto y las
opciones específicas del índice para analizar, indexar y buscar.
OMNIFIND tiene una interfaz gráfica de usuario para la administración de servidores e índices de texto.
El servidor de búsqueda de texto también suministra procedimientos almacenados SQL y herramientas de
línea de mandatos que pueden utilizarse para tareas habituales. Estas tareas habituales incluyen la
configuración y administración del servidor de búsqueda de texto, la creación de un diccionario de
sinónimos para una colección y el diagnóstico de problemas.
Conceptos relacionados:
“Procedimientos almacenados de administración para búsqueda de texto” en la página 15
Puede iniciar y detener funciones de búsqueda de texto y crear, eliminar y actualizar índices de búsqueda
de texto mediante un conjunto de procedimientos almacenados SQL de administración. Estos
procedimientos pueden invocarse desde cualquier interfaz de SQL. No puede llamar a estos
procedimientos desde una línea de mandatos de IBM i mediante mandatos CL.
Referencia relacionada:
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
OmniFind Text Search Server
3
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
Requisitos del sistema para la instalación de OmniFind Text Search
Server for DB2 for i
Antes de instalar OmniFind Text Search Server for DB2 for i, asegúrese de que el sistema cumple todos
los requisitos de hardware, software y sistema operativo.
Al instalar OmniFind Text Search Server for DB2 for i, el programa de instalación crea un servidor de
búsqueda de texto para IBM i. Puede instalar servidores de búsqueda de texto en servidores remotos que
ejecuten Linux o Windows. Estos servidores forman parte de DB2 Accessories Suite for z/OS (5655-R14)
(http://www-01.ibm.com/software/data/db2imstools/db2tools/accessories-suite/)
contiene información relativa a la descarga de la suite.
. El enlace
Requisitos de software
Asegúrese de que el sistema cumple los siguientes requisitos mínimos de software:
v 5770JV1 IBM Developer Kit for Java™
– Uno de los siguientes:
- 5770JV1 Opción 11 Java SE 6 32 bits
- 5770JV1 Opción 12 Java SE 6 64 bits
v DB2 Universal Java Driver instalado y configurado en el servidor de búsqueda de texto
v Para IBM i, deben estar instalados los programas siguientes:
– 5770SS1 Opción 30 Qshell
– 5770SS1 Opción 33 IBM i Portable Application Solutions Environment (IBM i PASE)
– 5770SS1 Opción 39 International Components for Unicode
– Haber aplicado al sistema el PTF de grupo más reciente para IBM DB2 for i.
Conceptos clave
La comprensión de los conceptos clave acerca de las funciones de búsqueda de texto le ayudará a
aprovechar las ventajas de OmniFind Text Search for DB2 for i. Los conceptos clave son los tipos de
documentos y los idiomas soportados.
Crear y actualizar un índice de búsqueda de texto
Puede crear un índice de búsqueda de texto definiendo y declarando las propiedades del mismo. Puede
actualizar un índice de búsqueda de texto añadiendo al mismo datos nuevos de una tabla de DB2.
También puede actualizar un índice de búsqueda de texto cambiando los datos existentes en el mismo.
Para cada índice de búsqueda de texto que cree, se creará una colección en OmniFind Text Search Server
for DB2 for i. Tras la creación inicial, el índice de búsqueda de texto no contiene datos.
Los datos se añaden al índice de búsqueda de texto llamando al procedimiento almacenado
SYSPROC.SYSTS_UPDATE. El primer proceso de actualización añade todos los documentos de texto de
la columna de texto al índice de búsqueda de texto. Este proceso se conoce como actualización inicial. Las
actualizaciones subsiguientes son incrementales.
Cuando se crea un índice de búsqueda de texto, se crean o actualizan los objetos siguientes:
4
IBM i: OmniFind Text Search Server for DB2 for i
v La tabla intermedia se crea en la biblioteca QSYS2.
v Los desencadenantes INSERT, DELETE y UPDATE se añaden a la tabla base.
v Se crea una vista SQL con el nombre del índice de búsqueda de texto en el esquema del índice de
búsqueda de texto. Esta vista contiene información acerca del índice de texto. Por ejemplo, la vista
puede utilizarse para obtener el nombre de la tabla base y el nombre de la tabla intermedia. La vista
también muestra el número de cambios pendientes realizados en la tabla base que aún no se han
reflejado en el índice de búsqueda de texto.
v Los catálogos de índice de búsqueda de texto (SYSTEXTINDEXES y SYSTEXTCOLUMNS) de la
biblioteca QSYS2 se actualizan añadiendo una entrada para el nuevo índice de búsqueda de texto.
Consideraciones relativas a la tabla intermedia:
v No realice ninguna operación de base de datos en la tabla intermedia, excepto salvar y restaurar el
archivo o cambiar autorizaciones.
v Si está cambiando las autorizaciones sobre la tabla base, cambie también las autorizaciones sobre la
tabla intermedia.
Consideraciones relativas a la tabla base:
v No elimine los desencadenantes DELETE, UPDATE e INSERT que se han añadido al crear un índice de
búsqueda de texto.
v Al eliminar el índice de búsqueda de texto, se eliminan los desencadenantes.
v No modifique ni elimine el valor de ROWID, clave primaria o columna exclusiva utilizado como clave
en el índice de búsqueda de texto.
v La modificación de los datos de columna de la tabla base que provocan truncamiento de datos pueden
dar como resultado falsas coincidencias positivas en el índice de búsqueda de texto.
Referencia relacionada:
“SYSPROC.SYSTS_UPDATE” en la página 36
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
“Tabla de administración QSYS2.SYSTEXTINDEXES” en la página 112
Puede visualizar información acerca de cada índice de búsqueda de texto en la tabla de administración
QSYS2.SYSTEXTINDEXES. Cada índice de búsqueda de texto tiene un nombre, un nombre de esquema y
un nombre de colección asociada en el servidor de búsqueda de texto.
“Tabla de administración QSYS2.SYSTEXTCOLUMNS” en la página 114
Puede visualizar información acerca de las columnas de texto de un índice de búsqueda de texto en la
tabla de administración QSYS2.SYSTEXTCOLUMNS. Cada índice de búsqueda de texto tiene un ID de
índice, nombres de columna de texto y el nombre de esquema de la tabla base.
Indexación asíncrona y desencadenantes
Puede actualizar el índice de búsqueda de texto en OmniFind Text Search Server for DB2 for i
manualmente o planificarlo para que se ejecute automáticamente.
El índice de búsqueda de texto que se conserva en OmniFind Text Search Server for DB2 for i no se
actualiza síncronamente cuando se actualiza la tabla de DB2. La actualización de un índice de búsqueda
de texto es una operación extensa.
En lugar de ello, existen desencadenantes que capturan los cambios realizados en la columna de la tabla
de DB2 en una tabla de registro local. Esta tabla de registro también se denomina tabla intermedia. Estos
desencadenantes almacenan automáticamente la información relativa a los documentos nuevos,
cambiados y suprimidos en una tabla de registro. Cada tabla de registro está asociada a un índice de
búsqueda de texto. La aplicación del contenido de la tabla de registro a su índice de búsqueda de texto
correspondiente se denomina actualización incremental.
OmniFind Text Search Server
5
Debe actualizar periódicamente el índice de búsqueda de texto para que los cambios se reflejen en las
consultas.
Puede actualizar el índice de búsqueda de texto manualmente llamando al procedimiento almacenado
SYSPROC.SYSTS_UPDATE.
Las actualizaciones también pueden planificarse para que se produzcan automáticamente especificando la
cláusula UPDATE FREQUENCY en el procedimiento SYSPROC.SYSTS_CREATE al crear el índice de
texto.
Referencia relacionada:
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
“SYSPROC.SYSTS_UPDATE” en la página 36
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
Formatos de documento soportados
Los datos de una columna de texto pueden ser texto sin formato, un documento HTML, un XML o
cualquier documento que el motor de búsqueda reconozca.
OmniFind Text Search Server for DB2 for i analiza los documentos para extraer las partes relevantes y
hacer disponibles para las búsquedas. Por ejemplo, los códigos y metadatos de un documento HTML no
se indexan.
Está soportado el análisis de los formatos de documento siguientes:
v TEXT: texto sin formato
v HTML: lenguaje de marcado de hipertexto
v XML: lenguaje de códigos ampliable
v INSO: OmniFind Text Search Server for DB2 for i utiliza filtros para detectar el formato de los
documentos de texto. Están soportados los siguientes formatos de documento INSO:
– XML
– HTML
– JustSystems Ichitaro
– Lotus 123
– Lotus Freelance
– Lotus WordPro
– Microsoft Excel
– Microsoft PowerPoint
– Microsoft Rich Text Format
– Microsoft Visio
– Microsoft Word
– Microsoft Write
– Portable Document Format (PDF)
– Quattro Pro
– Rich Text RTF
– StarOffice Calc y OpenOffice Calc
6
IBM i: OmniFind Text Search Server for DB2 for i
Todos los documentos de una columna de texto indexado deben tener el mismo formato (TEXT, HTML,
XML o INSO).
Datos XML
La estructura XML de los datos XML se indexa en OmniFind Text Search Server for DB2 for i después de
analizar los datos por medio de un analizador XML. A continuación, puede utilizar la sintaxis de consulta
de búsquedas XML soportada para recuperar los resultados.
Conceptos relacionados:
“Búsqueda XML” en la página 53
Puede indexar y realizar búsquedas en documentos XML. La gramática de búsqueda XML utiliza un
subconjunto del lenguaje W3 XPath con ampliaciones para búsqueda de texto. Las ampliaciones dan
soporte a búsquedas de rango de valores numéricos, de fecha (Date) y fecha y hora (DateTime) asociados
con un atributo o elemento XML. Los elementos estructurales pueden utilizarse por separado o
combinarse con texto sin formato en las consultas.
Tipos de datos soportados
Los datos de las columnas de texto que desea indexar y en las que realizar búsquedas pueden ser datos
binarios o datos de tipo carácter.
Los tipos de datos siguientes son datos binarios:
v BINARY
v VARBINARY
v BLOB
Además, OMNIFIND maneja los tipos de datos siguientes de forma similar a los datos binarios:
v CHAR FOR BIT DATA
v VARCHAR FOR BIT DATA
Los tipos de datos siguientes son datos de tipo carácter:
v CHAR FOR SBCS DATA o FOR MIXED DATA
v VARCHAR FOR SBCS DATA o FOR MIXED DATA
v CLOB
v DBCLOB
v GRAPHIC
v VARGRAPHIC
v XML
Si los datos son binarios, puede especificar el CCSID (identificador de juego de caracteres codificados)
utilizado para crear el índice de búsqueda de texto. Para datos de tipo carácter, la base de datos DB2
conoce la codificación; por tanto, si especifica explícitamente un CCSID, dicha especificación se ignora.
Puntuación de texto y soporte de sinónimos
Puede utilizar sinónimos para mejorar los resultados de una consulta. Puede utilizar una puntuación de
texto para averiguar el grado de exactitud con el que un resultado coincide con la consulta.
Puntuación de texto
Una puntuación de texto se calcula como parte de la búsqueda y puede incluirse en los resultados de la
consulta. Una puntuación de texto es un valor de 0 a 1, de hasta tres dígitos decimales; por ejemplo,
OmniFind Text Search Server
7
0,000 a 1,000. Una puntuación de texto indica el grado de exactitud con el que un resultado coincide con
la consulta en relación a todos los demás documentos del índice de búsqueda de texto.
OMNIFIND compone la puntuación de texto a partir de diversos factores, tales como la importancia
genérica de los términos de búsqueda y la proximidad de apariciones de los términos de búsqueda. La
importancia general se basa en la frecuencia de los términos de cada documento y en el desplazamiento
de la frecuencia de los términos en todos los documentos.
Soporte de sinónimos
OmniFind Text Search Server for DB2 for i admite la utilización de sinónimos para modificar los
resultados de una consulta. La utilización de sinónimos puede aumentar el número de resultados de
consulta haciendo que más documentos coincidan con una consulta. Sin embargo, el uso de sinónimos
también puede disminuir la precisión de una consulta y dificultar la búsqueda de un número menor de
documentos que coincidan con los criterios de búsqueda exactos.
Por omisión, no se utilizan sinónimos para una consulta. Para utilizar sinónimos en una consulta, cree un
diccionario de sinónimos y añádalo a una colección mediante la herramienta de sinónimos.
Para obtener más información acerca de los sinónimos, consulte el apartado “Diccionarios de sinónimos”
en la página 85.
Referencia relacionada:
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
Proceso lingüístico
OmniFind Text Search Server for DB2 for i suministra paquetes de diccionarios para dar soporte al
proceso lingüístico de documentos y consultas que no están en inglés.
Como alternativa a la segmentación de palabras basada en diccionarios, OmniFind Text Search Server for
DB2 for i utiliza soporte de segmentación n-gram para idiomas tales como el chino, el japonés y el coreano.
La segmentación n-gram es un método de análisis que considera las secuencias solapadas de un número de
caracteres determinado como una sola palabra. Como alternativa, la segmentación de espacio en blanco
basada en Unicode utiliza un espacio en blanco para delimitar las palabras.
Si un documento de texto se encuentra en uno de los idiomas soportados, el proceso lingüístico se lleva a
cabo cuando el texto se analiza para generar señales. Para los idiomas no soportados, se devuelve un
código de error.
Al realizar una búsqueda en un índice de búsqueda de texto, se indica una coincidencia que contiene
variantes lingüísticas de los términos de consulta. Las variantes de una palabra dependen del idioma de
la consulta.
Idiomas soportados
Puede especificar que los documentos de texto se procesen mediante un idioma específico.
Puede especificar el idioma de los datos de texto indexados en el procedimiento almacenado de
administración SYSPROC.SYSTS_CREATE. Si establece el valor en AUTO, OmniFind Text Search Server
for DB2 for i intentará determinar el idioma. Para documentos breves, la detección automática puede no
ser exacta y no es recomendable. El idioma predeterminado para el proceso lingüístico es el inglés
(en_US).
8
IBM i: OmniFind Text Search Server for DB2 for i
La tabla siguiente muestra los códigos de idioma de cinco caracteres correspondientes a los idiomas
soportados.
Tabla 1. Códigos de idioma de cinco caracteres correspondientes a los idiomas soportados
Código de idioma
Idioma
ar_AA
Árabe
cs_CZ
Checo
da_DK
Danés
de_CH
Alemán (Suiza)
de_DE
Alemán (Alemania)
el_GR
Griego
en_AU
Inglés (Australia)
en_GB
Inglés (Reino Unido)
en_US
Inglés (Estados Unidos)
es_ES
Español (España)
fi_FI
Finés
fr_CA
Francés (Canadá)
fr_FR
Francés (Francia)
it_IT
Italiano
ja_JP
Japonés
ko_KR
Coreano
nb_NO
Noruego Bokmal
nl_NL
Holandés
nn_NO
Noruego Nynorsk
pl_PL
Polaco
pt_BR
Portugués de Brasil
pt_PT
Portugués (Portugal)
ru_RU
Ruso
sv_SE
Sueco
zh_CN
Chino Simplificado
zh_TW
Chino Tradicional
Referencia relacionada:
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
Proceso lingüístico de documentos en chino, japonés y coreano
Los documentos escritos en chino, japonés y coreano pueden procesarse mediante segmentación basada
en diccionario o mediante segmentación n-gram.
Para un motor de búsqueda, la obtención de buenos resultados de búsqueda depende en gran medida de
las técnicas utilizadas para procesar el texto. Después de extraer el texto del documento, el primer pasos
del proceso de texto consiste en identificar las palabras individuales del texto. La identificación de las
palabras individuales del texto se denomina segmentación. Para la mayoría de idiomas, puede utilizare el
OmniFind Text Search Server
9
espacio en blanco (blancos, el final de una línea y determinados caracteres de puntuación) para reconocer
los límites de palabra. Sin embargo, el chino, el japonés y el coreano no utilizan el espacio en blanco entre
caracteres para separar las palabras, por lo que deben utilizarse otras técnicas.
OmniFind Text Search Server for DB2 for i suministra los dos métodos siguientes para dar soporte al
proceso lingüístico del chino, el japonés y el coreano:
v Segmentación de palabras basada en diccionario (también denominada análisis morfológico)
v Segmentación N-gram
Segmentación de palabras basada en diccionario
La segmentación de palabras basada en diccionario utiliza un diccionario específico de idioma para identificar
las palabras en la secuencia de caracteres del documento. Esta técnica proporciona resultados de
búsqueda precisos, ya que los diccionarios se utilizan para identificar los límites de palabra. Sin embargo,
la segmentación de palabras basada en diccionario puede no detectar resultados de coincidencia
específicos.
Segmentación N-gram
La segmentación N-gram evita el problema de identificar los límites de palabra, y en su lugar indexa pares
de caracteres solapados. Dado que OmniFind Text Search Server for DB2 for i utiliza dos caracteres, esta
técnica también se denomina segmentación bi-gram.
La segmentación n-gram siempre devuelve todos los documentos coincidentes que contienen los términos
de búsqueda; sin embargo, esta técnica puede devolver a veces documentos que no coinciden con la
consulta.
Por omisión, OmniFind Text Search Server for DB2 for i se suministra con un índice preconfigurado que
utiliza segmentación n-gram para los idiomas chino, japonés y coreano.
Para observar cómo funcionan ambos tipos de proceso lingüístico, examine el texto siguiente de un
documento: elección del gobernador de la prefectura de Kanagawa. En japonés, este texto contiene
ocho caracteres. En este ejemplo, los ocho caracteres se representan como A B C D E F G H. Una consulta
de ejemplo que los usuarios podrían especificar podría ser elección del gobernador, que tiene cuatro
caracteres representados como E F G H. (El texto del documento y la consulta de ejemplo comparten
caracteres similares).
Si se utiliza el proceso por segmentación n-gram:
Una vez indexado el documento, el motor de búsqueda segmenta el texto elección del
gobernador de la prefectura de Kanagawa en los siguientes conjuntos de caracteres: AB BC CD
DE EF FG GH
La consulta de ejemplo elección del gobernador se segmenta en los siguientes conjuntos de
caracteres: DE EF FG GH. Si realiza una búsqueda con la consulta de ejemplo elección del
gobernador, se encontrará el documento. La razón es que las señales tanto para el texto del
documento como para la consulta aparecen en el mismo orden.
Si habilita la segmentación n-gram, es posible que visualice más resultados, pero posiblemente
éstos sean menos precisos. Por ejemplo, en japonés, si realiza una búsqueda con la consulta Kyoto
y un documento del índice contiene el texto Ciudad de Tokyo, se encontrará el documento. La
razón es que Ciudad de Tokyo y Kyoto comparten dos de los mismos caracteres del japonés.
Si no se utiliza el proceso por segmentación n-gram:
Una vez indexado el documento, el motor de búsqueda segmenta el texto elección del
gobernador de la prefectura de Kanagawa en los siguientes conjuntos de caracteres: ABC DEF
GH.
10
IBM i: OmniFind Text Search Server for DB2 for i
La consulta de ejemplo elección del gobernador se segmenta en los siguientes conjuntos de
caracteres: EF GH. Los caracteres EF no aparecen en las señales del texto del documento.
(Aunque el documento no contiene EF, sí contiene DEF).
El texto del documento contiene DEF, pero la consulta sólo contiene EF. Por tanto, es menos
probable que el documento se encuentre mediante la consulta de ejemplo.
Si no habilita la segmentación n-gram, probablemente recibirá resultados más precisos, aunque
posiblemente su número sea menor.
Nombre de alias de servidor
Puede utilizar un nombre de alias de servidor para asignar un nombre significativo a un servidor.
Cada servidor de búsqueda de texto se identifica de forma exclusiva en la columna SERVERID del
catálogo QSYS2.SYSTEXTSERVERS. La columna SERVERID es un entero generado incrementalmente por
la base de datos.
La columna ALIASNAME de QSYS2.SYSTEXTSERVERS se suministra para permitir la asignación de un
nombre de alias significativo a cada servidor. Los nombres de alias de servidor pueden utilizarse para
hacer referencia a los servidores en los procedimientos SYSTS_START, SYSTS_STOP y SYSTS_CREATE,
SYSTS_SHUTDOWN y SYSTS_CLEAR_INDEXES.
Nota: El nombre de alias de servidor puede cambiarse directamente en la tabla de catálogo
QSYS2.SYSTEXTSERVERS actualizando el valor ALIASNAME.
Asignar el número de servidor 1 como nombre de alias de "PRIMARY_LOCAL_SERVER".
UPDATE QSYS2.SYSTEXTSERVERS
SET ALIASNAME = ’PRIMARY_LOCAL_SERVER’
WHERE SERVERID = 1
Para eliminar un nombre de alias de un servidor, establezca la columna en NULL.
Eliminar un nombre de alias del número de servidor 1.
UPDATE QSYS2.SYSTEXTSERVERS
SET ALIASNAME = NULL
WHERE SERVERID = 1
Referencia relacionada:
“Tabla de administración QSYS2.SYSTEXTSERVERS” en la página 115
Puede visualizar dónde están instalados los servidores de búsqueda de texto mediante la tabla de
administración QSYS2.SYSTEXTSERVERS.
“SYSPROC.SYSTS_START” en la página 15
Puede habilitar funciones de búsqueda de texto de DB2 llamando al procedimiento almacenado
SYSPROC.SYSTS_START.
“SYSPROC.SYSTS_STOP” en la página 17
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_STOP para detener las funciones de
búsqueda de texto de DB2. Este procedimiento almacenado establece el valor SERVERSTATUS del
catálogo QSYS2.SYSTEXTSERVERS en 1 (detenido).
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
OmniFind Text Search Server
11
“SYSPROC.SYSTS_SHUTDOWN” en la página 39
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_SHUTDOWN para concluir las funciones de
búsqueda de texto de DB2®. Este procedimiento almacenado establece el valor SERVERSTATUS del
catálogo QSYS2.SYSTEXTSERVERS en 1 (detenido) y también finaliza los trabajos del servidor de
búsqueda de texto del sistema host.
“SYSTS_CLEAR_INDEXES” en la página 81
Puede eliminar índices huérfanos con el procedimiento almacenado SQL SYSPROC.
SYSTS_CLEAR_INDEXES. Otra forma implícita es invocar SYSTS_START directamente, que intenta borrar
índices huérfanos automáticamente.
Instalar y configurar funciones de búsqueda de texto
Puede instalar y configurar OmniFind Text Search Server for DB2 for i. También puede crear y actualizar
un índice de búsqueda de texto para poder empezar a utilizar funciones de búsqueda de texto en una
columna de una tabla.
Instalar OmniFind Text Search Server for DB2 for i
Instale OmniFind Text Search Server for DB2 for i mediante los procedimientos de instalación estándar de
un programa bajo licencia de IBM i. Se creará un servidor de texto predeterminado y la tabla
QSYS2.SYSTEXTSERVERS se llenará con la información del servidor predeterminado. Opcionalmente,
puede añadir servidores de búsqueda de texto adicionales después de la instalación.
Llenar la tabla QSYS2.SYSTEXTSERVERS
OmniFind Text Search Server for DB2 for i es el programa bajo licencia 5733-OMF de IBM. Consulte el
apartado Instalar programas bajo licencia adicionales para obtener detalles acerca de la instalación de un
programa bajo licencia. Para buscar este producto, especifique GO LICPGM en la línea de mandatos y
seleccione la opción 10 (Visualizar programas bajo licencia instalados). Se visualizará en la lista de
programas bajo licencia.
La tabla QSYS2.SYSTEXTSERVERS contiene información acerca de los IBM OmniFind Text Search Servers
instalados y disponibles para DB2 for i. Cundo se instala por primera vez el producto OmniFind Text
Search Server for DB2 for i, se crea un servidor de búsqueda de texto predeterminado en el sistema IBM
i. La tabla QSYS.SYSTEXTSERVERS también se llena con información del servidor predeterminado.
Crear servidores de búsqueda de texto adicionales
Si está utilizando servidores de búsqueda de texto en un sistema IBM remoto o si está utilizando
servidores no IBM, como por ejemplo un servidor Windows o Linux, llene explícitamente esta tabla
emitiendo una sentencia SQL INSERT.
Si desea llenar la tabla QSYS2.SYSTEXTSERVERS con servidores adicionales, siga estos pasos en la
sentencia SQL INSERT:
1. Especifique el número de puerto y el nombre del servidor para cada servidor de búsqueda de texto en
las columnas SERVERPORT y SERVERNAME de la tabla QSYS2.SYSTEXTSERVERS emitiendo una
sentencia SQL INSERT.
2. Especifique la señal de autenticación de cada servidor de búsqueda de texto en la columna
SERVERAUTHTOKEN de la tabla QSYS2.SYSTEXTSERVERS en la sentencia SQL INSERT.
Cuando la base de datos DB2 se comunica con un servidor de búsqueda de texto, es necesaria una
señal de autenticación. Esta señal se genera en el servidor de búsqueda de texto durante la
instalación.
3. Especifique la clave de servidor de cada servidor de búsqueda de texto en la columna
SERVERMASTERKEY de la tabla QSYS2.SYSTEXTSERVERS en la sentencia SQL INSERT.
12
IBM i: OmniFind Text Search Server for DB2 for i
4. OPCIONAL: especifique un nombre de alias (ALIASNAME) para el servidor en la columna
ALIASNAME. Este ALIASNAME puede utilizarse para hacer referencia al servidor en las operaciones
posteriores.
Ejemplo
El ejemplo siguiente de sentencia SQL INSERT copia la información necesaria para un servidor de
búsqueda de texto en las columnas de la tabla QSYS2.SYSTEXTSERVERS:
INSERT INTO QSYS2.SYSTEXTSERVERS(SERVERNAME,
SERVERADRINFO,
SERVERPORT,
SERVERTYPE,
SERVERAUTHTOKEN,
SERVERMASTERKEY,
SERVERPATH,
ALIASNAME)
VALUES(’127.0.0.1’,
VARBINARY(X’0000’),
49200,
0,
’AH2X4w==’,
’b1YhcR9O858ArwxLJeIY/Q==’,
’/QOpenSys/QIBM/ProdData/TextSearch/server1/bin/’,
’LOCALSERVER2’);
Los valores de ejemplo deben sustituirse por los valores reales del servidor.
Conceptos relacionados:
“Nombre de alias de servidor” en la página 11
Puede utilizar un nombre de alias de servidor para asignar un nombre significativo a un servidor.
Referencia relacionada:
“Tabla de administración QSYS2.SYSTEXTSERVERS” en la página 115
Puede visualizar dónde están instalados los servidores de búsqueda de texto mediante la tabla de
administración QSYS2.SYSTEXTSERVERS.
Iniciar funciones de búsqueda de texto
Antes de empezar a utilizar las funciones de búsqueda de texto, llame al procedimiento almacenado
SYSPROC.SYSTS_START. Al llamar a este procedimiento, podrá iniciar todos los servidores de
producción que ha definido como locales con respecto al sistema.
El soporte de búsqueda de texto incluye sentencias SQL que utilizan la función CONTAINS, la función
SCORE y los siguientes procedimientos almacenados de administración:
v SYSPROC.SYSTS_CREATE
v SYSPROC.SYSTS_UPDATE
v SYSPROC.SYSTS_DROP
Referencia relacionada:
“SYSPROC.SYSTS_START” en la página 15
Puede habilitar funciones de búsqueda de texto de DB2 llamando al procedimiento almacenado
SYSPROC.SYSTS_START.
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
“SYSPROC.SYSTS_UPDATE” en la página 36
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
OmniFind Text Search Server
13
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
“SYSPROC.SYSTS_DROP” en la página 34
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_DROP para eliminar un índice de búsqueda
de texto definido mediante el procedimiento almacenado SYSPROC.SYSTS_CREATE.
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
Crear un índice de búsqueda de texto
Puede crear un índice de búsqueda de texto llamando al procedimiento almacenado
SYSPROC.SYSTS_CREATE.
La tabla base de DB2 debe contener una columna ROWID, una clave exclusiva o una clave primaria.
Para crear un índice de búsqueda de texto en una tabla de DB2 existente con una columna que contiene
texto:
Llame al procedimiento almacenado SYSPROC.SYSTS_CREATE.
El índice de búsqueda de texto estará vacío hasta que el índice se actualice por primera vez.
Referencia relacionada:
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
Actualizar un índice de búsqueda de texto
Puede actualizar un índice de búsqueda de texto llamando al procedimiento almacenado
SYSPROC.SYSTS_UPDATE.
La llamada a SYSTS_UPDATE se utiliza para llenar inicialmente el índice de búsqueda de texto. También
se utiliza cuando cambia el contenido de las tablas de DB2 y el usuario desea sincronizar el índice de
búsqueda de texto con dichos cambios.
Una vez realizada una actualización del índice de búsqueda de texto, puede realizar consultas de
búsqueda en el índice de búsqueda de texto. La columna de búsqueda de texto de la tabla base puede
cambiarse después de la actualización. En ese caso, los resultados de la consulta de búsqueda no
reflejarán dichos cambios hasta la próxima vez que se ejecute una actualización del índice de búsqueda
de texto.
Referencia relacionada:
“SYSPROC.SYSTS_UPDATE” en la página 36
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
Buscar en un índice de búsqueda de texto
Puede buscar en un índice de búsqueda de texto mediante una sentencia SQL con una función
CONTAINS o SCORE. En la función se especifican los criterios del argumento de búsqueda.
14
IBM i: OmniFind Text Search Server for DB2 for i
El usuario que realiza las consultas de texto en una tabla de DB2 debe tener establecido el privilegio
estándar necesario para cualquier formato de consulta, según lo especificado en DB2 SQL Reference.
Referencia relacionada:
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
Recorte de documentos
OmniFind Text Search Server for DB2 for i limita el número de caracteres que pueden indexarse para
cada documento de texto. A veces, esta limitación de caracteres provoca el recorte de documentos de
texto grandes en el índice de búsqueda de texto.
El servidor de búsqueda de texto puede recortar los documentos que contienen más de 10 millones de
caracteres Unicode. En el caso de un documento de texto enriquecido, este límite se aplica después de
transformar el documento a texto sin formato.
So un documentos de texto se recorta durante la fase de análisis, el usuario recibe un aviso que indica
que algunos documentos no se han proceso totalmente. El aviso aparece en el registro de trabajo. El
documento se indexa parcialmente. El texto que se encuentra en el documento una vez alcanzado el
límite no se indexa y no se tiene en cuenta durante las búsquedas.
Puede que sea conveniente eliminar del índice de búsqueda de texto el documento recortado para evitar
un comportamiento inesperado durante el proceso de búsqueda. Puede eliminar el documento
eliminando el registro correspondiente de la tabla de DB2 o cambiado el valor del documento a vacío o
nulo.
Procedimientos almacenados de administración para búsqueda de
texto
Puede iniciar y detener funciones de búsqueda de texto y crear, eliminar y actualizar índices de búsqueda
de texto mediante un conjunto de procedimientos almacenados SQL de administración. Estos
procedimientos pueden invocarse desde cualquier interfaz de SQL. No puede llamar a estos
procedimientos desde una línea de mandatos de IBM i mediante mandatos CL.
Al examinar los catálogos de sistema mediante STRSQL, puede visualizar el contenido de las columnas
estableciendo el trabajo con un CCSID distinto de 65535.
SYSPROC.SYSTS_START
Puede habilitar funciones de búsqueda de texto de DB2 llamando al procedimiento almacenado
SYSPROC.SYSTS_START.
Las funciones de búsqueda de texto incluyen soporte para consultas SQL que utilizan la función
CONTAINS, la función SCORE y los procedimientos almacenados de administración utilizados para el
mantenimiento de los índices de búsqueda de texto.
Ejecute el procedimiento almacenado SYSPROC.SYSTS_START cada vez que se añada o cambie un
servidor de la tabla QSYS2.SYSTEXTSERVERS.
OmniFind Text Search Server
15
Si las funciones de búsqueda de texto no se inician, la base de datos devuelve el SQLCODE -20424 con el
código de razón 4 para las funciones CONTAINS y SCORE. Los procedimientos administrativos
SYSPROC.SYSTS_CREATE y SYSPROC.SYSTS_UPDATE también fallarán con el SQLCODE -20424 si el
servidor no se ha iniciado.
Para los servidores de búsqueda de texto que se encuentran en la tabla QSYS2.SYSTEXTSERVERS, se
resuelven nombres TCP/IP. Varias llamadas al procedimiento almacenado SYSPROC.SYSTS_START no se
consideran un error. Este proceso permite comprobar la resolución de direcciones de la tabla
QSYS2.SYSTEXTSERVERS.
Si el servidor es local, esta llamada al procedimiento almacenado inicia el servidor, si aún no lo ha hecho.
Si el servidor es remoto, la llamada al procedimiento comprueba que el servidor está activo, pero no lo
inicia realmente.
Requisitos previos
Antes de llamar al procedimiento almacenado SYSPROC.SYSTS_START, compruebe que la tabla
QSYS2.SYSTEXTSERVERS contiene como mínimo una entrada.
Autorización
El ID de usuario bajo el que se invoca este procedimiento almacenado debe tener los siguientes
privilegios:
v Autorización *EXECUTE sobre el procedimiento.
v Privilegios SELECT y UPDATE sobre la tabla SYSTXTSRVR.
v Autorización *EXECUTE sobre la biblioteca QSYS2 del archivo SYSTXTSRVR.
v Autorización *JOBCTL o utilización de la función especial de seguridad QIBM_DB_SQLADM.
Para obtener información acerca de las autorizaciones del sistema correspondientes a los privilegios SQL,
consulte el apartado GRANT (Privilegios de tabla o vista).
Sintaxis
SYSPROC.SYSTS_START (
)
idservidor
nombrealias
El calificador de esquema es SYSPROC.
Parámetro
idservidor o nombrealias
Especifica el identificador del servidor que debe iniciarse. Un idservidor o un nombrealias de servidor
es una serie de caracteres. Si no se especifica ningún identificador, el valor predeterminado es iniciar
todos los servidores. La serie del identificador debe ser un idservidor válido existente en la columna
SERVERID o un nombrealias de servidor válido existente en la columna ALIASNAME de la tabla
QSYS2.SYSTEXTSERVERS. Si el identificador puede convertirse a un valor entero, se interpreta como
idservidor. Si el identificador no puede convertirse a un valor entero, se interpreta como nombrealias de
servidor.
El tipo de datos de este parámetro es VARCHAR(128).
Nota: Si no se especifica ningún valor para idservidor o nombrealias, sólo se inician los servidores
identificados como servidores de producción. Los servidores de producción se identifican mediante el
16
IBM i: OmniFind Text Search Server for DB2 for i
parámetro SERVERCLASS = 0 en la tabla QSYS2.SYSTEXTSERVERS. Los servidores de prueba deben
iniciarse especificando el idservidor o nombrealias asociado con ellos.
Para iniciar todos los servidores de producción:
CALL SYSPROC.SYSTS_START().
Para
iniciar un servidor con el ID 1:
CALL SYSPROC.SYSTS_START(1)
Para
iniciar un servidor con el nombre de alias "LOCAL_SERVER":
CALL SYSPROC.SYSTS_START('LOCAL_SERVER')
Para iniciar un servidor con el nombre de alias "local_server":
CALL SYSPROC.SYSTS_START('"local_server"')
Conceptos relacionados:
“Nombre de alias de servidor” en la página 11
Puede utilizar un nombre de alias de servidor para asignar un nombre significativo a un servidor.
Tareas relacionadas:
“Iniciar OmniFind Text Search Server for DB2 for i” en la página 70
Puede iniciar OmniFind Text Search Server for DB2 for i llamando al procedimiento
SYSPROC.SYSTS_START.
Referencia relacionada:
“Tabla de administración QSYS2.SYSTEXTSERVERS” en la página 115
Puede visualizar dónde están instalados los servidores de búsqueda de texto mediante la tabla de
administración QSYS2.SYSTEXTSERVERS.
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
SYSPROC.SYSTS_STOP
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_STOP para detener las funciones de
búsqueda de texto de DB2. Este procedimiento almacenado establece el valor SERVERSTATUS del
catálogo QSYS2.SYSTEXTSERVERS en 1 (detenido).
Una vez completado este procedimiento almacenado, las consultas SQL que utilicen las funciones
CONTAINS o SCORE o los procedimientos almacenados de administración utilizados para el
mantenimiento de los índices devolverán una anomalía sin intentar contactar con un servidor de
búsqueda de texto.
Nota: Los procedimientos administrativos y las consultas SQL que utilizan las funciones incorporadas
CONTAINS o SCORE que se estuvieran ejecutando al invocar SYSTS_STOP podrán finalizar.
Los cambios en la tabla base del índice se siguen registrando aunque el servidor esté detenido. Sin
embargo, las actualizaciones planificadas del índice no se producirán hasta que se haya invocado a
SYSPROC.SYSTS_START.
OmniFind Text Search Server
17
Autorización
El ID de usuario bajo el que se invoca este procedimiento almacenado debe tener los siguientes
privilegios:
v Autorización *EXECUTE sobre el procedimiento.
v Privilegios SELECT y UPDATE sobre la tabla SYSTEXTSERVERS.
v Autorización *EXECUTE sobre la biblioteca QSYS2 del archivo SYSTEXTSERVERS.
v Autorización *JOBCTL o utilización de la función especial de seguridad QIBM_DB_SQLADM.
Para obtener información acerca de las autorizaciones del sistema correspondientes a los privilegios SQL,
consulte el apartado GRANT (Privilegios de tabla o vista).
Sintaxis
SYSTS_STOP (
)
idservidor
nombrealias
El calificador de esquema es SYSPROC.
Parámetro
idservidor o nombrealias
Especifica el identificador del servidor que debe detenerse. Un idservidor o un nombrealias de servidor
es una serie de caracteres. Si no se especifica ningún identificador, el valor predeterminado es detener
todos los servidores. La serie del identificador debe ser un idservidor válido existente en la columna
SERVERID o un nombrealias de servidor válido existente en la columna ALIASNAME de la tabla
QSYS2.SYSTEXTSERVERS. Si el identificador puede convertirse a un valor entero, se interpreta como
idservidor. Si el identificador no puede convertirse a un valor entero, se interpreta como nombrealias de
servidor.
El tipo de datos de este parámetro es VARCHAR(128).
Para detener todos los servidores de producción:
CALL SYSPROC.SYSTS_STOP().
Para
detener un servidor con el ID 1:
CALL SYSPROC.SYSTS_STOP(1)
Para
detener un servidor con el nombre de alias "LOCAL_SERVER":
CALL SYSPROC.SYSTS_STOP('LOCAL_SERVER')
Para detener un servidor con el nombre de alias "local_server":
CALL SYSPROC.SYSTS_STOP('"local_server"')
Conceptos relacionados:
“Nombre de alias de servidor” en la página 11
Puede utilizar un nombre de alias de servidor para asignar un nombre significativo a un servidor.
Referencia relacionada:
“Tabla de administración QSYS2.SYSTEXTSERVERS” en la página 115
Puede visualizar dónde están instalados los servidores de búsqueda de texto mediante la tabla de
administración QSYS2.SYSTEXTSERVERS.
18
IBM i: OmniFind Text Search Server for DB2 for i
“SYSPROC.SYSTS_START” en la página 15
Puede habilitar funciones de búsqueda de texto de DB2 llamando al procedimiento almacenado
SYSPROC.SYSTS_START.
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
SYSPROC.SYSTS_CREATE
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
El índice de búsqueda de texto se crea en uno de los servidores de búsqueda de texto listados en la tabla
QSYS2.SYSTEXTSERVERS. El índice de búsqueda de texto no se actualiza síncronamente cuando se
actualiza la tabla de DB2. En lugar de ello, existen desencadenantes que capturan un registro de los
cambios realizados en la columna de la tabla de DB2, que se coloca en una tabla intermedia.
Nota: este procedimiento almacenado sólo define el índice de búsqueda de texto. El índice de búsqueda
de texto no contiene datos hasta que se ha realizado la primera invocación del procedimiento almacenado
SYSPROC.SYSTS_UPDATE para el nuevo índice de búsqueda de texto. El índice de búsqueda de texto se
crea después de llenar inicialmente la tabla. Mediante la creación del índice de búsqueda de texto una
vez llenada inicialmente la tabla, se evita la activación de desencadenantes de cambios antes de una
actualización de índice inicial.
Requisitos previos
Antes de la llamada al procedimiento almacenado SYSPROC.SYSTS_CREATE, compruebe los siguientes
requisitos previos:
v Que se han iniciado las funciones de búsqueda de texto de DB2, invocando el procedimiento
almacenado SYSPROC.SYSTS_START, y que existe como mínimo un servidor de búsqueda de texto en
ejecución.
v Que la tabla incluye una columna definida como clave primaria, índice exclusivo o ROWID.
v Que la tabla QSYS2.SYSTEXTSERVERS contiene como mínimo una entrada.
Autorización
Los privilegios detentados por el ID de autorización de la sentencia deben incluir como mínimo uno de
los siguientes:
v El privilegio de creación en el esquema. Para obtener más información, consulte el apartado
Autorización, privilegios y propiedad de objetos.
v Autoridad administrativa
Los privilegios detentados por el ID de autorización de la sentencia deben incluir como mínimo uno de
los siguientes:
v Las siguientes autorizaciones del sistema:
– *USE sobre el mandato Crear archivo lógico (CRTLF)
OmniFind Text Search Server
19
– *CHANGE sobre el diccionario de datos si la biblioteca en la que se crea el índice de texto es un
esquema SQL con un diccionario de datos
v Autoridad administrativa
Los privilegios detentados por el ID de autorización de la sentencia también deben incluir como mínimo
uno de los siguientes:
v Para la tabla referenciada:
– El privilegio INDEX sobre la tabla
– La autorización del sistema *EXECUTE sobre la biblioteca que contiene la tabla
v Autoridad administrativa
v Si se especifican nombres SQL y existe un perfil de usuario que tiene el mismo nombre que la
biblioteca en la que se crea el índice de texto, y dicho nombre es diferente del ID de autorización de la
sentencia, los privilegios detentados por el ID de autorización de la sentencia deben incluir como
mínimo uno de los privilegios siguientes:
– Autorización del sistema *ADD sobre el perfil de usuario con ese nombre
– Autoridad administrativa
Si se hace referencia a un tipo distinct, los privilegios detentados por el ID de autorización de la sentencia
deben incluir como mínimo uno de los siguientes:
v Para cada tipo distinct identificado en la sentencia:
– El privilegio USAGE sobre el tipo distinct, y
– La autorización del sistema *EXECUTE sobre la biblioteca que contiene el tipo distinct
v Autoridad administrativa
Si la columna sobre la que se ha creado el índice de búsqueda de texto contiene un procedimiento de
campo, el ID de autorización debe tener
v Autorización *EXECUTE sobre el programa y
v Autorización *EXECUTE sobre la biblioteca que contiene el programa
O bien
v Autoridad administrativa
Para obtener información acerca de las autorizaciones del sistema correspondientes a los privilegios SQL,
consulte el apartado GRANT (Privilegios de tabla o vista).
Sintaxis
SYSTS_CREATE (
esquemaÍndice
nulo
,
nombreÍndice
, origenTexto
, opciones )
El calificador de esquema es SYSPROC.
Parámetros
esquemaÍndice
Identifica el esquema del índice de búsqueda de texto. Si este parámetro es nulo, se utiliza el valor
del registro especial CURRENT SCHEMA correspondiente al invocante. Este valor debe ser un
nombre SQL válido.
Nota: especifique los nombres entre comillas dobles si los nombres entran en conflicto con palabras
clave SQL o palabras clave de OmniFind que puedan utilizarse.
20
IBM i: OmniFind Text Search Server for DB2 for i
El tipo de datos de este parámetro es VARCHAR(128).
nombreÍndice
Identifica el nombre del índice de búsqueda de texto. El nombre del índice de búsqueda de texto,
junto con el esquema del índice, identifican de forma exclusiva el índice de texto en el subsistema
DB2. Debe especificar un valor no nulo en este parámetro. Este valor debe ser un nombre SQL válido.
Nota: especifique los nombres entre comillas dobles si los nombres entran en conflicto con palabras
clave SQL o palabras clave de OmniFind que puedan utilizarse.
El tipo de datos de este parámetro es VARCHAR(128).
origenTexto
Identifica la especificación de tabla y columna para el origen de texto del documento. Este parámetro
puede incluir funciones definidas por el usuario. Debe especificar un valor no nulo en este
parámetro.
El tipo de datos de este parámetro es VARCHAR(1024).
origenTexto:
esquemaTabla. nombreTabla (
nombre-columna-texto
)
nombre-función
esquema-función
(
nombre-columna-texto
)
.
esquemaTabla
Identifica el esquema de la tabla en que se crea el índice de búsqueda de texto.
Nota: especifique los nombres entre comillas dobles si los nombres entran en conflicto con
palabras clave SQL o palabras clave de OmniFind que puedan utilizarse.
nombreTabla
Identifica el nombre de la tabla de texto que contiene la columna sobre la que se crea el
índice de búsqueda de texto externo.
Notas:
v Las vistas y archivos lógicos no están soportados.
v Un alias debe señalar hacia una tabla o hacia un único miembro de un archivo físico.
v Especifique los nombres entre comillas dobles si los nombres entran en conflicto con
palabras clave SQL o palabras clave de OmniFind.
nombre-columna-texto
Identifica el nombre de la columna que contiene el texto utilizado para crear el índice de
búsqueda de texto. Esta columna debe ser de tipo CHAR, CHAR FOR BIT DATA, BINARY,
VARCHAR, VARCHAR FOR BIT DATA, VARBINARY, CLOB, DBCLOB, BLOB, XML,
GRAPHIC o VARGRAPHIC. Si el tipo de datos no pertenece a uno de los anteriores, puede
especificar una función externa que devuelva un tipo de datos soportado.
Notas:
v Sólo se permite un índice de búsqueda de texto para una columna. Si existe un índice de
búsqueda de texto para la columna, se devuelve el SQLCODE-20427.
v Especifique los nombres entre comillas dobles si los nombres entran en conflicto con
palabras clave SQL o palabras clave de OmniFind.
esquema-función. nombre-función
Identifica el esquema y el nombre de una función incorporada o definida por usuario. La
función puede utilizarse para modificar un documento de texto almacenado en la columna.
La función también puede utilizarse para acceder a documentos de texto que se encuentran
OmniFind Text Search Server
21
en una columna que no es de un tipo de datos soportado. O bien puede utilizarse para
acceder a un documento almacenado en otro lugar. La función tiene un parámetro de entrada
para el tipo de datos de columna de texto. Por ejemplo, un entero que actúa como clave
foránea del contenido del documento de otro tabla. La función devuelve un valor de uno de
los tipos de datos soportados por OmniFind Text Search for DB2 for i. La función transforma
el contenido de la columna de texto en el contenido del documento indexado.
Notas:
v Las funciones de conversión de tipo de datos y las funciones con más de un argumento no
están permitidas.
v especifique los nombres entre comillas dobles si los nombres entran en conflicto con
palabras clave SQL o palabras clave de OmniFind que puedan utilizarse.
opciones
Serie de caracteres que especifica las diversas opciones que están disponibles para este procedimiento
almacenado.
El tipo de datos de este parámetro es VARCHAR(32000).
opciones:
información-predeterminada-texto
características-actualización
opciones-configuración-índice
información-predeterminada-texto:
CCSID ccsid
LANGUAGE
idioma
FORMAT
formato
información-predeterminada-texto
Especifica el identificador de juego de caracteres codificados utilizado al indexar documentos de
texto binarios. También especifica el idioma utilizado al procesar documentos y el formato de los
documentos de texto de la columna.
CCSID ccsid
Especifica el identificador de juego de caracteres codificados utilizado para un índice de
búsqueda de texto en una columna con un tipo de datos binarios. El valor predeterminado es
1208 (UTF-8), que se toma de la tabla QSYS2.SYSTEXTDEFAULTS. En este parámetro se
permiten todos los CCSID soportados para la conversión a UTF-8 por los servicios de
conversión de IBM i.
Este parámetro se ignora para un índice de búsqueda de texto en una columna con un tipo
de datos no binarios. Las columnas de texto heredan el CCSID de la especificación de tabla.
El valor de ccsid se ignora cuando el valor de formato se establece en INSO.
LANGUAGE idioma
Especifica el idioma que OmniFind Text Search Server for DB2 for i utiliza para el proceso
lingüístico de los documentos de texto. El valor predeterminado es en_US (inglés). Si
especifica AUTO como valor de este parámetro, OmniFind Text Search Server for DB2 for i
intentará determinar el idioma.
Importante: Si el idioma de los documentos no es el inglés, no utilice el valor
predeterminado en_US. Cambie el valor al idioma de los documentos; de lo contrario, el
proceso lingüístico no funcionará según lo esperado.
FORMAT formato
identifica el formato de los documentos de texto de la columna, como por ejemplo HTML.
OmniFind Text Search Server for DB2 for i necesita conocer el formato, o tipo de contenido,
22
IBM i: OmniFind Text Search Server for DB2 for i
de los documentos de texto que tiene previsto indexar y en los que va a realizar búsquedas.
Si no especifica el parámetro formato, el valor predeterminado se toma de la columna
FORMAT de la tabla QSYS2.SYSTEXTDEFAULTS. Los valores de formato soportados son
TEXT, HTML, XML e INSO.
El valor de formato INSO permite a OmniFind Text Search Server for DB2 for i determinar el
formato. En este caso, el valor de ccsid se ignora. Si OmniFind Text Search Server for DB2 for
i no puede determinar el formato del documento, el procedimiento almacenado
SYSPROC.SYSTS_UPDATE anota un error de documento en el registro de trabajo durante el
proceso.
Nota: Si no especifica el parámetro formato al crear el índice sobre una columna de tipo de
datos XML, el valor predeterminado es XML. Si especifica el parámetro formato como TEXT o
INSO, la prestación de búsqueda XML no estará disponible para este índice. Además,
aparecerá un mensaje de aviso en el registro de trabajo.
características-actualización:
NONE
< frecuencia-actualización>
UPDATE FREQUENCY
UPDATE MINIMUM
mín_cambios
características-actualización
Especifica la frecuencia de las actualizaciones automáticas en el índice de búsqueda de texto.
También especifica el número mínimo de cambios que deben realizarse en los documentos de
texto antes de que el índice de búsqueda de texto se actualice incrementalmente a la hora
especificada.
UPDATE FREQUENCY frecuencia-actualización
Especifica cuándo realizar actualizaciones automáticas en el índice de búsqueda de texto. El
valor predeterminado es NONE. Esta opción puede ser de utilidad para una columna de
texto en la que no haya más cambios. El formato de la opción frecuencia-actualización admite
dos formatos.
frecuencia-actualización (Formato 1):
NONE
D (
*
)
H
(
*
,
)
M
(
*
,
0..6 0..23 0..6
)
,
0..59 0..23
0..59
NONE
Si se especifica NONE, no se realizan más actualizaciones de índice. La actualización
debe iniciarse manualmente. Esta opción puede ser de utilidad para una columna de
texto en la que no haya más cambios planificados.
D
Especifica el día o días de la semana en los que se actualiza el índice. Un asterisco (*)
indica todos los días. 0 indica el Domingo.
H
Especifica la hora u horas en las que se actualiza el índice. Un asterisco (*) indica
todas las horas.
M
Especifica el minuto o minutos en los que se actualiza el índice. No puede
especificarse un asterisco (*). La frecuencia de actualización mínima es de 5 minutos.
Ejemplo: este ejemplo especifica que la actualización de índice debe ejecutarse cada 30
minutos.
UPDATE FREQUENCY D(*) H(*) M(0,30)
OmniFind Text Search Server
23
frecuencia-actualización (Formato 2, cronológico):
< minuto> < hora> <díaDelMes> <mesDelAño> <díaDeLaSemana>
El formato de la opción frecuencia-actualización (cronológica) es una lista de cinco valores
separados por espacios en blanco. Los cinco valores representan los minutos, horas, días del
mes, meses del año y días de la semana empezando por el Domingo.
Si especifica un intervalo de valores o un asterisco (*), puede especificar un valor de recorrido
utilizando una barra inclinada (/) al final del intervalo definido.
Ejemplo: este ejemplo especifica que la actualización de índice debe ejecutarse cada cuarto de
hora (0,15,30,45) en las horas pares entre las 8 a.m. y las 6:45 p.m. (8-18/2 es equivalente a
8,10,12,14,16,18), de Lunes a Viernes todos los meses del año (* * 1-5).
0,15,30,45 8-18/2 * * 1-5
minuto Especifica los minutos de la hora en los que debe actualizarse el índice de búsqueda
de texto. Puede especificar un asterisco (*) para un intervalo de cada 5 minutos o un
entero de 0 a 59. No pueden repetirse valores. La frecuencia de actualización mínima
es de 5 minutos. Un valor de 1, 4 u 8 no es válido.
frecuencia-actualización (minuto):
*
/ 0...59
,
0...59 - 0...59
/ 0...59
0...59
hora
Especifica las horas del día en las que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para cada hora o un entero de 0 a 23. No
pueden repetirse valores.
frecuencia-actualización (hora):
*
/ 0...23
,
0...23 - 0...23
/ 0...23
0...23
díaDelMes
Especifica los días del mes en los que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para cada día o un entero de 1 a 31. No
pueden repetirse valores.
frecuencia-actualización (díaDelMes):
*
/ 1...31
,
1...31 - 1...31
/ 1...31
1...31
24
IBM i: OmniFind Text Search Server for DB2 for i
mesDelAño
Especifica los meses del año en los que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para cada mes o un entero de 1 a 12. No
pueden repetirse valores.
frecuencia-actualización (mesDelAño):
*
/ 1...12
,
1...12 - 1...12
/ 1...12
1...12
díaDeLaSemana
Especifica los días de la semana en los que debe actualizarse el índice de búsqueda
de texto. Puede especificar un asterisco (*) para cada día o un entero de 0 a 7. Tanto 0
como 7 son valores válidos para el Domingo. No pueden repetirse valores.
frecuencia-actualización (díaDeLaSemana):
*
/ 0...7
,
0...7 - 0...7
/ 0...7
0...7
UPDATE MINIMUM mín_cambios
Especifica el número mínimo de cambios de registro realizados en la tabla subyacente antes
de que el índice de búsqueda de texto se actualice incrementalmente a la hora especificada en
la opción frecuencia-actualización. El valor debe ser un entero de 1 a 2147483647. El valor
predeterminado se toma de la columna UPDATEMINIMUM de la tabla
QSYS2.SYSTEXTDEFAULTS.
Esta opción se ignora al actualizar el índice de búsqueda de texto, a menos que especifique la
opción USING UPDATE MINIMUM en el procedimiento almacenado
SYSPROC.SYSTS_UPDATE.
opciones-configuración-índice:
,
INDEX CONFIGURATION ( opción
valor
)
ROW_COLUMN_ACCESS:
NOT SECURED
SECURED
opciones-configuración-índice
Especifica valores adicionales específicos de índice en forma de pares de opción y valor. Debe
especificar los valores tipo serie entre comillas simples. Un comilla simple dentro de un valor tipo
serie debe representarse mediante dos comillas simples consecutivas.
OmniFind Text Search Server
25
CJKSEGMENTATION
Especifica el método de segmentación que debe utilizarse al indexar documentos para
idiomas CJK (chino, japonés, coreano). Los valores soportados son MORPHOLOGICAL y
NGRAM. Si no se especifica el valor CJKSEGMENTATION, se utiliza el valor
predeterminado. El valor predeterminado se especifica en la columna DEFAULTNAME de la
tabla QSYS2.SYSTEXTDEFAULTS.
COMMENT
Especifica un comentario que se almacena en la columna REMARKS de la tabla de
administración QSYS2.SYSTEXTINDEXES y como descripción de la colección de OmniFind
Text Search Server for DB2 for i.
El valor de esta opción es un valor tipo serie inferior o igual a 512 bytes.
IGNOREEMPTYDOCS
Especifica si deben representarse los documentos vacíos en el índice de búsqueda de texto.
Los documentos vacíos son aquellos con una serie vacía o un valor nulo.
Los valores soportados para esta opción son 0 (cero) y 1. El valor predeterminado es 1.
Si esta opción se establece en 1, los documentos vacíos no estarán representados en el índice
de búsqueda de texto. Si utiliza esta opción y cambia el contenido del documento a vacío, la
próxima actualización incremental suprimirá los documentos del índice de búsqueda de texto.
KEYCOLUMN
Especifica el nombre de una columna exclusiva que debe utilizarse como columna de clave en
el índice de texto. La columna de clave se utiliza para asociar datos del índice de texto a un
documento o fila de la tabla base. La columna especificada debe tener una restricción de
clave primaria o índice exclusivo. Si no se especifica KEYCOLUMN, se utiliza la columna
ROWID de la tabla, si existe. De lo contrario, se utiliza la clave primaria definida en la tabla.
SERVER
Especifica el ID o nombre de alias del servidor que debe utilizarse para almacenar el índice
de búsqueda de texto. Si se utiliza un ID, el valor es un entero que debe existir en la columna
SERVERID del catálogo QSYS2.SYSTEXTSERVERS. Si se utiliza un nombre de alias, el valor
es una serie que debe existir en la columna ALIASNAME del catálogo
QSYS2.SYSTEXTSERVERS. Si no se especifica SERVER, el valor predeterminado es seleccionar
el servidor con menos índices de búsqueda de texto entre los servidores de la tabla
QSYS2.SYSTEXTSERVERS en los que el parámetro SERVERSTATUS está establecido en 0
(cero), lo que indica que el servidor está disponible.
UPDATEAUTOCOMMIT
Especifica la frecuencia con la que se realiza una operación de confirmación al extraer
documentos durante una actualización de índice. El valor 0 (cero) indica que una operación
de confirmación sólo se realiza al final del proceso.
El valor debe ser un entero entre 0 (cero) y 2147483647. El valor predeterminado es 100.
Sugerencia de rendimiento: el valor de UPDATEAUTOCOMMIT puede tener un impacto
significativo sobre el rendimiento de las actualizaciones de índice. La operación de
confirmación que tiene lugar con el intervalo especificado garantiza un punto de
comprobación coherente desde el que reiniciar la actualización de índice, si se interrumpe. Sin
embargo, la confirmación también suspende temporalmente el proceso de actualización.
Aumentar el valor de UPDATEAUTOCOMMIT (o establecerlo en 0) puede mejorar
significativamente el rendimiento de la actualización, especialmente de la inicial. El valor que
especifique debe buscar el equilibrio entre las necesidades de rendimiento y las de
recuperabilidad, en función de la frecuencia de las actualizaciones del índice.
ROW_COLUMN_ACCESS
Especifica si el índice de búsqueda de texto se considera seguro para el control de acceso a
filas y el control de acceso a columnas.
26
IBM i: OmniFind Text Search Server for DB2 for i
NOT_SECURED
Especifica que el índice de búsqueda de texto no se considera seguro para el control de
acceso a filas y el control de acceso a columnas. Este es el valor predeterminado.
La tabla base para el índice no debe tener un permiso o máscara activa.
SECURED
Especifica que el índice se considera seguro para el control de acceso a filas y el control
de acceso a columnas.
Un índice de búsqueda de texto debe estar definido como seguro para poder crearse
sobre una tabla con una máscara de columna o permiso activo. Si una función está
referenciada para acceder o modificar datos de una columna enmascarados, la función
debe definirse como segura. El ID de autorización debe tener la autorización
DB_SECADMIN para crear un índice de búsqueda de texto con el atributo SECURED.
Cuando un índice de búsqueda de texto se crea sobre información confidencial, existen
consideraciones adicionales:
El administrador de bases de datos debe ser consciente de que los datos especificados
como columnas de clave para el índice de búsqueda de texto se almacenarán en una tabla
intermedia de QSYS2 y se enviarán al servidor de búsqueda de texto utilizando
protocolos de red.
El administrador de bases de datos debe ser consciente de que los datos indexados por
un índice de búsqueda de texto se envían al servidor de búsqueda de texto utilizando
protocolos de red y se almacenan fuera de DB2 en el servidor de búsqueda de texto.
Valores predeterminados del parámetro opciones
Al instalar OmniFind Text Search for DB2 for i, se crea la tabla QSYS2.SYSTEXTDEFAULTS y se llena con
valores predeterminados para el parámetro opciones del procedimiento almacenado
SYSPROC.SYSTS_CREATE.
En la tabla siguiente se indican las opciones, los valores predeterminados y las descripciones de las
opciones.
Tabla 2. Valores predeterminados del parámetro opciones
Opción
Valor
predeterminado Descripción
CCSID
1208
Especifica el identificador de juego de caracteres
codificados utilizado al indexar documentos de texto
binarios.
CJKSEGMENTATION
NGRAM
Especifica el método de segmentación que debe
utilizarse al indexar documentos para idiomas CJK
(chino, japonés, coreano).
LANGUAGE
en_US
Especifica el idioma utilizado para procesar
documentos de texto.
FORMAT
TEXT
Identifica el formato de los documentos de texto de la
columna. El formato predeterminado es texto sin
formato, a menos que el tipo de datos sea XML.
UPDATEFREQUENCY
NONE
Indica que no hay actualizaciones automáticas
planificadas.
UPDATEMINIMUM
1
Si un documento como mínimo ha cambiado desde la
última actualización del índice, el procedimiento
almacenado SYSPROC.SYSTS_UPDATE inicia el
proceso.
OmniFind Text Search Server
27
Tabla 2. Valores predeterminados del parámetro opciones (continuación)
Opción
Valor
predeterminado Descripción
IGNOREEMPTYDOCS
1
Especifica que los documentos vacíos (aquellos con una
serie vacía o un valor nulo) no están representados en
el índice de búsqueda de texto. Los campos de
metadatos para estos documentos no están disponibles
para la búsqueda.
UPDATEAUTOCOMMIT
100
Especifica la frecuencia con la que se realiza una
operación de confirmación al extraer documentos
durante una actualización de índice.
MINIMUMUPDATEINTERVAL
5
Especifica los intervalos de la opción
UPDATEFREQUENCY. Los intervalos no pueden ser
inferiores a 5 minutos.
ROW_COLUMN_ACCESS
NOT_SECURED Especifica si el índice se crea como protegido.
USEREXITTHREADS
0
Reservada
Conceptos relacionados:
“Formatos de documento soportados” en la página 6
Los datos de una columna de texto pueden ser texto sin formato, un documento HTML, un XML o
cualquier documento que el motor de búsqueda reconozca.
“Tipos de datos soportados” en la página 7
Los datos de las columnas de texto que desea indexar y en las que realizar búsquedas pueden ser datos
binarios o datos de tipo carácter.
Referencia relacionada:
“Tabla de administración QSYS2.SYSTEXTSERVERS” en la página 115
Puede visualizar dónde están instalados los servidores de búsqueda de texto mediante la tabla de
administración QSYS2.SYSTEXTSERVERS.
“Tabla de administración QSYS2.SYSTEXTINDEXES” en la página 112
Puede visualizar información acerca de cada índice de búsqueda de texto en la tabla de administración
QSYS2.SYSTEXTINDEXES. Cada índice de búsqueda de texto tiene un nombre, un nombre de esquema y
un nombre de colección asociada en el servidor de búsqueda de texto.
“Tabla de administración QSYS2.SYSTEXTDEFAULTS” en la página 111
Puede visualizar los parámetros y valores predeterminados en la tabla de administración
QSYS2.SYSTEXTDEFAULTS. Esta tabla se crea al instalar OmniFind Text Search for DB2 for i.
“SYSPROC.SYSTS_UPDATE” en la página 36
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
“SYSPROC.SYSTS_START” en la página 15
Puede habilitar funciones de búsqueda de texto de DB2 llamando al procedimiento almacenado
SYSPROC.SYSTS_START.
“Idiomas soportados” en la página 8
Puede especificar que los documentos de texto se procesen mediante un idioma específico.
SYSPROC.SYSTS_ALTER
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_ALTER para modificar los atributos de un
índice creado por SYSPROC.SYSTS_CREATE. Sólo se cambiarán los atributos especificados explícitamente
en este procedimiento. Todos los demás atributos del índice permanecerán sin cambios.
Este procedimiento resulta de utilidad si necesita cambiar los atributos del índice, como por ejemplo la
frecuencia de actualización, una vez que éste se ha creado.
28
IBM i: OmniFind Text Search Server for DB2 for i
Requisitos previos
Antes de llamar al procedimiento almacenado SYSPROC.SYSTS_ALTER, compruebe el siguiente requisito
previo:
v El índice de búsqueda de texto debe haberse creado (por invocación del procedimiento almacenado
SYSPROC.SYSTS_CREATE).
Autorización
Los privilegios detentados por el ID de autorización de la sentencia deben incluir como mínimo uno de
los siguientes:
v El privilegio de creación en el esquema. Para obtener más información, consulte el apartado
Autorización, privilegios y propiedad de objetos.
v Autoridad administrativa
Los privilegios detentados por el ID de autorización de la sentencia deben incluir como mínimo uno de
los siguientes:
v Las siguientes autorizaciones del sistema:
– *USE sobre el mandato Crear archivo lógico (CRTLF)
– *CHANGE sobre el diccionario de datos si la biblioteca en la que se crea el índice de texto es un
esquema SQL con un diccionario de datos
v Autoridad administrativa
Los privilegios detentados por el ID de autorización de la sentencia también deben incluir como mínimo
uno de los siguientes:
v Para la tabla referenciada:
– El privilegio INDEX sobre la tabla
– La autorización del sistema *EXECUTE sobre la biblioteca que contiene la tabla
v Autoridad administrativa
v Si se especifican nombres SQL y existe un perfil de usuario que tiene el mismo nombre que la
biblioteca en la que se crea el índice de texto, y dicho nombre es diferente del ID de autorización de la
sentencia, los privilegios detentados por el ID de autorización de la sentencia deben incluir como
mínimo una de las autorizaciones siguientes:
– Autorización del sistema *ADD sobre el perfil de usuario con ese nombre
– Autoridad administrativa
Si se hace referencia a un tipo distinct, los privilegios detentados por el ID de autorización de la sentencia
deben incluir como mínimo uno de los siguientes:
v Para cada tipo distinct identificado en la sentencia:
– El privilegio USAGE sobre el tipo distinct, y
– La autorización del sistema *EXECUTE sobre la biblioteca que contiene el tipo distinct
v Autoridad administrativa
Para obtener información acerca de las autorizaciones del sistema correspondientes a los privilegios SQL,
consulte el apartado GRANT (Privilegios de tabla o vista).
Sintaxis
SYSTS_ALTER (
esquemaÍndice
, nombreÍndice
, opciones
)
OmniFind Text Search Server
29
El calificador de esquema es SYSPROC.
Parámetros
esquemaÍndice
Identifica el esquema del índice de búsqueda de texto. Si este parámetro es nulo, se utiliza el valor
del registro especial CURRENT SCHEMA correspondiente al invocante.
El tipo de datos de este parámetro es VARCHAR(128).
nombreÍndice
Identifica el nombre del índice de búsqueda de texto. El nombre del índice de búsqueda de texto,
junto con el esquema del índice, identifica de forma exclusiva el índice de texto en el subsistema DB2.
Debe especificar un valor no nulo en este parámetro.
El tipo de datos de este parámetro es VARCHAR(128).
opciones
Serie de caracteres que especifica las diversas opciones que están disponibles para este procedimiento
almacenado.
El tipo de datos de este parámetro es VARCHAR(32000).
El valor del parámetro no puede ser NULL.
Opciones:
información-redenominar-función
características-actualización
opciones-configuración-índice
información-redenominar-función:
RENAME FUNCTION
nombre-función
esquema-función
.
Especifica la función definida por el usuario que debe redenominarse.
esquema-función.nombre-función
Especifica el esquema y el nombre de una función definida por el usuario.
Esta opción se utiliza para cambiar una función que se ha especificado al crear un índice. Si se
modifica la función, SYSTS_UPDATE utilizará la función nueva para indexar la columna de texto.
Si la función se ha cambiado, SYSTS_UPDATE no cambiará los datos existentes del índice. Sólo se
procesarán los datos nuevos cambiados después de la última actualización.
características-actualización:
UPDATE FREQUENCY
NONE
frecuencia-actualización
UPDATE MINIMUM
mín_cambios
características-actualización
Especifica la frecuencia de las actualizaciones automáticas en el índice de búsqueda de texto.
También especifica el número mínimo de cambios que deben realizarse en los documentos de
texto antes de que el índice de búsqueda de texto se actualice incrementalmente a la hora
especificada.
UPDATE FREQUENCY frecuencia-actualización
Especifica la frecuencia de las actualizaciones automáticas en el índice de búsqueda de texto.
30
IBM i: OmniFind Text Search Server for DB2 for i
El valor predeterminado es NONE. Esta opción puede ser de utilidad para una columna de
texto en la que no haya más cambios. El formato de la opción frecuencia-actualización admite
dos formatos.
frecuencia-actualización (Formato 1):
NONE
D (
*
)
H
(
*
,
)
M
(
*
,
0..6 0..23 0..6
)
,
0..59 0..23
0..59
NONE
Si se especifica NONE, no se realizan más actualizaciones de índice. La actualización
debe iniciarse manualmente. Esta opción puede ser de utilidad para una columna de
texto en la que no haya más cambios planificados.
D
Especifica el día o días de la semana en los que se actualiza el índice. Un asterisco (*)
indica todos los días. 0 indica el Domingo.
H
Especifica la hora u horas en las que se actualiza el índice. Un asterisco (*) indica
todas las horas.
M
Especifica el minuto o minutos en los que se actualiza el índice. No puede
especificarse un asterisco (*). La frecuencia de actualización mínima es de 5 minutos.
Ejemplo: este ejemplo especifica que la actualización de índice debe ejecutarse cada 30
minutos.
UPDATE FREQUENCY D(*) H(*) M(0,30)
frecuencia-actualización (Formato 2, cronológico):
< minuto> < hora> <díaDelMes> <mesDelAño> <díaDeLaSemana>
El formato de la opción frecuencia-actualización (cronológica) es una lista de cinco valores
separados por espacios en blanco. Los cinco valores representan los minutos, horas, días del
mes, meses del año y días de la semana empezando por el Domingo.
Si especifica un intervalo de valores o un asterisco (*), puede especificar un valor de recorrido
utilizando una barra inclinada (/) al final del intervalo definido.
Ejemplo: este ejemplo especifica que la actualización de índice debe ejecutarse cada cuarto de
hora (0,15,30,45) en las horas pares entre las 8 a.m. y las 6:45 p.m. (8-18/2 es equivalente a
8,10,12,14,16,18), de Lunes a Viernes todos los meses del año (* * 1-5).
0,15,30,45 8-18/2 * * 1-5
minuto Especifica los minutos de la hora en los que debe actualizarse el índice de búsqueda
de texto. Puede especificar un asterisco (*) para un intervalo de cada 5 minutos o un
entero de 0 a 59. No pueden repetirse valores. La frecuencia de actualización mínima
es de 5 minutos. Un valor de 1, 4 u 8 no está permitido.
OmniFind Text Search Server
31
frecuencia-actualización (minuto):
*
/ 0...59
,
0...59 - 0...59
/ 0...59
0...59
hora
Especifica las horas del día en las que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para cada hora o un entero de 0 a 23. No
pueden repetirse valores.
frecuencia-actualización (hora):
*
/ 0...23
,
0...23 - 0...23
/ 0...23
0...23
díaDelMes
Especifica los días del mes en los que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para cada día o un entero de 1 a 31. No
pueden repetirse valores.
frecuencia-actualización (díaDelMes):
*
/ 1...31
,
1...31 - 1...31
/ 1...31
1...31
mesDelAño
Especifica los meses del año en los que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para cada mes o un entero de 1 a 12. No
pueden repetirse valores.
frecuencia-actualización (mesDelAño):
*
/ 1...12
,
1...12 - 1...12
/ 1...12
1...12
díaDeLaSemana
Especifica los días de la semana en los que debe actualizarse el índice de búsqueda
de texto. Puede especificar un asterisco (*) para cada día o un entero de 0 a 7. Tanto 0
como 7 son valores válidos para el Domingo. No pueden repetirse valores.
32
IBM i: OmniFind Text Search Server for DB2 for i
frecuencia-actualización (díaDeLaSemana):
*
/ 0...7
,
0...7 - 0...7
/ 0...7
0...7
UPDATE MINIMUM mín_cambios
Especifica el número mínimo de cambios de registro realizados en la tabla subyacente antes
de que el índice de búsqueda de texto se actualice incrementalmente a la hora especificada en
la opción frecuencia-actualización. El valor debe ser un entero de 1 a 2147483647.
opciones-configuración-índice:
,
INDEX CONFIGURATION ( opción
valor
)
ROW_COLUMN_ACCESS:
NOT SECURED
SECURED
COMMENT
Especifica un comentario que se almacena en la columna REMARKS de la tabla de
administración QSYS2.SYSTEXTINDEXES y como descripción de la colección de OmniFind Text
Search Server for DB2 for i.
El valor de esta opción es un valor tipo serie inferior o igual a 512 bytes.
UPDATEAUTOCOMMIT
Especifica la frecuencia con la que se realiza una operación de confirmación al extraer
documentos durante una actualización de índice. El valor 0 (cero) indica que una operación de
confirmación sólo se realiza al final del proceso.
El valor debe ser un entero entre 0 (cero) y 2147483647.
Sugerencia de rendimiento: el valor de UPDATEAUTOCOMMIT puede tener un impacto
significativo sobre el rendimiento de las actualizaciones de índice. La operación de confirmación
que tiene lugar con el intervalo especificado garantiza un punto de comprobación coherente
desde el que reiniciar la actualización de índice, si se interrumpe. Sin embargo, la confirmación
también suspende temporalmente el proceso de actualización. Aumentar el valor de
UPDATEAUTOCOMMIT (o establecerlo en 0) puede mejorar significativamente el rendimiento de
la actualización, especialmente de la inicial. El valor que especifique debe buscar el equilibrio
entre las necesidades de rendimiento y las de recuperabilidad, en función de la frecuencia de las
actualizaciones del índice.
ROW_COLUMN_ACCESS
Especifica si el índice de búsqueda de texto se considera seguro para el control de acceso a filas y
el control de acceso a columnas.
NOT_SECURED
Especifica que el índice de búsqueda de texto no se considera seguro para el control de
acceso a filas y el control de acceso a columnas. Este es el valor predeterminado.
La tabla base para el índice no debe tener un permiso o máscara activa.
OmniFind Text Search Server
33
SECURED
Especifica que el índice se considera seguro para el control de acceso a filas y el control de
acceso a columnas.
Un índice de búsqueda de texto debe estar definido como seguro para poder crearse sobre
una tabla con una máscara de columna o permiso activo. Si una función está referenciada
para acceder o modificar datos de una columna enmascarados, la función debe definirse
como segura. El ID de autorización debe tener la autorización DB_SECADMIN para crear un
índice de búsqueda de texto con el atributo SECURED.
Cuando un índice de búsqueda de texto se crea sobre información confidencial, existen
consideraciones adicionales:
El administrador de bases de datos debe ser consciente de que los datos especificados como
columnas de clave para el índice de búsqueda de texto se almacenarán en una tabla
intermedia de QSYS2 y se enviarán al servidor de búsqueda de texto utilizando protocolos de
red.
El administrador de bases de datos debe ser consciente de que los datos indexados por un
índice de búsqueda de texto se envían al servidor de búsqueda de texto utilizando protocolos
de red y se almacenan fuera de DB2 en el servidor de búsqueda de texto.
Consejos: si los usuarios alteran un índice de SECURED a NOT SECURED, los usuarios deben
asegurarse de que la tabla base no tenga una máscara de permiso activa. De lo contrario, se producirá un
error.
Referencia relacionada:
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
“SYSPROC.SYSTS_UPDATE” en la página 36
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
“Tabla de administración QSYS2.SYSTEXTINDEXES” en la página 112
Puede visualizar información acerca de cada índice de búsqueda de texto en la tabla de administración
QSYS2.SYSTEXTINDEXES. Cada índice de búsqueda de texto tiene un nombre, un nombre de esquema y
un nombre de colección asociada en el servidor de búsqueda de texto.
SYSPROC.SYSTS_DROP
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_DROP para eliminar un índice de búsqueda
de texto definido mediante el procedimiento almacenado SYSPROC.SYSTS_CREATE.
Es aconsejable eliminar un índice de búsqueda de texto mediante el procedimiento almacenado
SYSPROC.SYSTS_DROP antes de eliminar la tabla.
Al eliminar la vista que representa el índice de búsqueda de texto, incluso como resultado de una
sentencia DROP TABLE CASCADE, se intenta eliminar el índice de búsqueda de texto. Sin embargo,
dado que el índice de búsqueda de texto no puede eliminarse bajo control de compromiso, la vista SQL
no puede eliminarse bajo control de compromiso.
Si no puede accederse al servidor de búsqueda de texto, la colección del servidor puede quedar huérfana.
Si eso ocurre, la colección deberá suprimirse manualmente. Cuando el servidor esté nuevo disponible,
utilice la herramienta de administración de OmniFind Text Search Server for DB2 for i para suprimir la
colección del servidor.
34
IBM i: OmniFind Text Search Server for DB2 for i
En el apartado “Herramientas de administración” en la página 76 encontrará información acerca de las
herramientas que puede utilizar para identificar índices huérfanos y el procedimiento almacenado
STSPROC.SYSTS_REMOVE o SYSPROC.SYSTS_CLEAR_INDEXES para suprimirlos.
Requisitos previos
Antes de llamar al procedimiento almacenado SYSPROC.SYSTS_DROP, compruebe los siguientes
requisitos previos:
v Que se han iniciado las funciones de búsqueda de texto de DB2 llamando al procedimiento
almacenado SYSPROC.SYSTS_START.
v El índice de búsqueda de texto debe haberse creado (por invocación del procedimiento almacenado
SYSPROC.SYSTS_CREATE).
v Asegúrese de que los siguientes procedimientos almacenados no estén en ejecución para el índice de
búsqueda de texto que desea eliminar: SYSPROC.SYSTS_CREATE, SYSPROC.SYSTS_UPDATE y
SYSPROC.SYSTS_DROP.
Autorización
Los privilegios detentados por el ID de autorización de la sentencia deben incluir como mínimo uno de
los siguientes:
v Las siguientes autorizaciones del sistema:
– Las autorizaciones del sistema *OBJOPR y *OBJEXIST sobre el índice de texto que debe eliminarse
– La autorización del sistema *EXECUTE sobre la biblioteca que contiene el índice de texto que debe
eliminarse
v Autoridad administrativa
Para obtener información acerca de las autorizaciones del sistema correspondientes a los privilegios SQL,
consulte el apartado GRANT (Privilegios de tabla o vista).
Sintaxis
SYSTS_DROP (
esquemaÍndice
nulo
, nombreÍndice
)
El calificador de esquema es SYSPROC.
Parámetros
esquemaÍndice
Identifica el esquema del índice de búsqueda de texto. Si este parámetro es nulo, se utiliza el valor
del registro especial CURRENT SCHEMA correspondiente al invocante.
El tipo de datos de este parámetro es VARCHAR(128).
nombreÍndice
Identifica el nombre del índice de búsqueda de texto. El nombre del índice de búsqueda de texto,
junto con el esquema del índice, identifica de forma exclusiva el índice de texto en el subsistema DB2.
Debe especificar un valor no nulo en este parámetro.
El tipo de datos de este parámetro es VARCHAR(128).
Referencia relacionada:
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
OmniFind Text Search Server
35
las funciones CONTAINS o SCORE.
“SYSPROC.SYSTS_START” en la página 15
Puede habilitar funciones de búsqueda de texto de DB2 llamando al procedimiento almacenado
SYSPROC.SYSTS_START.
“SYSPROC.SYSTS_UPDATE”
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
“SYSPROC.SYSTS_REMOVE” en la página 78
Puede eliminar índices huérfanos con el procedimiento almacenado SQL SYSPROC.SYSTS_REMOVE.
“SYSTS_CLEAR_INDEXES” en la página 81
Puede eliminar índices huérfanos con el procedimiento almacenado SQL SYSPROC.
SYSTS_CLEAR_INDEXES. Otra forma implícita es invocar SYSTS_START directamente, que intenta borrar
índices huérfanos automáticamente.
SYSPROC.SYSTS_UPDATE
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
Dado que la actualización de un índice de búsqueda de texto es una operación amplia, el índice de
búsqueda de texto no se actualiza síncronamente cuando se actualiza la tabla de DB2. En lugar de ello,
los cambios de la columna de la tabla de DB2 se capturan mediante un desencadenante y se graban en
una tabla intermedia. El índice de búsqueda de texto se actualizará la próxima vez que se invoque el
procedimiento almacenado SYSPROC.SYSTS_UPDATE o cuando la opción UPDATE FREQUENCY
indique que se actualiza. Por tanto, es posible que algunas solicitudes de búsqueda no reflejen las
actualizaciones recientes de la tabla.
Este procedimiento almacenado sólo efectúa el retorno una vez finalizado todo el proceso de
actualización del índice de búsqueda de texto en OmniFind Text Search Server for DB2 for i. La duración
depende del número de entradas de la tabla intermedia en el momento de llamar a SYSTS_UPDATE.
Durante el proceso de actualización, sigue siendo posible realizar búsquedas en el índice de búsqueda de
texto.
Si se ha producido un problema al indexar un documento de la tabla base, la columna de la tabla
intermedia con TOBEDELETED tendrá un valor establecido en E (error) o W (aviso). La columna
ERRORMSG tiene valor para registrar mensajes de error. Puede recuperar estos registros con un
procedimiento almacenado que incluya la consulta siguiente:
SELECT s.TOBEDELETED, s.ERRORMSG, columnas_base
FROM tabla_base t INNER JOIN QSYS2.tablasintermedias
ON (QQQ_TEXTSEARCH_KEY(t.k1, t.k2, t.k3, ...) = s.KEYID)
WHERE s.TOBEDELETED IN(’E’,’W’)
En este caso, columnas_base es la lista de columnas que es necesario visualizar de la tabla_base.
tabla_base es la tabla que se indexa. tabla intermedia es la tabla intermedia indicada en los catálogos
del índice de búsqueda de texto. k1, k2, k3, ... es la lista de columnas de clave de la clave primaria,
ID de fila o clave exclusiva utilizada para construir el índice de búsqueda de texto. ERRORMSG es una
columna que registra los mensajes de error al indexar este documento. Una vez corregidos los errores de
esos documentos, ejecute de nuevo la actualización.
Si se solicita una actualización de índice al mismo tiempo que ya se está realizando una actualización
para dicho índice, se devuelve un error. Sólo se permite una actualización a la vez para un índice
determinado.
Si se crea un índice como SECURED, los datos no enmascarados se recupera de la tabla base y se
indexan, como si no hubiera ninguna máscara o permiso creados en esta tabla.
36
IBM i: OmniFind Text Search Server for DB2 for i
Si hay procedimientos de campo creados en la tabla base, se indexan los datos originales sin enmascarar.
Requisitos previos
Antes de llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE, compruebe los siguientes
requisitos previos:
v El índice de búsqueda de texto debe haberse creado (por invocación del procedimiento almacenado
SYSPROC.SYSTS_CREATE).
v Los siguientes procedimientos almacenados no deben estar en ejecución para el índice de búsqueda de
texto que desea actualizar: SYSPROC.SYSTS_CREATE, SYSPROC.SYSTS_UPDATE y
SYSPROC.SYSTS_DROP.
v El servidor de búsqueda de texto en el que reside el índice debe haberse iniciado mediante el
procedimiento almacenado SYSTS_START. La columna SERVERSTATUS de QSYS2.SYSTEXTSERVERS
debe tener el valor '0' (iniciado).
Autorización
Los privilegios detentados por el ID de autorización de la sentencia deben incluir como mínimo uno de
los siguientes:
v El privilegio de creación en el esquema. Para obtener más información, consulte el apartado
Autorización, privilegios y propiedad de objetos.
v Autoridad administrativa
Los privilegios detentados por el ID de autorización de la sentencia deben incluir como mínimo uno de
los siguientes:
v Las siguientes autorizaciones del sistema:
– *USE sobre el mandato Crear archivo lógico (CRTLF)
– *CHANGE sobre el diccionario de datos si la biblioteca en la que se crea el índice de texto es un
esquema SQL con un diccionario de datos
v Autoridad administrativa
Los privilegios detentados por el ID de autorización de la sentencia también deben incluir como mínimo
uno de los siguientes:
v Para la tabla referenciada:
– El privilegio INDEX sobre la tabla
– La autorización del sistema *EXECUTE sobre la biblioteca que contiene la tabla
v Autoridad administrativa
v Si se especifican nombres SQL y existe un perfil de usuario que tiene el mismo nombre que la
biblioteca en la que se crea el índice de texto, y dicho nombre es diferente del ID de autorización de la
sentencia, los privilegios detentados por el ID de autorización de la sentencia deben incluir como
mínimo uno de los privilegios siguientes:
– Autorización del sistema *ADD sobre el perfil de usuario con ese nombre
– Autoridad administrativa
Si se hace referencia a un tipo distinct, los privilegios detentados por el ID de autorización de la sentencia
deben incluir como mínimo uno de los siguientes:
v Para cada tipo distinct identificado en la sentencia:
– El privilegio USAGE sobre el tipo distinct, y
– La autorización del sistema *EXECUTE sobre la biblioteca que contiene el tipo distinct
v Autoridad administrativa
OmniFind Text Search Server
37
Si el índice se ha creado mediante SYSTS_CREATE como índice SECURED, el ID de autorización debe
tener la autorización DB_SECADMIN.
Para obtener información acerca de las autorizaciones del sistema correspondientes a los privilegios SQL,
consulte el apartado GRANT (Privilegios de tabla o vista).
Sintaxis
SYSTS_UPDATE (
esquemaÍndice
nulo
,
nombreÍndice
, opciones
)
El calificador de esquema es SYSPROC.
Parámetros
esquemaÍndice
Identifica el esquema del índice de búsqueda de texto. Si este parámetro es nulo, se utiliza el valor
del registro especial CURRENT SCHEMA correspondiente al invocante.
El tipo de datos de este parámetro es VARCHAR(128).
nombreÍndice
Identifica el nombre del índice de búsqueda de texto. El nombre del índice de búsqueda de texto,
junto con el esquema del índice, identifica de forma exclusiva el índice de texto completo en el
subsistema DB2. Debe especificar un valor no nulo en este parámetro.
El tipo de datos de este parámetro es VARCHAR(128).
Opciones
Serie de caracteres que especifica la opción que está disponible para este procedimiento almacenado.
La opción disponible es USING UPDATE MINIMUM. Esta opción utiliza los valores USING UPDATE
MINIMUM que ha especificado para el procedimiento almacenado SYSPROC.SYSTS_CREATE. Inicia
una actualización incremental sólo si se ha alcanzado el número de cambios especificado. El valor
predeterminado es iniciar incondicionalmente el proceso de actualización.
USING UPDATE MINIMUM:
USING UPDATE MINIMUM
Conceptos relacionados:
“Recorte de documentos” en la página 15
OmniFind Text Search Server for DB2 for i limita el número de caracteres que pueden indexarse para
cada documento de texto. A veces, esta limitación de caracteres provoca el recorte de documentos de
texto grandes en el índice de búsqueda de texto.
Referencia relacionada:
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
“SYSPROC.SYSTS_START” en la página 15
Puede habilitar funciones de búsqueda de texto de DB2 llamando al procedimiento almacenado
SYSPROC.SYSTS_START.
“SYSPROC.SYSTS_DROP” en la página 34
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_DROP para eliminar un índice de búsqueda
38
IBM i: OmniFind Text Search Server for DB2 for i
de texto definido mediante el procedimiento almacenado SYSPROC.SYSTS_CREATE.
SYSPROC.SYSTS_SHUTDOWN
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_SHUTDOWN para concluir las funciones de
búsqueda de texto de DB2®. Este procedimiento almacenado establece el valor SERVERSTATUS del
catálogo QSYS2.SYSTEXTSERVERS en 1 (detenido) y también finaliza los trabajos del servidor de
búsqueda de texto del sistema host.
Una vez completado este procedimiento almacenado, las consultas SQL que utilicen las funciones
CONTAINS o SCORE o los procedimientos almacenados de administración utilizados para el
mantenimiento de los índices devolverán una anomalía sin intentar contactar con un servidor de
búsqueda de texto.
Los cambios en la tabla base del índice se siguen registrando aunque el servidor haya concluido. Sin
embargo, las actualizaciones planificadas del índice no se producirán hasta que se haya invocado a
SYSPROC.SYSTS_START.
Autorización
El ID de usuario bajo el que se invoca este procedimiento almacenado debe tener los siguientes
privilegios:
v Autorización *EXECUTE sobre el procedimiento.
v Privilegios SELECT y UPDATE sobre la tabla SYSTEXTSERVERS.
v Autorización *EXECUTE sobre la biblioteca QSYS2 del archivo SYSTEXTSERVERS.
v Autorización *JOBCTL o utilización de la función especial de seguridad QIBM_DB_SQLADM.
Para obtener información acerca de las autorizaciones del sistema correspondientes a los privilegios SQL,
consulte el apartado GRANT (Privilegios de tabla o vista).
Sintaxis
>>-SYSTS_SHUTDOWN--(--+-----------+--)-----------------------------><
+-id_servidor--+
’-nombre_alias-’
Parámetros
id_servidor o nombre_alias
Especifica el identificador del servidor cuyos índices huérfanos deben borrarse. Un idservidor o un
nombrealias de servidor es una serie de caracteres. Si no se proporciona ningún identificador, el valor
predeterminado es borrar los índices huérfanos de todos los servidores. La serie del identificador
debe ser un id_servidor válido que exista en la columna SERVERID o un nombre de alias de servidor
válido que exista en la columna ALIASNAME de la tabla QSYS2.SYSTEXTSERVERS. Si el
identificador puede convertirse a un valor entero, se interpreta como idservidor. Si el identificador no
puede convertirse a un valor entero, se interpreta como nombrealias de servidor.
El tipo de datos de este parámetro es VARCHAR(128).
Ejemplo
v Para concluir todos los servidores de producción:
CALL SYSPROC.SYSTS_SHUTDOWN().
v Para concluir un servidor con el ID 1:
CALL SYSPROC.SYSTS_SHUTDOWN(1)
v Para concluir un servidor con el nombre de alias "LOCAL_SERVER":
CALL SYSPROC.SYSTS_SHUTDOWN(’LOCAL_SERVER’)
OmniFind Text Search Server
39
v Para concluir un servidor con el nombre de alias "local_server":
CALL SYSPROC.SYSTS_SHUTDOWN(’local_server’)
Conceptos relacionados:
“Nombre de alias de servidor” en la página 11
Puede utilizar un nombre de alias de servidor para asignar un nombre significativo a un servidor.
Referencia relacionada:
“Tabla de administración QSYS2.SYSTEXTSERVERS” en la página 115
Puede visualizar dónde están instalados los servidores de búsqueda de texto mediante la tabla de
administración QSYS2.SYSTEXTSERVERS.
“SYSPROC.SYSTS_START” en la página 15
Puede habilitar funciones de búsqueda de texto de DB2 llamando al procedimiento almacenado
SYSPROC.SYSTS_START.
“CONTAINS”
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
Buscar con un índice de búsqueda de texto
Puede utilizar las funciones CONTAINS y SCORE en una consulta SQL con OMNIFIND. CONTAINS y
SCORE se utilizan para realizar búsquedas en un índice de búsqueda de texto utilizando los criterios
especificados en un argumento de búsqueda. También puede indexar y realizar búsquedas en
documentos XML.
CONTAINS
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
(1)
CONTAINS (
)
nombre-columna , argumento-búsqueda
,
constante-serie
Notas:
1
La constante-serie debe ajustarse a las normas de las opciones de argumento-búsqueda.
opciones-argumento-búsqueda:
(1)
QUERYLANGUAGE = valor
RESULTLIMIT = valor
OFF
SYNONYM =
ON
Notas:
1
No puede especificarse la misma cláusula más de una vez.
40
IBM i: OmniFind Text Search Server for DB2 for i
El esquema es QSYS2.
nombre-columna
Especifica un nombre calificado o no calificado de una columna que contiene un índice de búsqueda
de texto en el que debe buscarse. La columna debe existir en la tabla o vista identificada en la
cláusula FROM de la sentencia. La columna de la tabla o la columna de la tabla base subyacente de
la vista debe tener un índice de búsqueda de texto asociado (SQLSTATE 38H12). La expresión
subyacente de la columna de una vista debe ser una referencia de columna simple a la columna de
una tabla subyacente, directamente o a través de otra vista anidada.
argumento-búsqueda
Especifica una expresión que devuelve un valor tipo serie que contiene los términos utilizados en la
búsqueda. La expresión no puede estar formada sólo por espacios en blanco ni ser la serie vacía
(SQLSTATE 38H14). La longitud real de la serie no puede sobrepasar los 32704 bytes. Esta longitud
puede quedar aún más limitada por el valor soportado por el servidor de búsqueda de texto
(SQLSTATE 38H10). El valor se convierte a Unicode antes de utilizarlo para realizar búsquedas en el
índice de búsqueda de texto.
constante-serie
Identifica una constante de tipo serie que especifica las opciones de argumento de búsqueda en vigor
para la función.
Las opciones que pueden especificarse como parte de las opciones-argumento-búsqueda son las
siguientes:
QUERYLANGUAGE=valor
Especifica el idioma de la consulta. El valor puede ser cualquiera de los códigos de idioma
soportados. Si no se especifica la opción QUERYLANGUAGE, el valor predeterminado es el
valor de idioma del índice de búsqueda de texto utilizado cuando se invoca la función. Si el
valor de idioma del índice de búsqueda de texto es AUTO, el valor predeterminado para
QUERYLANGUAGE es en_US.
RESULTLIMIT=valor
Especifica el número máximo de resultados que el motor de búsqueda subyacente puede
devolver. El valor puede ser un entero de 1 a 2 147 483 647. Si no se especifica la opción
RESULTLIMIT, no habrá ningún límite de resultados en vigor para la consulta.
Es posible que no pueda llamarse a esta función escalar para cada fila de la tabla de
resultados, dependiendo del plan elegido por el optimizador. Esta función puede llamarse
una vez para toda la consulta al motor de búsqueda subyacente. Se devuelve un conjunto de
resultados de todas las claves primarias coincidentes. A continuación, este conjunto de
resultados se une a la tabla que contiene la columna para identificar las filas de resultados.
En este caso, el valor RESULTLIMIT actúa como FETCH FIRST ?? ROWS desde el motor de
búsqueda de texto subyacente, y puede utilizarse como optimización. Si se llama al motor de
búsqueda para cada fila del resultado debido a que este es el mejor plan, la opción
RESULTLIMIT se ignora.
SYNONYM = OFF o SYNONYM = ON
Especifica si debe utilizarse un diccionario de sinónimos asociado con el índice de búsqueda
de texto. Puede añadir un diccionario de sinónimos a una colección mediante la herramienta
de sinónimos.
OFF
OFF es el valor predeterminado.
ON
Se utiliza el diccionario de sinónimos que está asociado con el índice de búsqueda de
texto.
El resultado de la función es un entero grande. Si el segundo argumento puede ser nulo, el resultado
puede ser nulo. Si el segundo argumento es nulo, el resultado es el valor nulo.
OmniFind Text Search Server
41
El resultado es 1 si el documento contiene una coincidencia con los criterios de búsqueda especificados en
el argumento de búsqueda. De lo contrario, el resultado es 0. Si la columna es nula, el resultado también
es 0. Si el argumento de búsqueda es nulo, el resultado es el valor nulo.
CONTAINS es una función no determinística.
Ejemplo 1
La sentencia siguiente busca todos los empleados cuyo currículum contiene COBOL.
SELECT EMPNO
FROM EMP_RESUME
WHERE RESUME_FORMAT = ’ascii’
AND CONTAINS(RESUME, ’COBOL’) = 1
Ejemplo 2
El argumento de búsqueda no tiene que ser necesariamente una constante de tipo serie. El argumento de
búsqueda puede ser cualquier expresión de serie SQL, incluida una serie contenida en una variable host.
La sentencia siguiente busca el término exacto "ate" en la columna COMMENT.
Nota: El término "ate" debe delimitarse mediante comillas dobles para que se busque sólo el término
exacto sin tener en cuenta las variantes lingüísticas.
char search_arg[100]; /* variable host de entrada */
...
EXEC SQL DECLARE C3 CURSOR FOR
SELECT CUSTKEY
FROM K55ADMIN.CUSTOMERS
WHERE CONTAINS(COMMENT, :search_arg)= 1
ORDER BY CUSTKEY;
strcpy(search_arg, "\"ate\""’);
EXEC SQL OPEN C3;
...
Ejemplo 3
La sentencia siguiente busca aleatoriamente 10 estudiantes que hayan escrito artículos en línea que
contengan la frase "fossil fuel" en español, es decir, "combustible fósil". Estos estudiantes están destinados
a una entrevista radiofónica. Utilice el diccionario de sinónimos que se ha creado para el índice de
búsqueda de texto asociado. Dado que sólo son necesarios 10 estudiantes, optimice la consulta mediante
la opción RESULTLIMIT para limitar el número de resultados del servidor de búsqueda de texto
subyacente.
SELECT FIRSTNME, LASTNAME
FROM STUDENT_ESSAYS
WHERE CONTAINS(TERM_PAPER, ’combustible fósil’,
’QUERYLANGUAGE= es_ES RESULTLIMIT = 10 SYNONYM=ON’) = 1
Tareas relacionadas:
“Buscar en un índice de búsqueda de texto” en la página 14
Puede buscar en un índice de búsqueda de texto mediante una sentencia SQL con una función
CONTAINS o SCORE. En la función se especifican los criterios del argumento de búsqueda.
Referencia relacionada:
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
42
IBM i: OmniFind Text Search Server for DB2 for i
“Sintaxis de argumentos de búsqueda” en la página 45
Puede especificar un argumento de búsqueda como condición de una búsqueda de términos en
documentos de texto. Consta de parámetros de búsqueda y uno o más términos de búsqueda. Las
funciones escalares de búsqueda de texto SQL que utilizan argumentos de búsqueda son CONTAINS y
SCORE.
SCORE
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
(1)
SCORE (
nombre-columna , argumento-búsqueda
)
,
constante-serie
Notas:
1
La constante-serie debe ajustarse a las normas de las opciones de argumento-búsqueda.
opciones-argumento-búsqueda:
(1)
QUERYLANGUAGE = valor
RESULTLIMIT = valor
OFF
SYNONYM =
ON
Notas:
1
No puede especificarse la misma cláusula más de una vez.
El esquema es QSYS2.
nombre-columna
Especifica un nombre calificado o no calificado de una columna que contiene un índice de búsqueda
de texto en el que debe buscarse. La columna debe existir en la tabla o vista identificada en la
cláusula FROM de la sentencia. La columna de la tabla o la columna de la tabla base subyacente de
la vista debe tener un índice de búsqueda de texto asociado (SQLSTATE 38H12). La expresión
subyacente de la columna de una vista debe ser una referencia de columna simple a la columna de
una tabla subyacente, directamente o a través de otra vista anidada.
argumento-búsqueda
Especifica una expresión que devuelve un valor tipo serie que contiene los términos utilizados en la
búsqueda. La expresión no puede estar formada sólo por espacios en blanco ni ser la serie vacía
(SQLSTATE 38H14). La longitud real de la serie no puede sobrepasar los 32704 bytes. Esta longitud
puede quedar aún más limitada por el valor soportado por el servidor de búsqueda de texto
(SQLSTATE 38H10). El valor se convierte a Unicode antes de utilizarlo para realizar búsquedas en el
índice de búsqueda de texto. Si el argumento de búsqueda es nulo, el resultado es el valor nulo.
constante-serie
Identifica una constante de tipo serie que especifica las opciones de argumento de búsqueda en vigor
para la función.
Las opciones que pueden especificarse como parte de las opciones-argumento-búsqueda son las
siguientes:
QUERYLANGUAGE=valor
Especifica el idioma de la consulta. El valor puede ser cualquiera de los códigos de idioma
OmniFind Text Search Server
43
soportados. Si no se especifica la opción QUERYLANGUAGE, el valor predeterminado es el
valor de idioma del índice de búsqueda de texto utilizado cuando se invoca la función. Si el
valor de idioma del índice de búsqueda de texto es AUTO, el valor predeterminado para
QUERYLANGUAGE es en_US.
RESULTLIMIT=valor
Especifica el número máximo de resultados que el motor de búsqueda subyacente puede
devolver. El valor puede ser un entero de 1 a 2 147 483 647. Si no se especifica la opción
RESULTLIMIT, no habrá ningún límite de resultados en vigor para la consulta.
Es posible que no pueda llamarse a esta función escalar para cada fila de la tabla de
resultados, dependiendo del plan elegido por el optimizador. Esta función puede llamarse
una vez para toda la consulta al motor de búsqueda subyacente. Se devuelve un conjunto de
resultados de todas las claves primarias coincidentes. A continuación, este conjunto de
resultados se une a la tabla que contiene la columna para identificar las filas de resultados.
En este caso, el valor RESULTLIMIT actúa como FETCH FIRST ?? ROWS desde el motor de
búsqueda de texto subyacente, y puede utilizarse como optimización. Si se llama al motor de
búsqueda para cada fila del resultado debido a que este es el mejor plan, la opción
RESULTLIMIT se ignora.
SYNONYM = OFF o SYNONYM = ON
Especifica si debe utilizarse un diccionario de sinónimos asociado con el índice de búsqueda
de texto. Puede añadir un diccionario de sinónimos a una colección mediante la herramienta
de sinónimos.
OFF
OFF es el valor predeterminado.
ON
Se utiliza el diccionario de sinónimos que está asociado con el índice de búsqueda de
texto.
El resultado de la función es un número de coma flotante de precisión doble. Si el segundo argumento
puede ser nulo, el resultado puede ser nulo. Si el segundo argumento es nulo, el resultado es el valor
nulo.
El resultado es mayor que 0 pero menor que 1 si la columna contiene una coincidencia con los criterios
de búsqueda especificados por el argumento de búsqueda. Cuanto mayor sea la frecuencia con la que se
encuentre una coincidencia, mayor será el valor del resultado. Si la columna no contiene ninguna
coincidencia, el resultado será 0. La puntuación también será 0 si la columna es nula.
SCORE es una función no determinística.
Ejemplo
La sentencia siguiente genera una lista de empleados ordenada por el grado de coincidencia de sus
currículums con programador AND (java OR cobol). Además, se devuelve un valor de relevancia
normalizado entre 0 (cero) y 100.
SELECT EMPNO, INTEGER(SCORE(RESUME, ’programador AND
(java OR cobol)’) * 100) AS RELEVANCE
FROM EMP_RESUME
WHERE RESUME_FORMAT = ’ascii’
ORDER BY RELEVANCE DESC
Tareas relacionadas:
“Buscar en un índice de búsqueda de texto” en la página 14
Puede buscar en un índice de búsqueda de texto mediante una sentencia SQL con una función
CONTAINS o SCORE. En la función se especifican los criterios del argumento de búsqueda.
Referencia relacionada:
44
IBM i: OmniFind Text Search Server for DB2 for i
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
“Sintaxis de argumentos de búsqueda”
Puede especificar un argumento de búsqueda como condición de una búsqueda de términos en
documentos de texto. Consta de parámetros de búsqueda y uno o más términos de búsqueda. Las
funciones escalares de búsqueda de texto SQL que utilizan argumentos de búsqueda son CONTAINS y
SCORE.
Sintaxis de argumentos de búsqueda
Puede especificar un argumento de búsqueda como condición de una búsqueda de términos en
documentos de texto. Consta de parámetros de búsqueda y uno o más términos de búsqueda. Las
funciones escalares de búsqueda de texto SQL que utilizan argumentos de búsqueda son CONTAINS y
SCORE.
En cualquier proceso específico de idioma durante una búsqueda, puede especificar un valor para el
parámetro QUERYLANGUAGE como opción de argumento de búsqueda. El valor puede ser cualquiera
de los códigos de idioma soportados.
Si no se especifica el parámetro QUERYLANGUAGE, el valor predeterminado es el valor de idioma del
índice de búsqueda de texto utilizado cuando se llama a esta función.
Si el valor de idioma del índice de búsqueda de texto es AUTO, el valor predeterminado para
QUERYLANGUAGE es en_US.
Limitaciones
No pueden utilizarse las funciones CONTAINS y SCORE en una restricción SQL o definición de índice.
Puede utilizarlas en definiciones de vista y sentencias de consulta SQL con las restricciones siguientes:
v Si una vista, expresión de tabla anidada o expresión de tabla común suministra una columna de
búsqueda de texto para una función escalar CONTAINS o SCORE, y si la vista, expresión de tabla
anidada o expresión de tabla común en cuestión contiene una cláusula DISTINCT en la sentencia
SELECT más externa, la lista de SELECT debe contener todos los campos de clave correspondientes del
índice de búsqueda de texto. De lo contrario, se devuelve el mensaje SQL 38H12.
v Si una vista, expresión de tabla anidada o expresión de tabla común suministra una columna de
búsqueda de texto para una función escalar CONTAINS o SCORE, la vista, expresión de tabla anidada
o expresión de tabla común en cuestión no pueden contener una sentencia UNION, EXCEPT o
INTERSECT en el nivel más externo de SELECT. De lo contrario, se devuelve el mensaje SQL 38H12.
v Si una expresión de tabla común suministra una columna de búsqueda de texto para una función
escalar CONTAINS o SCORE, la expresión de tabla común puede referenciarse de nuevo en toda la
consulta sólo si la referencia no suministra una columna de búsqueda de texto para una función escalar
CONTAINS o SCORE. De lo contrario, se devuelve el mensaje SQL 38H12.
v No puede crearse una función cuyo origen sean las funciones escalares CONTAINS o SCORE. De lo
contrario, se devuelve el mensaje SQL SQL0457.
v La consulta puede ejecutarse mediante el motor de consultas SQL (SQE).
OmniFind Text Search Server
45
Búsqueda simple
Para realizar una búsqueda simple de palabras clave, especifique una o varias palabras clave en la
consulta. El motor de búsqueda devuelve los documentos que contienen todas las palabras clave
especificadas o variantes de las mismas.
Por ejemplo, si especifica rey, el motor de búsqueda devolverá todos los documentos que contienen la
palabra rey o reyes. Si especifica la consulta rey lear, el motor de búsqueda devolverá los documentos
que contienen los términos rey y lear.
Para visualizar resultados más precisos, utilice palabras clave más específicas. Por ejemplo, especifique
café irlandés en lugar de café, o senderismo en Kauai en lugar de vacaciones en Hawai.
Si una búsqueda simple de palabras clave devuelve demasiados documentos que no corresponden a lo
que está buscando, puede utilizar operadores para refinar la búsqueda.
Exclusión de términos de una búsqueda
Para excluir términos se utiliza el signo menos (-). Por ejemplo, si desea buscar los documentos que
contienen el término lear, pero no eduardo, especifique la consulta lear -eduardo.
El signo menos (-) también se aplica a un término y a sus variantes. Por ejemplo, la consulta -eduardo
excluye los documentos que contienen la palabra eduardiano.
Búsqueda de frases
Si desea asegurarse de que los términos se visualicen exactamente en el orden en que los ha especificado,
puede utilizar comillas dobles. Por ejemplo, si desea visualizar los documentos que contienen
exactamente el término rey lear, pero no frases relacionadas, tales como real lear o rey y reina lear,
especifique "rey lear". La búsqueda no distingue entre mayúsculas y minúsculas, pero las variantes
terminológicas no se consideran coincidencias.
Carácter comodín en una búsqueda
El carácter comodín (*) ayuda a encontrar documentos cuando no se conoce la palabra completa o si se
desea buscar variantes del término. Por ejemplo, la consulta chec* devuelve los documentos que
contienen los términos checo, checoslovaquia, checoslovaco, república checa y otros resultados posibles.
También puede utilizar el carácter comodín en una búsqueda de frase. Por ejemplo, la consulta "John *
Kennedy" devuelve los documentos que contienen los términos John Fitzgerald Kennedy y John F
Kennedy, pero no John Kennedy. La consulta Mi*l Gorbachev devuelve Mikhail Gorbachev.
La adición de un carácter comodín al principio de una consulta (por ejemplo, *hec) puede provocar que
el motor de búsqueda tarde más tiempo en devolver resultados.
Búsquedas de uno de los términos como mínimo
El operador lógico OR especifica que debe visualizarse como mínimo uno de los términos de una
consulta en el documento devuelto. Por ejemplo, la consulta (othello OR otelo) devuelve los
documentos que contienen el término othello u otelo.
También puede utilizar los operadores lógicos AND, OR y NOT en combinaciones utilizando paréntesis.
Por ejemplo, la consulta cougar OR (jaguar AND NOT coche) devuelve los documentos que contienen los
términos cougar o jaguar, pero no coche.
46
IBM i: OmniFind Text Search Server for DB2 for i
Debe especificar los operadores lógicos AND, OR y NOT en mayúsculas. Utilice los paréntesis para
especificar agrupaciones.
Conceptos relacionados:
“Búsqueda XML” en la página 53
Puede indexar y realizar búsquedas en documentos XML. La gramática de búsqueda XML utiliza un
subconjunto del lenguaje W3 XPath con ampliaciones para búsqueda de texto. Las ampliaciones dan
soporte a búsquedas de rango de valores numéricos, de fecha (Date) y fecha y hora (DateTime) asociados
con un atributo o elemento XML. Los elementos estructurales pueden utilizarse por separado o
combinarse con texto sin formato en las consultas.
Referencia relacionada:
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
Ejemplos de consulta simple
Las consultas simples de las funciones CONTAINS y SCORE buscan una o varias palabras en un índice
de búsqueda de texto.
El motor de búsqueda ignora los espacios en blanco entre caracteres. La serie de búsqueda no debe estar
vacía ni contener sólo espacios en blanco (SQLSTATE 38H14).
La tabla siguiente muestra algunos ejemplos de consultas de búsqueda simples.
Tabla 3. Ejemplos de consulta simple
Tipos de palabras de
búsqueda
Ejemplos
Resultados de consulta
Palabra única
rey
Devuelve todos los documentos que
contienen la palabra rey o reyes. Esta
consulta compara diferentes formularios
de superficie y no es sensible a las
mayúsculas y minúsculas.
Varias palabras
rey lear
Devuelve todos los documentos que
contienen la palabra rey y lear. El
operador predeterminado es el operador
lógico AND.
Los operadores AND y + están implícitos en todas las consultas. Por ejemplo, la consulta Rey Lear
devuelve los mismos resultados que Rey AND Lear o Rey + Lear.
Debe especificar los operadores lógicos NOT, AND y OR en mayúsculas.
Referencia relacionada:
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
OmniFind Text Search Server
47
que mide hasta que punto un documento coincide con la consulta.
Operadores de búsqueda avanzada
Puede utilizar operadores de búsqueda avanzada para refinar los resultados de búsqueda de las
funciones CONTAINS y SCORE.
En la tabla siguiente, la primera columna describe el operador que puede utilizarse en una consulta de
búsqueda. Debe especificar los operadores lógicos NOT, AND u OR en mayúsculas. La segunda columna
muestra una consulta de ejemplo que puede especificarse. La tercera columna describe los tipos de
resultados que puede observar en la consulta de ejemplo.
Tabla 4. Operadores de búsqueda avanzada y ejemplos de consultas complejas
Operadores
Ejemplos
Resultados de consulta
AND
"Rey Lear" AND "Otelo"
Cualquier consulta devolverá los
documentos que contengan ambos
términos, Rey Lear y Otelo. AND es el
operador de conjunción predeterminado.
Si no hay ningún operador lógico entre
los dos términos, se utiliza el operador
AND. Por ejemplo, la consulta Rey Lear
es igual a la consulta Rey AND Lear.
"Rey Lear" "Otelo"
OR
"Rey Lear" OR Lear
Devuelve los documentos que contienen
Rey Lear o sólo Lear. El operador OR
enlaza los dos términos y busca un
documento coincidente si alguno de los
dos términos existe en un documento.
NOT
"Rey Lear"
NOT "Norman Lear"
Devuelve los documentos que contienen
Rey Lear, pero no Norman Lear.
""
Primera consulta:
La primera consulta devuelve la frase
exacta Rey Lear.
"Rey Lear"
(Coincidencia exacta)
Segunda consulta:
"rey"
*
test*
te*t
Devuelve los documentos que pueden
coincidir con las posibles combinaciones,
como por ejemplo test, tests y tester,
o test y text.
Primera consulta:
La primera consulta fuerza a los
documentos que contienen la frase Rey
Lear a visualizarse más arriba en la lista
de resultados de búsqueda.
(Carácter comodín)
^
La segunda consulta devuelve sólo la
palabra rey sin otras variantes, tales
como reyes o reyezuelo.
"Rey Lear"^4 "Ricardo III"
(Factor de coincidencia de puntuación)
Segunda consulta:
número^de
alguna palabra o frase
title:
(descarga de software)^5
pdf viewer -shipping
La segunda consulta fuerza a un
documento titulado descarga de
software a visualizarse más arriba en la
lista de resultados.
Aunque un factor de coincidencia (boost
factor) debe ser positivo, puede ser
inferior a 1. Por ejemplo, puede ser de
0,2. El número del factor de coincidencia
no tiene límite.
+
+Lear Rey
(Includes)
48
IBM i: OmniFind Text Search Server for DB2 for i
Devuelve todos los documentos que
contienen Lear y Rey, que es lo mismo
que la consulta Lear AND Rey.
Tabla 4. Operadores de búsqueda avanzada y ejemplos de consultas complejas (continuación)
Operadores
Ejemplos
Resultados de consulta
-
"Rey Lear" -"Lear Jet"
Devuelve los documentos que contienen
Rey Lear, pero no Lear Jet.
()
(Rey OR Lear) AND obras
Devuelve los documentos que contienen
Rey o Lear y obras. Los paréntesis
garantizan que se encuentre obras y el
término Rey o Lear esté presente.
\
\(1\+1\)\:2
Devuelve los documentos que contienen
(1+1):2. Use \ como carácter de escape
para poder utilizar caracteres especiales
que normalmente forman parte de la
sintaxis de consulta. Si un carácter
especial va precedido del carácter de
escape, el carácter especial se analiza
como parte de la consulta. Los caracteres
especiales son: +, -, &&, ||, !, (, ), {, }, [,
], ^, ", ~, *, ?, : y \. Si se borra un
carácter especial, éste se analiza como
parte de la consulta.
log %file
Devuelve los documentos que incluyen
el término log y opcionalmente incluyen
el término file.
analytics~
analytics~0.8
La primera consulta devuelve los
documentos que incluyen los términos
analytics, analyze, analysis, etc.
(Excludes)
(Carácter de escape)
%
Términos opcionales
~
Búsqueda difusa
Una consulta de búsqueda difusa busca
secuencias de caracteres que no sólo son
iguales sino similares al término de
consulta. Utilice el símbolo de tilde (~)
al final de un término para realizar una
búsqueda difusa.
Puede añadir un parámetro opcional
para especificar la similitud necesaria.
Especifique un valor superior a 0 e
inferior a 1. El valor debe ir precedido
de un 0 y coma decimal, por ejemplo,
0,8. Un valor más cercano a 1 hace
coincidir los términos con una similitud
mayor. Si no se especifica el parámetro,
el valor predeterminado es 0,5.
Restricción: los caracteres especiales no
están soportados en las consultas de
búsqueda de proximidad.
OmniFind Text Search Server
49
Tabla 4. Operadores de búsqueda avanzada y ejemplos de consultas complejas (continuación)
Operadores
Ejemplos
Resultados de consulta
~
"IBM WebSphere"~7
Devuelve los documentos que contienen
"IBM" y "WebSphere" con siete palabras
entre sí.
Búsquedas de proximidad
Una búsqueda de proximidad busca los
documentos que contienen términos
dentro de un número especificado de
palabras entre sí. Utilice el símbolo de
tilde (~) para realizar una búsqueda de
proximidad.
La búsqueda de proximidad está
soportada para términos individuales,
no para frases. Además, tenga en cuenta
que una palabra después de una
interrupción de frase no se considera
adyacente a las palabras de la frase
anterior.
Restricción: los caracteres especiales no
están soportados en las consultas de
búsqueda de proximidad.
Referencia relacionada:
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
Búsqueda de caracteres especiales
OmniFind admite la indexación y búsqueda de caracteres especiales.
Puede buscar caracteres especiales como otros términos de consulta. Para encontrar un carácter especial
en un documento, incluya dicho carácter en la expresión de consulta. En algunos casos, es necesario salir
de caracteres especiales con un carácter de escape.
Escape de caracteres especiales
Los caracteres especiales pueden desempeñar distintas funciones en la sintaxis de la consulta. Por
ejemplo, los signos de interrogación (?) pueden utilizarse como caracteres comodín. Para buscar un
carácter especial que tiene una función especial en la sintaxis de la consulta, debe salir del carácter
especial añadiendo una barra inclinada invertida antes del mismo, por ejemplo:
v Para buscar la serie “where?”, especifique un escape para el signo de interrogación de la manera
siguiente: “where\?”
v Para buscar la serie “c:\temp,” especifique un escape para los dos puntos y la barra invertida de este
modo:“c\:\\temp”
Si no especifica un escape para estos caracteres especiales, es posible que se produzcan errores de
sintaxis.
50
IBM i: OmniFind Text Search Server for DB2 for i
Tabla 5. Caracteres especiales que deben especificarse con escape para poder realizar una búsqueda
Carácter especial
Notas sobre el comportamiento si no se especifica
escape
Ampersand (&)
Asterisco (*)
Se utiliza como carácter comodín.
Signo de arroba (@)
Se genera un error de sintaxis cuando el carácter de
arroba es el primer carácter de una consulta. En
expresiones xmlxp, el signo de arroba se utiliza para
hacer referencia a un atributo.
Corchetes [ ]
Se utiliza en expresiones xmlxp para buscar en el
contenido de elementos y atributos.
Llaves { }
Genera un error de sintaxis.
Barra inclinada invertida (\)
Signo de intercalación (^)
Se utiliza para ponderar (aumentar) términos.
Dos puntos (:)
Se utilizan para realizar búsquedas en el contenido de
los campos.
Signo de igualdad (=)
Genera un error de sintaxis.
Signo de exclamación (!)
Se devuelve un error de sintaxis cuando el signo de
instalación es el primer carácter de una consulta.
Barra inclinada (/)
En expresiones xmlxp, una barra inclinada se utiliza
como separador de elementos de vía de acceso.
Símbolo Mayor que (>); Símbolo Menor que (<)
Se utiliza en expresiones xmlxp para comparar el valor
de un atributo. De lo contrario, estos caracteres generan
errores de sintaxis.
Signo menos (-)
Cuando un signo menos es el primer carácter de un
término, sólo se devuelven los documentos que no
contienen el término.
Paréntesis ( )
Se utilizan para agrupación.
Signo de porcentaje (%)
Especifica que un término de búsqueda es opcional.
Signo más (+)
Signo de interrogación (?)
Se maneja como carácter comodín.
Punto y coma (;)
Comillas simples (‘)
Las comillas simples se utilizan para contener
expresiones xmlxp.
Tilde (~)
Se maneja como operadores de búsqueda difusa y
proximidad
Barra vertical (|)
El escape de caracteres especiales que no desempeñan ninguna función especial en la sintaxis de la
consulta es opcional. En la siguiente tabla se muestran algunos ejemplos de caracteres especiales que no
requieren escape.
Tabla 6. Ejemplos de caracteres especiales que no requieren escape.
Carácter especial
Notas sobre el comportamiento si no se especifica
escape
Coma (,)
Signo de dólar ($)
OmniFind Text Search Server
51
Tabla 6. Ejemplos de caracteres especiales que no requieren escape. (continuación)
Carácter especial
Punto (.)
Notas sobre el comportamiento si no se especifica
escape
En expresiones xmlxp, un punto se utiliza para buscar
el contenido de los elementos.
Signo de almohadilla (#)
Subrayado (_)
Caracteres especiales adyacentes a términos de consulta
Cuando existe un carácter especial adyacente a un término de la consulta, se devuelven los documentos
que contienen el carácter especial y la palabra en el mismo orden. Por ejemplo, si busca “30$”, se
encuentran documentos que contienen “30$”, pero no documentos que contengan “$30”. No obstante, si
busca “30 $” (con un espacio), se encuentran todos los documentos que contienen “30” y “$” en cualquier
lugar del documento, incluidos “30$” y “$30”.
Cuando un carácter especial está adyacente a una palabra vacía de la consulta, la palabra vacía no se
elimina de la consulta. Por ejemplo, si busca “at&t”, la palabra vacía “at” no se elimina. En cambio, si
busca “at & t” con espacio, se elimina la palabra “at”.
Cuando un carácter especial separa dos palabras, la secuencia de símbolos se busca como secuencia. Por
ejemplo, si busca “jack_jones”, se encuentran documentos que contienen “jack_jones”, pero no
documentos que contienen “jack_and_jones”.
Las palabras adyacentes a caracteres especiales se lematizan. Por ejemplo, si busca “cats&dogs” en inglés,
se encuentran documentos que contienen “cat&dog”.
Puede utilizar caracteres en expresiones de búsqueda con caracteres comodín. Por ejemplo, si busca
“ja*_”, se encuentran documentos que contienen “jack_jones”. No obstante, no pueden utilizarse
caracteres comodín para encontrar caracteres especiales. Por ejemplo, la búsqueda “ca*s” encontrará los
documentos que contienen “cats”, “categories” o “cas”, pero no los documentos que contienen “ca_s”.
Indexación de caracteres especiales
Durante la simbolización y el proceso idiomático, el servidor OmniFind identifica e indexa los caracteres
especiales como signos de puntuación. Los caracteres especiales son delimitadores de símbolos.
Por ejemplo, “jack_jones” tiene como unidades léxicas tres símbolos distintos: “jack”, “_” y “jones”. Los
correos electrónicos, URL y vías de acceso de archivo se desglosan en unidades léxicas, por ejemplo:
v Jack_jones@ibm.com tiene las unidades léxicas jack _ jones @ ibm . com
v http://www.ibm.com tiene las unidades léxicas http :// www . ibm . com
Los caracteres especiales no ocupan una posición de símbolo en el archivo. Por ejemplo, "jack_jones" se
indexa con el carácter de subrayado en la misma posición de símbolo que "jack". Los caracteres especiales
tampoco ocupan ninguna posición de símbolo si se incluyen espacios. Por ejemplo, “jack_jones” se indexa
del mismo modo que “jack _ jones”.
La posición del símbolo se utiliza para la búsqueda de frases exactas y para la búsqueda de proximidad.
Por ejemplo, si un documento contiene la expresión jack_jones, al buscar la frase exacta ““jack jones”” se
encuentra este documento.
52
IBM i: OmniFind Text Search Server for DB2 for i
Cuando una secuencia de caracteres especiales se indexa por separado, dichos caracteres no se buscan en
ningún orden especial. Por ejemplo, al buscar “#$” también se encuentran los documentos que contienen
“$#”.
Caracteres especiales en idiomas CJK
Para buscar una secuencia de caracteres que incluya caracteres especiales, la expresión de consulta debe
incluir los caracteres especiales. Si omite los caracteres especiales de la expresión de consulta, es posible
que la secuencia de caracteres no se encuentre. En idiomas no CJK, la secuencia de caracteres se
encuentra siempre, aunque la expresión de consulta omita los caracteres especiales. Por ejemplo, si un
documento indexado contiene john_smith, puede buscar john_smith o "john smith" (coincidencia exacta,
sin el carácter de subrayado) y ambas consultas devuelven el documento que contiene john_smith.
Restricción: no puede buscar los siguientes caracteres especiales en documentos CJK: ? * \
Ejemplo de utilización de las funciones CONTAINS y SCORE
Puede utilizar las funciones CONTAINS y SCORE en la misma consulta. La consulta busca en un índice
de búsqueda de texto y devuelve si y con qué frecuencia el documento de texto coincide con los criterios
del argumento de búsqueda.
El ejemplo de la tabla siguiente utiliza datos de la tabla base BOOKS con las columnas ISBN
(VARCHAR(20)), ABSTRACT (VARCHAR(10000)) y PRICE (INTEGER).
Tabla 7. La tabla base BOOKS
ISBN
ABSTRACT
PRICE
i1
"a b c"
7
i2
"a b d"
10
i3
"a e a"
8
Ejecute la consulta siguiente:
SELECT ISBN, SCORE(ABSTRACT,’"b"’)
FROM BOOKS
WHERE CONTAINS (ABSTRACT,’"b"’) = 1
Esta consulta devuelve las dos filas siguientes:
i1, 0.3
i3, 0.4
Los valores de puntuación pueden diferir en función del contenido de la columna de texto.
Referencia relacionada:
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
Búsqueda XML
Puede indexar y realizar búsquedas en documentos XML. La gramática de búsqueda XML utiliza un
subconjunto del lenguaje W3 XPath con ampliaciones para búsqueda de texto. Las ampliaciones dan
OmniFind Text Search Server
53
soporte a búsquedas de rango de valores numéricos, de fecha (Date) y fecha y hora (DateTime) asociados
con un atributo o elemento XML. Los elementos estructurales pueden utilizarse por separado o
combinarse con texto sin formato en las consultas.
Los documentos deben indexarse para que incluyan el código XML para poder realizar búsquedas en el
índice mediante la sintaxis de consulta xmlxp. La indexación de documentos se realiza mediante la
opción “FORMAT XML” durante la creación del índice.
Los índices creados en un release anterior pueden utilizarse para realizar búsquedas. Sin embargo, los
documentos indexados en un release anterior no contienen la información necesaria para utilizar todas las
prestaciones de búsqueda XML disponibles en un release más reciente. Los documentos añadidos o
actualizados en el índice de búsqueda de texto después de la actualización al nuevo release incluyen la
información adicional.
Es posible que, como resultado de una actualización, los documentos indexados en el release anterior no
se incluyan en algunos resultados de búsqueda. Puede utilizarse el procedimiento almacenado
SYSPROC.SYSTS_REPRIMEINDEX para reconstruir el índice y resolver este problema.
Para utilizar las funciones incorporadas CONTAINS y SCORE de OMNIFIND para buscar datos XML, la
serie de búsqueda debe empezar por el prefijo de búsqueda @xmlxp:. El prefijo va seguido de una
expresión de consulta de búsqueda XML válida. El prefijo de término 'opaco' @xmlxp indica que una
búsqueda se realiza utilizando la expresión de vía de acceso de consulta.
Por ejemplo: CONTAINS(columnname, '@xmlxp:’’expresión_consulta’’ ').
Las comillas simples ' ’ que entrecomillan la expresión_consulta deben ser dobles, ya que se encuentran
dentro de una serie SQL, siendo en realidad una serie dentro de otra serie.
El prefijo de término opaco @xpath: utilizado en releases anteriores de OmniFind Text Search Server for
DB2 for i está soportado a efectos de compatibilidad con versiones anteriores. Sin embargo, ha quedado
en desuso y no es aconsejable utilizarlo.
A continuación figura una lista donde se resaltan las características clave de la búsqueda XML:
Búsqueda estructural XML
Mediante la inclusión de términos XML opacos especiales en las consultas, puede buscar en documentos
XML elementos estructurales y texto cuyo ámbito sea el de dichos elementos. Los elementos estructurales
son nombres de códigos, nombres de atributos y valores de atributos. Los nombres de elementos y
códigos son sensibles a las mayúsculas y minúsculas.
Señalización de consultas XML
La señalización es el proceso de analizar la entrada para generar señales. El texto sin formato de los
términos de consulta XML se señaliza del mismo modo que el texto de los términos de consulta no XML.
Una excepción son los términos opacos anidados, que no están soportados. La búsqueda de texto sin
formato no es sensible a las mayúsculas y minúsculas.
Esquema XML y DTD
Los esquemas XML asociados con el documento XML no se descargan, y los valores predeterminados no
se indexan.
Valores numéricos
Los predicados que comparan valores de atributos o elementos con números están soportados.
54
IBM i: OmniFind Text Search Server for DB2 for i
Valores de elementos
Los predicados que comparan valores de elementos con números o fechas están soportados. El elemento
que contiene la fecha o el número debe ser un elemento XML que contenga sólo el número o la fecha.
Los espacios en blanco iniciales y finales se ignoran.
Valores de tipo serie
La utilización del operador = para un argumento de tipo serie en un predicado requiere la coincidencia
completa de todas las palabras clave de la serie con las señales del ámbito de texto identificado. El orden
de las señales no es significativo al realizar la comparación.
Valores DateTime
Los predicados que comparan atributos o elementos de tipo Date o DateTime están soportados.
Expresiones de vía de acceso:
Tabla 8. Expresiones de vía de acceso:
Expresión @xmlxp
Descripción
TagName
Selecciona un código denominado TagName y todos los
hijos de dicho código.
@AttributeName
Selecciona un atributo denominado @AttributeName.
/
Realiza una selección del nodo raíz.
//
Selecciona los códigos y atributos coincidentes que
descienden de la posición actual y coinciden con la
expresión.
.
Self: el nodo de elemento o código actual.
Tabla 9. Ejemplos de expresiones de vía de acceso:
Expresión @xmlxp
Resultado
/Document
Devuelve todos los documentos con un código de nivel
superior Document.
//Document
Devuelve todos los documentos con un código Document
en cualquier nivel.
/Document/Child1
Devuelve todos los documentos con un código de nivel
superior Document que tienen un código hijo directo
Child1.
/Document//Child1
Devuelve todos los documentos con un código de nivel
superior Document que tienen un código descendiente
Child1 en cualquier nivel.
/Root/@attr1
Devuelve todos los documentos con un código de nivel
superior Root con un atributo attr1.
/Root//@attr1
Devuelve todos los documentos con un código de nivel
superior Root con un atributo attr1 en dicho código raíz
o en cualquier código descendiente.
//@attr1
Devuelve todos los documentos que tienen un atributo
@attr1 en cualquier nivel.
Nota: La expresión de búsqueda XML debe tener un código o nombre de atributo real en la expresión de
vía de acceso relativa. / y // no son por sí mismos consultas de búsqueda válidas.
OmniFind Text Search Server
55
Las expresiones de vía de acceso sólo se permiten hacia adelante, y sólo en un único eje.
Es aconsejable que una expresión de vía de acceso empiece por un carácter / o //. Esto indica que el
contexto inicial de la expresión es el nodo raíz del documento. Si se omite el carácter inicial / o //, la
expresión se compara en cualquier nivel. Por ejemplo, 'Sentences' se trata como ’//Sentences’. El
comportamiento está definido de esta manera para que sea compatible con releases anteriores y no sigue
el estándar de W3 o SQL/XML.
Soporte de comodín de expresiones de vía de acceso
En la expresión de vía de acceso, puede utilizarse el carácter comodín especial * para indicar exactamente
un código con cualquier nombre.
Los comodines finales de expresión de vía de acceso se ignoran.
Las siguientes utilizaciones de comodines de expresión de vía de acceso no están soportadas y
provocarán un error:
v Una expresión que haga referencia sólo a comodines y no a elementos o atributos específicos.
v Un atributo de comodín en cualquier nivel: /Tag/@*.
v Un comodín que preceda inmediatamente a una expresión de predicado: /Root/*[//anytag].
v
v
v
v
Un
Un
Un
Un
comodín utilizado en una comparación de predicados: /Root[* > 5].
comodín como prefijo de espacio de nombres XML: //*:tagname.
comodín con un espacio de nombres XML como prefijo: //ns:*.
carácter comodín utilizado como parte de un nombre de código: /start*.
Tabla 10. Ejemplos de comodines de expresión de vía de acceso:
Expresión @xmlxp
Resultado
/Root/*/T1
Todos los documentos que tengan un código de nivel
superior Root que tenga un código descendiente T1 con
un nivel intermedio.
/Root/*//T1
Todos los documentos que tengan un código de nivel
superior Root que tenga un código descendiente T1 con
uno o más niveles intermedios.
Predicados
Los predicados se utilizan para especificar un valor o condición que un nodo de elemento o atributo debe
cumplir. Los predicados se especifican siempre entre corchetes cuadrados: [].
Tabla 11. Ejemplos de predicados:
Expresión @xmlxp
Resultado
/Book[Sentences]
El código de nivel superior es Book y debe tener un hijo
directo Sentences.
/Book[.//Sentences and .//Author]
El código de nivel superior es Book y debe tener los
descendientes Sentences y Author. Cada descendiente
puede estar a cualquier nivel por debajo de Book.
Dado que las expresiones de vía de acceso siempre se especifican hacia adelante y están limitadas a un
único acceso, las expresiones de vía de acceso en predicados deben ser relativas al nodo actual.
/Book[/Root] y /Book[//Root] no son válidas, ya que en ambos casos la expresión de vía de acceso del
predicado empieza por el código de nivel superior ‘Root' en lugar del nodo actual.
56
IBM i: OmniFind Text Search Server for DB2 for i
Comparaciones numéricas
OMNIFIND admite los operadores =, <=, >=, >, < y != para comparaciones de elementos y atributos con
valores enteros y de coma flotante.
Si se trata de elementos simples, sólo se indexan sus valores numéricos. No pueden contener caracteres
adicionales (aparte del espacio en blanco) ni tener elementos descendientes. Los elementos complejos se
indexan sólo como texto.
Tabla 12. Ejemplos de comparación numérica:
Expresión @xmlxp
Resultado
/Book[@id_num = 12345]
El código de nivel superior es Book y debe tener un
atributo id_num con el valor 12345.
/Book[Cost <= 100,50]
El código de nivel superior es Book. Book tiene el
elemento hijo directo Cost cuyo valor numérico es
inferior o igual a 100,50.
Comparaciones de Date y DateTime
OMNIFIND admite los operadores =, <=, >=, >, < y != para comparaciones de elementos y atributos con
valores de tipo Date y DateTime.
En los elementos simples, sólo se indexan sus valores DateTime. Estos elementos no pueden contener
caracteres adicionales (aparte del espacio en blanco) ni tener elementos descendientes. Los elementos
complejos se indexan sólo como texto.
Durante la indexación, se examinan los valores de atributo y el texto contenidos dentro de códigos XML
simples. Si se determina que el texto coincide con un formato ISO de fecha (Date) o de fecha y hora
(DateTime), se indexa como un valor Date o DateTime que puede buscarse en un predicado.
Durante una búsqueda, el valor Date o DateTime debe incluirse en una llamada a una función xs:date()
o xs:dateTime() para que se reconozca como el tipo de datos correcto.
Un tipo de datos XML DateTime de un documento XML puede especificar un valor de huso horario. Sin
embargo, al indexar un valor DateTime, el servidor de búsqueda de texto trunca los valores de huso
horario. Por tanto, los husos horarios no se tienen en cuenta durante las búsquedas XML que implican a
tipos de datos Date o DateTime.
Además, un valor DateTime con la hora 24 sólo se permite si los minutos y los segundos son cero. Se
tratará como un valor entre el último instante del día y el primer instante del día siguiente.
Cuando se especifica un valor Date o DateTime en un predicado de búsqueda XML, se produce un error
de sintaxis si se especifica un huso horario en el valor.
El tipo de datos DateTime admite un máximo de 12 dígitos de segundos fraccionarios.
Tabla 13. Ejemplos de comparación con Date y DateTime:
Expresión @xmlxp
Resultado
/Book[@publishDate > xs:date(“2000-01-01”)]
El código de nivel superior es Book. Book tiene un
atributo publishDate que es mayor que la fecha
2000-01-01.
/Book[purchaseTime > xs:dateTime(“2009-0520T13:00:00”)]
El código de nivel superior es Book. Book tiene un hijo
directo purchaseTime que es una expresión DateTime
mayor que 2009-05-20T13:00:00.000000.
OmniFind Text Search Server
57
Funciones contains y excludes en el código XML
Las funciones contains y excludes se utilizan para realizar búsquedas de texto completas en el código XML.
La función contains devuelve true si la consulta se encuentra dentro del nodo destino; excludes devuelve
true si la consulta No se encuentra dentro del nodo destino.
Por ejemplo, podemos buscar todos los documentos con un código de nivel superior denominado email y
un descendiente directo denominado body que contenga variantes de la frase “Presupuesto de
departamento”.
@xnkxo:’’/email[body contains (“presupuesto de departamento”)]’’
El texto sin formato pasado a la función contains o excludes se maneja del mismo modo que cualquier otra
búsqueda de texto sin formato. La búsqueda no distingue entre mayúsculas y minúsculas y se tienen en
cuenta las variantes lingüísticas. La consulta anterior encontrará “presupuestos de departamentos” y
también “presupuesto para el departamento”.
La búsqueda puede restringirse a una coincidencia exacta mediante las comillas tradicionales, por
ejemplo, @xmlxp:’’/email[body contains(“””presupuesto de departamento”””)] ’’. Las comillas que
indican una coincidencia exacta deben ser dobles para que no se interpreten como el final de la serie de
texto sin formato de contains.
Tabla 14. Ejemplos de funciones contains y excludes:
Expresión @xmlxp
Resultado
/Book[abstract contains(“gato AND perro”)]
Código de nivel superior Book que tiene un código hijo
abstract que contiene variantes lingüísticas de los
términos gato y perro.
/Book[abstract contains(“gato AND perro”)]
/Book/@title[. contains(“gato OR perro”)]
Código de nivel superior Book que tiene un atributo
title que contiene variantes lingüísticas de gato o perro.
/Book/Title[. contains(“””Todos los buenos perros
van al cielo”””)]
Código de nivel superior Book con un hijo directo Title
que contiene todos los buenos perros van al cielo por
orden, y sin tener en cuenta las variantes lingüísticas.
/Book[abstract excludes(“gato AND perro”)]
Código de nivel superior Book que tiene un código hijo
abstract que no contiene variantes lingüísticas de los
términos gato y perro.
Operador de comparación de series completas
El operador = con un argumento de tipo serie en un predicado requiere la coincidencia completa de todas
las señales de la serie con todas las señales del ámbito de texto identificado. Los equivalentes lingüísticos
no se tienen en cuenta. El orden de los términos buscados no es significativo. No es obligatorio que el
elemento o atributo contengan sólo el texto buscado.
Tabla 15. Ejemplos de operador de comparación de series completas:
Expresión @xmlxp
/Book[@author =
/Book[author =
58
Resultado
“Nicholas Lawrence”]
“””Nicholas Lawrence”””]
IBM i: OmniFind Text Search Server for DB2 for i
Código de nivel superior Book que tiene un atributo
author. El atributo author debe contener los términos
Nicholas Lawrence. Las variantes lingüísticas de esos
términos no se consideran coincidencias.
Código de nivel superior Book que tiene un descendiente
directo author. El atributo author debe contener los
términos Nicholas Lawrence por orden. Las variantes
lingüísticas de esos términos no se consideran
coincidencias.
Operadores lógicos
Pueden utilizarse los operadores lógicos and y or en los predicados.
Tabla 16. Ejemplos de operadores lógicos:
Expresión @xmlxp
Resultado
/Book[@author = “””Nicholas Lawrence”””]/Price[. <
1000 and @unit = “dollars”]
Código de nivel superior Book que tiene un atributo
author. El atributo author debe contener los términos
Nicholas Lawrence por orden. Las variantes lingüísticas
de esos términos no se consideran coincidencias.
Book debe tener un hijo directo Price con el valor <1000.
El nodo Price debe tener un atributo @unit que tenga el
valor dollars.
Precedencia de operadores
En los predicados de búsqueda XML, los operadores de contención y comparación tienen preferencia
sobre los operadores lógicos, y todos los operadores lógicos tienen la misma preferencia.
v Los operadores de contención son contains y excludes.
v Los operadores de comparación son =, !=, <, >, <= y >=.
v Los operadores lógicos son and y or.
Puede utilizar paréntesis para garantizar la precedencia deseada.
Referencia relacionada:
“Sintaxis de argumentos de búsqueda” en la página 45
Puede especificar un argumento de búsqueda como condición de una búsqueda de términos en
documentos de texto. Consta de parámetros de búsqueda y uno o más términos de búsqueda. Las
funciones escalares de búsqueda de texto SQL que utilizan argumentos de búsqueda son CONTAINS y
SCORE.
“SYSPROC.SYSTS_REPRIMEINDEX” en la página 80
Puede ajustar (reprime) el índice e iniciar una actualización inicial mediante el procedimiento almacenado
SYSPROC.SYSTS_REPRIMEINDEX. Utilice este procedimiento almacenado cuando desee restaurar datos
desde la tabla base.
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
Soporte de espacio de nombres en búsquedas XML
Puede utilizar un espacio de nombres para establecer el ámbito de los elementos y atributos de un
documento. Los espacios de nombres resultan de utilidad para restringir la búsqueda de consultas a los
elementos significativos del documento.
Visión general
En XML, el desarrollador elige los nombres de elementos y atributos. Estos nombres pueden crear
conflictos cuando se mezclan documentos XML procedentes de aplicaciones diferentes.
OmniFind Text Search Server
59
Por tanto, resulta de utilidad restringir la búsqueda de consultas a los elementos significativos del
documento, especialmente cuando pueden indexarse varios tipos de documentos diferentes. La restricción
de la búsqueda puede realizarse mediante espacios de nombres.
Los espacios de nombres proporcionan el ámbito de los elemento y atributoss del documento para
garantizar la interpretación correcta de los valores. Los espacios de nombres se describen con un nombre
largo (URI) y, opcionalmente, un nombre abreviado denominado Qname (nombre calificado).
<?xml version=’1.0’?>
<doc xmlns:x="http://example.com/ns/abc">
<x:p/>
</doc>
http://example.com/ns/abc es el nombre largo del espacio de nombres y x es el prefijo de Qname. Un
prefijo de Qname resulta de utilidad como abreviatura del espacio de nombres de cada referencia de
elemento.
El elemento p está calificado por el espacio de nombres http://example.com/ns/abc.
El espacio de nombres predeterminado
Puede especificarse un espacio de nombres predeterminado para los elementos XML. El espacio de
nombres predeterminado se aplica al código actual y a los códigos descendientes. Cualquier código sin
calificar del espacio de trabajo hereda el espacio de nombres predeterminado.
<?xml version=’1.0’?>
<doc xmlns="http://example.com/ns/abc">
<p/>
</doc>
En este caso, tanto el elemento doc como el elemento p se encuentran en el espacio de nombres
http://example.com/ns/abc.
Espacios de nombres de atributos
Un atributo puede tener un espacio de nombres diferente del de su elemento asociado.
Elemento y atributo calificados:
<dog xmlns:an="http://example.org/animals" xmlns:sz=”http://example.org/sizes”>
<an:breed sz:size=”Medium”>Mutt</an:breed>
</dog>
Los elementos y atributos heredan el espacio de nombres de forma diferente, cuando éste no se especifica
explícitamente. Los elementos sin calificar recogen el espacio de nombres predeterminado del ámbito en
el que se encuentran. Los atributos sin calificar no tienen espacio de nombres.
Elemento y atributo sin calificar:
<dog xmlns:an="http://example.org/animals">
<breed size=”Medium”>Mutt</an:breed>
</dog>
En este ejemplo, el elemento breed tiene el espacio de nombres http://example.org/animals. Sin
embargo, el atributo size no tiene ningún espacio de nombres asociado.
Para obtener más información acerca de los espacios de nombres de XML, consulte la recomendación
W3C para espacios de nombres en XML, que se encuentra en el sitio de World Wide Web
Consortium(W3C) (http://www.w3.org)
60
IBM i: OmniFind Text Search Server for DB2 for i
.
Prefijos de Qname reservados
Los siguientes prefijos de Qname están reservados y no deben utilizarse para calificar elementos o
atributos definidos por usuario: xml, xs, xsi, fn, local.
Utilizar espacios de nombres en una búsqueda
Los prefijos QName y los espacios de nombres de elemento predeterminados deben definirse en el
prólogo de consulta @xmlxp del término de búsqueda.
Ejemplo de prólogo que correlaciona el espacio de nombres ns1 con el URI "http://miempresa.com"
declare namespace ns1 = "http://miempresa.com";
Ejemplo de prólogo que especifica que todos los elementos sin calificar están calificados por el URI
"http://miempresa.com":
declare default element namespace "http://miempresa.com"
Si una consulta no declara ningún prefijo QName de espacio de nombres o espacio de nombres de
elementos predeterminado, los espacios de nombres no se tienen en cuenta en la consulta. Un elemento o
atributo se considera coincidente si existe en algún espacio de nombres.
Si se declara algún prefijo QName o espacio de nombres predeterminado, los nombres de elemento o
atributo sólo se consideran coincidentes si existen en el espacio de nombres especificado.
La sintaxis
declare default element namespace "”;
no podría utilizarse para indicar que los códigos sin calificar no se encuentran en ningún espacio de
nombres.
No es necesario que los prefijos QName utilizados en la serie de búsqueda XML coincidan con el prefijo
QName utilizado en el documento XML. Las coincidencias se basan únicamente en el URI de nombre
largo.
Ejemplos:
Restringir la búsqueda al atributo attr del elemento test, estando el elemento test correlacionado con el
espacio de nombres (namespace) "http://posample.org", y attr no se encuentra en ningún espacio de
nombre (namespace). Utilizar el namespace predeterminado para simplificar la sintaxis.
CONTAINS(myxmlcol, ’@xmlxp:’’declare default element namespace “http://myexample.org”;
/test[@attr > xs:date(“2005-01-01”)]’’’)
Restringir la búsqueda al atributo attr del elemento test, donde el elemento test tiene el namespace
"http://myexample.org". Utilizar sintaxis de namespace explícito mediante el prefijo QName abc.
CONTAINS(myxmlcol, ’@xmlxp:’’declare namespace abc =
/abc:test[@attr < xs:date(“2009-01-01”)]’’’)
“http://myexample.org”;
Restringir la búsqueda a los elementos hijos shipTo name y billTo name del elemento purchaseOrder, que
está correlacionado explícitamente con namespace "http://myexample.org" mediante el prefijo QName ns1.
También se define un espacio de nombres predeterminado ("http://mastsample.org"), que se aplica a
shipTo, name y billTo.
CONTAINS(myxmlcol, ’@xmlxp:’’ declare default namespace "http://mastsample.org";
declare namespace ns1 = "http://posample.org"; /ns1:purchaseOrder[shipTo/name = "Jane"
and billTo/name = "Jason"]’’’)
Restringir la búsqueda al atributo name (definido explícitamente en el espacio de nombres
"http://posample.org") del elemento shipTo (del espacio de nombres predeterminado
OmniFind Text Search Server
61
"http://mastsample.org"), que es un elemento hijo del elemento purchaseOrder (definido explícitamente
en el espacio de nombres "http://posample.org"). El espacio de nombres predeterminado
"http://mastsample.org" se aplica a los elementos shipTo, billTo y name.
CONTAINS(myxmlcol, ’@xmlxp:’’ declare default namespace "http://mastsample.org";
declare namespace ns1 = "http://posample.org"; /ns1:purchaseOrder/shipTo[@ns1:name =
"Jane" and billTo/name = "Jason"]’’’)
Ejemplo de búsqueda XML
v Cree una tabla XML_DOCUMENTS en el esquema XMLTEST para almacenar los documentos XML:
CREATE TABLE XMLTEST.XML_DOCUMENTS (ID INT, XML_DATA XML, PRIMARY KEY (ID));
v Cree un índice de búsqueda de texto denominado XML_INDEX sobre la columna XML:
call SYSPROC.SYSTS_CREATE(’XMLTEST’, ’XML_INDEX’, ’XMLTEST.XML_DOCUMENTS(XML_DATA)’, ’’);
v Inserte algunos documentos XML:
INSERT INTO XMLTEST.XML_DOCUMENTS (ID, XML_DATA)
VALUES(1,
’<BOOK publication_date="2009-01-01">’ ||
’ <TITLE> OmniFind Text Search Server for DB2 </TITLE>’ ||
’ <ID_NUMBER> 1 ></ID_NUMBER>’ ||
’ <CHAPTER>’ ||
’ <NUMBER> 1 </NUMBER>’ ||
’ <TITLE> Introducción </TITLE>’ ||
’ <ABSTRACT> Este capítulo presentará al lector las prestaciones de OmniFind
for DB2 for IBM i </ABSTRACT>’ ||
’ </CHAPTER>’||
’ <CHAPTER>’ ||
’ <NUMBER> 2 </NUMBER>’ ||
’ <TITLE> Crear un índice de búsqueda de texto </TITLE>’ ||
’ <ABSTRACT> Este capítulo describirá cómo crear un índice de búsqueda de texto </ABSTRACT>’ ||
’ </CHAPTER>’ ||
’</BOOK>’);
INSERT INTO XMLTEST.XML_DOCUMENTS (ID, XML_DATA)
VALUES(2,
’<BOOK publication_date="2010-02-01">’ ||
’ <TITLE> Utilizar el tipo de datos XML para DB2 for IBM i </TITLE>’ ||
’ <ID_NUMBER> 2 ></ID_NUMBER>’ ||
’ <CHAPTER>’ ||
’ <NUMBER> 1 </NUMBER>’ ||
’ <TITLE> Introducción </TITLE>’ ||
’ <ABSTRACT> Este capítulo presentará al lector el tipo de datos XML de DB2 </ABSTRACT>’ ||
’ </CHAPTER> ’ ||
’ <CHAPTER>’ ||
’
<NUMBER> 2 </NUMBER>’ ||
’
<TITLE> Insertar datos XML en una tabla de DB2 </TITLE>’ ||
’
<ABSTRACT> Este capítulo describirá cómo insertar datos XML en una tabla de DB2 </ABSTRACT>’ ||
’ </CHAPTER>’ ||
’ <CHAPTER>’ ||
’
<NUMBER> 3 </NUMBER>’ ||
’
<TITLE> Buscar datos XML </TITLE>’ ||
’
<ABSTRACT> Este capítulo describirá cómo consultar datos de columnas XML
mediante las UDFS CONTAINS y SCORE </ABSTRACT>’ ||
’ </CHAPTER>’ ||
’</BOOK>’);
INSERT INTO XMLTEST.XML_DOCUMENTS (ID, XML_DATA)
VALUES(3,
’<BOOK xmlns="http://www.ibm.com/digital_media_library"’ ||
’
publication_date="2010-02-01">’ ||
’ <TITLE> Utilizar espacios de nombres con OmniFind Text Search Server for DB2 for IBM i </TITLE>’ ||
’ <ID_NUMBER> 2 </ID_NUMBER>’ ||
’ <CHAPTER>’ ||
’ <NUMBER> 1 </NUMBER>’ ||
’ <TITLE> Introducción </TITLE>’ ||
’ <ABSTRACT> Este capítulo presentará al lector los espacios de nombres XML </ABSTRACT>’ ||
62
IBM i: OmniFind Text Search Server for DB2 for i
’ </CHAPTER>’ ||
’ <CHAPTER>’ ||
’ <NUMBER> 2 </NUMBER>’ ||
’ <TITLE> Utilizar espacios de nombres predeterminados </TITLE>’ ||
’ <ABSTRACT> Este capítulo describirá cómo utilizar un espacio de nombres en una búsqueda XML </ABSTRACT>’ ||
’ </CHAPTER>’ ||
’</BOOK>’);
v Actualice el índice:
CALL SYSPROC.SYSTS_UPDATE(’XMLTEST’, ’XML_INDEX’, ’’);
Consultas de ejemplo
Ejemplo 1:
Buscar todos los documentos que tienen un elemento raíz BOOK con un descendiente directo TITLE que
contiene DB2.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’/BOOK/TITLE[. contains("DB2")]’’ ’) = 1;
Dado que no se ha especificado un prólogo de espacio de nombres en el término de búsqueda, no se
tiene en cuenta ningún espacio de nombres para la búsqueda.
Tabla 17. Resultado
ID
1
2
3
Ejemplo 2:
Buscar todos los documentos que tienen un elemento raíz BOOK con un descendiente directo TITLE que
contiene DB2. Utilizar un espacio de nombres de elemento predeterminado para indicar que BOOK y TITLE
deben estar en el espacio de nombres "http://www.ibm.com/digital_media_library”.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’declare default element namespace
"http://www.ibm.com/digital_media_library";
/BOOK/TITLE[. contains("DB2")]’’ ’) = 1;
Tabla 18. Resultado
ID
3
Ejemplo 3:
Buscar todos los documentos que tienen un elemento raíz BOOK que tiene un atributo publication_date
posterior a "2010-01-01" y un elemento hijo TITLE que contiene DB2. Restringir la búsqueda para que los
códigos BOOK y TITLE no deban existir en ningún espacio de nombres.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’declare default element namespace "";
/BOOK[@publication_date > xs:date("2010-01-01")]/TITLE[. contains("DB2")]’’ ’) = 1;
OmniFind Text Search Server
63
Tabla 19. Resultado
ID
2
Ejemplo 4:
Buscar todos los documentos con un elemento raíz BOOK (que no esté en ningún espacio de nombres) que
tengan un descendiente directo CHAPTER (tampoco en un espacio de nombres) que contenga información
acerca de la inserción de datos en una tabla XML.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’declare default element namespace "";
/BOOK/CHAPTER[. contains("insertar datos XML en una tabla")]’’ ’) = 1;
Nota:
v El texto contenido en CHAPTER incluye el texto contenido en los elementos ABSTRACT y TITLE que son
descendientes de CHAPTER.
v La serie de búsqueda no distingue entre mayúsculas y minúsculas y se tienen en cuenta las variantes
lingüísticas de las palabras de búsqueda.
Tabla 20. Resultado
ID
2
Ejemplo 5:
Buscar todos los documentos con un elemento raíz BOOK (en el espacio de nombres “http://www.ibm.com/
digital_media_library”) que tengan un descendiente directo CHAPTER (también en el espacio de nombres
“http://www.ibm.com/digital_media_library”). CHAPTER debe tener un descendiente directo NUMBER (en el
espacio de nombres “http://www.ibm.com/digital_media_library") con el valor 1, y también contener
información de texto acerca de la búsqueda en un espacio de nombres XML.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’declare namespace ns1 = "http://www.ibm.com/digital_media_library";
/ns1:BOOK/ns1:CHAPTER[. contains("búsqueda XML mediante un espacio de nombres") and NUMBER = 1]’’ ’) = 1;
El documento #3 es el único con códigos en el espacio de nombres correcto, pero sólo tiene coincidencias
de palabras clave en un capítulo con el valor de número 2 (no 1).
No se devuelve ninguna fila.
Tabla 21. Resultado
ID
Ejemplo 6:
Buscar todos los documentos con un elemento raíz BOOK (en el espacio de nombres “http://www.ibm.com/
digital_media_library”) que tengan un descendiente directo CHAPTER (en el espacio de nombres
“http://www.ibm.com/digital_media_library”). CHAPTER debe tener un descendiente directo NUMBER (en el
espacio de nombres “http://www.ibm.com/digital_media_library”) con el valor 1. BOOK debe tener un
64
IBM i: OmniFind Text Search Server for DB2 for i
descendiente CHAPTER (no necesariamente con un descendiente NUMBER) que contenga información de texto
acerca de la búsqueda en un espacio de nombres XML.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’declare namespace ns1 = "http://www.ibm.com/digital_media_library";
/ns1:BOOK[ns1:CHAPTER contains("búsqueda XML mediante un espacio de nombres")]/ns1:CHAPTER[ns1:NUMBER = 1]’’ ’) = 1;
El documento 3 tiene un elemento CHAPTER que coincide con los criterios de CONTAINS, y también un
elemento CHAPTER con un descendienteNUMBER que tiene el valor 1. Por tanto, el documento 3 coincide con
esta consulta.
Tabla 22. Resultado
ID
3
Referencia relacionada:
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
“SYSPROC.SYSTS_UPDATE” en la página 36
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
Ejemplo de búsqueda XML
Este ejemplo incluye una tabla de documentos XML, un índice de búsqueda de texto sobre una columna
XML de la tabla y seis búsquedas de texto SQL que utilizan CONTAINS.
Nota: Al utilizar los ejemplos de código, acepta los términos del apartado “Información sobre licencia de
código y exención de responsabilidad” en la página 156.
v Cree una tabla XML_DOCUMENTS en el esquema XMLTEST para almacenar los documentos XML:
CREATE TABLE XMLTEST.XML_DOCUMENTS (ID INT, XML_DATA XML, PRIMARY KEY (ID));
v Cree un índice de búsqueda de texto denominado XML_INDEX sobre la columna XML:
call SYSPROC.SYSTS_CREATE(’XMLTEST’, ’XML_INDEX’, ’XMLTEST.XML_DOCUMENTS(XML_DATA)’, ’’);
v Inserte algunos documentos XML:
INSERT INTO XMLTEST.XML_DOCUMENTS (ID, XML_DATA)
VALUES(1,
’<BOOK publication_date="2009-01-01">’ ||
’ <TITLE> OmniFind Text Search Server for DB2 </TITLE>’ ||
’ <ID_NUMBER> 1 ></ID_NUMBER>’ ||
’ <CHAPTER>’ ||
’ <NUMBER> 1 </NUMBER>’ ||
’ <TITLE> Introducción </TITLE>’ ||
’ <ABSTRACT> Este capítulo presentará al lector las prestaciones de OmniFind
for DB2 for IBM i </ABSTRACT>’ ||
’ </CHAPTER>’||
’ <CHAPTER>’ ||
’ <NUMBER> 2 </NUMBER>’ ||
’ <TITLE> Crear un índice de búsqueda de texto </TITLE>’ ||
’ <ABSTRACT> Este capítulo describirá cómo crear un índice de búsqueda de texto </ABSTRACT>’ ||
’ </CHAPTER>’ ||
’</BOOK>’);
OmniFind Text Search Server
65
INSERT INTO XMLTEST.XML_DOCUMENTS (ID, XML_DATA)
VALUES(2,
’<BOOK publication_date="2010-02-01">’ ||
’ <TITLE> Utilizar el tipo de datos XML para DB2 for IBM i </TITLE>’ ||
’ <ID_NUMBER> 2 ></ID_NUMBER>’ ||
’ <CHAPTER>’ ||
’ <NUMBER> 1 </NUMBER>’ ||
’ <TITLE> Introducción </TITLE>’ ||
’ <ABSTRACT> Este capítulo presentará al lector el tipo de datos XML de DB2 </ABSTRACT>’ ||
’ </CHAPTER> ’ ||
’ <CHAPTER>’ ||
’
<NUMBER> 2 </NUMBER>’ ||
’
<TITLE> Insertar datos XML en una tabla de DB2 </TITLE>’ ||
’
<ABSTRACT> Este capítulo describirá cómo insertar datos XML en una tabla de DB2 </ABSTRACT>’ ||
’ </CHAPTER>’ ||
’ <CHAPTER>’ ||
’
<NUMBER> 3 </NUMBER>’ ||
’
<TITLE> Buscar datos XML </TITLE>’ ||
’
<ABSTRACT> Este capítulo describirá cómo consultar datos de columnas XML
mediante las UDFS CONTAINS y SCORE </ABSTRACT>’ ||
’ </CHAPTER>’ ||
’</BOOK>’);
INSERT INTO XMLTEST.XML_DOCUMENTS (ID, XML_DATA)
VALUES(3,
’<BOOK xmlns="http://www.ibm.com/digital_media_library"’ ||
’
publication_date="2010-02-01">’ ||
’ <TITLE> Utilizar espacios de nombres con OmniFind Text Search Server for DB2 for IBM i </TITLE>’ ||
’ <ID_NUMBER> 2 </ID_NUMBER>’ ||
’ <CHAPTER>’ ||
’ <NUMBER> 1 </NUMBER>’ ||
’ <TITLE> Introducción </TITLE>’ ||
’ <ABSTRACT> Este capítulo presentará al lector los espacios de nombres XML </ABSTRACT>’ ||
’ </CHAPTER>’ ||
’ <CHAPTER>’ ||
’ <NUMBER> 2 </NUMBER>’ ||
’ <TITLE> Utilizar espacios de nombres predeterminados </TITLE>’ ||
’ <ABSTRACT> Este capítulo describirá cómo utilizar un espacio de nombres en una búsqueda XML </ABSTRACT>’ ||
’ </CHAPTER>’ ||
’</BOOK>’);
v Actualice el índice:
CALL SYSPROC.SYSTS_UPDATE(’XMLTEST’, ’XML_INDEX’, ’’);
Consultas de ejemplo
Búsqueda 1:
Buscar todos los documentos que tienen un elemento raíz BOOK con un descendiente directo TITLE que
contiene DB2.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’/BOOK/TITLE[. contains("DB2")]’’ ’) = 1;
Dado que no se ha especificado un prólogo de espacio de nombres en el término de búsqueda, no se
tiene en cuenta ningún espacio de nombres para la búsqueda.
Tabla 23. Resultado
ID
1
2
3
66
IBM i: OmniFind Text Search Server for DB2 for i
Búsqueda 2:
Buscar todos los documentos que tienen un elemento raíz BOOK con un descendiente directo TITLE que
contiene DB2. Utilizar un espacio de nombres de elemento predeterminado para indicar que BOOK y TITLE
deben estar en el espacio de nombres "http://www.ibm.com/digital_media_library”.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’declare default element namespace
"http://www.ibm.com/digital_media_library";
/BOOK/TITLE[. contains("DB2")]’’ ’) = 1;
Tabla 24. Resultado
ID
3
Búsqueda 3:
Buscar todos los documentos que tienen un elemento raíz BOOK que tiene un atributo publication_date
posterior a "2010-01-01" y un elemento hijo TITLE que contiene DB2. Restringir la búsqueda para que los
códigos BOOK y TITLE no deban existir en ningún espacio de nombres.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’declare default element namespace "";
/BOOK[@publication_date > xs:date("2010-01-01")]/TITLE[. contains("DB2")]’’ ’) = 1;
Tabla 25. Resultado
ID
2
Búsqueda 4:
Buscar todos los documentos con un elemento raíz BOOK (que no esté en ningún espacio de nombres) que
tengan un descendiente directo CHAPTER (tampoco en un espacio de nombres) que contenga información
acerca de la inserción de datos en una tabla XML.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’declare default element namespace "";
/BOOK/CHAPTER[. contains("insertar datos XML en una tabla")]’’ ’) = 1;
Nota:
v El texto contenido en CHAPTER incluye el texto contenido en los elementos ABSTRACT y TITLE que son
descendientes de CHAPTER.
v La serie de búsqueda no distingue entre mayúsculas y minúsculas y se tienen en cuenta las variantes
lingüísticas de las palabras de búsqueda.
Tabla 26. Resultado
ID
2
Búsqueda 5:
Buscar todos los documentos con un elemento raíz BOOK (en el espacio de nombres “http://www.ibm.com/
digital_media_library”) que tengan un descendiente directo CHAPTER (también en el espacio de nombres
OmniFind Text Search Server
67
“http://www.ibm.com/digital_media_library”). CHAPTER debe tener un descendiente directo NUMBER (en el
espacio de nombres “http://www.ibm.com/digital_media_library") con el valor 1, y también contener
información de texto acerca de la búsqueda en un espacio de nombres XML.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’declare namespace ns1 = "http://www.ibm.com/digital_media_library";
/ns1:BOOK/ns1:CHAPTER[. contains("búsqueda XML mediante un espacio de nombres") and NUMBER = 1]’’ ’) = 1;
El documento #3 es el único con códigos en el espacio de nombres correcto, pero sólo tiene coincidencias
de palabras clave en un capítulo con el valor de número 2 (no 1).
No se devuelve ninguna fila.
Tabla 27. Resultado
ID
Búsqueda 6:
Buscar todos los documentos con un elemento raíz BOOK (en el espacio de nombres “http://www.ibm.com/
digital_media_library”) que tengan un descendiente directo CHAPTER (en el espacio de nombres
“http://www.ibm.com/digital_media_library”). CHAPTER debe tener un descendiente directo NUMBER (en el
espacio de nombres “http://www.ibm.com/digital_media_library”) con el valor 1. BOOK debe tener un
descendiente CHAPTER (no necesariamente con un descendiente NUMBER) que contenga información de texto
acerca de la búsqueda en un espacio de nombres XML.
SELECT ID
FROM XMLTEST.XML_DOCUMENTS
WHERE CONTAINS(XML_DATA, ’@xmlxp:’’declare namespace ns1 = "http://www.ibm.com/digital_media_library";
/ns1:BOOK[ns1:CHAPTER contains("búsqueda XML mediante un espacio de nombres")]/ns1:CHAPTER[ns1:NUMBER = 1]’’ ’) = 1;
El documento 3 tiene un elemento CHAPTER que coincide con los criterios de CONTAINS, y también un
elemento CHAPTER con un descendienteNUMBER que tiene el valor 1. Por tanto, el documento 3 coincide con
esta consulta.
Tabla 28. Resultado
ID
3
Gramática de consultas de búsqueda XML
La gramática de la búsqueda XML se basa en un subconjunto del lenguaje XPath, definido por la
gramática EBNF (Extended Backus-Naur Form). El analizador de consultas rechazará las consultas que no
se ajusten a la gramática soportada.
La gramática EBNF se ha simplificado en los siguientes aspectos:
v No permitiendo nombres de vía de acceso absoluta en expresiones de predicado.
v Reconociendo sólo un eje (código) y sólo hacia adelante.
v Aplicando restricciones semánticas adicionales al uso del carácter comodín (consulte la sección anterior
dedicada al soporte de comodines en las expresiones de vía de acceso, del apartado “Búsqueda XML”
en la página 53.
v Exigiendo la especificación de la declaración de espacio de nombres en la serie de búsqueda antes de
cualquier utilización, implícita o explícita, del espacio de nombres. Si no se incluye la declaración de
espacio de nombres, los espacios de nombres no se tienen en cuenta en la búsqueda.
68
IBM i: OmniFind Text Search Server for DB2 for i
v Las expresiones de vía de acceso relativa deben tener un nombre de atributo o código incluido en la
expresión. La consulta ‘/' para seleccionar el nodo raíz y ‘//' para seleccionar todos los nodos no son
expresiones válidas.
La tabla siguiente muestra la gramática soportada en la notación EBNF.
Tabla 29. Gramática de consultas soportada en la notación EBNF
Símbolo
Producción
XMLQuery ::=
QueryPrefix NameSpaceDeclaration QueryString
| QueryPrefix QueryString
QueryPrefix ::=
@xmlxp:
QueryString ::=
"'" PathExpr "'"
PathExpr ::=
RelativePathExpr
| "/" RelativePathExpr?
| "//" RelativePathExpr
RelativePathExpr ::=
StepExpr ( ( "/" | "//" ) StepExpr )*
StepExpr ::=
( "." | AbbrevForwardStep ) Predicate?
AbbrevForwardStep ::=
"@"? (QName | "*")
Predicate ::=
"[" PredicateExpr "]"
PredicateExpr ::=
Expr
| PredicateExpr ( "and" | "or" )
| "(" PredicateExpr ")"
Expr ::=
ComparisonExpr | ContainmentExpr
ComparisonExpr ::=
PathExpr ComparisonOp Literal
ComparisonOp ::=
"=" | "<" | ">" | "!=" | "<=" | ">="
Literal ::=
StringLiteral | NumericLiteral | DateLiteral
ContainmentExpr ::=
PathExpr "contains" "(" StringLiteral ")"
| PathExpr "excludes" "(" StringLiteral ")"
StringLiteral ::=
"\"" [^"]* "\""
| "'" [^']* "'"
DateLiteral ::=
"xs:date(\"" xmlDate "\")"
| "xs:dateTime(\"" xmlDateTime "\")"
xmlDate ::=
aaaa"-"mm"-"dd
xmlDateTime ::=
aaaa"-"mm"-"dd [T] hh":"mm":"ss"."uuuuuu
NameSpaceDeclaration ::=
defaultNameSpace (NameSpacePrefixDeclaration)*
defaultNameSpace ::=
“declare default element namespace
“ StringLiteral “;”
NameSpacePrefixDeclaration ::=
“declare namespace”
StringLiteral “;”
NameSpacePrefix ::=
[^”:]+
NameSpacePrefix “=”
Administrar un OmniFind(r) Text Search Server for DB2(r) for i
Puede administrar OmniFind Text Search Server for DB2 for i mediante las siguientes técnicas y
herramientas.
OmniFind Text Search Server
69
Iniciar OmniFind Text Search Server for DB2 for i
Puede iniciar OmniFind Text Search Server for DB2 for i llamando al procedimiento
SYSPROC.SYSTS_START.
OMNIFIND inicia automáticamente el servidor de búsqueda de texto cuando es necesario, siempre y
cuando el valor de SERVERSTATUS de QSYS2.SYSTEXTSERVERS sea 0. Esta política permite iniciar
automáticamente el servidor de búsqueda de texto cuando se inicia el sistema host. Sin embargo, puede
iniciar el servidor manualmente si es necesario.
Para iniciar el servidor:
CALL SYSPROC.SYSTS_START(idservidor)
Si la llamada es satisfactoria, el valor de SERVERSTATUS de QSYS2.SYSTEXTSERVERS se establece en 0
después de llamar al procedimiento. Si el servidor es local, los trabajos siguientes estarán activos en
segundo plano:
v QJVAEXEC QDBTS BCI 0.0 JVM-com.ibm.es
v QJVAEXEC QDBTS BCI 0.0 PGM-textExtrac
v QJVAEXEC QDBTS BCI 0.0 PGM-textExtrac
v QJVAEXEC QDBTS BCI 0.0 PGM-textExtrac
v QJVAEXEC QDBTS BCI 0.0 PGM-textExtrac
donde QDBTS es el perfil de usuario de OmniFind creado durante la instalación del producto.
Puede que deban transcurrir unos minutos antes de que todos estos trabajos estén activos y el servidor
de texto pueda utilizarse.
Referencia relacionada:
“SYSPROC.SYSTS_START” en la página 15
Puede habilitar funciones de búsqueda de texto de DB2 llamando al procedimiento almacenado
SYSPROC.SYSTS_START.
“Tabla de administración QSYS2.SYSTEXTSERVERS” en la página 115
Puede visualizar dónde están instalados los servidores de búsqueda de texto mediante la tabla de
administración QSYS2.SYSTEXTSERVERS.
Detener OmniFind Text Search Server for DB2 for i
Puede detener OmniFind Text Search Server for DB2 for i manualmente mediante el script de conclusión
que se suministra.
Si ha instalado OmniFind Text Search Server for DB2 for i como servicio, el servidor de búsqueda de
texto se detiene automáticamente cada vez que se concluye el sistema host. Sin embargo, puede detener
el servidor manualmente aunque haya instalado OmniFind Text Search Server for DB2 for i como
servicio.
Para detener OmniFind Text Search Server for DB2 for i:
1. Indique en el catálogo SYSTEXTSERVER que el servidor se detiene llamando a
SYSPROC.SYSTS_STOP.
v Para detener todos los servidores: CALL SYSPROC.SYSTS_STOP().
v Para detener un servidor específico:
a. Consulte el catálogo de servidores para obtener el idservidor que desea detener:
SELECT SERVERID,SERVERPORT,SERVERSTATUS,SERVERPATH
FROM QSYS2.SYSTEXTSERVERS
70
IBM i: OmniFind Text Search Server for DB2 for i
Nota: SERVERPATH identifica al servidor. SERVERSTATUS indica si el servidor está actualmente
activo (0) o inactivo (1).
b. Llame a SYSPROC.SYSTS_STOP, especificando el idservidor numérico o el nombre de alias del
servidor que desea detener.
CALL SYSPROC.SYSTS_STOP(idservidor).
2. Indique en el catálogo SYSTEXTSERVER que el servidor se detiene llamando a
SYSPROC.SYSTS_SHUTDOWN. Además de establecer SERVERSTATUS en inactivo(1), este
procedimiento también finalizará los trabajos de servidor de búsqueda de texto en el sistema host.
v Para concluir todos los servidores: CALL SYSPROC.SYSTS_SHUTDOWN().
v Para concluir un servidor específico:
a. Consulte el catálogo de servidores para obtener el idservidor que desea concluir:
SELECT SERVERID,SERVERPORT,SERVERSTATUS,SERVERPATH
FROM QSYS2.SYSTEXTSERVERS
Nota: SERVERPATH identifica al servidor. SERVERSTATUS indica si el servidor está actualmente
activo (0) o inactivo (1).
b. Llame a SYSPROC.SYSTS_SHUTDOWN, especificando el idservidor numérico o el nombre de
alias del servidor que desea concluir.
CALL SYSPROC.SYSTS_SHUTDOWN(idservidor).
3. (Opcional) Detenga el servidor en sí llamando al script de conclusión. Al detener el servidor, se
detienen todos los trabajos del servidor de búsqueda de texto del sistema host. Detenga el servidor en
el entorno Qshell.
Para concluir el servidor local, especifique el mandato siguiente en la línea de mandatos:
QSH CMD(’cd /QOpenSys/QIBM/ProdData/TextSearch/server1/bin; shutdown.sh’)
.
Si el servidor que debe concluirse no es el servidor local predeterminado creado por el proceso de
instalación, debe obtener el valor correcto de SERVERPATH de QSYS2.SYSTEXTSERVERS. Utilice ese
valor de SERVERPATH en lugar de /QOpenSys/QIBM/ProdData/TextSearch/server1/bin.
Si detiene el servidor mediante el script de conclusión, el catálogo SERVERSTATUS no cambia a
estado Inactivo (1). La próxima vez que se llame a los procedimientos almacenados SYSTS_CREATE,
SYSTS_UPDATE y SYSTS_DROP, o cuando se invoque una función incorporada CONTAINS o SCORE
como parte de una consulta SQL, el servidor se iniciará automáticamente.
Referencia relacionada:
“SYSPROC.SYSTS_STOP” en la página 17
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_STOP para detener las funciones de
búsqueda de texto de DB2. Este procedimiento almacenado establece el valor SERVERSTATUS del
catálogo QSYS2.SYSTEXTSERVERS en 1 (detenido).
“SYSPROC.SYSTS_SHUTDOWN” en la página 39
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_SHUTDOWN para concluir las funciones de
búsqueda de texto de DB2®. Este procedimiento almacenado establece el valor SERVERSTATUS del
catálogo QSYS2.SYSTEXTSERVERS en 1 (detenido) y también finaliza los trabajos del servidor de
búsqueda de texto del sistema host.
“Tabla de administración QSYS2.SYSTEXTSERVERS” en la página 115
Puede visualizar dónde están instalados los servidores de búsqueda de texto mediante la tabla de
administración QSYS2.SYSTEXTSERVERS.
Salvar y restaurar índices de búsqueda de texto
Puede salvar y restaurar los índices de búsqueda de texto con o sin datos.
Salvar y restaurar un índice de búsqueda de texto sin datos
Puede salvar y restaurar una estructura de índice de búsqueda de texto sin los datos de índice. El proceso
de salvar y restaurar puede realizarse mediante los mandatos CL SAVOBJ y SAVLIB.
OmniFind Text Search Server
71
Cuando se crea un índice de búsqueda de texto mediante SYSTS_CREATE, se crea una vista de DB2
utilizando el esquema y el nombre del índice como nombre de la vista. La vista actúa como mecanismo
para salvar y restaurar la estructura del índice.
El usuario puede salvar la vista mediante los mismos métodos utilizados para salvar tablas y vistas de
base de datos. (Consulte los mandatos CL SAVOBJ o SAVLIB). Al salvar la vista automáticamente, se
salva la información adicional necesaria para volver a crear el índice durante la restauración.
La vista puede restaurarse mediante los mandatos CL RSTOBJ o RSTLIB. DB2 for i reconoce que la vista
representa un índice de búsqueda de texto y vuelve a crear el índice. Una vez recreada la estructura del
índice, se someterá una actualización a un trabajo en segundo plano para volver a llenar los datos del
índice.
Durante el proceso de restauración deben tenerse en cuenta consideraciones adicionales:
1. Si el servidor de búsqueda de texto no puede iniciarse o un producto necesario no está instalado en el
sistema, la restauración fallará. Consulte los Requisitos de software para obtener una lista de los
productos necesarios.
2. Si el índice de búsqueda de texto existe en el sistema, se realizan las acciones siguientes.
a. Si la información de índice existente coincide exactamente con el índice que se restaura, la
restauración será satisfactoria. El índice no se reconstruye.
b. Si la información de índice existente no coincide con el índice que se restaura y no puede
modificarse para que coincida sin volver a crear el índice, la restauración fallará.
c. Si la información de índice existente no coincide con el índice que se restaura, pero puede
modificarse para que coincida mediante SYSTS_ALTER, el índice existente se modificará para que
coincida con el índice que se ha salvado. El índice no se reconstruye.
3. El índice se restaura para utilizar el mismo servidor de búsqueda de texto utilizado en el momento de
realizar la operación de salvar. Si el servidor utilizado cuando se realizó la operación de salvar no está
definido, se seleccionará un servidor disponible en ese momento. Si el servidor salvado está definido
pero no está disponible, la restauración fallará.
4. Si el índice de búsqueda de texto no puede crearse por alguna otra razón, como por ejemplo una
columna incompatible en la tabla base, la restauración fallará.
5. El nombre de la tabla intermedia en QSYS2, los nombres de desencadenantes que se añaden a la tabla
base y el nombre de colección en el servidor de búsqueda de texto pueden cambiar, ya que los genera
el sistema.
6. Los sinónimos añadidos al diccionario de sinónimos del índice de búsqueda de texto no se conservan.
7. Si el índice existe en los catálogos del sistema durante la restauración y la vista no existe actualmente
en el sistema, sólo se restaura la vista. La tabla intermedia, la colección del servidor de búsqueda de
texto y los desencadenantes de la tabla base no se crean.
En este caso, se presupone que el índice de búsqueda de texto forma parte de una restauración mayor
en la que el usuario ha salvado explícitamente las partes individuales del índice, y ahora se restauran
todas ellas (como por ejemplo al restaurar todo el sistema).
Todas las partes necesarias del índice deben restaurarse para que funcione el índice. Es
responsabilidad del usuario asegurarse de que todas las partes del índice estén sincronizadas.
Los índices de búsqueda de texto están soportados por el mandato Restaurar objetos diferidos
(RSTDFROBJ). Es aconsejable utilizar el parámetro DFRID en los mandatos CL RSTOBJ y RSTLIB. Este
parámetro permite restaurar índices de búsqueda de texto mediante el mandato RSTDFROBJ después de
corregir condiciones habituales que impiden la creación del índice.
Son ejemplos de condiciones que provocan el diferimiento del índice:
v Un producto necesario que no está instalado.
v Un servidor de búsqueda de texto no está disponible o definido.
72
IBM i: OmniFind Text Search Server for DB2 for i
v La tabla base no existía.
Referencia relacionada:
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
“SYSPROC.SYSTS_ALTER” en la página 28
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_ALTER para modificar los atributos de un
índice creado por SYSPROC.SYSTS_CREATE. Sólo se cambiarán los atributos especificados explícitamente
en este procedimiento. Todos los demás atributos del índice permanecerán sin cambios.
Información relacionada:
Salvar objeto (SAVOBJ)
Salvar biblioteca (SAVLIB)
Restaurar objeto (RSTOBJ)
Restaurar biblioteca (RSTLIB)
Restaurar objetos diferidos (RSTDFROBJ)
Salvar y restaurar un índice de búsqueda de texto con datos
Salvar y restaurar un índice de búsqueda de texto con datos es una operación más compleja que hacerlo
sin datos.
Debe salvar los objetos siguientes:
v El índice de búsqueda de texto (almacenado en el sistema de archivos integrado).
v La tabla intermedia utilizada como archivo de registro que realiza el seguimiento de los cambios de
registro de la tabla base (sobre la cual se ha creado el índice). La tabla intermedia se encuentra en la
biblioteca QSYS2. Su nombre empieza por QDBTS, por ejemplo, QDBTS00001.
v La vista, que es el objeto de base de datos que representa el índice de texto. La vista tiene el mismo
nombre que el índice de texto.
v La tabla base a partir de la cual se ha construido el índice.
v Los catálogos SQL que almacenan la información destinada a realizar el seguimiento del índice.
Para salvar los índices de búsqueda de texto, siga estos pasos:
1. Recomendado: actualice los índices realizando primero operaciones de actualización (SYSTS_UPDATE)
para los índices de búsqueda de texto.
2. Salve la tabla base y la vista mediante técnicas de salvación estándar, como por ejemplo el mandato
SAVOBJ.
3. Salve las tablas intermedias que se encuentran en QSYS2 mediante técnicas de salvación estándar. Por
ejemplo, SAVOBJ LIB(QSYS2) OBJ(QDBTS*).
4. Salve los catálogos de índice de búsqueda de texto en QSYS2:
Todos los nombres de catálogo empiezan por SYSTXT, por ejemplo, SYSTXTSRVR. Al igual que los
demás catálogos SQL de QSYS2, es responsabilidad del usuario asegurarse de que se haya salvado y
esté disponible una copia de seguridad.
Esta copia de seguridad puede realizarse de dos maneras:
a. Puede salvarse toda la biblioteca como parte del mandato SAVLIB, especificando *ALLUSR o *IBM
en el parámetro LIB.
b. Pueden salvarse los catálogos de búsqueda de texto específicos mediante el mandato SAVOBJ,
especificando LIB(QSYS2) y OBJ((SYSTXT*)).
5. Salve la información del índice de búsqueda de texto en el sistema de archivos integrado. Esta
información incluye todo el contenido del directorio config bajo la vía de acceso del servidor de texto.
OmniFind Text Search Server
73
La vía de acceso del servidor de texto puede determinarse consultando la columna SERVERPATH del
catálogo SYSTXTSRVR del servidor en cuestión. La vía de acceso del servidor contiene un directorio
añadido al final, que debe sustituirse por el directorio config.
Una técnica habitual de salvar es utilizar el mandato SAV, aunque funcionará cualquier tipo de
compresión de salvado.
Nota: Esta información de salvar sólo es aplicable a los servidores de texto ejecutados en IBM i.
Ejemplo:
Supongamos que desea salvar todos los índices de texto asociados con el servidor de texto
predeterminado creado por OMNIFIND. Tiene una tabla QGPL/MYDOCS con el índice de texto
QGPL/MYDOCIX construido a partir de ella. En este ejemplo, los soportes de salvar son archivos.
Siga estos pasos:
1. Salve todas las tablas intermedias y los catálogos de OMNIFIND de QSYS2:
SAVOBJ OBJ(QDBTS* SYSTXT*) LIB(QSYS2) DEV(*SAVF) SAVF(QGPL/SAVFQSYS2)
2. Salve la tabla base y la vista:
SAVOBJ OBJ(MYDOCS MYDOCIX) LIB(QGPL) DEV(*SAVF) SAVF(QGPL/SAVFMYFILE)
3. Mediante SQL, obtenga el nombre de vía de acceso del servidor de texto. En este ejemplo, serverid =
2:
SELECT SERVERPATH FROM systxtsrvr WHERE serverid=2
El valor de SERVERPATH devuelto es /QOpenSys/QIBM/ProdData/TextSearch/server1/bin/.
Nota: Compruebe que está consultando el servidor correcto.
4. Especifique config en lugar de bin/ y salve los índices de texto:
SAV DEV(’/QSYS.LIB/QGPL.LIB/SAVIFS.FILE’) OBJ((’/QOpenSys/QIBM/ProdData/TextSearch/server1/
config’))
Los índices de texto se salvarán ahora en los archivos de salvar QGPL/SAVFMYFILE, QGPL/SAVFQSYS2
y QGPL/SAVIFS.
La operación de restaurar los índices de texto debe realizarse en el mismo orden que la operación de
salvar. Los catálogos de QSYS2 DEBEN restaurarse en primer lugar.
Referencia relacionada:
“SYSPROC.SYSTS_UPDATE” en la página 36
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
Información relacionada:
Salvar objeto (SAVOBJ)
Salvar biblioteca (SAVLIB)
Determinación de problemas
Puede utilizar los mensajes del sistema y de rastreo registrados para determinar el origen de los
problemas que puedan surgir.
El registro del servidor OmniFind Text Search Server for DB2 for i se encuentra en el directorio
<DIRECTORIO_INICIAL_INSTALACIÓN>/log. El registro de servidor predeterminado creado durante la
instalación se encuentra en el directorio /QOpenSys/QIBM/ProdData/TextSearch/server1/log.
74
IBM i: OmniFind Text Search Server for DB2 for i
Por omisión, el registro cronológico de rastreo está desactivado, y el nivel de registro del sistema está
establecido en informativo. Puede utilizar la herramienta de configuración para cambiar las opciones de
rastreo y nivel de registro.
Los archivos de registro del servidor se rotan por tamaño. Se almacenan las cinco copias más recientes de
los archivos de registro del servidor que no superan los 8 MB. Puede visualizar y guardar los registros
del servidor mediante el script que se suministra.
En IBM i o en un servidor Linux, el script es logformatter.sh. En un servidor Windows, el script es
logformatter.bat.
Opciones
El script tiene las opciones siguientes.
-f logfile
Especifica el archivo de registro del servidor que desea formatear.
-l locale
Especifica el entorno local que debe utilizarse al grabar los mensajes reformateados. Por ejemplo,
especifique en_US para el inglés o ja_JP para el japonés. Este valor es opcional. El valor
predeterminado es en_US.
-o outputfile
Especifica el archivo de salida en el que deben grabarse los mensajes de registro reformateados
mediante la codificación UTF-8. Este valor es opcional. Si no especifica esta opción, se utilizará un
archivo de salida estándar.
-? Imprime el mensaje de ayuda. Este valor es opcional.
-v Especifica la modalidad de visualización de los mensajes de depuración. Este valor es opcional.
Visualizar y guardar registros del servidor
Puede utilizar los scripts que se suministran para visualizar y guardar los registros del servidor. Estos
registros pueden ayudar a determinar el origen de los problemas.
Para visualizar y guardar un registro del servidor:
1. Para visualizar el registro del servidor, ejecute uno de los mandatos siguientes:
Opción
Descripción
En IBM i (dentro del entorno QSH)
bin/logformatter.sh -f
log/System.0.log
En un servidor Linux
bin/logformatter.sh -f
log/System.0.log
En un servidor Windows
bin/logformatter.bat -f
log/System.0.log
2. Para guardar el registro del servidor en un archivo para poder leerlo en un editor de archivos, ejecute
uno de los mandatos siguientes:
Opción
Descripción
En IBM i (dentro del entorno QSH)
bin/logformatter.sh
-f log/System.0.log
–o <nombre de archivo de salida>
En un servidor Linux
bin/logformatter.sh
-f log/System.0.log
–o <nombre de archivo de salida>
OmniFind Text Search Server
75
Opción
Descripción
En un servidor Windows
bin/logformatter.bat
-f log/System.0.log
–o <nombre de archivo de salida>
Herramientas de administración
OMNIFIND suministra herramientas que pueden utilizarse para tareas habituales. Estas tareas incluyen la
configuración y administración de un servidor de búsqueda de texto adicional y la adición de un
diccionario de sinónimos a una colección.
Estas herramientas son scripts de shell en lugar de mandatos CL. Pueden invocarse dentro del entorno de
scripts que se inicia mediante los mandatos CL Iniciar QSH (STRQSH) o QSH (QSH).
Estas herramientas no autentican ID de usuario. Sin embargo, sólo un usuario que tenga acceso válido al
servidor de búsqueda de texto puede ejecutarlas.
Información relacionada:
Iniciar QSH (STRQSH)
Iniciar QSH (QSH)
Herramienta de configuración
La herramienta de configuración se utiliza para personalizar valores de configuración después de instalar
OmniFind Text Search Server for DB2 for i.
Para personalizar la mayoría de los valores de configuración, es necesario detener el servidor de
búsqueda de texto antes de ejecutar la herramienta de configuración.
Sin embargo, mientras el servidor está en ejecución puede visualizar las opciones siguientes:
v la señal de autenticación actual
v el puerto del servidor
v las propiedades actuales del sistema
La herramienta configServerAndDB2
La herramienta configServerAndDB2 (configServerAndDB2.sh) se encuentra en el directorio del sistema
de archivos integrado /QOpenSys/QIBM/ProdData/TextSearch. Esta herramienta puede utilizarse para crear
o modificar entradas del archivo de catálogo de DB2 SYSTEXTSERVERS.
También puede utilizarse para configurar la señal de autenticación o el número de puerto asociados con
un servidor específico. La herramienta modifica o establece los valores de SERVERAUTHTOKEN y
SERVERPORT en el archivo de catálogo de DB2 SYSTEXTSERVERS.
Si desea crear un servidor adicional que se ejecute localmente en el sistema, utilice la “Herramienta
ServerInstance” en la página 90.
La herramienta configServerAndDB2 (configServerAndDB2.sh) se invoca con cinco parámetros:
1. El primer parámetro es generateToken o configureHTTPListener.
2. El segundo parámetro es -serverPath.
3. El tercer parámetro es la vía de acceso al nodo raíz del sistema de archivos integrado donde se
almacena la información relacionada con el servidor. Ejemplo: /QOpenSys/QIBM/ProdData/TextSearch/
server2.
4. El cuarto y quinto parámetros varían en función del valor del primer parámetro.
76
IBM i: OmniFind Text Search Server for DB2 for i
v Si el primer parámetro es generateToken, el cuarto parámetro es -seed seguido de un entero (por
ejemplo, 1) como quinto parámetro.
v Si el primer parámetro es configureHTTPListener, el cuarto parámetro es -adminHTTPPort. El quinto
parámetro es un valor entero que se utiliza como puerto de socket del servidor.
A continuación se muestran dos ejemplos:
v STRQSH
cd /QOpenSys/QIBM/ProdData/TextSearch
configServerAndDB2.sh generateToken -serverPath /QOpenSys/QIBM/ProdData/TextSearch/server2 -seed 1
v STRQSH
cd /QOpenSys/QIBM/ProdData/TextSearch
configServerAndDB2.sh configureHTTPListener -serverPath /QOpenSys/QIBM/ProdData/TextSearch/server2
-adminHTTPPort 9997
El script configTool
El script configTool.sh está disponible para cada servidor local. No es aconsejable utilizarlo para
modificar entradas de servidor. Puede utilizarlo para imprimir la información del servidor (como, por
ejemplo, printAll y printToken).
Tabla 30. Mandatos de ejecución de la herramienta de configuración
En IBM i:
configTool.sh
<opción_mandato_obligatoria>
<argumentos_globales_obligatorios>
<argumentos_globales_opcionales>
<opciones_mandato_opcionales>
En un servidor Linux
configTool.sh
<opción_mandato_obligatoria>
<argumentos_globales_obligatorios>
<argumentos_globales_opcionales>
<opciones_mandato_opcionales>
En un servidor Windows
configTool.bat
<opción_mandato_obligatoria>
<argumentos_globales_obligatorios>
<argumentos_globales_opcionales>
<opciones_mandato_opcionales>
Opciones de mandato
La herramienta de configuración admite las siguientes opciones de mandato:
configureParams
Especifica los parámetros del sistema que puede configurar. Puede configurar los parámetros
siguientes:
-configPath
Especifica la vía de acceso absoluta a la carpeta de configuración que contiene el archivo
config.xml.
-adminHTTPPort
Especifica el número de puerto HTTP de administración. Si se produce un error, se devuelve el
código de error -3.
-logPath
Especifica la vía de acceso absoluta al directorio de registros.
OmniFind Text Search Server
77
-temDirPath
Especifica la vía de acceso absoluta al directorio temporal.
-numberOfIndexers
Especifica el número de subsistemas de indexación de búsqueda de texto simultáneos.
-numberOfTokenizers
Especifica el número de subsistemas simultáneos utilizados para analizar la entrada a fin de
generar señales.
-maxDocumentSize
Especifica el número máximo de caracteres que deben indexarse para un documento. Si se
produce un error, se devuelve el código de error -3.
-logLevel
Especifica el nivel de registro de los mensajes del sistema en el archivo de registro. El nivel
predeterminado es informativo. Las opciones adicionales son aviso y grave.
-maxHeapSize
Inicia y detiene el tamaño de almacenamiento dinámico en un formato aceptado por la máquina
virtual Java. Si se produce un error, se devuelve el código de error -5.
printToken
Imprime la señal de autenticación y la clave de cifrado actuales.
printAll
Imprime todos los valores actuales para las opciones que pueden configurarse con esta herramienta.
printAdminHTTPPort
Imprime el valor actual del puerto HTTP de administración.
generateToken
Genera la señal de autenticación.
Argumentos globales
-configPath
Especifica la vía de acceso absoluta a la carpeta de configuración que contiene el archivo config.xml.
Este argumento global es obligatorio.
-locale
Especifica el valor de entorno local de cinco caracteres para la escritura de mensajes en el archivo de
rastreo. Si no especifica este valor, se utilizará el valor predeterminado, -en_US.
Ejemplo
En un servidor Linux, especifique el mandato siguiente para imprimir la señal de autenticación actual:
configTool.sh printToken -configPath <vía_acceso> <argumentos_globales_opcionales>
Información relacionada:
Iniciar QSH (QSH)
SYSPROC.SYSTS_REMOVE
Puede eliminar índices huérfanos con el procedimiento almacenado SQL SYSPROC.SYSTS_REMOVE.
Autorización
El nombre de colección de los índices huérfanos posibles puede identificarse mediante la función de tabla
definida por usuario (UDTF) QDBTS_LISTINXSTS.
Los privilegios detentados por el ID de autorización de la sentencia deben incluir como mínimo uno de
los siguientes:
78
IBM i: OmniFind Text Search Server for DB2 for i
v Autoridad *JOBCTL
v Utilización de la función especial de seguridad QIBM_DB_SQLADM
Sintaxis
>>-SYSPROC.SYSTS_REMOVE (nombre-colección) -><
Parámetro
nombre-colección
Especifica un literal de tipo serie que identifica el nombre de la colección que debe eliminarse.
Nota: Este procedimiento utiliza el script de shell adminTool.sh para eliminar el directorio de colección.
Para utilizar este script de shell, el servidor debe encontrarse en funcionamiento. Si el servidor no se ha
iniciado, este procedimiento devolverá un mensaje de error.
SQL para SYSTS_REMOVE
CREATE PROCEDURE SYSPROC.SYSTS_REMOVE(
IN COLLECTIONNAME VARCHAR(255) CCSID 1208)
EXTERNAL NAME QDBTSLIB.DSN5RMCOLL
DYNAMIC RESULT SETS 0
LANGUAGE C++
PARAMETER STYLE SQL
PROGRAM TYPE MAIN
COMMIT ON RETURN NO
INHERIT SPECIAL REGISTERS;
Ejemplos
v
Para eliminar un índice huérfano con el nombre de colección 0_65_2815_2008_06_02_11_58_22_901726
del grupo de ASP *SYSBASE, especifique el mandato siguiente en cualquier interfaz SQL:
CALL SYSPROC.SYSTS_REMOVE(’0_65_2815_2008_06_02_11_58_22_901726’)
El procedimiento almacenado SYSTS_REMOVE comprueba si la información de índice se encuentra en
la tabla de catálogo QSYS2.SYSTEXTINDEXES. Si es verdadero (true), se devuelve el mensaje de error
DSX_INDEX_EXIST; si no es así, el procedimiento busca en el directorio config/collections del
servidor 65.
Si la colección no existe, se devolverá el mensaje de error DSX_COLLECTION_NOT_FOUND; si la
colección existe, el procedimiento llamará a adminTool.sh para eliminar la colección.
A continuación, el procedimiento comprobará de nuevo el directorio para ver si la colección se ha
eliminado. Si la colección no se ha eliminado, se devolverá al usuario el mensaje de error
DSX_REMOVE_COLLECTION_FAILED.
Nota: Cuando la colección del servidor de búsqueda de texto se encuentra en un grupo de ASP
independientes, la hebra que llama al procedimiento almacenado SYSTS_REMOVE debe ejecutarse en
el espacio de nombres de la ASP independiente. Utilice el mandato Establecer grupo de agrupaciones
de almacenamiento auxiliar (SETASPGRP).
v Para eliminar un índice huérfano con el nombre de colección 33_7_26_2008_06_18_21_28_39_407824 de
la ASP independiente iaspXXX, puede utilizar los mandatos siguientes:
CL:
SETASPGRP(iaspXXX)
SQL:
CALL SYSPROC.SYSTS_REMOVE(’ 33_7_26_2008_06_18_21_28_39_407824’)
Nota: Si utiliza System i Navigator, pulse con el botón derecho del ratón el nombre de base de datos de
la ASP independiente y ejecute los scripts SQL.
OmniFind Text Search Server
79
Referencia relacionada:
“Tabla de administración QSYS2.SYSTEXTINDEXES” en la página 112
Puede visualizar información acerca de cada índice de búsqueda de texto en la tabla de administración
QSYS2.SYSTEXTINDEXES. Cada índice de búsqueda de texto tiene un nombre, un nombre de esquema y
un nombre de colección asociada en el servidor de búsqueda de texto.
“Buscar índices huérfanos y ausentes” en la página 87
Puede buscar índices huérfanos y ausentes mediante una función de tabla definida por usuario (UDTF)
SQL denominada QDBTS_LISTINXSTS.
SYSPROC.SYSTS_REPRIMEINDEX
Puede ajustar (reprime) el índice e iniciar una actualización inicial mediante el procedimiento almacenado
SYSPROC.SYSTS_REPRIMEINDEX. Utilice este procedimiento almacenado cuando desee restaurar datos
desde la tabla base.
Si se restauran los datos de la tabla base, el contenido actualizado de la tabla base no puede indexarse
mientras se llama al procedimiento almacenado SYSTS_UPDATE. En este caso, puede llamarse al
procedimiento almacenado SYSPROC.SYSTS_REPRIMEINDEX para ajustar el índice.
Nota: Si se ha creado un diccionario de sinónimos para el índice de búsqueda de texto, este proceso
elimina el diccionario.
Sintaxis
>>-SYSPROC.SYSTS_REPRIMEINDEX(
indexSchema, indexName, options) -><
El calificador de esquema es SYSPROC.
Parámetros
indexSchema
Identifica el esquema del índice de búsqueda de texto. Si este parámetro es nulo, se utiliza el valor
del registro especial CURRENT SCHEMA correspondiente al invocante.
El tipo de datos de este parámetro es VARCHAR(128).
indexName
Identifica el nombre del índice de búsqueda de texto. El nombre del índice de búsqueda de texto,
junto con el esquema del índice, identifica de forma exclusiva el índice de texto completo en el
subsistema DB2. Debe especificar un valor que no sea nulo para este parámetro.
El tipo de datos de este parámetro es VARCHAR(128).
options
Serie de caracteres que especifica opciones que pueden añadirse en el futuro a este procedimiento
almacenado.
Importante: Debe especificar un valor no nulo para el parámetro options. De lo contrario, pueden
generarse errores. Observe el ejemplo siguiente para saber cómo especificar el parámetro opciones.
SQL para SYSTS_REPRIMEINDEX
CREATE PROCEDURE SYSPROC.SYSTS_REPRIMEINDEX(
IN INDEXSCHEMA VARCHAR(128) CCSID 1208,
IN INDEXNAME VARCHAR(128) CCSID 1208,
IN OPTIONS VARCHAR(32000) CCSID 1208)
EXTERNAL NAME QDBTSLIB.DSN5RPMIDX
DYNAMIC RESULT SETS 0
LANGUAGE C
PARAMETER STYLE SQL
80
IBM i: OmniFind Text Search Server for DB2 for i
MODIFIES SQL DATA
PROGRAM TYPE MAIN
COMMIT ON RETURN NO
INHERIT SPECIAL REGISTERS
Ejemplo
v Para ajustar (reprime) un índice desde cualquier interfaz SQL, especifique el mandato siguiente desde
cualquier interfaz de SQL:
CALL SYSPROC.SYSTS_REPRIMEINDEX('indexSchema1’,’indexName1’,’’)
Referencia relacionada:
“SYSPROC.SYSTS_UPDATE” en la página 36
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
SYSTS_CLEAR_INDEXES
Puede eliminar índices huérfanos con el procedimiento almacenado SQL SYSPROC.
SYSTS_CLEAR_INDEXES. Otra forma implícita es invocar SYSTS_START directamente, que intenta borrar
índices huérfanos automáticamente.
Autorización
Los índices huérfanos posibles pueden identificarse mediante la función de tabla definida por usuario
(UDTF) QDBTS_LISTINXSTS.
Los privilegios detentados por el ID de autorización de la sentencia deben incluir como mínimo uno de
los siguientes:
v Autoridad *JOBCTL
v Utilización de la función especial de seguridad QIBM_DB_SQLADM
Sintaxis
>>- SYSTS_CLEAR_INDEXES
--(--+-----------+--)-----------------------------><
+-id_servidor--+
’-nombre_alias-’
Parámetros
id_servidor o nombre_alias
Especifica el identificador del servidor cuyos índices huérfanos deben borrarse. Un idservidor o un
nombrealias de servidor es una serie de caracteres. Si no se proporciona ningún identificador, el valor
predeterminado es borrar los índices huérfanos de todos los servidores. La serie del identificador
debe ser un id_servidor válido que exista en la columna SERVERID o un nombre de alias de servidor
válido que exista en la columna ALIASNAME de la tabla QSYS2.SYSTEXTSERVERS. Si el
identificador puede convertirse a un valor entero, se interpreta como idservidor. Si el identificador no
puede convertirse a un valor entero, se interpreta como nombrealias de servidor.
El tipo de datos de este parámetro es VARCHAR(128).
Ejemplo
v Borrar todos los índices huérfanos:
Call SYSPROC.SYSTS_CLEAR_INDEXES();
v Borrar los índices huérfanos de un servidor específico con el ID 50:
Call SYSPROC.SYSTS_CLEAR_INDEXES(50);
Call SYSPROC.SYSTS_CLEAR_INDEXES(’50’);
v Borrar los índices huérfanos de un servidor específico con el nombre de alias “Local_server”:
OmniFind Text Search Server
81
Call SYSPROC.SYSTS_CLEAR_INDEXES(’Local_server’);
v Borrar implícitamente índices huérfanos:
CALL SYSPROC.SYSTS_START();
CALL SYSPROC.SYSTS_START(50);
Nota: cuando la colección del servidor de búsqueda de texto se encuentra en un grupo de ASP
independientes, la hebra que llama al procedimiento almacenado SYSTS_CLEAR_INDEXES debe
ejecutarse en el espacio de nombres de la ASP independiente. Utilice el mandato Establecer grupo de
agrupaciones de almacenamiento auxiliar (SETASPGRP).
Para eliminar un índice huérfano de una ASP independiente iaspXXX, puede utilizar los siguientes
mandatos:
CL:
SETASPGRP(isapXXX)
SQL:
CALL SYSPROC.SYSTS_CLEAR_INDEXES( )
Nota: si utiliza System i® Navigator, pulse con el botón derecho del ratón el nombre de base de datos de
la ASP independiente y ejecute los scripts SQL.
Conceptos relacionados:
“Nombre de alias de servidor” en la página 11
Puede utilizar un nombre de alias de servidor para asignar un nombre significativo a un servidor.
Referencia relacionada:
“Tabla de administración QSYS2.SYSTEXTINDEXES” en la página 112
Puede visualizar información acerca de cada índice de búsqueda de texto en la tabla de administración
QSYS2.SYSTEXTINDEXES. Cada índice de búsqueda de texto tiene un nombre, un nombre de esquema y
un nombre de colección asociada en el servidor de búsqueda de texto.
“Buscar índices huérfanos y ausentes” en la página 87
Puede buscar índices huérfanos y ausentes mediante una función de tabla definida por usuario (UDTF)
SQL denominada QDBTS_LISTINXSTS.
SYSPROC.SYSTS_VALIDITYCHECK
Puede comprobar la validez de elementos de índice mediante el procedimiento almacenado SQL
SYSPROC.SYSTS_VALIDITYCHECK.
Sintaxis
Este procedimiento almacenado puede arreglar algunos elementos que no son válidos si se especifica el
parámetro autoFix.
>>-SYSPROC.SYSTS_VALIDITYCHECK (indexSchema, indexName, autoFix) -><
El calificador de esquema es SYSPROC.
Parámetros
indexSchema
Identifica el esquema del índice de búsqueda de texto. Si este parámetro es nulo, se utiliza el valor
del registro especial CURRENT SCHEMA correspondiente al invocante.
El tipo de datos de este parámetro es VARCHAR(128).
indexName
Identifica el nombre del índice de búsqueda de texto. El nombre del índice de búsqueda de texto,
junto con el esquema del índice, identifica de forma exclusiva el índice de texto completo en el
subsistema DB2. Debe especificar un valor que no sea nulo para este parámetro.
82
IBM i: OmniFind Text Search Server for DB2 for i
El tipo de datos de este parámetro es VARCHAR(128).
autoFix
Identifica si es necesario un arreglo automático. El valor de este parámetro sólo puede ser 0 o 1. Los
significados de estos valores son los siguientes:
0
Sólo se comprueba la validez del índice.
1
Se comprueba la validez del índice y se arreglan los elementos que no son válidos.
Nota:
Si se especifican valores que no son 0 o 1, se consideran 0.
El tipo de datos de este parámetro es INTEGER.
Restricciones: si tanto indexSchema como indexName se especifican como *NONE, el procedimiento
almacenado sólo comprueba la validez de los componentes comunes del producto.
SQL para SYSTS_VALIDITYCHECK
CREATE PROCEDURE SYSPROC.SYSTS_VALIDITYCHECK
(IN INDEXSCHEMA VARCHAR(128) CCSID 1208,
IN INDEXNAME VARCHAR(128) CCSID 1208,
IN AUTOFIX INTEGER)
EXTERNAL NAME QDBTSLIB.DSN5VALCHK
DYNAMIC RESULT SETS 0
LANGUAGE C
PARAMETER STYLE SQL
MODIFIES SQL DATA
PROGRAM TYPE MAIN
COMMIT ON RETURN NO
INHERIT SPECIAL REGISTERS
Ejemplos
v Para comprobar la validez de un índice, especifique el mandato siguiente desde cualquier interfaz de
SQL:
CALL SYSPROC.SYSTS_VALIDITYCHECK('indexSchema1’,’indexName1’,0)
v Para comprobar y arreglar un índice automáticamente:
CALL SYSPROC.SYSTS_VALIDITYCHECK('indexSchema1’,’indexName1’,1)
QDBTSLIB.QDBTS_ROWS_STATUS
Los usuarios pueden comprobar qué documentos no se han indexado satisfactoriamente utilizando el
procedimiento almacenado SQL QDBTSLIB.QDBTS_ROWS_STATUS después de llamar a
SYSTS_UPDATE.
Con este procedimiento almacenado, los usuarios pueden obtener un conjunto de resultados que presenta
los documentos que no se han indexado satisfactoriamente. Los usuarios también pueden optar por
generar una nueva tabla para almacenar información relacionada de los documentos que no se han
indexado satisfactoriamente.
Sintaxis
>>-QDBTSLIB.QDBTS_ROWS_STATUS (EsquemaÍndice, NombreÍndice, IndicadorConjuntoResultados,
EsquemaTabla, NombreTabla) -><
El calificador de esquema es QDBTSLIB.
OmniFind Text Search Server
83
Parámetro
Grupo de parámetros obligatorios
EsquemaÍndice
Identifica el esquema del índice de búsqueda de texto. Debe especificar un valor que no sea nulo
para este parámetro.
El tipo de datos de este parámetro es VARCHAR(128).
NombreÍndice
Identifica el nombre del índice de búsqueda de texto. El nombre del índice de búsqueda de texto con
el esquema de índice identifica de forma exclusiva el índice de texto completo en el subsistema DB2®.
Debe especificar un valor que no sea nulo para este parámetro.
El tipo de datos de este parámetro es VARCHAR(128).
Grupo de parámetros opcionales
IndicadorConjuntoResultados
Identifica si debe devolverse directamente el usuario el conjunto de resultados.
Si el IndicadorConjuntoResultados no se pasa o está establecido en cero, el conjunto de resultados se
devuelve al interlocutor.
Si el IndicadorConjuntoResultados se especifica y NO está establecido en cero, no se devuelve ningún
conjunto de resultados y el interlocutor puede consultar la tabla especificada por EsquemaTabla y
NombreTabla.
El tipo de datos de este parámetro es INTEGER.
EsquemaTabla
Identifica el esquema de tabla de la tabla. Si IndicadorConjuntoResultados se especifica y NO es cero,
este esquema debe existir.
NombreTabla
Identifica el nombre de tabla generado por este procedimiento almacenado. Si
IndicadorConjuntoResultados se especifica y NO es cero, este procedimiento almacenado creará una
tabla con este nombre de tabla.
Conjunto de resultados o estructura de tabla
TIME
TIMESTAMP
STATUS
INTEGER
TEXT_STATUSVARCHAR(50)
MESSAGE
VARCHAR(1024)
KEYCOLUMNNAMES
Depende de las columnas de clave definidas en la tabla base
TIME
Momento en que se ha lanzado el error/aviso. ..
STATUS, TEXT_STATUS
30
WARNING
este registro se ha indexado pero hay aviso acerca de él
40
ERROR
este registro no se ha indexado satisfactoriamente debido a algunos errores
50
FATAL
ERROR
este registro devuelve un error muy grave e interrumpe la indexación
84
IBM i: OmniFind Text Search Server for DB2 for i
MESSAGE
Muestra el código de error y el mensaje de error. De acuerdo con esta columna, los usuarios pueden
saber por qué el registro no se ha indexado satisfactoriamente.
KEYCOLUMNNAMES
Puede haber más de una columnas de clave especificada. Si es así, se devolverán todas las columnas
de clave. Cada nombre de columna de clave tendrá un prefijo 'PK_'.
Ejemplos
v
Para comprobar si el índice contiene un documento que no se indexado satisfactoriamente:
CALL QDBTSLIB.QDBTS_ROWS_STATUS(’indexSchema1’,’indexName1’)
El conjunto de resultados se devolverá directamente al interlocutor.
v Para generar una nueva tabla para almacenar el resultado:
CALL QDBTSLIB.QDBTS_ROWS_STATUS(’indexSchema1’,’indexName1’,1,’TableSchema’,’ResultTable’)
A continuación, los usuarios pueden consultar la tabla de resultados para obtener más información.
SELECT * FROM TABLESCHEMA.RESULTTABLE;
Supongamos que hay 2 columnas (K1, K2) de la tabla base que deben indexarse.
Para obtener las filas no indexadas de la usuario, los usuarios pueden utilizar la siguiente sentencia
SQL.
SELECT b.*,r.MESSAGE FROM TABLESCHEMA.RESULTTABLE r LFET JOIN BASETABLESCHEMA.BASETABLE b on r.PK_K1=b.K1 and r.PK_K2=b.K2;
A continuación, los usuarios pueden actualizar esa fila en función del mensaje devuelto y luego
invocar de nuevo SYSTS_UPDATE para indexar la nueva fila modificada.
Diccionarios de sinónimos
Un diccionario de sinónimos puede mejorar la calidad de los resultados de búsqueda.
Puede añadir un diccionario de sinónimos a una colección en cualquier momento.
Un diccionario de sinónimos consta de grupos de sinónimos que el usuario define en un archivo XML.
Por ejemplo:
<?xml version="1.0" encoding="UTF-8"?>
<synonymgroups version="1.0">
<synonymgroup>
<synonym>Paixão</synonym>
<synonym>amor</synonym>
<synonym>flor</synonym>
<synonym>linda</synonym>
</synonymgroup>
<synonymgroup>
<synonym>worldwide patent tracking system</synonym>
<synonym>wpts</synonym>
</synonymgroup>
</synonymgroups>
Añadir un diccionario de sinónimos a una colección:
La especificación de los grupos de sinónimos en un diccionario de sinónimos mejora la calidad de los
resultados de búsqueda de texto. El administrador de OMNIFIND tiene la autoridad y los privilegios
adecuados para ejecutar la herramienta de sinónimos e IBM Navigator for i.
v Para añadir un diccionario de sinónimos a una colección con la herramienta de sinónimos, siga estos
pasos:
1. Cree un archivo XML de sinónimos especificando los grupos de sinónimos, como se muestra en el
ejemplo siguiente:
<?xml version="1.0" encoding="UTF-8"?>
<synonymgroups version="1.0">
<synonymgroup>
OmniFind Text Search Server
85
<synonym>Paixão</synonym>
<synonym>amor</synonym>
<synonym>flor</synonym>
<synonym>linda</synonym>
</synonymgroup>
<synonymgroup>
<synonym>worldwide patent tracking system</synonym>
<synonym>wpts</synonym>
</synonymgroup>
</synonymgroups>
2. Copie el archivo XML de sinónimos en el servidor de búsqueda de texto.
3. Utilice la herramienta de sinónimos para añadir el diccionario de sinónimos a una colección.
Puede añadir un diccionario de sinónimos en modalidad de adición o en modalidad de
sustitución. Si añade un diccionario de sinónimos en modalidad de adición, los sinónimos nuevos
se añadirán al diccionario de sinónimos existente. Si añade un diccionario de sinónimos en
modalidad de sustitución, los sinónimos existentes se sustituirán por los sinónimos nuevos que ha
definido para el índice de búsqueda de texto.
Opción
Descripción
En IBM i, especifique el mandato siguiente (dentro de
la interfaz QSH):
synonymTool.sh importSynonym
-synonymFile <vía de acceso absoluta al archivo
XML de sinónimos>
-collectionName <nombre de colección>
-replace <[true|false]>
-configPath <vía de acceso absoluta
a la carpeta de configuración>
En un servidor Linux, especifique el mandato siguiente: synonymTool.sh importSynonym
-synonymFile <vía de acceso absoluta al archivo
XML de sinónimos>
-collectionName <nombre de colección>
-replace <[true|false]>
-configPath <vía de acceso absoluta
a la carpeta de configuración>
En un servidor Windows, especifique el mandato
siguiente:
synonymTool.bat importSynonym
-synonymFile <vía de acceso absoluta al archivo
XML de sinónimos>
-collectionName <nombre de colección>
-replace <[true|false]>
-configPath <vía de acceso absoluta
a la carpeta de configuración>
Si el formato del archivo XML no es válido o si está vacío, se devolverá un código de error.
v Para importar un diccionario de sinónimos a una colección desde IBM Navigator for i, siga estos pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > OmniFind > Lista de colecciones.
3. Pulse la colección con el botón derecho del ratón y seleccione Importar diccionario de sinónimos.
Eliminar un diccionario de sinónimos de una colección:
Utilice el script que se suministra para eliminar un diccionario de sinónimos de una colección.
El administrador de OMNIFIND debe recuperar el nombre de la colección de la que debe eliminarse el
diccionario de sinónimos.
Ejecute el script para eliminar un diccionario de sinónimos de una colección.
86
IBM i: OmniFind Text Search Server for DB2 for i
Opción
Descripción
En IBM i, especifique el mandato siguiente (dentro de
la interfaz QSH):
removeSynonym.sh
-collectionName <nombre de colección>
-configPath <vía de acceso absoluta
a la carpeta de configuración>
En un servidor Linux, especifique el mandato siguiente: removeSynonym.sh
-collectionName <nombre de colección>
-configPath <vía de acceso absoluta
a la carpeta de configuración>
En un servidor Windows, especifique el mandato
siguiente:
removeSynonym.bat
-collectionName <nombre de colección>
-configPath <vía de acceso absoluta
a la carpeta de configuración>
Si una base de datos tiene varios índices de búsqueda de texto, debe realizar esta tarea para cada una de
las colecciones correspondientes.
Buscar índices huérfanos y ausentes
Puede buscar índices huérfanos y ausentes mediante una función de tabla definida por usuario (UDTF)
SQL denominada QDBTS_LISTINXSTS.
Un índice puede quedar huérfano si se llama a un procedimiento almacenado SYSTS_DROP y el servidor
se detiene en el momento de ejecutar el procedimiento.
La función QDBTS_LISTINXSTS combina todos los índices de catálogo y colecciones del sistema de
archivos integrado del espacio de nombres actual en una sola tabla. La función decide qué agrupación de
almacenamiento auxiliar (ASP) independiente o *SYSBASE se establece. A continuación, explora el
directorio de colección de cada servidor de la ASP independiente o de *SYSBASE.
Para *SYSBASE, se comprueba cada uno de los directorios de servidor que se encuentran bajo
/QOpenSys/QIBM/ProdData/TextSearch. Para las ASP independientes, se comprueba cada uno de los
directorios de servidor que se encuentran bajo /el número de ASP/QOpenSys/QIBM/ProdData/TextSearch.
Por ejemplo, si el número de ASP independiente es 67, se comprueba cada uno de los directorios de
servidor situados bajo /67/QOpenSys/QIBM/ProdData/TextSearch.
Para la información de índice de catálogo, los datos se obtienen de la tabla de catálogo
QSYS2.SYSTEXTINDEXES. Si desea comprobar los servidores de una ASP independiente, emita el
mandato Establecer grupo de agrupaciones de almacenamiento auxiliar (SETASPGRP) antes de llamar a
esta función.
Si desea eliminar posibles índices huérfanos del sistema de archivos integrado una vez identificados,
utilice los procedimientos almacenados SYSPROC.SYSTS_REMOVE o SYSPROC.
SYSTS_CLEAR_INDEXES o la herramienta “Administración avanzada” en la página 88 (adminTool.sh).
Términos
Índice huérfano
Existe una colección (índice) en el directorio del sistema de archivos integrado del servidor, pero
no hay ningún índice correspondiente registrado en el catálogo QSYS2.SYSTEXTINDEXES.
Índice ausente
Existen índices de registro en el catálogo QSYS2.SYSTEXTINDEXES, pero no existe el directorio
de colección correspondiente.
OmniFind Text Search Server
87
Sintaxis
>>-QDBTS_LISTINXSTS(--null--)---><
Formato de retorno
La función QDBTS_LISTINXSTS devuelve la información de los índices detectados en una tabla. Consulte
el mandato SQL siguiente, utilizado para crear la UDTF.
SQL para LISTINXSTS UDTF
CREATE FUNCTION QDBTSLIB.QDBTS_LISTINXSTS()
RETURNS TABLE(COLLECTIONNAME VARCHAR(255),
INDEXID INTEGER,
INDEXSCHEMA VARCHAR(128),
INDEXNAME VARCHAR(128),
SERVERID INTEGER)
SPECIFIC qdbts_listinxsts
SCRATCHPAD
NO FINAL CALL
LANGUAGE C++
PARAMETER STYLE DB2SQL
EXTERNAL NAME ’QDBTSLIB/QDBTSSP(checkIndex)’;
Ejemplos
v Detectar todos los índices huérfanos:
SELECT COLLECTIONNAME, SERVERID
FROM TABLE(QDBTSLIB.QDBTS_LISTINXSTS()) AS T
WHERE T.INDEXSCHEMA IS NULL AND T.INDEXNAME IS NULL
v Detectar todos los índices ausentes:
SELECT INDEXSCHEMA, INDEXNAME
FROM TABLE(QDBTSLIB. QDBTS_LISTINXSTS()) AS T
WHERE T.COLLECTIONNAME is NULL
v Detectar los índices huérfanos en serverid = 2 de la ASP independiente iaspXXX:
CONNECT TO iaspXXX
SQL:
SELECT T.COLLECTIONNAME, S.SERVERPATH
FROM TABLE(QDBTSLIB.QDBTS_LISTINXSTS())
AS T LEFT OUTER JOIN QSYS2.SYSTEXTSERVERS S ON (T.SERVERID = S.SERVERID)
WHERE T.INDEXSCHMEA IS NULL AND T.INDEXNAME IS NULL AND T.SERVERID = 2
Referencia relacionada:
“SYSPROC.SYSTS_DROP” en la página 34
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_DROP para eliminar un índice de búsqueda
de texto definido mediante el procedimiento almacenado SYSPROC.SYSTS_CREATE.
“SYSPROC.SYSTS_REMOVE” en la página 78
Puede eliminar índices huérfanos con el procedimiento almacenado SQL SYSPROC.SYSTS_REMOVE.
“SYSTS_CLEAR_INDEXES” en la página 81
Puede eliminar índices huérfanos con el procedimiento almacenado SQL SYSPROC.
SYSTS_CLEAR_INDEXES. Otra forma implícita es invocar SYSTS_START directamente, que intenta borrar
índices huérfanos automáticamente.
“Tabla de administración QSYS2.SYSTEXTINDEXES” en la página 112
Puede visualizar información acerca de cada índice de búsqueda de texto en la tabla de administración
QSYS2.SYSTEXTINDEXES. Cada índice de búsqueda de texto tiene un nombre, un nombre de esquema y
un nombre de colección asociada en el servidor de búsqueda de texto.
Administración avanzada
Puede utilizar la herramienta de administración para la administración avanzada.
88
IBM i: OmniFind Text Search Server for DB2 for i
OmniFind Text Search Server for DB2 for i puede estar en ejecución cuando se utiliza la herramienta de
administración.
Puede utilizar la herramienta de administración para realizar las tareas siguientes:
v Comprobar el estado de las colecciones, como por ejemplo averiguar cuántos documentos están
presentes
v Suprimir colecciones huérfanas
v Notificar la versión del servidor
v Notificar todas las colecciones que se encuentran en el servidor de búsqueda de texto
Mandatos
El mandato emitido para ejecutar la herramienta de administración dependerá del sistema operativo en el
que esté instalado el servidor de búsqueda de texto. El mandato también depende de la tarea que se
desea realizar.
Tabla 31. Mandatos destinados a comprobar el estado de las colecciones y a suprimir colecciones huérfanas
En IBM i (dentro de la interfaz
QSH)
En un servidor Linux
En un servidor Windows
adminTool.sh -[delete|status]
–collectionName <nombre colección>
-configPath <vía de acceso absoluta
a la carpeta de configuración>
adminTool.sh -[delete|status]
–collectionName <nombre colección>
-configPath <vía de acceso absoluta
a la carpeta de configuración>
adminTool.bat -[delete|status]
–collectionName <nombre colección>
-configPath <vía de acceso absoluta
a la carpeta de configuración>
Tabla 32. Mandatos destinados a visualizar la versión del servidor y a notificar todas las colecciones
En IBM i (dentro de la interfaz
QSH)
En un servidor Linux
En un servidor Windows
adminTool.sh -[version]
adminTool.sh -[version|reportAll] adminTool.bat -[version|reportAll]
-configPath <vía de acceso absoluta -configPath <vía de acceso absoluta -configPath <vía de acceso absoluta
a la carpeta de configuración>
a la carpeta de configuración>
a la carpeta de configuración>
Opciones
status
Comprueba el estado de la colección.
delete
Especifica que el usuario desea suprimir la colección huérfana.
version
Visualiza la versión del servidor.
reportAll
Notifica todas las colecciones que se encuentran en el servidor de búsqueda de texto.
Ejemplo
Para averiguar la versión del servidor, especifique el mandato siguiente en un servidor Linux:
adminTool.sh –version -s <vía de acceso absoluta al archivo config.xml del servidor>
Si utiliza un servidor Windows, se le suministrará un script .bat correspondiente.
OmniFind Text Search Server
89
Herramienta ServerInstance
Puede utilizar la herramienta ServerInstance para crear o suprimir servidores de *SYSBASE o de una
agrupación de almacenamiento auxiliar (ASP) independiente. También puede utilizar la herramienta
ServerInstance para enlazar archivos de un servidor con el servidor en el que está instalado OmniFind
Text Search Server for DB2 for i.
Por omisión, OmniFind Text Search Server for DB2 for i se instala en el directorio /QOpenSys/QIBM/
ProdData/TextSearch/server1.
Puede utilizar la herramienta ServerInstance para realizar las tareas siguientes antes de utilizarla para
detener server1 en *SYSBASE:
v Crear un servidor en *SYSBASE o en ASP independientes
v Suprimir un servidor de *SYSBASE o de ASP independientes
v Enlazar archivos de un servidor con server1
Sintaxis
ServerInstance.sh –[create|delete|relink]
–servernum <número_servidor>
(-port <puerto>)
(-device <nombre_dispositivo>)
Opciones de mandato
create
Crea un servidor.
delete
Suprime un servidor.
relink
Enlaza archivos de un servidor con server1.
Nota: Esta opción no es necesaria una vez instalado el arreglo temporal de programa (PTF) SI31548
en el sistema. El sistema procesa automáticamente la operación de enlace si tiene instalado este PTF.
Parámetros
número_servidor
Especifica el número de servidor. Por ejemplo, si se crea un servidor con el número 3, el directorio
del servidor será /QOpenSys/QIBM/ProdData/TextSearch/server3.
puerto
Especifica el puerto del servidor. Este parámetro sólo es necesario al crear un servidor.
dispositivo
Especifica el nombre de la ASP independiente. Este parámetro sólo es necesario cuando la operación
se realiza en la ASP independiente.
Ejemplos
v Para crear un servidor con el número de servidor 2 y el número de puerto 50000 en *SYSBASE:
ServerInstance.sh -create -servernum 2 -port 50000
v Para crear un servidor con el número de servidor 3 y el número de puerto 50001 en la ASP
independiente iasp1:
ServerInstance.sh -create -servernum 3 -port 50001 -device iasp1
v Para suprimir un servidor con el número de servidor 2 de *SYSBASE:
ServerInstance.sh -delete -servernum 2
v Para suprimir un servidor con el número de servidor 3 de la ASP independiente iasp1:
90
IBM i: OmniFind Text Search Server for DB2 for i
ServerInstance.sh -delete -servernum 3 -device iasp1
v Para enlazar archivos de un servidor con el número de servidor 2 de *SYSBASE:
ServerInstance.sh -relink -servernum 2
v Para enlazar archivos de un servidor con el número de servidor 3 de la ASP independiente iasp1:
ServerInstance.sh -relink -servernum 3 -device iasp1
Health Checker
Health Checker es una herramienta de verificación de entorno que puede utilizarse para diagnosticar
cualquier problema de configuración de OmniFind Text Search Server for DB2 for i. Puede utilizarse para
verificar que los índices y servidores de texto de OmniFind Text Search Server for DB2 for i están
funcionando correctamente y generará un informe con avisos o errores de los posibles problemas
encontrados.
Requisitos previos
El comprobador de funcionamiento de OmniFind Text Search Server for DB2 for i se basa en ARE
(Application Runtime Expert for i, producto 5770-ARE). Por tanto, ARE debe estar instalado para poder
ejecutar esta herramienta.
Procedimientos de Health Checker
Health checker se invoca mediante una serie de procedimientos almacenados SQL de DB2. Los
procedimientos pueden invocarse a través de cualquier interfaz SQL, incluyendo lenguajes de alto nivel
como RPG y COBOL. Toda la información, incluidos los avisos o errores, se devuelve a través de un
conjunto de resultados correspondiente.
SYSPROC.SYSTS_HC_GENERAL()
Este procedimiento almacenado se utiliza para comprobar el estado general del producto OmniFind Text
Search Server for DB2 for i. El procedimiento comprueba la configuración del producto. Este es un
ejemplo que devuelve todos los mensajes de aviso y de error relacionados con la información de
configuración general de OmniFind Text Search Server for DB2 for i:
> CALL SYSPROC.SYSTS_HC_GENERAL();
SYSPROC.SYSTS_HC_USR_AUTH()
Este procedimiento almacenado se utiliza para identificar los problemas de autorización del usuario
invocante que podrían impedirle utilizar OmniFind Text Search Server for DB2 for i para las búsquedas.
Este es un ejemplo que devuelve los avisos o errores relativos a las autorizaciones del usuario invocante:
> CALL SYSPROC.SYSTS_HC_USR_AUTH();
SYSPROC.SYSTS_HC_IDX()
Este procedimiento almacenado se utiliza para comprobar todos los índices de texto de OmniFind Text
Search Server for DB2 for i para asegurarse de que están en un estado válido. Nota: si utiliza un grupo
de IASP (agrupación de almacenamiento auxiliar independiente), esto sólo se aplica al grupo de IASP
actualmente activo en el trabajo.
SYSSTS.HC_SVR()
Este procedimiento almacenado se utiliza para comprobar el estado de todos los servidores de texto
locales de OmniFind Text Search Server for DB2 for i que se han definido.
OmniFind Text Search Server
91
Información adicional
Encontrará más información sobre el comprobador de estado de OmniFind Text Search Server for DB2 for
i, incluidas diversas opciones adicionales de procedimientos almacenados, así como una interfaz de
QShell, en developerWorks OmniFind Text Search Server for DB2 for i bajo el artículo ’Health Checker’.
Consideraciones relativas a las ASP independientes para OmniFind
Text Search Server for DB2 for i
Puede administrar un índice de búsqueda de texto en una agrupación de almacenamiento auxiliar (ASP)
independiente. La ASP puede conmutarse entre varios sistemas, por lo que existen consideraciones
adicionales.
Durante la instalación de OMNIFIND, se crea un servidor de búsqueda de texto local. En el caso de las
ASP independientes, un administrador crea un servidor de texto local mediante la herramienta
ServerInstance (ServerInstance.sh) una vez creado el grupo de ASP independientes.
Después de crear un servidor de búsqueda de texto local en la ASP independiente, los datos de índice
existen en el sistema de archivos de la ASP independiente. Los datos están disponibles si la ASP
independiente se conmuta a otro sistema. El administrador sólo necesita crear un servidor de búsqueda
de texto local una vez para cada grupo de ASP independientes.
Los índices de búsqueda de texto que se encuentran en la ASP independiente deben estar contenidos en
servidores de búsqueda de texto definidos en la ASP independiente. No es posible visualizar un servidor
de búsqueda de texto definido en otro grupo de ASP independientes o en la ASP del sistema cuando el
trabajo está conectado a la ASP independiente.
Para crear un servidor de búsqueda de texto en una ASP independiente denominada miiasp, siga estos
pasos:
1. Active la ASP independiente con el mandato CL Trabajar con estado de configuración (WRKCFGSTS)
o mediante System i Navigator.
2. Conéctese al espacio de nombres del grupo de ASP independientes mediante el mandato CL
Establecer grupo de agrupaciones auxiliares (SETASPGRP).
3. Utilice el script ServerInstance.sh para crear un servidor de búsqueda de texto.
A continuación figura un ejemplo del mandato QSH que debe utilizarse:
/QOpenSys/QIBM/ProdData/TextSearch/ServerInstance.sh -create
-servernum 2 -port nnnnn -device miiasp
En el mandato, nnnnn es un número de puerto disponible para el servidor. Este número de puerto
debe estar disponible en todos los sistemas a los que el grupo de ASP independientes pueda
conmutarse.
Una vez definido un servidor de búsqueda de texto para el grupo de ASP independientes, pueden
utilizarse los procedimientos almacenados administrativos para iniciar y detener el servidor de búsqueda
de texto. Los procedimientos almacenados también pueden utilizarse para crear, eliminar y actualizar
índices de búsqueda de texto.
Nota: Cuando se activa la ASP independiente, se añaden entradas de planificador de trabajos para los
índices con actualizaciones planificadas existentes en la ASP independiente. Las entradas del planificador
de trabajos permiten continuar con las actualizaciones planificadas aunque la ASP independiente se
conmute entre sistemas.
92
IBM i: OmniFind Text Search Server for DB2 for i
Restricciones de utilización de índices de búsqueda de texto y ASP
independientes
v Todos los sistemas a los que la ASP independiente puede conmutarse deben tener instalado OmniFind
Text Search Server for DB2 for i y estar al mismo nivel de arreglo temporal de programa (PTF).
v No cree índices de búsqueda de texto en una ASP que no sea aquella sobre la que se ha creado el
índice de tabla.
v Los catálogos de sistema SYSTEXTSERVERS, SYSTEXTINDEXES, SYSTEXTDEFAULTS,
SYSTEXTCOLUMNS y SYSTEXTCONFIGURATION no contienen registros para índices y servidores
definidos en un grupo de ASP diferente, incluida la ASP del sistema. Los catálogos contienen sólo filas
para índices y servidores definidos para el grupo de ASP independientes al que el trabajo está
conectado.
v Los procedimientos almacenados administrativos sólo pueden utilizarse para realizar funciones en
servidores de búsqueda de texto e índices definidos en el grupo de ASP independientes al que el
trabajo está conectado.
Nota: Puede utilizar las sentencias SQL CONTAINS y SCORE cuando un trabajo esté conectado a un
grupo de ASP independientes, aunque la columna esté basada en una tabla existente en la ASP del
sistema.
Alta disponibilidad
Puede implementar una solución de alta disponibilidad que incluya índices de búsqueda de texto
utilizando API y mandatos existentes. Ahora, DB2 for IBM i reconoce los índices de búsqueda de texto y
realiza acciones especiales durante las operaciones de DB2 que afectan a dichos índices.
Consideraciones especiales relativas a índices de búsqueda de texto, alta disponibilidad y
administración de bases de datos
v Un mandato de supresión de archivo (mandato CL DLTF) o una sentencia SQL DROP VIEW ejecutados
con respecto a la vista que representa el índice de búsqueda de texto provoca la eliminación del
mismo. La eliminación falla si se ejecuta bajo control de compromiso.
v Al restaurar una tabla o archivo físico que se ha salvado con un índice de búsqueda de texto a partir
de una columna no habilita los desencadenantes creados para el índice de búsqueda de texto antes de
la operación de salvar. Si más adelante se restaura o crea el índice de búsqueda de texto, los
desencadenantes se añaden como parte de la creación del índice. Este método permite que las
aplicaciones funcionen aunque el índice de búsqueda de texto construido originariamente a partir de la
tabla no se restaure o cree.
Reproducción de entradas de diario para procedimientos almacenados administrativos de OmniFind
v La reproducción de la entrada de diario (API QDBRPLAY) para la creación de la vista que representa el
índice de búsqueda de texto provoca la creación del índice de búsqueda de texto.
v La adición y eliminación de los desencadenantes en la tabla base durante las llamadas a los
procedimientos SYSTS_CREATE o SYSTS_DROP no provoca el registro de entradas de diario.
v Una llamada al procedimiento almacenado SYSTS_UPDATE o SYSTS_REPRIMEINDEX da como
resultado el registro de una entrada de diario con respecto a la vista del índice de búsqueda de texto.
Una repetición de esta entrada de diario mediante la API QDBRPLAY provoca la repetición de la
llamada al procedimiento correcto.
v Las actualizaciones planificadas automáticamente NO dan como resultado entradas de diario para el
índice y no pueden reproducirse.
v Una llamada a SYSTS_ALTER provoca un cambio de entrada de diario en la vista. Una repetición de la
entrada de diario mediante la API QDBRPLAY provoca la repetición de la llamada a SYSTS_ALTER.
Recomendaciones con respecto a la alta disponibilidad
OmniFind Text Search Server
93
Si desea implementar una solución de alta disponibilidad, tenga en cuenta las siguientes
recomendaciones:
v Después de crear el índice de búsqueda de texto en el sistema primario, puede utilizarse la API
QDBRPLAY para repetir la creación en el sistema de copia de seguridad.
v El sistema de copia de seguridad contiene ahora un índice duplicado, con actualizaciones planificadas
que se producen con la misma frecuencia que en el sistema primario.
v A medida que los cambios de registro se reproducen en los sistemas de copia de seguridad basados en
la tabla, se registran en la tabla intermedia del sistema de copia de seguridad.
v Las llamadas a SYSTS_UPDATE, SYSTS_REPRIMEINDEX y SYSTS_ALTER en el sistema primario
generan entradas de diario que pueden reproducirse en el sistema de copia de seguridad.
v NO es necesario que los clientes registren por diario y repliquen los archivos IFS para los índices de
búsqueda de texto.
v Es necesario asegurarse de que los desencadenantes que se han añadido como parte de
SYSTS_CREATE estén habilitados para registrar los cambios en la tabla base. Estos desencadenantes
pueden identificarse mediante el prefijo especial "QDBTS" en el nombre del desencadenante.
Mandato CL Aplicar cambios de diario (APYJRNCHG)
Puede utilizarse el mandato CL Aplicar cambios de diario (APYJRNCHG) para reproducir sucesos de
OmniFind. Los usuarios que deseen utilizar este mandato deben considerar cuidadosamente el orden en
que se reproducen las entradas de diario. La tabla intermedia de QSYS2 debe sincronizarse exactamente
con la tabla base en el momento de reproducir o invocar SYSTS_UPDATE.
Los cambios de registro que se aplican a la tabla base NO se registran en la tabla intermedia durante el
proceso de APYJRNCHG. En algunos casos puede ser necesario llamar al procedimiento almacenado
SYSTS_REPRIMEINDEX para reconstruir el índice después de utilizar este mandato.
Referencia relacionada:
“SYSPROC.SYSTS_REPRIMEINDEX” en la página 80
Puede ajustar (reprime) el índice e iniciar una actualización inicial mediante el procedimiento almacenado
SYSPROC.SYSTS_REPRIMEINDEX. Utilice este procedimiento almacenado cuando desee restaurar datos
desde la tabla base.
Análisis del rendimiento
El análisis de rendimiento de OMNIFIND incluye la elección de la definición de índice correcta, el
manejo eficiente de los documentos y la especificación de una búsqueda selectiva.
Segundo plano
El proceso de OmniFind es una combinación de tareas en un trabajo 'cliente' de componente frontal y de
tareas en un trabajo 'servidor' de segundo plano, que se intercomunican. La comunicación se realiza
mediante conexiones de socket estándar.
El trabajo cliente lee los registros de la tabla de base de datos adecuada durante las construcciones y el
mantenimiento del índice. Procesa el registro de los cambios de tabla, envía los documentos para el
proceso y maneja las solicitudes de búsqueda de texto mediante las funciones SQL CONTAINS o SCORE.
El trabajo cliente es aquel en el que se ejecuta el procedimiento, por ejemplo SYSTS_CREATE o
SYSTS_UPDATE, o la consulta con CONTAINS o SCORE. El rendimiento del trabajo cliente depende de
la rapidez de proceso de las acciones de base de datos y la recuperación y transporte eficientes de
documentos de texto al trabajo servidor.
El trabajo servidor analiza los documentos enviados desde el trabajo cliente, mantiene el índice de texto
asociado con las inserciones y supresiones y maneja las solicitudes de búsqueda dentro del índice. El
rendimiento del trabajo servidor depende de su capacidad para comunicarse con los trabajos cliente y
94
IBM i: OmniFind Text Search Server for DB2 for i
para manejar los documentos de forma eficiente. Generalmente hay un único trabajo servidor que da
servicio a varios trabajos cliente. En consecuencia, el trabajo servidor es un trabajo multihebra para que
pueda manejar varios clientes.
Un índice de texto no se actualiza inmediatamente con los cambios realizados en la tabla de base de
datos subyacente. En lugar de ello, los cambios de registro de la tabla se registran mediante una
combinación de un desencadenante de base de datos y una tabla intermedia. La tabla intermedia registra
el tipo de actualización (inserción, actualización o supresión) junto con una indicación de qué registro de
la tabla de base de datos ha cambiado. En el archivo de registro no se captura el texto cambiado; sólo la
información que identifica el registro que ha cambiado.
Los cambios en los registros de la tabla no se reflejan en el índice de texto, y en consecuencia tampoco en
las búsquedas con CONTAINS o SCORE, hasta la próxima operación SYSTS_UPDATE satisfactoria.
Las actualizaciones de un índice de texto posteriores a la actualización inicial se denominan
actualizaciones incrementales. Estas actualizaciones añaden o suprimen documentos del índice de texto
en función de los cambios de registro efectuados en la tabla subyacente desde la última actualización.
Los cambios realizados en la tabla base se registran en una tabla intermedia. En una actualización
incremental, la tabla intermedia se utiliza para determinar qué registros de la tabla base han cambiado.
Dichos registros se leen más adelante de la tabla base y su contenido actualizado se refleja en el índice.
La actualización inicial es un proceso más eficiente, por fila, que una actualización incremental. La tabla
base se procesa sin necesidad de procesar también la tabla intermedia. Por tanto, es una técnica
aconsejable de cara al rendimiento realizar la actualización inicial en el índice de texto después de llenar
inicialmente la tabla subyacente. Esta técnica minimiza el tiempo necesario para llenar el índice con los
documentos.
Una opción de configuración importante relacionada con el rendimiento es UPDATEAUTOCOMMIT. Este
valor define la frecuencia con la que el trabajo cliente de la base de datos interrumpe el proceso de
documentos. El cliente espera a que el trabajo servidor confirme que ha procesado todos los documentos
que se le han enviado actualmente. UPDATEAUTOCOMMIT se utiliza como método de punto de
comprobación para que la base de datos pueda establecer límites de trabajo finalizado.
Si la actualización del índice se interrumpe y prosigue más adelante, el proceso se reinicia en el límite del
punto de comprobación. Al igual que en cualquier interrupción, un límite de punto de comprobación
obliga a la suspensión del flujo de documentos y a la eliminación de los documentos de la interconexión
entre el cliente y el servidor; en otras palabras, se vacía de documentos. Este proceso de inicio y
detención puede tener un efecto negativo considerable sobre el rendimiento.
El valor predeterminado de UPDATEAUTOCOMMIT es 100, que proporciona puntos de comprobación
frecuentes. Si se establece en un valor superior, generalmente se produce un rendimiento de tiempo de
respuesta mejor para las llamadas a SYSTS_UPDATE. Sin embargo, un valor superior no implica un
tiempo de recuperación mayor si la actualización se cancela y se reinicia.
El establecimiento de UPDATEAUTOCOMMIT es un número superior (o en cero, que significa que no se
producirán puntos de comprobación) proporciona el mejor rendimiento de tiempo de respuesta. Sin
embargo, si se cancela la actualización inicial, OmniFind debe reiniciarse desde el principio del índice
construido, debido a que no existe ningún punto de comprobación.
Para algunos clientes, un valor entre 5000 y 20000 ofrece un equilibrio razonable entre el rendimiento y la
recuperabilidad de puntos de comprobación.
OmniFind Text Search Server
95
Elegir la definición de índice correcta
Un índice de texto puede especificarse en cuatro tipos de configuración FORMAT: TEXT, HTML, XML e
INSO.
1. TEXT es generalmente el formato más eficiente. El texto se lee del registro de base de datos y se envía
al servidor de texto, que lo procesa directamente.
2. HTML se utiliza cuando se sabe que los documentos se encuentran en el formato de HyperText
Markup Language. El texto se procesa ignorando los valores de control de marcación del documento.
3. XML se utiliza cuando se sabe que los documentos se encuentran en el formato de Extensible Markup
Language. Se toma en especial consideración la naturaleza estructural del contenido de los
documentos, con seguimiento de elementos, atributos y la jerarquía interna del documento. La
marcación de un índice como XML ofrece la posibilidad de realizar búsquedas XML mediante el
lenguaje de búsqueda xmlxp (xpath) en las funciones CONTAINS y SCORE.
4. INSO se utiliza cuando el documento debe procesarse al revés (INSide Out). En este formato, se
presupone que el contenido de cada documento es más que texto simple. Cada documento se
preanaliza para determinar de qué tipo de documento se trata y, a continuación, se convierte a texto
sin formato. Los documentos INSO son generalmente documentos de tratamiento de texto enriquecido
generados por programas de tratamiento de texto.
Desde la perspectiva del rendimiento, el trabajo para indexar un documento aumenta al pasar del
formato TEXT al formato INSO. Aunque el formato INSO maneja texto simple, genera más carga global
que el formato TEXT, ya que tiene lugar un proceso de interpretación. Utilice TEXT cuando el documento
sea de texto simple en la columna de base de datos.
La opción de configuración LANGUAGE no es estrictamente necesaria, ya que OmniFind determina el
lenguaje del documento en función de la exploración. Sin embargo, si se conoce el lenguaje de los
documentos, el hecho de especificarlo en la opción LANGUAGE puede mejorar el rendimiento. Esto
limitará el volumen de interpretación que debe realizarse.
Manejar documentos de forma eficiente
Los trabajos cliente y servidor comunican la información del documento mediante UTF (Unicode
Transformation Format). Para convertir el documento a este formato, el cliente lo lee de la base de datos
y convierte los datos resultantes a UTF-8, también denominado CCSID 1208. Todos el texto se convierte a
UTF-8 antes de enviarlo al servidor.
Para mejorar el rendimiento, establezca la columna de texto que se indexa en el CCSID 1208 para evitar
esta conversión, mejorando con ello la eficiencia del proceso de manejo de documentos.
Utilizar SYSTS_REPRIMEINDEX en lugar de SYSTS_UPDATE para obtener una
posible mejora de rendimiento
SYSTS_REPRIMEINDEX y SYSTS_UPDATE se utilizan para actualizar el índice de búsqueda de texto.
SYSTS_REPRIMEINDEX se utiliza para volver a crear el índice. SYSTS_UPDATE se utiliza para actualizar
el índice con los cambios incrementales utilizados después de la última actualización satisfactoria. En
algunos casos, SYSTS_REPRIMEINDEX puede funcionar mejor que SYSTS_UPDATE.
Para determinar si SYSTS_REPRIMEINDEX funcionará mejor que SYSTS_UPDATE, compruebe la
columna PENDINGCOUNT de la vista Índice de búsqueda de texto. La columna PENDINGCOUNT
indicará cuántas filas tendrán que modificarse para el próximo proceso de actualización. Si el usuario ha
actualizado el mismo registro en la tabla base 10 veces, la columna PENDINGCOUNT se incrementará en
10. Por tanto, si el usuario actualiza la tabla base con frecuencia, la columna PENDINGCOUNT
aumentará. En la mayoría de los casos, si la columna PENDINGCOUNT es mayor que el número total de
la tabla base, el procedimiento SYSTS_REPRIMEINDEX será la mejor opción en lugar de
SYSTS_UPDATE.
96
IBM i: OmniFind Text Search Server for DB2 for i
Especificar una búsqueda selectiva
Las búsquedas de texto se realizan mediante las funciones CONTAINS o SCORE dentro de una sentencia
de consulta SQL. Estas búsquedas comparan los criterios de búsqueda de la función con los documentos
asociados con la columna en la que se busca. Los registros coincidentes se identifican y seleccionan. El
trabajo cliente envía la solicitud de búsqueda al servidor y recibe la respuesta con respecto a si se ha
encontrado una coincidencia.
Al igual que en todos los criterios de búsqueda, cuanto más selectiva sea la búsqueda, más eficiente
resultará. La búsqueda de frases habituales, como por ejemplo el artículo 'the' en el idioma inglés,
produce numerosas coincidencias y puede afectar negativamente al rendimiento. En la práctica, es
improbable que una búsqueda de este tipo proporcione información significativa. La especificación de
frases de búsqueda más selectivas producirá menos coincidencias más significativas.
Generalmente, la utilización de CONTAINS en la cláusula WHERE de una sentencia SQL ofrece un mejor
rendimiento que utilizar AND para otros criterios. Por ejemplo:
SELECT bn, pubdate, description
FROM myBooks
WHERE CONTAINS(description,’Alladin’) = 1
AND Pubdate > '2004-01-01’
Utilizar CONTAINS y SCORE
El optimizador puede mejorar el rendimiento de las funciones CONTAINS y SCORE combinando
internamente y sustituyendo estas funciones incorporadas por una función de tabla definido por el
usuario (UDTF). La UDTF devuelve una lista de documentos coincidentes en un resultado. En muchos
casos, este proceso de UDTF ofrece un mejor rendimiento que el proceso alternativo consistente en
invocar la función incorporada para cada registro para determinar si existe una coincidencia.
Para habilitar el optimizador para realizar la reescritura de la UDTF, la función CONTAINS debe:
v residir en la cláusula WHERE de la sentencia SQL
v estar conectada mediante "AND" a cada predicado adicional de la cláusula WHERE
v ser una comparación con el valor 1.
Por ejemplo, la cláusula:
WHERE CONTAINS(MyDocuments, ’java performance’) = 1
podría reescribirse mediante el optimizador en el formato de UDTF. Sin embargo, la cláusula:
WHERE CONTAINS(MyDocuments, ’java performance’) = 1 OR price >100
no podría reescribirse debido a que se aplica OR a CONTAINS para otros predicados.
Nota: cuando se habilita una reescritura de UDTF, el optimizador sigue utilizando la comparación de
coste para elegir el plan óptimo.
Referencia relacionada:
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado que
indica si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizando
criterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevancia
que mide hasta que punto un documento coincide con la consulta.
OmniFind Text Search Server
97
“SYSPROC.SYSTS_UPDATE” en la página 36
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_UPDATE para actualizar el índice de
búsqueda de texto a fin de reflejar el contenido actual de la columna de texto.
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
Consideraciones relativas a las transacciones
Tenga en cuenta el entorno al decidir la frecuencia con la que va a actualizar los índices de texto a partir
de los datos subyacentes de las tablas de base de datos.
Una consideración de amplio espectro para los usuarios de bases de datos tradicionales es el concepto de
límites de transacción y proceso de transacción. Un ejemplo clásico de ello es una transacción bancaria, en
la que se transfiere dinero de una cuenta a otra. La transferencia se considera una única transacción,
independientemente de que se realice o no. El cliente no deseará que el dinero se elimine de una cuenta
sin que aparezca en la otra hasta transcurrido algún tiempo. A su vez, el banco no desea que el dinero
aparezca en ambas cuentas durante algún tiempo hasta que la transacción se haya completado. La idea es
que, si se realiza un cambio, éste se refleje inmediatamente.
En gestión de la información existen muchos ejemplos en los que los retardos son más aceptables e
incluso esperados. En un diseño de depósito de datos tradicional, el contenido del depósito de datos
carece con frecuencia de los datos operativos durante horas, o incluso más tiempo. Esta aceptación del
retardo se basa en una combinación de expectativas realistas de un depósito de datos y el deseo de contar
con datos coherentes y previsibles.
Las búsquedas de texto no estructurado se sitúan en algún punto entre estos extremos. En la práctica, la
indexación de documentos de texto es un proceso intensivo consistente en analizar y dividir el
significado subyacente de las palabras del documento. Las búsquedas de texto permiten que una
búsqueda de ‘mice' (ratones, en inglés) encuentre los documentos que contienen ‘mouse' (ratón, en
inglés). Este resultado de búsqueda se produce debido a la capacidad de la técnica de indexación para
separar las palabras en sus significados subyacentes. Este análisis se realiza en el momento de indexar un
documento para que las búsquedas subsiguientes sean lo más rápidas posible.
Los usuarios de índices de bases de datos tradicionales esperan que el índice refleje el estado de los datos
en la tabla de base de datos. Esta expectativa no se cumple en el caso de un índice de texto. El contenido
del índice de texto refleja el estado de la tabla en función del momento en que se realizó la última
actualización (SYSTS_UPDATE).
En un entorno altamente cambiante, es improbable que el índice de texto refleje el estado actual de la
tabla en un momento dado. Sin embargo, en un entorno más previsible, en el que la tabla de base de
datos se actualice con menor frecuencia o se realice en modalidad de proceso por lotes, las
actualizaciones del índice de texto pueden temporizarse para que se realicen después de la actualización
de la tabla, reflejando exactamente el estado de ésta.
Es importante que las expectativas con respecto a un índice de texto sean adecuadas. Utilice la opción
UPDATE FREQUENCY en los procedimientos “SYSPROC.SYSTS_CREATE” en la página 19 o
“SYSPROC.SYSTS_UPDATE” en la página 36 del índice de texto o llame explícitamente al procedimiento
SYSTS_UPDATE para actualizar adecuadamente el contenido del índice de texto.
Para entornos más estáticos, como por ejemplo cargas de datos masivas, es aconsejable temporizar la
actualización del índice de texto para que se produzca una vez realizada la carga masiva. En entornos
más orientados a transacciones, puede establecerse el valor UPDATE FREQUENCY en una duración más
98
IBM i: OmniFind Text Search Server for DB2 for i
corta o invocarse con frecuencia el procedimiento SYSTS_UPDATE. Normalmente, cuanto mayor es la
frecuencia de actualización, mayor es la carga de trabajo a la que se somete la máquina.
Referencia relacionada:
“Tabla de administración QSYS2.SYSTEXTINDEXES” en la página 112
Puede visualizar información acerca de cada índice de búsqueda de texto en la tabla de administración
QSYS2.SYSTEXTINDEXES. Cada índice de búsqueda de texto tiene un nombre, un nombre de esquema y
un nombre de colección asociada en el servidor de búsqueda de texto.
Utilización de IBM Navigator for i
Puede administrar los servidores de búsqueda de texto e índices de búsqueda de texto de OmniFind
mediante IBM Navigator for i.
1. En la ventana de IBM Navigator for i, expanda el sistema que desea utilizar.
2. Expanda Bases de datos.
3. Expanda la base de datos con la que desee trabajar.
4. Seleccione Búsqueda de texto de OmniFind.
Trabajar con servidores de búsqueda de texto
Puede iniciar y detener los servidores de búsqueda de texto de OmniFind y crear un índice de búsqueda
de texto mediante IBM Systems Director Navigator for i.
Visualizar el estado de los Servidores de texto de OmniFind:
1. Seleccione la carpeta Servidores de texto en el panel derecho.
2. Visualice el estado de los servidores de búsqueda de texto configurados actualmente en el sistema en
el panel derecho.
3. Seleccione Renovar para renovar la lista de servidores.
OmniFind Text Search Server
99
Iniciar y detener los Servidores de texto de OmniFind:
1. Seleccione el recuadro situado junto al ID de servidor seleccionado en el panel derecho.
2. En el menú Acciones, seleccione una de las acciones siguientes:
v Iniciar servidor
v Detener servidor
v Crear un índice de búsqueda de texto
Crear un índice de búsqueda de texto:
100
IBM i: OmniFind Text Search Server for DB2 for i
Trabajar con índices de búsqueda de texto
Puede realizar operaciones sobre cualquier índice de búsqueda de texto de un sistema mediante IBM
Systems Director Navigator for i.
Visualizar los índices de texto de OmniFind para un servidor de texto:
1.
2.
3.
4.
5.
En la ventana de IBM Systems Director Navigator, expanda el sistema que desee utilizar.
Expanda Bases de datos.
Expanda la base de datos con la que desee trabajar.
Seleccione Búsqueda de texto de OmniFind.
Seleccione Servidores de texto.
6. Seleccione el servidor de texto con el que desee trabajar. Los índices correspondientes a ese servidor
se visualizarán en el panel derecho.
OmniFind Text Search Server
101
Visualizar los índices de texto de OmniFind para este sistema:
1. Seleccione Búsqueda de texto de OmniFind.
2. Seleccione Índices de texto. Estos índices son todos los índices de búsqueda de texto correspondientes
a este sistema en la partición actual.
Realizar operaciones sobre un índice de texto:
102
IBM i: OmniFind Text Search Server for DB2 for i
1. Seleccione en el panel derecho el recuadro correspondiente al índice con el que desee trabajar.
2. Pulse Seleccionar acción en el recuadro situado en la parte superior del panel.
v Definición
v Actualización
v Reinicialización
v Supresión
v Descripción
Visualizar los índices de texto de OmniFind para un esquema:
1. En la ventana de IBM Systems Director Navigator, expanda el sistema que desee utilizar.
2. Expanda Bases de datos.
3. Expanda la base de datos con la que desee trabajar.
4. Expanda Esquemas.
5. Expanda el esquema con el que desee trabajar.
6. Seleccione Índices de texto de OmniFind. Estos índices son todos los índices de búsqueda de texto
correspondientes a este esquema.
Visualizar construcciones de índice de búsqueda de texto:
Puede visualizar los índices de texto que la base de datos está construyendo mediante IBM Systems
Director Navigator. Esta vista resulta de utilidad para determinar cuándo quedan disponibles los índices
de búsqueda de texto para las aplicaciones.
Para visualizar los índices de búsqueda que se están construyendo, siga estos pasos:
1. En la ventana de IBM Systems Director Navigator, expanda el sistema que desee utilizar.
OmniFind Text Search Server
103
2.
3.
4.
5.
Expanda Bases de datos.
Expanda la base de datos con la que desee trabajar.
Seleccione Mantenimiento de base de datos.
Seleccione Construcciones de índice de texto.
Este panel sólo muestra las actualizaciones de índice de búsqueda de texto en proceso. Si no hay
actualizaciones o ajustes ejecutados actualmente en el sistema, estará vacío.
Utilizar System i Navigator
Puede administrar los servidores de búsqueda de texto e índices de búsqueda de texto de OmniFind
mediante System i Navigator.
1. En la ventana de System i Navigator, expanda el sistema que desee utilizar.
2. Expanda Bases de datos.
3. Expanda la base de datos con la que desee trabajar.
4. Seleccione Búsqueda de texto de OmniFind.
104
IBM i: OmniFind Text Search Server for DB2 for i
Trabajar con servidores de búsqueda de texto
Puede iniciar y detener los servidores de búsqueda de texto de OmniFind y crear un índice de búsqueda
de texto mediante System i Navigator.
Visualizar el estado de los Servidores de texto de OmniFind:
1. Seleccione la carpeta Servidores de texto en el panel derecho.
2. Visualice el estado de los servidores de búsqueda de texto configurados actualmente en el sistema en
el panel derecho.
3. Seleccione F5 para renovar la lista de servidores.
OmniFind Text Search Server
105
Iniciar y detener los Servidores de texto de OmniFind:
1. Seleccione el ID de servidor seleccionado en el panel derecho.
2. Pulse el botón derecho del ratón para visualizar las opciones:
v Iniciar servidor
v Detener servidor
v Crear un índice de búsqueda de texto
Crear un índice de búsqueda de texto:
106
IBM i: OmniFind Text Search Server for DB2 for i
Trabajar con índices de búsqueda de texto
Puede realizar operaciones sobre cualquier índice de búsqueda de texto de un sistema mediante System i
Navigator.
Visualizar los índices de texto de OmniFind para un servidor de texto:
1.
2.
3.
4.
5.
6.
En la ventana de System i Navigator, expanda el sistema que desee utilizar.
Expanda Bases de datos.
Expanda la base de datos con la que desee trabajar.
Seleccione Búsqueda de texto de OmniFind.
Seleccione Servidores de texto.
Seleccione el servidor de texto con el que desee trabajar. Los índices correspondientes a ese servidor
se visualizarán en el panel derecho.
OmniFind Text Search Server
107
Visualizar los índices de texto de OmniFind para este sistema:
1. Seleccione Búsqueda de texto de OmniFind.
2. Seleccione Índices de texto. Los índices mostrados son todos los índices de búsqueda de texto
correspondientes a este sistema en la partición actual.
108
IBM i: OmniFind Text Search Server for DB2 for i
Realizar operaciones sobre un índice de texto:
1. Seleccione en el panel derecho un índice con el que desee trabajar.
2. Pulse el índice con el botón derecho del ratón.
3. Seleccione una operación:
v actualizar
v
v
v
v
v
ajustar
suprimir
ver descripción
ver definición
modificar definición
Visualizar los índices de texto de OmniFind para un esquema:
1. En la ventana de System i Navigator, expanda el sistema que desee utilizar.
2.
3.
4.
5.
6.
Expanda Bases de datos.
Expanda la base de datos con la que desee trabajar.
Expanda Esquemas.
Expanda el esquema con el que desee trabajar.
Seleccione Índices de texto de OmniFind. Estos índices son todos los índices de búsqueda de texto
correspondientes a este esquema.
OmniFind Text Search Server
109
Visualizar construcciones de índice de búsqueda de texto:
Puede visualizar los índices de texto que la base de datos está construyendo mediante System i
Navigator. Esta vista resulta de utilidad para determinar cuándo quedan disponibles los índices de
búsqueda de texto para las aplicaciones.
Para visualizar los índices de búsqueda que se están construyendo, siga estos pasos:
1.
2.
3.
4.
5.
En la ventana de System i Navigator, expanda el sistema que desee utilizar.
Expanda Bases de datos.
Expanda la base de datos con la que desee trabajar.
Expanda Mantenimiento de base de datos.
Seleccione Construcciones de índice de texto.
Este panel sólo muestra las actualizaciones de índice de búsqueda de texto en proceso. Si no hay
actualizaciones o ajustes ejecutados actualmente en el sistema, estará vacío.
110
IBM i: OmniFind Text Search Server for DB2 for i
Tablas de administración de búsqueda de texto
Puede dar soporte a los servidores e índices de búsqueda de texto mediante las tablas de administración
de QSYS2.
Tabla de administración QSYS2.SYSTEXTDEFAULTS
Puede visualizar los parámetros y valores predeterminados en la tabla de administración
QSYS2.SYSTEXTDEFAULTS. Esta tabla se crea al instalar OmniFind Text Search for DB2 for i.
La tabla siguiente muestra el contenido de la tabla de administración QSYS2.SYSTEXTDEFAULTS.
Tabla 33. Contenido de la tabla de administración QSYS2.SYSTEXTDEFAULTS
Nombre de columna
Tipo de datos
Capacidad para
nulos
NAME
VARCHAR(30)
No
Nombre de un parámetro
predeterminado de la base de datos
para la búsqueda de texto.
VALUE
VARCHAR(512)
No
Valor del parámetro predeterminado
para la búsqueda de texto.
TYPE
INTEGER
No
Reservada.
Descripción
OmniFind Text Search Server
111
Tabla de administración QSYS2.SYSTEXTINDEXES
Puede visualizar información acerca de cada índice de búsqueda de texto en la tabla de administración
QSYS2.SYSTEXTINDEXES. Cada índice de búsqueda de texto tiene un nombre, un nombre de esquema y
un nombre de colección asociada en el servidor de búsqueda de texto.
La tabla siguiente muestra el contenido de la tabla de administración QSYS2.SYSTEXTINDEXES. La clave
exclusiva de esta tabla es la columna INDEXSCHEMA con la columna INDEXNAME. La clave primaria
es la columna INDEXID.
Tabla 34. Contenido de la tabla de administración QSYS2.SYSTEXTINDEXES
Nombre de columna
Tipo de datos
Capacidad para
nulos
INDEXID
INTEGER
No
ID de índice del índice de búsqueda de
texto generado de forma exclusiva.
INDEXSCHEMA
VARCHAR(128)
No
Nombre de esquema del índice de
búsqueda de texto.
INDEXNAME
VARCHAR(128)
No
Nombre no calificado del índice de
búsqueda de texto.
TABLESCHEMA
VARCHAR(128)
No
Nombre de esquema de la tabla base.
TABLENAME
VARCHAR(128)
No
Nombre no calificado de la tabla base.
TABLEIASP
SMALLINT
No
ASP independiente de la tabla base.
COLLECTIONNAME
VARCHAR(255)
No
Nombre de la colección asociada en el
servidor de búsqueda de texto.
SERVERID
INTEGER
No
ID de servidor del índice de búsqueda
de texto.
TAKEOVERSERVERID
INTEGER
Sí
Reservada para uso futuro.
TAKEOVERSERVERPULSE
TIMESTAMP
Sí
Reservada para uso futuro.
SEARCHARGS
VARBINARY(1024)
Sí
Reservada para uso futuro.
ALIASSCHEMA
VARCHAR(128)
No
El alias del esquema de la tabla base
utilizada en el procedimiento
almacenado SYSPROC.SYSTS_CREATE.
Si no se utiliza ningún alias, este valor
es idéntico a TABLESCHEMA.
ALIASNAME
VARCHAR(128)
No
El alias del nombre de la tabla base
utilizada en el procedimiento
almacenado SYSPROC.SYSTS_CREATE.
Si no se utiliza ningún alias, este valor
es idéntico a TABLENAME.
STAGINGTABLENAME
VARCHAR(128)
Sí
El nombre de la tabla de registro para
el índice de búsqueda de texto.
EVENTTABLENAME
VARCHAR(128)
No
El nombre de la tabla de sucesos para
el índice de búsqueda de texto.
OFINDEXTABLENAME
VARCHAR(128)
No
El nombre de la tabla para el índice de
búsqueda de texto en OmniFind Text
Search Server for DB2 for i.
UPDATEMINIMUM
INTEGER
No
Número mínimo de entradas de la tabla
de registro antes de realizar una
actualización incremental del índice de
búsqueda de texto.
112
IBM i: OmniFind Text Search Server for DB2 for i
Descripción
Tabla 34. Contenido de la tabla de administración QSYS2.SYSTEXTINDEXES (continuación)
Nombre de columna
Tipo de datos
Capacidad para
nulos
UPDATEFREQUENCY
VARCHAR(512)
No
Frecuencia de actualización del índice
de búsqueda de texto según lo
especificado en el procedimiento
almacenado SYSPROC.SYSTS_CREATE.
UPDATEMODE
INTEGER
No
Indica la modalidad de actualización
del índice de búsqueda de texto. El
entero 0 (cero) indica la actualización
inicial del índice de búsqueda de texto.
El valor 1 indica actualizaciones
incrementales posteriores.
REORGANIZATIONMODE
INTEGER
No
Indica la modalidad de reorganización
del índice de búsqueda de texto.
CREATETIME
TIMESTAMP
No
Hora de creación del índice de
búsqueda de texto.
LASTUPDATETIME
TIMESTAMP
Sí
Hora de última actualización del índice
de búsqueda de texto.
LASTUPDATESTATUS
CHAR
Sí
Indica el estado interno para optimizar
el proceso de limpieza después de una
actualización inicial o incremental del
índice de búsqueda de texto. Los
valores típicos son:
Descripción
v (Nulo) indica que el índice nunca se
ha actualizado.
v 'C' indica que se ha iniciado una
actualización inicial. Si la modalidad
de actualización no es incremental, la
actualización inicial sigue en proceso
o no ha finalizado.
v 'N' indica que se ha realizado
satisfactoriamente una actualización
incremental.
Durante el proceso de actualización se
utilizan otros códigos internamente. El
proceso de actualización utiliza dichos
códigos para determinar las acciones de
recuperación específicas que pueden
realizarse si la actualización no puede
realizarse.
SCHEDULERTASKID
INTEGER
Sí
Reservada para uso futuro.
EXPRESSIONLISTS
CLOB (32 K)
Sí
Reservada para uso futuro.
EXPRESSIONNUMBERS
VARBINARY(32)
Sí
Reservada para uso futuro.
USEREXITFUNCTION
VARCHAR(18)
Sí
Reservada para uso futuro.
REMARKS
VARCHAR(2000)
Sí
Indicaciones realizadas en la opción
COMMENTS del parámetro
opciones-configuración-índice del
procedimiento almacenado
SYSPROC.SYSTS_CREATE.
OmniFind Text Search Server
113
Tabla 34. Contenido de la tabla de administración QSYS2.SYSTEXTINDEXES (continuación)
Nombre de columna
Tipo de datos
Capacidad para
nulos
TABLEMBR
VARCHAR(10)
Sí
Descripción
El miembro de tabla a partir del cual se
ha construido el índice de texto. Se
utiliza para realizar el seguimiento del
miembro específico que se indexa si el
archivo es multimiembro. Si el valor es
nulo, es miembro es el primero y único
de la tabla.
Conceptos relacionados:
“Nombre de alias de servidor” en la página 11
Puede utilizar un nombre de alias de servidor para asignar un nombre significativo a un servidor.
Tabla de administración QSYS2.SYSTEXTCOLUMNS
Puede visualizar información acerca de las columnas de texto de un índice de búsqueda de texto en la
tabla de administración QSYS2.SYSTEXTCOLUMNS. Cada índice de búsqueda de texto tiene un ID de
índice, nombres de columna de texto y el nombre de esquema de la tabla base.
La tabla siguiente muestra el contenido de la tabla de administración QSYS2.SYSTEXTCOLUMNS. La
clave primaria de esta tabla es la columna INDEXID con la columna COLUMNNAME. La clave foránea
es la columna INDEXID.
Tabla 35. Contenido de la tabla de administración QSYS2.SYSTEXTCOLUMNS
Nombre de columna
Tipo de datos
Capacidad
para nulos
INDEXID
INTEGER
No
ID de índice del índice de búsqueda de
texto generado de forma exclusiva.
COLUMNNAME
VARCHAR(128)
No
Nombre no calificado de la columna de
texto.
TABLESCHEMA
VARCHAR(128)
No
Nombre de esquema de la tabla base.
TABLENAME
VARCHAR(128)
No
Nombre no calificado de la tabla base.
LANGUAGE
VARCHAR(5)
No
El idioma que el servidor de búsqueda
de texto utiliza para el proceso
lingüístico de los documentos de texto.
El valor predeterminado es en_US
(inglés).
FUNCTIONSCHEMA
VARCHAR(128)
Sí
El esquema de una función definida
por el usuario utilizada por
OMNIFIND para acceder a documentos
de texto que se encuentran en una
columna que no es de un tipo de datos
soportado o que están almacenados en
otro lugar.
FUNCTIONNAME
VARCHAR(18)
Sí
El nombre de una función definida por
el usuario utilizada por OMNIFIND
para acceder a documentos de texto
que se encuentran en una columna que
no es de un tipo de datos soportado o
que están almacenados en otro lugar.
114
IBM i: OmniFind Text Search Server for DB2 for i
Descripción
Tabla 35. Contenido de la tabla de administración QSYS2.SYSTEXTCOLUMNS (continuación)
Nombre de columna
Tipo de datos
Capacidad
para nulos
CCSID
INTEGER
No
Identificador de juego de caracteres
codificados utilizado para un índice de
búsqueda de texto en una columna con
un tipo de datos binarios.
FORMAT
VARCHAR(30)
No
El formato de los documentos de texto
de la columna. Los valores de formato
soportados son TEXT, HTML, XML e
INSO.
KEYCOLUMNCOUNT
INTEGER
No
El recuento de columnas de clave para
el índice de búsqueda de texto.
KEYCOLUMNNAMES
VARCHAR(1200)
No
Los nombres de columnas de clave
para el índice de búsqueda de texto.
Descripción
Tabla de administración QSYS2.SYSTEXTSERVERS
Puede visualizar dónde están instalados los servidores de búsqueda de texto mediante la tabla de
administración QSYS2.SYSTEXTSERVERS.
La tabla siguiente muestra el contenido de la tabla de administración QSYS2.SYSTEXTSERVERS. La clave
exclusiva de esta tabla es la columna SERVERNAME con la columna SERVERPORT. La clave primaria es
la columna SERVERID.
Tabla 36. Contenido de la tabla de administración QSYS2.SYSTEXTSERVERS
Nombre de columna
Tipo de datos
Capacidad
para nulos
SERVERID
INTEGER
No
ID del servidor de búsqueda de texto
generado de forma exclusiva.
SERVERNAME
VARCHAR(128)
No
Nombre o dirección IP del host del
servidor de búsqueda de texto.
SERVERADRINFO
VARBINARY(3000)
Sí
Representación interna de SERVERNAME
y SERVERPORT según lo determinado por
el procedimiento almacenado
SYSPROC.SYSTS_START.
SERVERPORT
INTEGER
No
Número de puerto del servidor de
búsqueda de texto.
SERVERPATH
VARCHAR(512)
No
Vía de acceso del servidor de búsqueda de
texto.
SERVERTYPE
INTEGER
No
Tipo del servidor de búsqueda de texto. El
valor 0 (cero) indica un servidor de
búsqueda de texto IBM i. El valor 1 indica
un servidor de búsqueda de texto Linux. El
valor 2 indica un servidor de búsqueda de
texto Windows.
SERVERAUTHTOKEN
VARCHAR(256)
No
Señal de autenticación para el servidor de
búsqueda de texto.
SERVERMASTERKEY
VARCHAR(36)
No
Clave de servidor del servidor de
búsqueda de texto.
Descripción
OmniFind Text Search Server
115
Tabla 36. Contenido de la tabla de administración QSYS2.SYSTEXTSERVERS (continuación)
Nombre de columna
Tipo de datos
Capacidad
para nulos
SERVERCLASS
INTEGER
No
Clase de servidor del servidor de
búsqueda de texto. El valor 0 (cero) indica
un servidor de producción, disponible para
selección automática. El valor 9 indica un
servidor de prueba, nunca asignado
automáticamente.
SERVERSTATUS
INTEGER
No
Indica si el servidor puede utilizarse como
servidor de búsqueda de texto para crear
índices de búsqueda de texto. El valor
predeterminado es 0 (cero), que indica que
el servidor puede utilizarse.
ALIASNAME
VARCHAR(128)
Sí
El nombre de alias es exclusivo cuando no
es nulo y es sensible a las mayúsculas y
minúsculas.
Descripción
Conceptos relacionados:
“Nombre de alias de servidor” en la página 11
Puede utilizar un nombre de alias de servidor para asignar un nombre significativo a un servidor.
Tabla de administración QSYS2.SYSTEXTCONFIGURATION
Puede visualizar los parámetros de configuración del índice de búsqueda de texto pasados por el
procedimiento almacenado SYSPROC.SYSTS_CREATE en la tabla de administración
QSYS2.SYSTEXTCONFIGURATION.
La tabla siguiente muestra el contenido de la tabla de administración QSYS2.SYSTEXTCONFIGURATION.
La clave primaria es la columna INDEXID con la columna PARAMETER. La clave foránea es la columna
INDEXID.
Tabla 37. Contenido de la tabla de administración QSYS2.SYSTEXTCONFIGURATION
Nombre de columna
Tipo de datos
Capacidad para
nulos
Descripción
INDEXID
INTEGER
No
ID de índice del índice de búsqueda de
texto generado de forma exclusiva.
PARAMETER
VARCHAR(30)
No
Parámetros especificados para el índice
de búsqueda de texto en el
procedimiento almacenado
SYSPROC.SYSTS_CREATE.
VALUE
VARCHAR(512)
No
Valores de los parámetros especificados.
Referencia relacionada:
“SYSPROC.SYSTS_CREATE” en la página 19
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_CREATE para crear un índice de búsqueda
de texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsqueda
de texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contengan
las funciones CONTAINS o SCORE.
Tabla de administración QSYS2.SYSTEXTSERVERHISTORY
Puede ver el historial de los servidores utilizados para el procedimiento almacenado
SYSPROC.SYSTS_DROP visualizando la tabla auxiliar QSYS2.SYSTEXTSERVERHISTORY.
116
IBM i: OmniFind Text Search Server for DB2 for i
La tabla siguiente muestra el contenido de la tabla de administración QSYS2.SYSTEXTSERVERHISTORY.
La clave exclusiva de esta tabla es la columna INDEXID con la columna SERVERID. La clave foránea es
la columna INDEXID.
Tabla 38. Contenido de la tabla de administración QSYS2.SYSTEXTSERVERHISTORY
Nombre de columna
Tipo de datos
Capacidad para
nulos
INDEXID
INTEGER
No
ID de índice de un índice de búsqueda
de texto creado.
SERVERID
INTEGER
No
ID del servidor donde debe descartarse
un índice de búsqueda de texto en
SYSPROC.SYSTS_DROP.
Descripción
Referencia relacionada:
“SYSPROC.SYSTS_DROP” en la página 34
Puede llamar al procedimiento almacenado SYSPROC.SYSTS_DROP para eliminar un índice de búsqueda
de texto definido mediante el procedimiento almacenado SYSPROC.SYSTS_CREATE.
Vista Índice de búsqueda de texto
Si se crea un índice de búsqueda de texto con SYSTS_CREATE, se creará una vista que representa el
índice. Consultar la vista del índice de búsqueda de texto puede ayudar al usuario a obtener el estado del
índice. El nombre de la vista del índice de búsqueda de texto es el mismo nombre que el nombre de
índice de búsqueda de texto que se ha especificado al crear el índice con SYSTS_CREATE.
La tabla siguiente muestra el contenido de la vista de índice de búsqueda de texto.
Tabla 39. Contenido de la vista creada por SYSTS_CREATE
Nombre de columna
Tipo de datos
CCSID
Capacidad
para nulos
TABLESCHEMA
VARCHAR(128)
1208
No
Nombre de esquema de la tabla
base.
TABLENAME
VARCHAR(128)
1208
No
Nombre no calificado de la
tabla base.
COLUMNNAME
VARCHAR(128)
1208
No
Nombre no calificado de la
columna de texto de la tabla
base.
SERVERID
INTEGER
No
ID de servidor exclusivo de
SYSTEXTSERVERS.
SERVERNAME
VARCHAR(128)
1208
No
Nombre no calificado del
servidor de búsqueda de texto.
SERVERSTATUS
VARCHAR(32)
1208
No
v ‘STARTED’ – El servidor está
en ejecución.
Descripción
v ‘STOPPED’ – El servido está
detenido.
STAGINGTABLENAME
VARCHAR(128)
LASTUPDATETIME
TIMESTAMP
1208
No
Nombre no calificado de la
tabla de registro para el índice
de búsqueda de texto.
Sí
Hora de última actualización
del índice de búsqueda de
texto.
OmniFind Text Search Server
117
Tabla 39. Contenido de la vista creada por SYSTS_CREATE (continuación)
Nombre de columna
Tipo de datos
CCSID
Capacidad
para nulos
LASTUPDATESTATUS
VARCHAR(30)
1208
Sí
Descripción
v ’NEVER UPDATED’ – El
índice no se ha actualizado
antes.
v ‘UP TO DATE’ – Última
actualización satisfactoria y
no hay ningún cambio
pendiente.
v ‘CHANGES PENDING’ –
Última actualización
satisfactoria, pero todavía
hay nuevos cambios que
actualizar.
v ‘FAILED’ – Última
actualización anómala.
UPDATEMINIMUM
INTEGER
UPDATEFREQUENCY
VARCHAR(512)
PENDINGCOUNT
INTEGER
1208
No
Número mínimo de entradas
de la tabla de registro antes de
realizar una actualización
incremental del índice de
búsqueda de texto.
No
Frecuencia de actualización del
índice de búsqueda de texto
según lo especificado en el
procedimiento almacenado
SYSPROC.SYSTS_CREATE.
No
Indica cuántas filas deben
indexarse en el próximo
proceso de actualización.
Ampliaciones para indexar y buscar datos no DB2
La OmniFind Text Search for DB2 for i proporciona un conjunto adicional de los procedimientos
almacenados para crear, administrar y buscar colecciones de búsqueda de texto.
Visión general de las ampliaciones
OmniFind Text Search Server for DB2 for i proporciona un conjunto adicional de procedimientos
almacenados para crear, administrar y buscar en colecciones de búsqueda de texto. Una colección de
búsqueda de texto se utiliza para indexar datos asociados con objetos del sistema, como por ejemplo
archivos spool de una cola de salida o datos de archivo continuo del sistema de archivos integrado.
Una colección de búsqueda de texto describe uno o más conjuntos de objetos del sistema cuyos datos de
texto asociados se indexarán y buscarán. Por ejemplo, una colección puede contener un conjunto de
objetos de todos los archivos spool de la cola de salida QUSRSYS/QEZJOBLOG y/o un conjunto de
objetos de todos los archivos continuos del directorio '/home/alice/text_data'.
La colección de búsqueda de texto a la que se hace referencia en esta documentación no debe confundirse
con un esquema de DB2 (a veces también llamado colección) o una colección de Lucene (parte de la
estructura interna de un índice de búsqueda de texto de DB2).
118
IBM i: OmniFind Text Search Server for DB2 for i
Cuando se crea una colección de búsqueda de texto, se crean varios objetos de DB2 en el sistema en un
esquema SQL. Los objetos siguientes se crearán en el esquema:
v Catálogos para el seguimiento de la configuración de la colección.
v Catálogos para el seguimiento de los objetos que se han indexado.
v Procedimientos almacenados SQL para administrar y buscar en la colección.
v Un índice de búsqueda de texto de DB2 para indexar el texto asociado.
Se suministran procedimientos almacenados para la administración de la colección, la mayoría de los
cuales se crean en el esquema.
Puede encontrar una descripción de otras mejoras de OmniFind Text Search Server for DB2 for i en:
Mejoras de OmniFind Text Search Server for DB2 for i.
Crear una colección de búsqueda de texto
Este procedimiento crea una colección de búsqueda vacía. Se creará un esquema SQL en el sistema para
contener información acerca de la colección. El esquema contendrá objetos DB2 necesarios para rastrear e
indexar objetos.
SYSPROC.SYSTS_CRTCOL y SYSPROC.SYSTS_CREATE_COLLECTION
Autorización
SYSTS_CRTCOL y SYSTS_CREATE_COLLECTION se suministrarán con la autorización *EXECUTE
otorgada de modo público.
Estos procedimientos no adoptarán ninguna autorización adicional y se ejecutarán bajo el perfil de
invocación.
Para crear una colección de búsqueda de texto, el invocador debe tener:
v Autorización para crear un esquema DB2
v Autorización/capacidad para crear un índice de búsqueda de texto
Los objetos de DB2 creados como parte de la colección, incluidos los procedimientos almacenados
administrativos, se crean con la autorización pública *EXCLUDE.
El perfil de usuario que crea la colección es propietario de todos los objetos de la misma. Un usuario
puede otorgar autorización sobre un procedimiento específico a otros usuarios con el fin de permitir que
otro usuario administre y busque en la colección de búsqueda de texto.
Sintaxis
SYSTS_CRTCOL (
nombre_colección
)
,
opciones
,
nombre_dispositivo_asp
Sintaxis
SYSTS_CREATE_COLLECTION (
nombre_colección
)
,
opciones
,
nombre_dispositivo_asp
El calificador de esquema es SYSPROC.
OmniFind Text Search Server
119
Parámetros
nombre_colección
Nombre de la colección. Este nombre identifica de forma exclusiva la colección y debe ser una serie
no nula. Se creará un esquema del nombre especificado para el nombre de la colección para que
contenga los objetos DB2 asociados.
Nota: especifique los nombres entre comillas dobles si los nombres entran en conflicto con palabras
clave SQL o palabras clave de OmniFind que puedan utilizarse.
El parámetro de nombre de colección seguirá las reglas de SQL para los nombres de esquema.
El nombre de colección no debe coincidir con el nombre de un perfil de usuario existente.
El tipo de datos de este parámetro es VARCHAR(128).
opciones
Serie de caracteres que especifica las diversas opciones que están disponibles para este procedimiento
almacenado.
El tipo de datos de este parámetro es VARCHAR(32000).
opciones:
información-predeterminada-texto
características-actualización
opciones-configuración-índice
información-predeterminada-texto:
LANGUAGE
idioma
FORMAT
formato
información-predeterminada-texto
Especifica el idioma utilizado al procesar documentos y el formato de los documentos de texto de
la columna.
LANGUAGE idioma
Especifica el idioma que OmniFind Text Search Server for DB2 for i utiliza para el proceso
lingüístico de los documentos de texto. El valor predeterminado es en_US (inglés). Si
especifica AUTO como valor de este parámetro, OmniFind Text Search Server for DB2 for i
intentará determinar el idioma.
Importante: Si el idioma de los documentos no es el inglés, no utilice el valor
predeterminado en_US. Cambie el valor al idioma de los documentos; de lo contrario, el
proceso lingüístico no funcionará según lo esperado.
FORMAT formato
Identifica el formato de los documentos de texto que se van a indexar, como por ejemplo
TEXT o INSO. OmniFind Text Search Server for DB2 for i necesita conocer el formato, o tipo
de contenido, de los documentos de texto que tiene previsto indexar y en los que va a
realizar búsquedas. Si no especifica el parámetro formato, el valor predeterminado es TEXT.
El valor de formato INSO permite a OmniFind Text Search Server for DB2 for i determinar el
formato. Si OmniFind Text Search Server for DB2 for i no puede determinar el formato del
documento, el procedimiento almacenado UPDATE anota un error de documento en el
registro de trabajo durante el proceso.
120
IBM i: OmniFind Text Search Server for DB2 for i
características-actualización:
NONE
< frecuencia-actualización>
UPDATE FREQUENCY
características-actualización
Especifica la frecuencia de las actualizaciones automáticas de la colección de búsqueda de texto.
El proceso de actualización de una colección de búsqueda de texto implica tanto la indexación de
los datos de texto como el rastreo de los objetos del sistema para detectar datos nuevos o
cambiados.
UPDATE FREQUENCY frecuencia-actualización
Especifica cuándo deben realizarse actualizaciones automáticas en la colección de búsqueda
de texto. El valor predeterminado es NONE.
frecuencia-actualización (Formato 1):
NONE
D (
*
)
H
(
*
,
)
M
(
*
,
0..6 0..23 0..6
)
,
0..59 0..23
0..59
NONE
Si se especifica NONE, no se realizan más actualizaciones de índice. La actualización
debe iniciarse manualmente.
D
Especifica el día o días de la semana en los que se actualiza el índice. Un asterisco (*)
indica todos los días. 0 indica el Domingo.
H
Especifica la hora u horas en las que se actualiza el índice. Un asterisco (*) indica
todas las horas.
M
Especifica el minuto o minutos en los que se actualiza el índice. No puede
especificarse un asterisco (*). La frecuencia de actualización mínima es de 5 minutos.
Ejemplo: este ejemplo especifica que la actualización de índice debe ejecutarse cada 30
minutos.
UPDATE FREQUENCY D(*) H(*) M(0,30)
frecuencia-actualización (Formato 2, cronológico):
< minuto> < hora> <díaDelMes> <mesDelAño> <díaDeLaSemana>
El formato de la opción frecuencia-actualización (cronológica) es una lista de cinco valores
separados por espacios en blanco. Los cinco valores representan los minutos, horas, días del
mes, meses del año y días de la semana empezando por el Domingo.
Si especifica un intervalo de valores o un asterisco (*), puede especificar un valor de recorrido
utilizando una barra inclinada (/) al final del intervalo definido.
Ejemplo: este ejemplo especifica que la actualización de índice debe ejecutarse cada cuarto de
hora (0,15,30,45) en las horas pares entre las 8 a.m. y las 6:45 p.m. (8-18/2 es equivalente a
8,10,12,14,16,18), de Lunes a Viernes todos los meses del año (* * 1-5).
0,15,30,45 8-18/2 * * 1-5
minuto Especifica los minutos de la hora en los que debe actualizarse el índice de búsqueda
de texto. Puede especificar un asterisco (*) para un intervalo de cada 5 minutos o un
OmniFind Text Search Server
121
entero de 0 a 59. No pueden repetirse valores. La frecuencia de actualización mínima
es de 5 minutos. Un valor de 1, 4 u 8 no es válido.
frecuencia-actualización (minuto):
*
/ 0...59
,
0...59 - 0...59
/ 0...59
0...59
hora
Especifica las horas del día en las que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para cada hora o un entero de 0 a 23. No
pueden repetirse valores.
frecuencia-actualización (hora):
*
/ 0...23
,
0...23 - 0...23
/ 0...23
0...23
díaDelMes
Especifica los días del mes en los que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para cada día o un entero de 1 a 31. No
pueden repetirse valores.
frecuencia-actualización (díaDelMes):
*
/ 1...31
,
1...31 - 1...31
/ 1...31
1...31
mesDelAño
Especifica los meses del año en los que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para cada mes o un entero de 1 a 12. No
pueden repetirse valores.
frecuencia-actualización (mesDelAño):
*
/ 1...12
,
1...12 - 1...12
/ 1...12
1...12
díaDeLaSemana
Especifica los días de la semana en los que debe actualizarse el índice de búsqueda
122
IBM i: OmniFind Text Search Server for DB2 for i
de texto. Puede especificar un asterisco (*) para cada día o un entero de 0 a 7. Tanto 0
como 7 son valores válidos para el Domingo. No pueden repetirse valores.
frecuencia-actualización (díaDeLaSemana):
*
/ 0...7
,
0...7 - 0...7
/ 0...7
0...7
opciones-configuración-índice:
,
INDEX CONFIGURATION ( opción
valor
)
opciones-configuración-índice
Especifica valores adicionales específicos de índice en forma de pares de opción y valor. Debe
especificar los valores tipo serie entre comillas simples. Un comilla simple dentro de un valor tipo
serie debe representarse mediante dos comillas simples consecutivas.
CJKSEGMENTATION
Especifica el método de segmentación que debe utilizarse al indexar documentos para
idiomas CJK (chino, japonés, coreano). Los valores soportados son MORPHOLOGICAL y
NGRAM. Si no se especifica el valor CJKSEGMENTATION, se utiliza el valor
predeterminado. El valor predeterminado se especifica en la columna DEFAULTNAME de la
tabla QSYS2.SYSTEXTDEFAULTS.
SERVER
Especifica el ID o nombre de alias del servidor que debe utilizarse para almacenar el índice
de búsqueda de texto. Si se utiliza un ID, el valor es un entero que debe existir en la columna
SERVERID del catálogo QSYS2.SYSTEXTSERVERS. Si se utiliza un nombre de alias, el valor
es una serie que debe existir en la columna ALIASNAME del catálogo
QSYS2.SYSTEXTSERVERS. Si no se especifica SERVER, el valor predeterminado es seleccionar
el servidor con menos índices de búsqueda de texto entre los servidores de la tabla
QSYS2.SYSTEXTSERVERS en los que el parámetro SERVERSTATUS está establecido en 0
(cero), lo que indica que el servidor está disponible.
UPDATEAUTOCOMMIT
Especifica la frecuencia con la que se realiza una operación de confirmación al extraer
documentos durante una actualización de índice. El valor 0 (cero) indica que una operación
de confirmación sólo se realiza al final del proceso.
El valor debe ser un entero entre 0 (cero) y 2147483647. El valor predeterminado es 100.
Sugerencia de rendimiento: el valor de UPDATEAUTOCOMMIT puede tener un impacto
significativo sobre el rendimiento de las actualizaciones de índice. La operación de
confirmación que tiene lugar con el intervalo especificado garantiza un punto de
comprobación coherente desde el que reiniciar la actualización de índice, si se interrumpe. Sin
embargo, la confirmación también suspende temporalmente el proceso de actualización.
Aumentar el valor de UPDATEAUTOCOMMIT (o establecerlo en 0) puede mejorar
significativamente el rendimiento de la actualización, especialmente de la inicial. El valor que
especifique debe buscar el equilibrio entre las necesidades de rendimiento y las de
recuperabilidad, en función de la frecuencia de las actualizaciones del índice.
OmniFind Text Search Server
123
nombre_dispositivo_asp
Este parámetro, si se especifica y no es nulo, determina la agrupación de almacenamiento auxiliar en
la que se crea la colección. Este parámetro está opcionalmente disponible para la coincidencia con la
prestación CREATE SCHEMA para crear los objetos de DB2 en un dispositivo ASP específico.
Si se especifica un valor para este parámetro, debe indicar el nombre de una agrupación de discos del
grupo de ASP primario del espacio de nombres actual o una unidad de ASP básica si el espacio de
nombres es sólo la ASP del sistema.
El tipo de datos de este parámetro es VARCHAR(10).
Ejemplos
1. CALL SYSTS_CRTCOL(‘mycollection');
Se crea la colección MYCOLLECTION.
2. CALL SYSTS_CRTCOL(‘”mycollection”', “UPDATE FREQUENCY D(*) H(*) M(0)”)
Se crea la colección mycollection (minúsculas sin incluir los delimitadores).
La colección de búsqueda de texto tendrá una frecuencia de actualización diaria, al principio de cada
hora.
3. CALL SYSTS_CRTCOL(‘ur_collection',‘UPDATE FREQUENCY NONE ‘ || ‘ LANGUAGE zh_CN
INDEX CONFIGURATION( ‘ || ‘ CJKSEGMENTATION MORPHOLOGICAL) ‘, ‘23')
Se crea la colección UR_COLLECTION.
La colección tiene ninguna frecuencia de actualización.
El idioma de la colección es chino simplificado, utilizando análisis lingüístico de diccionario
(morfológico).
El esquema de SQL se crea en la ASP básica #23.
Cuando se crea la colección de búsqueda de texto, se crean procedimientos en el esquema de DB2
para administrar la colección.
Para crear una colección desde IBM Navigator for i, siga estos pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > Omnifind > Crear colección.
Añadir un conjunto de objetos de datos de archivo spool
El procedimiento almacenado se encuentra en el esquema de DB2 para añadir un conjunto de objetos de
datos de archivo spool.
Nota: sólo se admiten datos de serie de caracteres SNA (SCS). Los archivos spool que contienen otros
tipos de datos no pueden indexarse y provocarán un error a nivel de documento cuando se encuentren.
El error se registrará en las anotaciones de trabajo y la indexación continuará con el archivo spool
siguiente. Puede utilizarse el procedimiento GET_OBJECTS_NOT_INDEXED para determinar qué
archivos de spool no se han incluido en el proceso de indexación.
ADD_SPLF_OBJECT_SET
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto. Se suministrará con la autorización *EXECUTE otorgada de
modo público.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
124
IBM i: OmniFind Text Search Server for DB2 for i
Sintaxis
Añadir un conjunto de objetos de archivo spool:
ADD_SPLF_OBJECT_SET (
biblioteca_cola_salida
nulo
nombre_trabajo_cal
nulo
,
usuario_trabajo_cal
nulo
indicación_fecha_hora_inicial
nulo
,
,
,
nombre_cola_salida
nulo
número_trabajo_cal
nulo
indicación_fecha_hora_final
nulo
,
,
nombre_usuario
nulo
datos_usuario
nulo
,
,
)
,
id_conjunto_salida
Las siguientes versiones simplificadas del procedimiento de adición de conjunto de objetos de archivo
spool pueden utilizarse a efectos de comodidad.
Seleccionar archivos spool sólo por cola de salida:
ADD_SPLF_OBJECT_SET (
biblioteca_cola_salida
nulo
,
nombre_cola_salida
nulo
)
Seleccionar archivos spool sólo por cola de salida y nombre de usuario:
ADD_SPLF_OBJECT_SET (
biblioteca_cola_salida
nulo
,
nombre_cola_salida
nulo
,
nombre_usuario
nulo
)
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
biblioteca_cola_salida
Nombre del sistema para la biblioteca de la cola de salida.
Un valor nulo o una serie vacía indica que se incluirán en el índice las colas de salida de todas las
bibliotecas.
El tipo de datos de este parámetro es VARCHAR(10)
[Consulte los convenios de nombres del sistema]
[Consulte las restricciones adicionales]
nombre_cola_salida
Nombre del sistema para el nombre de cola de salida.
Un valor nulo o una serie vacía indica que se incluirá en el índice cualquier cola de salida.
El tipo de datos de este parámetro es VARCHAR(10)
[Consulte los convenios de nombres del sistema]
[Consulte las restricciones adicionales]
nombre_usuario
Nombre del sistema para el usuario propietario del archivo spool.
Un valor nulo o una serie vacía indica que no se realizará ningún filtrado sobre el nombre de
usuario.
El tipo de datos de este parámetro es VARCHAR(10)
OmniFind Text Search Server
125
[Consulte los convenios de nombres del sistema]
[Consulte las restricciones adicionales]
nombre-trabajo_cal
Nombre del sistema para la biblioteca de la cola de salida.
Un valor nulo o una serie vacía indica que no se realizará ningún filtrado sobre el nombre de trabajo.
El tipo de datos de este parámetro es VARCHAR(10)
[Consulte los convenios de nombres del sistema]
usuario_trabajo_cal
Nombre del sistema para el nombre de perfil de usuario del trabajo asociada con el archivo spool.
Un valor nulo o una serie vacía indica que no se realizará ningún filtrado sobre el usuario de trabajo.
El tipo de datos de este parámetro es VARCHAR(10)
Es obligatorio un valor no nulo y no vacío para este parámetro si se ha especificado
NOMBRE_TRABAJO_CALIFICADO.
Si NOMBRE_TRABAJO_CALIFICADO es una serie vacía o NULL, este parámetro también debe ser
nulo o una serie vacía.
[Consulte los convenios de nombres del sistema]
[Consulte las restricciones adicionales]
número_trabajo_cal
Serie de seis caracteres que representa el número de trabajo. (Debe estar formada por los dígitos 0-9)
Un valor nulo o una serie vacía indica que no se realizará ningún filtrado sobre el número de trabajo.
El tipo de datos de este parámetro es VARCHAR(6)
Es obligatorio un valor no nulo y no vacío para este parámetro si se ha especificado
NOMBRE_TRABAJO_CALIFICADO.
Si NOMBRE_TRABAJO_CALIFICADO es una serie vacía o NULL, este parámetro también debe ser
nulo o una serie vacía.
[Consulte los convenios de nombres del sistema]
[Consulte las restricciones adicionales]
datos_usuario
Serie de diez caracteres que el usuario asocia con un archivo spool.
Esta serie no se convierte a mayúsculas y debe coincidir exactamente con los datos de usuario
asociados a un archivo spool para que se considere una coincidencia.
Nota: un valor de 'abc' es distinto de 'ABC'
Un valor nulo o una serie vacía indicará que no se realizará ningún filtrado sobre los datos de
usuario.
El tipo de datos de este parámetro es VARCHAR(10)
indicación_fecha_hora_inicial
Valor de indicación de fecha y hora que indica la hora de creación más antigua que se incluirá en la
colección. Los archivos en spool creados antes de esta indicación de fecha y hora no se indexarán.
Puede especificarse un valor NULL para indicar que debe indexarse cualquier archivo spool creado
antes del valor de indicación de fecha y hora final. Si INDICACIÓN_FECHA_HORA_FINAL también
es nulo, no se realizarán ningún filtrado sobre la indicación de fecha y hora de creación.
El tipo de datos de este parámetro es TIMESTAMP
126
IBM i: OmniFind Text Search Server for DB2 for i
indicación_fecha_hora_final
Valor de indicación de fecha y hora que indica la hora de creación más reciente que se incluirá en la
colección. Los archivos spool creados después de esta fecha no se indexarán.
Puede especificarse un valor NULL para indicar que debe indexarse cualquier archivo spool creado
después de la INDICACIÓN_FECHA_HORA_INICIAL. Si INDICACIÓN_FECHA_HORA_INICIAL
también es nulo, no se realizarán ningún filtrado sobre la indicación de fecha y hora de creación.
El tipo de datos de este parámetro es TIMESTAMP
id_conjunto_salida
Valor entero de salida que devuelve el ID de conjunto del conjunto de objetos que se ha añadido.
Este valor puede utilizarse para eliminar el conjunto de objetos en un momento posterior.
Este parámetro es opcional.
El tipo de datos de este parámetro es INTEGER
Convenios de denominación del sistema
Los parámetros que requieren nombres del sistema como entrada deben ser nombres del sistema válidos;
de lo contrario, se producirá un error. Estos parámetros se procesarán de la misma manera que el
analizador de mandatos procesa los nombres en los mandatos CL. Consulte las Reglas de denominación
de objetos para obtener más información acerca de los nombres del sistema.
call nick12345.add_splf_object_set('ntl', 'justtext', 'ntl', '', '', '', '', NULL, NULL);
La información de filtro que se pasa al procedimiento será una cola de salida NTL/JUSTTEXT para el
usuario NTL (convertido a mayúsculas)
A diferencia de los nombres de SQL, en un nombre del sistema los delimitadores permanecerán en el
nombre, pero sólo si es necesario. call nick12345.add_splf_object_set('"ntl"', '"justtext"', '"NTL"', '', '', '', '',
NULL, NULL);
La información de filtro pasada a la API será la cola de salida "ntl"/"justtext" para el usuario NTL (sin
comillas alrededor del usuario NTL)
Nota: El procedimiento almacenado tiene un límite de diez caracteres en la interfaz y no admite comillas
dobles innecesarias que hacen que se supere este límite.
Los nombres del sistema no válidos provocarán un error.
Restricciones adicionales
v Los nombres genéricos no están soportados. En otras palabras, no es posible indexar todas las colas de
salida que empiezan por MYOUT añadiendo un conjunto de objetos para MYOUT*
v El nombre de la biblioteca de la cola de salida y el nombre de la cola de salida deben ser ambos nulos
(o una serie vacía) tener ambos nombres del sistema válidos. No es posible filtrar todas las colas de
salida de la biblioteca xyz o filtrar todas las colas de salida denominadas 'abc' de cualquier biblioteca.
v Si se especifican un nombre de cola de salida y una biblioteca específicos, dicha cola de salida debe
existir en el momento de añadir el conjunto de objetos. No existe ninguna lógica para impedir la
supresión de la cola de salida en algún momento posterior, pero el conjunto de objetos pasará a estar
efectivamente 'vacío'.
v Si tanto NOMBRE_USUARIO como USUARIO_TRABAJO_CALIFICADO son valores no nulos y no
vacíos, deben ser iguales. Un propietario de archivo spool siempre coincidirá con el usuario de trabajo
calificado, y, por lo tanto, estos valores nunca pueden ser diferentes cuando ambos se utilizan como
filtro.
OmniFind Text Search Server
127
Autorizaciones para objetos indexados
Al añadir un conjunto de objetos de archivo spool, considere cuidadosamente los requisitos de
autorización para recuperar el texto de los archivos spool. Estas autorizaciones serán un factor a tener en
cuenta cuando se invoque el procedimiento almacenado UPDATE. Consulte la documentación del
procedimiento almacenado de actualización para obtener más información sobre los requisitos de
autorización para objetos indexados.
Ejemplos
Añadir un conjunto de objetos a la colección nick789 para todos los archivos spool de la cola de salida
NTL/MYOUTQ.
> call nick789.add_splf_object_set(’NTL’, ’MYOUTQ’);
Añadir un conjunto de objetos a la colección nick123 para indexar todos los archivos spool propiedad del
usuario NTL.
> call nick123.add_splf_object_set(’’, ’’, ’NTL’);
Añadir un conjunto de objetos a la colección default_search_col para indexar todos los archivos spool
creados en 2010.
> call default_search_col.add_splf_object_set(’’, ’’, ’’, ’’, ’’, ’’, ’’, ’2010-01-01T00:00:00’, ’2011-01-01T00:00:00’);
Añadir un conjunto de objetos a la colección default_search_col para indexar todos los archivos spool
creados en 2010 con los datos de usuario 'MYAPP':
> call default_search_col.add_splf_object_set(’’, ’’, ’’, ’’, ’’, ’’, ’MYAPP’, ’2010-01-01T00:00:00’, ’2011-01-01T00:00:00’);
Para añadir un conjunto de objetos de archivo spool a una colección desde IBM Navigator for i, siga estos
pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > OmniFind > Lista de colecciones.
3. Pulse la colección con el botón derecho del ratón y seleccione Propiedades. En la pestaña Objeto,
pulse el botón Añadir colas de salida o Añadir archivos en spool.
Eliminar un conjunto de objetos de datos de archivo spool
Este procedimiento almacenado eliminará un conjunto de objetos de datos de archivo en spool de una
colección de búsqueda de texto.
RMV_SPLF_OBJECT_SET
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
Eliminar un conjunto de objetos de archivo spool:
128
>--+-nombre_cola_salida-+--,--+-nombre_usuario-+--,------------------->
'-null -------------'
'-null -----'
IBM i: OmniFind Text Search Server for DB2 for i
>--+-nombre_trabajo_cal-+--,--+-usuario_trabajo_cal-+--,------------------->
'-null ---------'
'-null ---------'
>--+-número_trabajo_cal-+--,--+-datos_usuario-+--,--------------------->
'-null -----------'
'-null -----'
>--+-indicación_fecha_hora_inicial-+--,--+-indicación_fecha_hora_final-+----------------->
'-null -----------' '-null ------------'
Las siguientes versiones simplificadas del procedimiento de eliminación de conjunto de objetos de
archivo spool pueden utilizarse a efectos de comodidad.
Seleccionar archivos spool sólo por cola de salida:
>>-RMV_SPLF_OBJECT_SET--(--+-biblioteca_cola_salida-+--,-------------->
'-null ------------'
>--+-nombre_cola_salida-+--)------------------------------------><
'-null -------------'
Seleccionar archivos spool sólo por cola de salida y nombre de usuario:
>>-RMV_SPLF_OBJECT_SET--(--+-biblioteca_cola_salida-+--,-------------->
'-null ------------'
>--+-nombre_cola_salida-+--,--+-nombre_usuario-+--)------------------><
'-null -------------'
'-null -----'
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
biblioteca_cola_salida
Nombre del sistema para la biblioteca de la cola de salida.
El tipo de datos de este parámetro es VARCHAR(10).
nombre_cola_salida
Nombre del sistema para el nombre de cola de salida.
El tipo de datos de este parámetro es VARCHAR(10).
nombre_usuario
Nombre del sistema para el usuario propietario del archivo spool.
El tipo de datos de este parámetro es VARCHAR(10).
nombre_trabajo_cal
Nombre del sistema para la biblioteca de la cola de salida.
El tipo de datos de este parámetro es VARCHAR(10).
usuario_trabajo_cal
Nombre del sistema para el nombre de perfil de usuario del trabajo asociada con el archivo spool.
El tipo de datos de este parámetro es VARCHAR(10).
Es obligatorio un valor no nulo y no vacío para este parámetro si se ha especificado
NOMBRE_TRABAJO_CALIFICADO.
OmniFind Text Search Server
129
Si NOMBRE_TRABAJO_CALIFICADO es una serie vacía o NULL, este parámetro también debe ser
nulo o una serie vacía.
número_trabajo_cal
Serie de seis caracteres que representa el número de trabajo. (Debe estar formada por los dígitos 0-9)
El tipo de datos de este parámetro es VARCHAR(6)
Es obligatorio un valor no nulo y no vacío para este parámetro si se ha especificado
NOMBRE_TRABAJO_CALIFICADO.
Si NOMBRE_TRABAJO_CALIFICADO es una serie vacía o NULL, este parámetro también debe ser
nulo o una serie vacía.
datos_usuario
Serie de diez caracteres que el usuario asocia con un archivo spool.
Esta serie no se convierte a mayúsculas y debe coincidir exactamente con los datos de usuario
asociados a un archivo spool para que se considere una coincidencia.
Nota: un valor de 'abc' es distinto de 'ABC'
El tipo de datos de este parámetro es VARCHAR(10).
indicación_fecha_hora_inicial
Valor de indicación de fecha y hora que indica la hora de creación más antigua de los archivos spool
añadidos al conjunto de objetos.
El tipo de datos de este parámetro es TIMESTAMP
indicación_fecha_hora_final
Valor de indicación de fecha y hora que indica la hora de creación más reciente de los archivos spool
añadidos al conjunto de objetos.
El tipo de datos de este parámetro es TIMESTAMP
Nota: Para obtener más detalles sobre el significado y las restricciones de los parámetros anteriores,
consulte la descripción del procedimiento almacenado add_splf_object_set.
Nota sobre el resultado
En los casos siguientes, la eliminación fallará debido a un conjunto de objetos no encontrado:
>El usuario especifica parámetros incorrectos
>Especifica parámetros correspondientes a un conjunto de objetos que se ha suprimido. El usuario
recibirá un mensaje de error que mostrará que no existe un conjunto de objetos con el atributo específico.
QUERY_OBJECT_SET() devuelve la lista de conjuntos de objetos y los parámetros de entrada. El usuario
puede especificar los parámetros de entrada correctos al invocar este procedimiento almacenado para
eliminar el conjunto de objetos.
Ejemplos
Eliminar un conjunto de objetos de la colección nick789 para todos los archivos spool de la cola de salida
NTL/MYOUTQ.
> call nick789.rmv_splf_object_set(’NTL’, ’MYOUTQ’);
Eliminar un conjunto de objetos de la colección nick123 para todos los archivos spool propiedad del
usuario NTL.
> call nick123.rmv_splf_object_set(’’, ’’, ’NTL’);
130
IBM i: OmniFind Text Search Server for DB2 for i
Eliminar un conjunto de objetos de la colección test_col para todos los archivos spool creados en 2010.
> call test_col.rmv_splf_object_set(’’, ’’, ’’, ’’, ’’, ’’, ’’, ’2010-01-01T00:00:00’, ’2011-01-01T00:00:00’);
Añadir un conjunto de objetos a la colección default_search_col para indexar todos los archivos spool
creados en 2010 con los datos de usuario 'MYAPP':
> call default_search_col.add_splf_object_set(’’, ’’, ’’, ’’, ’’, ’’, ’MYAPP’, ’2010-01-01T00:00:00’, ’2011-01-01T00:00:00’);
Añadir un conjunto de objetos de datos de archivo continuo
El procedimiento almacenado se encuentra en el esquema de DB2 para añadir un conjunto de objetos de
datos de archivo continuo.
ADD_IFS_STMF_OBJECT_SET
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
Este procedimiento permite a un usuario añadir un conjunto de objetos de archivos continuos (STMF) al
sistema de archivos integrado (IFS).
Añadir un conjunto de objetos para datos de archivo continuo (archivos continuos en IFS):
ADD_IFS_STMF_OBJECT_SET (
serie-expresión_stmf
)
,
id_conjunto_salida
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
serie-expresión_stmf
Este parámetro contiene una vía de acceso absoluta a un directorio que contiene los archivos que se
indexarán.
Debe ser un directorio válido (de tipo *DIR) de un sistema de archivos que sea accesible. se indexarán
los objetos de archivo continuo (tipo *STMF) de este directorio. El nombre de vía de acceso debe ser
absoluto y no debe contener expresiones regulares.
El tipo de datos de este parámetro es VARCHAR(32000)
Se indexan los archivos continuos del directorio especificado.
v NO se siguen enlaces simbólicos
v NO se procesan subdirectorios
v Los nombres de vía de acceso no debe estar delimitados; los caracteres tales como '*' ', ?", etc. no
tienen ningún significado especial y no deben especificarse con escapes.
v Los nombres de vía de acceso pueden o no ser sensibles a las mayúsculas y minúsculas,
dependiendo del atributo del sistema de archivos.
Se realizará una comprobación al añadir el conjunto de objetos para verificar que no exista ya un
conjunto duplicado en la colección de búsqueda de texto. Esta comprobación no considera las vías de
acceso equivalentes como duplicadas.
OmniFind Text Search Server
131
En otras palabras, las siguientes vías de acceso podrían representar el mismo directorio, pero se
considerarán conjuntos de objetos exclusivos; es más, los objetos de esos conjuntos se indexarán
varias veces como objetos exclusivos.
/dir1/DIR2
/dir1//DIR2//
/DIR1/DIR2/ (si el sistema de archivos es sensible a las mayúsculas y minúsculas)
/dir1/DIR2/../DIR2
etc.
id_conjunto_salida
Valor entero de salida que devuelve el ID de conjunto del conjunto de objetos que se ha añadido. Este
valor puede utilizarse para eliminar el conjunto de objetos en un momento posterior.
Este parámetro es opcional.
El tipo de datos de este parámetro es INTEGER.
Consideraciones especiales para el proceso de actualización
Sistemas de archivos inexistentes:
Si un directorio no se puede localizar durante una operación de actualización, los archivos asociados a
ese directorio no se eliminarán del índice. Esto evita la reindexación innecesaria de documentos cuando
un sistema de archivos se desmonta y luego vuelve a montarse.
Si estos archivos deben eliminarse del índice, existen varias opciones:
v Emita el procedimiento almacenado de eliminación de conjunto de objetos en el conjunto de objetos de
archivo continuo IFS. Esta acción eliminará todos los documentos asociados con el conjunto de
objetos.
v Emita el procedimiento almacenado REPRIME en la colección. Todos los datos se eliminarán del índice
y sólo se reindexarán los archivos que puedan localizarse.
v Cree el directorio como un directorio vacío y emita la actualización
Conversión de CCSID
Si el formato (FORMAT) de la colección es TEXT:
v El atributo CCSID del archivo se utiliza para convertir los datos extraídos del archivo a UTF-8 para la
indexación. El atributo CCSID del archivo debe ser correcto para que el archivo pueda indexarse
correctamente.
Si el formato (FORMAT) de la colección es INSO:
v Los datos del archivo se extraerán del archivo y se enviarán al servidor de búsqueda de texto para el
proceso. No se realizará ninguna conversión de juego de caracteres y el atributo CCSID del archivo se
ignorará. El servidor de búsqueda de texto utilizará su proceso de texto enriquecido para determinar el
formato y la codificación del documento. Puede utilizarse para indexar archivos de texto enriquecido
(como PDF) o archivos de texto normales. En el caso de algunos documentos de texto sin formato,
puede que el servidor de búsqueda de texto no pueda determinar la codificación del documento con la
confianza suficiente para indexar los datos. Esto es más probable para documentos muy pequeños,
pero también puede producirse en documentos grandes que utilice una amplia gama de caracteres. Si
el formato y la codificación del archivo no pueden determinarse, el archivo no se indexará y se
registrará un error de documento.
Autorizaciones para objetos indexados
Al añadir un conjunto de objetos de archivo continuo IFS, considere cuidadosamente los requisitos de
autorización para leer los archivos continuos. Las autorizaciones adoptadas no se aceptan al acceder a los
datos del archivo continuo. Además, se ejecutan actualizaciones planificadas bajo el perfil de usuario
132
IBM i: OmniFind Text Search Server for DB2 for i
propietario del índice. Consulte la documentación del procedimiento almacenado de actualización para
obtener más información sobre los requisitos de autorización para objetos indexados.
ADD_IFS_STMF_OBJECT_SET_WITH_SUBDIR
La sintaxis y los requisitos de autorización de este procedimiento almacenado son similares a los de
ADD_IFS_STMF_OBJECT_SET. Con este procedimiento almacenado, el usuario puede añadir un
directorio como un conjunto de objetos a la colección. Todos los archivos y subdirectorios bajo este
directorio se indexarán recursivamente.
Ejemplo
Añadir un conjunto de objetos a MYCOLLECTION para indexar todos los archivos continuos del
directorio IFS '/home/ntl/stmf':
> CALL MYCOLLECTION.ADD_IFS_STMF_OBJECT_SET(’/home/ntl/stmf’);
Añadir un conjunto de objetos a MYCOLLECTION para indexar todos los archivos continuos y
subdirectorios del directorio IFS '/home/ntl/stmf':
> CALL MYCOLLECTION.ADD_IFS_STMF_OBJECT_SET_WITH_SUBDIR(’/home/ntl/stmf’);
Para añadir una vía de acceso de IFS a una colección desde IBM Navigator for i, siga estos pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > OmniFind > Lista de colecciones.
3. Pulse la colección con el botón derecho del ratón y seleccione Propiedades. En la pestaña Objeto,
pulse el botón Añadir vía de acceso de IFS. Seleccione Incluir subdirectorios para añadir todos los
subdirectorios bajo la vía de acceso de IFS especificada.
Eliminar un conjunto de objetos de datos de archivo continuo
El procedimiento almacenado se encuentra en el esquema de DB2® para eliminar un conjunto de objetos
de datos de archivo continuo.
RMV_IFS_STMF_OBJECT_SET
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
Este procedimiento permite a un usuario eliminar un conjunto de objetos de archivos continuos (STMF)
del sistema de archivos integrado (IFS).
Eliminar un conjunto de objetos para datos de archivo continuo (archivos continuos en IFS):
>>-RMV_IFS_STMF_OBJECT_SET -(--serie_expresión_stmf-----------><
El calificador de esquema es el nombre de la colección de búsqueda de texto.
OmniFind Text Search Server
133
Parámetros
serie-expresión_stmf
Este parámetro es una vía de acceso absoluta a un directorio que es el atributo del conjunto de
objetos.
No es necesario que sea un directorio válido de un sistema de archivos que sea accesible, ya que el
usuario podría suprimir la vía de acceso, pero el conjunto de objetos seguiría existiendo. El nombre
de vía de acceso debe ser absoluto y no debe contener expresiones regulares.
El tipo de datos de este parámetro es VARCHAR(32000)
Nota: Nota para el nombre de vía de acceso de directorio especificada:
v Los nombres de vía de acceso no debe estar delimitados; los caracteres tales como '*' ', ?", etc. no
tienen ningún significado especial y no deben especificarse con escapes.
v Los nombres de vía de acceso pueden o no ser sensibles a las mayúsculas y minúsculas,
dependiendo del atributo del sistema de archivos.
Dado que ADD_IFS_STMF_OBJECT_SET no considera las vías de acceso equivalentes como un
conjunto de objetos duplicado, el usuario debe indicar exactamente la misma vía de acceso que
ADD_IFS_STMF_OBJECT_SET añadido al intentar eliminar el conjunto de objetos específico.
En otras palabras, las siguientes vías de acceso podrían representar el mismo directorio, pero se
considerarán conjuntos de objetos diferentes.
/dir1/DIR2
/dir1//DIR2//
/DIR1/DIR2/ (si el sistema de archivos es sensible a las mayúsculas y minúsculas)
/dir1/DIR2/../DIR2
etc.
RMV_IFS_STMF_OBJECT_SET_WITH_SUBDIR
Este procedimiento almacenado puede eliminar un conjunto de objetos que incluya archivos IFS de
subdirectorio. Este conjunto de objetos puede añadirse mediante el procedimiento
ADD_IFS_STMF_OBJECT_SET_WITH_SUBDIR.
La sintaxis, requisitos de autorización y parámetros de este procedimiento almacenado son similares a los
de RMV_IFS_STMF_OBJECT_SET. Si el usuario añade una vía de acceso IFS a un conjunto de objetos con
subdirectorio y a un conjunto de objetos sin subdirectorios, el uso de este procedimiento sólo eliminará el
conjunto de objetos con subdirectorio.
Nota sobre el resultado
En los casos siguientes, la eliminación fallará debido a un conjunto de objetos no encontrado:
>El usuario especifica una vía de acceso IFS incorrecta
>Especifica una vía de acceso IFS correspondiente a un conjunto de objetos que se ha suprimido. El
usuario recibirá un mensaje de error que mostrará que no existe un conjunto de objetos con el atributo
específico.
QUERY_OBJECT_SET() devuelve la lista de conjuntos de objetos y los parámetros de entrada. El usuario
puede especificar los parámetros de entrada correctos al invocar este procedimiento almacenado para
eliminar el conjunto de objetos.
134
IBM i: OmniFind Text Search Server for DB2 for i
Ejemplos
Eliminar un conjunto de objetos de MYCOLLECTION, cuyo directorio de IFS es '/home/ntl/stmf':
> CALL MYCOLLECTION.RMV_IFS_STMF_OBJECT_SET(’/home/ntl/stmf’);
Eliminar un conjunto de objetos de MYCOLLECTION que incluye todos los archivos continuos y
subdirectorios del directorio de IFS '/home/ntl/stmf':
> CALL MYCOLLECTION.RMV_IFS_STMF_OBJECT_SET_WITH_SUBDIR(’/home/ntl/stmf’);
Añadir un conjunto de objetos de archivo físico de origen
multimiembro
El procedimiento almacenado se encuentra en el esquema de DB2® para añadir un conjunto de objetos de
archivo físico de origen multimiembro.
ADD_SRCPF_OBJECT_SET
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
Este procedimiento permite a un usuario añadir un conjunto de objetos de archivo físico de origen
multimiembro (MMPF).
Añadir un conjunto de objetos de archivo físico de origen multimiembro:
>>-ADD_SRCPF_OBJECT-SET -(---SRCPF_LIB----------->
>-------- SRCPF_NAME ------)-------------------------------------><
>--+------------------+--)-------------------------------------><
’-,-- OUT_SETID -’
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetro
SRCPF_LIB
Este parámetro indica una biblioteca absoluta que contiene los archivos físicos de origen que se
indexarán.
Debe ser un nombre de biblioteca válido en el sistema. Se indexarán los objetos de archivo físico de
origen multimiembro de esta biblioteca. El nombre de biblioteca debe ser absoluto y no debe contener
expresiones regulares.
El tipo de datos de este parámetro es VARCHAR(10)
SRCPF_NAME
Este parámetro indica un archivo físico de origen absoluto que puede tener uno o más miembros; se
indexarán todos los miembros del archivo físico de origen. El nombre de archivo debe ser absoluto y
no debe contener expresiones regulares.
OmniFind Text Search Server
135
Nota: si el archivo físico de origen se suprime después de añadir el conjunto de objetos a la colección
de búsqueda de texto, la llamada posterior al procedimiento almacenado UPDATE lo detectará, y el
resultado de la búsqueda no contendrá los miembros de ese archivo físico de origen.
*ALLSRCPF
Si se especifica *ALLSRCPF como nombre del archivo físico de origen, indicará que los archivos
físicos de origen de SRCPF_LIB se indexarán al actualizar el índice.
Nota: Si el usuario especifica *ALLSRCPF como nombre de archivo físico de origen al añadir un
conjunto de objetos, también se permite añadir otro PF específico bajo la misma biblioteca que un
conjunto de objetos. Esto NO conducirá a un error de duplicación.
El tipo de datos de este parámetro es VARCHAR(10).
OUT_SETID
Valor entero de salida que devuelve el ID de conjunto del conjunto de objetos que se ha añadido. Este
valor puede utilizarse para eliminar el conjunto de objetos en un momento posterior.
Este parámetro es opcional.
El tipo de datos de este parámetro es INTEGER.
Restricciones adicionales
v Se realizará una comprobación al añadir el conjunto de objetos para verificar que no exista ya un
conjunto duplicado en la colección de búsqueda de texto.
v Al añadir un conjunto de objetos de archivo físico de origen a una colección de búsqueda de texto,
OmniFind verifica que el archivo físico de origen existe. Si el archivo físico de origen no existe, se
devuelve un mensaje de error y el conjunto de objetos no se añade.
v Si el archivo especificado no es un archivo físico de origen, la llamada al procedimiento falla con un
error.
Autorizaciones para objetos indexados
Al añadir un conjunto de objetos de archivo físico de origen de varios miembros, considere
cuidadosamente los requisitos de autorización para leer los archivos. Las autorizaciones adoptadas no se
aceptan al acceder a los datos del archivo físico de origen. Además, se ejecutan actualizaciones
planificadas bajo el perfil de usuario propietario del índice. Consulte la documentación del procedimiento
almacenado de actualización para obtener más información sobre los requisitos de autorización para
objetos indexados.
Ejemplos
Añadir un conjunto de objetos a MYCOLLECTION para indexar el archivo físico de origen multimiembro
QCSRC de la biblioteca ISVSQLLP:
> CALL MYCOLLECTION.ADD_SRCPF_OBJECT_SET(’ISVSQLLP’,’QCSRC’);
Añadir un conjunto de objetos a MYCOLLECTION para indexar el archivo físico de origen multimiembro
QCSRC de la biblioteca ISVSQLLP, y esperar la obtención del ID de conjunto (setid).
> create variable setid int default 0;
> CALL MYCOLLECTION.ADD_SRCPF_OBJECT_SET(’ISVSQLLP’,’QCSRC’,setid);
Añadir un conjunto de objetos a MYCOLLECTION para indexar todos los archivos físicos de origen
multimiembro de la biblioteca ISVSQLLP:
> CALL MYCOLLECTION.ADD_SRCPF_OBJECT_SET(’ISVSQLLP’,’*ALLSRCPF’);
Para añadir un conjunto de objetos de archivo físico de origen a una colección desde IBM® Navigator for
i, siga estos pasos.
136
IBM i: OmniFind Text Search Server for DB2 for i
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas >OmniFind > Lista
de colecciones.
2. Pulse la colección con el botón derecho del ratón y seleccione Propiedades. En la pestaña Objeto,
pulse el menú desplegable, seleccione Añadir archivo físico de origen y, a continuación, pulse
Añadir.
Eliminar un conjunto de objetos de archivo físico de origen
multimiembro
El procedimiento almacenado se encuentra en el esquema de DB2® para eliminar un conjunto de objetos
de archivo físico de origen multimiembro.
RMV_SRCPF_OBJECT_SET
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
Este procedimiento permite a un usuario eliminar un conjunto de objetos de archivo físico de origen
multimiembro (MMPF).
Eliminar un conjunto de objetos de archivo físico de origen multimiembro:
>>-RMV_SRCPF_OBJECT-SET -(---SRCPF_LIB----------->
>-------- SRCPF_NAME ------)-------------------------------------><
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetro
SRCPF_LIB
Este parámetro indica una biblioteca absoluta que contiene los archivos físicos de origen.
El nombre de biblioteca debe ser absoluto y no debe contener expresiones regulares.
El tipo de datos de este parámetro es VARCHAR(10).
SRCPF_NAME
Este parámetro indica un archivo físico de origen absoluto que puede tener uno o más miembros; se
indexarán todos los miembros del archivo físico de origen. El nombre de archivo debe ser absoluto y
no debe contener expresiones regulares.
*ALLSRCPF
Si se especifica *ALLSRCPF como nombre del archivo físico de origen, indica que se eliminará el
conjunto de objetos de todos los archivos físicos de origen de SRCPF_LIB.
El tipo de datos de este parámetro es VARCHAR(10).
Nota sobre el resultado
En los casos siguientes, la eliminación fallará debido a un conjunto de objetos no encontrado:
>El usuario especifica un valor incorrecto de SRCPF_LIB o SRCPF_NAME
>Especifica un conjunto de objetos SRCPF_LIB/SRCPF_NAME correspondiente que se ha eliminado anteriormente.
OmniFind Text Search Server
137
El usuario recibirá un mensaje de error que mostrará que no existe un conjunto de objetos con el atributo
específico.
QUERY_OBJECT_SET() devuelve la lista de conjuntos de objetos y los parámetros de entrada. El usuario
puede especificar los parámetros de entrada correctos al invocar este procedimiento almacenado para
eliminar el conjunto de objetos.
Ejemplos
Eliminar un conjunto de objetos de MYCOLLECTION para el archivo físico de origen multimiembro
QCSRC de la biblioteca ISVSQLLP:
> CALL MYCOLLECTION.RMV_SRCPF_OBJECT_SET(’ISVSQLLP’,’QCSRC’);
Eliminar un conjunto de objetos de MYCOLLECTION para todos los archivos físicos de origen
multimiembro de la biblioteca ISVSQLLP:
> CALL MYCOLLECTION.RMV_SRCPF_OBJECT_SET(’ISVSQLLP’,’*ALLSRCPF’);
Eliminar un conjunto de objetos
Este procedimiento almacenado eliminará un conjunto de objetos de una colección de búsqueda de texto.
REMOVE_OBJECT_SET
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
REMOVE_OBJECT_SET (
setid )
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
setid
El ID de conjunto que se ha obtenido al añadir el conjunto de objetos.
El ID de conjunto de objetos también puede obtenerse utilizando el procedimiento almacenado
QUERY_OBJECT_SET después de añadir el conjunto de objetos.
El tipo de datos de este parámetro es INTEGER.
Ejemplos
Eliminar el conjunto de objetos #1 de la colección MYCOLLECTION.
> CALL MYCOLLECTION.remove_object_set(1)
Para eliminar un conjunto de objetos de una colección desde IBM Navigator for i, siga estos pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > OmniFind > Lista de colecciones.
138
IBM i: OmniFind Text Search Server for DB2 for i
3. Pulse la colección con el botón derecho del ratón y seleccione Propiedades. En la pestaña Objeto,
pulse el botón Eliminar.
Actualizar la colección
Este procedimiento almacenado actualiza la colección. Cuando se llama inicialmente, se indexan todos los
objetos incluidos en los conjuntos de objetos de la colección. Cuando se llama a este procedimiento
almacenado después de completar una actualización inicial satisfactoria, todos los objetos cambiados se
actualizan en el índice. El procedimiento no devuelve el control al interlocutor hasta que ha finalizado la
actualización.
UPDATE
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
UPDATE
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
Ninguno
Requisitos de autorización sobre objetos indexados
Las actualizaciones planificadas se ejecutan bajo el perfil propietario de la colección de búsqueda de
texto.
Las llamadas a los procedimientos almacenados UPDATE se ejecutan bajo el perfil que invoca el
procedimiento.
Es recomendable que tanto el propietario del índice como el perfil que administra el índice tengan
autorización para leer los datos de texto de todos los objetos indexados en la colección. Si no se tiene la
autorización suficiente, pueden producirse resultados imprevisibles.
La autorización adoptada no se respetará necesariamente para rastrear objetos y extraer texto de esos
objetos.
Los problemas de autorización durante el proceso de actualización pueden provocar que la actualización
falle, o que no se indexen documentos individuales.
Ejemplos
CALL MYCOLLECTION.UPDATE;
Para actualizar el índice de colección desde IBM Navigator for i, siga estos pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > OmniFind > Lista de colecciones.
OmniFind Text Search Server
139
3. Pulse la colección con el botón derecho del ratón y seleccione Actualizar.
Volver a llenar la colección de búsqueda de texto
El procedimiento almacenado REPRIME borra la colección y, a continuación, realiza una actualización
inicial. El procedimiento no devuelve el control al interlocutor hasta que ha finalizado la actualización.
REPRIME
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
REPRIME
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
Ninguno
Consideraciones sobre la autorización de Reprime para objetos indexados
Las actualizaciones planificadas se ejecutan bajo el perfil propietario de la colección de búsqueda de
texto.
Las llamadas a los procedimientos almacenados REPRIME se ejecutan bajo el perfil que invoca el
procedimiento.
Es recomendable que tanto el propietario del índice como el perfil que administra el índice tengan
autorización para leer los datos de texto de todos los objetos indexados en la colección. Si no se tiene la
autorización suficiente, pueden producirse resultados imprevisibles.
La autorización adoptada no se respetará necesariamente para rastrear objetos y extraer texto de esos
objetos.
Los problemas de autorización durante el proceso de actualización pueden provocar que la actualización
falle, o que no se indexen documentos individuales.
Ejemplos
CALL MYCOLLECTION.REPRIME;
Para volver a llenar la colección de búsqueda de texto desde IBM Navigator for i, siga estos pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > OmniFind > Lista de colecciones.
3. Pulse la colección con el botón derecho del ratón y seleccione Volver a preparar.
140
IBM i: OmniFind Text Search Server for DB2 for i
Buscar en la colección
Este procedimiento permite a un usuario buscar en una colección de búsqueda de texto los objetos que
coinciden con una búsqueda.
SEARCH
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
SEARCH
( serie_búsqueda
)
,
opciones_búsqueda
,
número_de_resultados
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
serie_búsqueda
Un parámetro de serie que contiene la expresión de búsqueda.
Nota: esta expresión no puede estar formada sólo por espacios en blanco ni ser una serie vacía.
Consulte la sintaxis de argumentos de búsqueda del manual de consulta de OmniFind para obtener
detalles.
El tipo de datos de este parámetro es VARCHAR(32700).
opciones_búsqueda
Identifica una constante de tipo serie que especifica las opciones de argumento de búsqueda en vigor
para la función.
El tipo de datos de este parámetro es VARCHAR(32700).
opciones_búsqueda:
,
QUERYLANGUAGE =
valor
,
RESULTLIMIT =
valor
,
SYNONYM =
OFF
ON
QUERYLANGUAGE
Especifica el idioma de la consulta. El valor puede ser cualquiera de los códigos de idioma
soportados. Si no se especifica la opción QUERYLANGUAGE, el valor predeterminado es el valor
de idioma del índice de búsqueda de texto utilizado cuando se invoca la función. Si el valor de
idioma del índice de búsqueda de texto es AUTO, el valor predeterminado para
QUERYLANGUAGE es en_US.
RESULTLIMIT
Proporciona una pista al optimizador de DB2 con respecto al número de filas del conjunto de
resultados que se espera utilizar. El optimizador puede elegir un plan diferente para devolver
menos filas desde el procedimiento SEARCH. El optimizador también puede ignorar esta opción
si no se va a obtener una ventaja de rendimiento durante la búsqueda.
OmniFind Text Search Server
141
SYNONYM
Especifica si debe utilizarse un diccionario de sinónimos asociado con el índice de búsqueda de
texto. Puede añadir un diccionario de sinónimos a una colección mediante la herramienta de
sinónimos. OFF es el valor predeterminado.
número_de_resultados
Valor entero de salida que devuelve el número de documentos del resultado de la búsqueda.
El tipo de datos de este parámetro es VARCHAR(32700).
CONJUNTO DE RESULTADOS DEVUELTO
El procedimiento de búsqueda devuelve un conjunto de resultados con coincidencias para la expresión de
búsqueda.
El conjunto de resultados contiene las columnas siguientes:
OBJTYPE
OBJATTR
CONTAINING_OBJECT_LIB
CONTAINING_OBJECT_NAME
OBJECTINFOR
MODIFY_TIME
SCORE
CHAR(10) CCSID
CHAR(10) CCSID
CHAR(10) CCSID
CHAR(10) CCSID
XML
TIMESTAMP
DOUBLE
1208
1208
1208
1208
OBJTYPE - El tipo de objeto del sistema para este resultado (*STMF, *OUTQ, etc).
OBJATR - El atributo del objeto del sistema que ha coincidido con la expresión de búsqueda (*SPLF,
*DATA, etc.).
CONTAINING_OBJECT_LIB - La biblioteca del objeto del sistema coincidente.
CONTAINING_OBJECT_NAME - El nombre del objeto del sistema coincidente.
OBJECTINFOR - Un valor XML que describe la información de ubicación de los datos indexados
coincidentes con la expresión serie_búsqueda. A continuación se muestra un ejemplo de ubicación de
archivo spool:
<Spool_File xmlns=”http://www.ibm.com/xmlns/prod/db2textsearch/obj1”>
<job_name>QPADEV000Cjob_name>QPADEV000C>
<job_user_name>USERAjob_user_name>USERA>
<spool_file_name>DSXSVRALSspool_file_name>DSXSVRALS>
<spool_file_number>1spool_file_number>1>
<job_system_name>ZD21BP1job_system_name>ZD21BP1>
<create_date>1081027create_date>1081027>
<create_time>035554create_time>035554>
</Spool_File>
A continuación se muestra un ejemplo de ubicación de archivo continuo IFS:
<Stream_File xmlns=”http://www.ibm.com/xmlns/prod/db2textsearch/obj1”>
<file_path>/home/usera/a.txt</file_path>
</Spool_File>
A continuación se muestra un ejemplo de ubicación de miembro de archivo físico:
<Source_Physical_File_Member xmlns=”http://www.ibm.com/xmlns/prod/db2textsearch/obj1>
<file_library>MYLIB</file_library>
<file_name>MYPF</file_name>
<member_name>member1</member_name>
</Source_Physical_File_Member>
DB2 proporciona una serie de métodos para convertir un valor XML a otros formatos para que las
aplicaciones puedan acceder a los datos. Una posibilidad es crear una hoja de estilo XSL y utilizar la
142
IBM i: OmniFind Text Search Server for DB2 for i
función XSLTRANSFORM. Otra posibilidad es crear un esquema anotado para los valores XML y utilizar
el procedimiento XDBDECOMPXML para llenar las tablas relacionales con los valores. El manual de
consulta de SQL de Information Center contiene detalles sobre ambas funciones.
MODIFY_TIME - Indicación de fecha y hora que indica la hora de la última modificación del objeto que
está en la colección. Esta indicación de fecha y hora nunca será más reciente que el proceso de la última
actualización.
SCORE - El resultado es mayor que 0 pero menor que 1 si los datos de texto indexados contienen una
coincidencia con los criterios de búsqueda especificados por el argumento de búsqueda. Cuanto mayor
sea la frecuencia con la que se encuentre una coincidencia, mayor será el valor del resultado. Si la
columna no contiene una coincidencia, el resultado es 0.
El conjunto de resultados se ordena por puntuación descendente.
Ejemplos
1. call MYCOLLECTION.search('big bad wolf');
2. call MYCOLLECTION.search('big bad wolf', 'QUERYLANGUAGE=en_US');
Para buscar en la colección desde IBM Navigator for i, siga estos pasos.
1. Desde IBM Navigator for i, expanda Gestión de IBM i > Sistema > Buscar.
2. Seleccione Buscar.
Consultar información de conjunto de objetos
Este procedimiento permite a un usuario ver la lista de conjuntos de objetos que están contenidos dentro
de la colección.
QUERY_OBJECT_SET
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
QUERY_OBJECT_SET
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
Ninguno
CONJUNTO DE RESULTADOS DEVUELTO
El procedimiento devuelve un conjunto de resultados que contiene una fila para cada conjunto de objetos:
SETID
SETSTATE
LASTREFRESHTIME
ADDOBJSETSQL
INTEGER
CHAR(10)
CCSID 1208
TIMESTAMP
VARCHAR(2000) CCSID 1208
OmniFind Text Search Server
143
SETID - Identificador exclusivo asignado a cada conjunto de objetos. Este identificador puede utilizarse
en el procedimiento almacenado remove_object_set para eliminar el conjunto de objetos de la colección.
SETSTATE - Estado del conjunto de objetos. Está reservado para una ampliación futura y siempre es
'ACTIVE'.
LASTREFRESHTIME - La última vez que el conjunto de objetos se ha renovado para reflejar los objetos
que se encuentran realmente en el sistema.
ADDOBJSETSQL - Llamada al procedimiento almacenado SQL que se ha utilizado para añadir este
conjunto de objetos.
Ejemplos
Call MYCOLLECTION.QUERY_OBJECT_SET;
Para consultar la información de conjunto de objetos de una colección desde IBM Navigator for i, siga
estos pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > OmniFind > Lista de colecciones.
3. Pulse la colección con el botón derecho del ratón y seleccione Propiedades. Pulse la pestaña Objeto.
Recuperar estado de objetos de índices
Este procedimiento devuelve el estado de todos los objetos de la colección de búsqueda de texto.
GET_OBJECT_STATUS
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
GET_OBJECT_STATUS
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
Ninguno
CONJUNTO DE RESULTADOS DEVUELTO
El procedimiento devuelve un conjunto de resultados que contiene una fila para cada conjunto de objetos:
OBJECT
STATUS_TIMESTAMP
STATUS_CODE
TEXT_STATUS
XML
TIMESTAMP
INTEGER
VARCHAR(100)
OBJECT - La información de ubicación del objeto en el índice, que coincide con el formato devuelto por
la búsqueda para la columna OBJECTINFOR.
144
IBM i: OmniFind Text Search Server for DB2 for i
STATUS_TIMESTAMP - Si el estado del objeto es INDEXED, esta es la indicación de fecha y hora de
modificación del objeto en el índice. En otras palabras, los cambios realizados en el objeto antes de esta
hora se reflejan en el índice de búsqueda de texto. Para todos los demás valores de estado, esta indicación
de fecha y hora es la hora en que el estado se ha registrado en el índice. Por ejemplo: si el estado del
objeto es ERROR, este es el momento en que se ha registrado el error.
STATUS_CODE - Valor numérico que representa el estado de este objeto:
0 = El objeto se ha indexado y no se han detectado cambios en el
objeto.
10 = El objeto se encuentra actualmente en proceso de indexación.
20 = Se han detectado cambios en el objeto.
30 = El objeto se ha indexado, pero se ha producido un aviso durante el proceso de indexación.
40 = Un error ha impedido la indexación del objeto.
Estos valores permiten criterios de selección más complejos. Es decir, recuperar todos los objetos no
actuales del índice se puede expresar como STATUS_CODE > 0.
Nota: el estado de los objetos que se encuentran en proceso de actualización o estaban en proceso de
actualización cuando se canceló una actualización puede diferir de la realidad. Es posible que un objeto
informe de que hay cambios pendientes, cuando en realidad el texto que se debe indexar ya ha sido
enviado al servidor. También es posible que el estado de un documento sea 'INDEXED', pero el objeto
puede no estar en condiciones de búsqueda hasta un punto de confirmación futuro del proceso de
actualización. STATUS_CODE reflejará la realidad cuando el procedimiento almacenado de actualización
se haya completado.
El conjunto de resultados se ordena (por orden descendente) por código de estado.
TEXT_STATUS - La versión de texto del código de estado:
0
10
20
30
40
=
=
=
=
=
INDEXED
INDEXING
CHANGES PENDING
WARNING
ERROR
Ejemplos
Call MYCOLLECTION.GET_OBJECT_STATUS;
Obtener objetos no indexados
Este procedimiento devuelve los objetos que no están indexados en la colección de búsqueda de texto.
GET_OBJECTS_NOT_INDEXED
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
GET_OBJECTS_NOT_INDEXED
El calificador de esquema es el nombre de la colección de búsqueda de texto.
OmniFind Text Search Server
145
Parámetros
Ninguno
CONJUNTO DE RESULTADOS DEVUELTO
El procedimiento devuelve un conjunto de resultados que contiene una fila para cada conjunto de objetos:
OBJECT
STATUS_TIMESTAMP
STATUS_CODE
TEXT_STATUS
XML
TIMESTAMP
INTEGER
VARCHAR(100)
OBJECT - La información de ubicación del objeto en el índice, que coincide con el formato devuelto por
la búsqueda para la columna OBJECTINFOR.
STATUS_TIMESTAMP - Si el estado del objeto es INDEXED, esta es la indicación de fecha y hora de
modificación del objeto en el índice. En otras palabras, los cambios realizados en el objeto antes de esta
hora se reflejan en el índice de búsqueda de texto. Para todos los demás valores de estado, esta indicación
de fecha y hora es la hora en que el estado se ha registrado en el índice. Por ejemplo: si el estado del
objeto es ERROR, este es el momento en que se ha registrado el error.
STATUS_CODE - Valor numérico que representa el estado de este objeto:
0 = El objeto se ha indexado y no se han detectado cambios en el objeto.
10 = El objeto se encuentra actualmente en proceso de indexación.
20 = Se han detectado cambios en el objeto.
30 = El objeto se ha indexado, pero se ha producido un aviso durante el proceso de indexación.
40 = Un error ha impedido la indexación del objeto.
Estos valores permiten criterios de selección más complejos. Es decir, recuperar todos los objetos no
actuales del índice se puede expresar como STATUS_CODE > 0.
Nota: el estado de los objetos que se encuentran en proceso de actualización o estaban en proceso de
actualización cuando se canceló una actualización puede diferir de la realidad. Es posible que un objeto
informe de que hay cambios pendientes, cuando en realidad el texto que se debe indexar ya ha sido
enviado al servidor. También es posible que el estado de un documento sea 'INDEXED', pero el objeto
puede no estar en condiciones de búsqueda hasta un punto de confirmación futuro del proceso de
actualización. STATUS_CODE reflejará la realidad cuando el procedimiento almacenado de actualización
se haya completado.
El conjunto de resultados se ordena (por orden descendente) por código de estado.
TEXT_STATUS - La versión de texto del código de estado:
0
10
20
30
40
=
=
=
=
=
INDEXED
INDEXING
CHANGES PENDING
WARNING y ERROR
WARNING y ERROR
Ejemplos
Call MYCOLLECTION.GET_OBJECTS_NOT_INDEXED;
Recuperar estado de colección
Este procedimiento devuelve el estado de la colección de búsqueda de texto.
STATUS
146
IBM i: OmniFind Text Search Server for DB2 for i
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
STATUS
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
Ninguno
CONJUNTO DE RESULTADOS DEVUELTO
El procedimiento devuelve un conjunto de resultados que contiene una fila para cada conjunto de objetos:
SERVERID
SERVERNAME
SERVERSTATUS
LASTUPDATETIME
LASTUPDATESTATUS
UPDATEFREQUENCY
INTEGER
VARCHAR(128)
VARCHAR(32)
TIMESTAMP
VARCHAR(30)
VARCHAR(512)
SERVERID - ID de servidor del índice de búsqueda de texto.
SERVERNAME - Nombre de host o dirección IP del servidor de búsqueda de texto.
SERVERSTATUS - Indica si el servidor puede utilizarse como servidor de búsqueda de texto para crear
índices de búsqueda de texto. El valor predeterminado es 0 (cero), que indica que el servidor puede
utilizarse.
LASTUPDATETIME - Hora de última actualización del índice de búsqueda de texto.
LASTUPDATESTATUS - Indica el último estado de actualización del índice de búsqueda de texto.
NEVER UPDATED - El índice de búsqueda de texto nuca se ha actualizado.
UP TO DATE - El índice de búsqueda de texto está actualizado.
CHANGES PENDING - Hay cambios pendientes. El usuario necesita actualizar el
índice para actualizar el índice de búsqueda de texto.
FAILED - El índice de búsqueda de texto se ha actualizado de forma anómala por última
vez.
UPDATEFREQUENCY - Frecuencia de actualizaciones automáticas en el índice de búsqueda de texto.
Ejemplos
Call MYCOLLECTION.STATUS;
Para recuperar el estado de colección desde IBM Navigator for i, siga estos pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > OmniFind > Lista de colecciones.
OmniFind Text Search Server
147
Eliminar una colección de búsqueda de texto
Este procedimiento elimina una colección de búsqueda de texto del sistema.
SYSPROC.SYSTS_DRPCOL y SYSPROC.SYSTS_DROP_COLLECTION
Autorización
Los procedimientos almacenados SYSPROC.SYSTS_DRPCOL y SYSPROC.SYSTS_DROP_COLLECTION se
suministran con la autorización pública *EXECUTE.
No se adopta ninguna autorización y el procedimiento se ejecuta bajo el perfil del usuario.
El usuario debe tener autorización para eliminar el esquema SQL (incluidos todos los objetos que
contiene) para poder eliminar correctamente la colección.
Sintaxis
SYSTS_DRPCOL (
nombre_colección )
Sintaxis
SYSTS_DROP_COLLECTION (
nombre_colección )
El calificador de esquema es SYSPROC.
Parámetros
nombre_colección
El nombre de la colección suministrado en el procedimiento almacenado
SYSTS_CREATE_COLLECTION.
El tipo de datos de este parámetro es VARCHARE(128).
Ejemplos
CALL SYSPROC.SYTS_DRPCOL(‘”MYCOLLECTION”')
Otros ejemplos utilizando procedimientos de colección de búsqueda de texto
>
CALL SYSPROC.SYSTS_CREATE_COLLECTION(’MYCOLLECTION’, ’FORMAT TEXT’);
De forma predeterminada, siempre se llama a los procedimientos almacenados asociados con la nueva colección.
> SET SCHEMA MYCOLLECTION
> SET PATH MYCOLLECTION
Añadir un conjunto de objetos para todos los archivos spool propiedad del usuario ZOOKEEPER
> CALL.ADD_SPLF_OBJECT_SET(’’, ’’, ’ZOOKEEPER’);
Añadir un conjunto de objetos para todos los archivos spool creados el 06/14/2010
> CALL ADD_SPLF_OBJECT_SET(’’, ’’, ’’, ’’, ’’, ’’, ’’, ’2010-06-14T00:00:00’, ’2010-06-15T00:00:00’);
Añadir un conjunto de objetos para todos los archivos continuos del directorio de IFS ’/home/zookeeper’
> CALL ADD_IFS_STMF_OBJECT_SET(’/home/zookeeper’);
Actualizar la colección
> CALL UPDATE;
Buscar ’Leones AND tigres AND osos’
148
IBM i: OmniFind Text Search Server for DB2 for i
> CALL SEARCH(’leones AND tigres AND osos’);
Otorgar autorización a otro usuario (SEARCHER)
> GRANT EXECUTE ON SPECIFIC PROCEDURE SEARCH1 TO SEARCHER
Eliminar la colección
> CALL SYSPROC.SYSTS_DROP_COLLECTION(’MYCOLLECTION’)
Para eliminar una colección de búsqueda de texto desde IBM Navigator for i, siga estos pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > OmniFind > Lista de colecciones.
3. Pulse la colección con el botón derecho del ratón y seleccione Suprimir.
Modificar una colección de búsqueda de texto
Puede llamar a este procedimiento almacenado para modificar los atributos de una colección que se ha
creado mediante SYSPROC.SYSTS_CREATE_COLLECTION. Sólo se cambiarán los atributos especificados
explícitamente en este procedimiento. Todos los demás atributos del índice permanecerán sin cambios.
Este procedimiento resulta de utilidad si necesita cambiar los atributos de la colección, como por ejemplo
la frecuencia de actualización, una vez que ésta se ha creado.
ALTER_COLLECTION
Autorización
Este procedimiento almacenado se crea con la autorización pública *EXCLUDE y es propiedad del
creador de la colección de búsqueda de texto.
El procedimiento adoptará la autorización del perfil del propietario de la colección de búsqueda de texto.
Puede otorgarse autorización a otros usuarios para permitirles ejecutar el procedimiento.
Sintaxis
>>-ALTER_COLLECTION--(--opciones-----------------------------><
El calificador de esquema es el nombre de la colección de búsqueda de texto.
Parámetros
opciones
Serie de caracteres que especifica las diversas opciones que están disponibles para este procedimiento
almacenado.
El tipo de datos de este parámetro es VARCHAR(32000).
opciones:
características-actualización
características-actualización:
UPDATE FREQUENCY
NONE
< frecuencia-actualización>
OmniFind Text Search Server
149
características-actualización
Especifica la frecuencia de las actualizaciones automáticas de la colección de búsqueda de texto. El
proceso de actualización de una colección de búsqueda de texto implica tanto la indexación de los
datos de texto como el rastreo de los objetos del sistema para detectar datos nuevos o cambiados.
UPDATE FREQUENCY frecuencia-actualización
Especifica cuándo deben realizarse actualizaciones automáticas en la colección de búsqueda de
texto. El valor predeterminado es NONE.
frecuencia-actualización (Formato 1):
NONE
D (
*
)
H
(
*
,
)
M
(
*
,
0..6 0..23 0..6
)
,
0..59 0..23
0..59
NONE
Si se especifica NONE, no se realizan más actualizaciones de índice. La actualización
debe iniciarse manualmente.
D
Especifica el día o días de la semana en los que se actualiza el índice. Un asterisco (*)
indica todos los días. 0 indica el Domingo.
H
Especifica la hora u horas en las que se actualiza el índice. Un asterisco (*) indica todas
las horas.
M
Especifica el minuto o minutos en los que se actualiza el índice. No puede especificarse
un asterisco (*). La frecuencia de actualización mínima es de 5 minutos.
Ejemplo: este ejemplo especifica que la actualización de índice debe ejecutarse cada 30 minutos.
UPDATE FREQUENCY D(*) H(*) M(0,30)
frecuencia-actualización (Formato 2, cronológico):
< minuto> < hora> <díaDelMes> <mesDelAño> <díaDeLaSemana>
El formato de la opción frecuencia-actualización (cronológica) es una lista de cinco valores separados
por espacios en blanco. Los cinco valores representan los minutos, horas, días del mes, meses del
año y días de la semana empezando por el Domingo.
Si especifica un intervalo de valores o un asterisco (*), puede especificar un valor de recorrido
utilizando una barra inclinada (/) al final del intervalo definido.
Ejemplo: este ejemplo especifica que la actualización de índice debe ejecutarse cada cuarto de
hora (0,15,30,45) en las horas pares entre las 8 a.m. y las 6:45 p.m. (8-18/2 es equivalente a
8,10,12,14,16,18), de Lunes a Viernes todos los meses del año (* * 1-5).
0,15,30,45 8-18/2 * * 1-5
minuto Especifica los minutos de la hora en los que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para un intervalo de cada 5 minutos o un entero
de 0 a 59. No pueden repetirse valores. La frecuencia de actualización mínima es de 5
minutos. Un valor de 1, 4 u 8 no es válido.
frecuencia-actualización (minuto):
150
IBM i: OmniFind Text Search Server for DB2 for i
*
/ 0...59
,
0...59 - 0...59
/ 0...59
0...59
hora
Especifica las horas del día en las que debe actualizarse el índice de búsqueda de texto.
Puede especificar un asterisco (*) para cada hora o un entero de 0 a 23. No pueden
repetirse valores.
frecuencia-actualización (hora):
*
/ 0...23
,
0...23 - 0...23
/ 0...23
0...23
díaDelMes
Especifica los días del mes en los que debe actualizarse el índice de búsqueda de texto.
Puede especificar un asterisco (*) para cada día o un entero de 1 a 31. No pueden
repetirse valores.
frecuencia-actualización (díaDelMes):
*
/ 1...31
,
1...31 - 1...31
/ 1...31
1...31
mesDelAño
Especifica los meses del año en los que debe actualizarse el índice de búsqueda de texto.
Puede especificar un asterisco (*) para cada mes o un entero de 1 a 12. No pueden
repetirse valores.
frecuencia-actualización (mesDelAño):
*
/ 1...12
,
1...12 - 1...12
/ 1...12
1...12
díaDeLaSemana
Especifica los días de la semana en los que debe actualizarse el índice de búsqueda de
texto. Puede especificar un asterisco (*) para cada día o un entero de 0 a 7. Tanto 0 como
7 son valores válidos para el Domingo. No pueden repetirse valores.
OmniFind Text Search Server
151
frecuencia-actualización (díaDeLaSemana):
*
/ 0...7
,
0...7 - 0...7
/ 0...7
0...7
Ejemplos
1. CALL MYCOLLECTION.ALTER_COLLECTION(‘UPDATE FREQUENCY H(0) M(0) D(*)');
Se modifica el valor de frecuencia de actualización de la colección MYCOLLECTION. La colección de
búsqueda de texto tendrá una frecuencia de actualización diaria a las 00:00 horas.
2. CALL MYCOLLECTION.ALTER_COLLECTION(‘UPDATE FREQUENCY NONE');
Esta colección de búsqueda de texto se cambia a no planificada.
Para modificar una colección desde IBM Navigator for i, siga estos pasos.
1. En IBM Navigator for i, expanda Gestión de IBM i > Sistema > Todas las tareas.
2. En el panel derecho, seleccione Sistema > OmniFind > Modificar colección.
Consideraciones sobre las ASP independientes para las colecciones
de búsqueda de texto
Consideraciones sobre las IASP para una colección de búsqueda de texto.
Pueden crearse colecciones de búsqueda de texto en un entorno de agrupaciones de almacenamiento
auxiliar (ASP) independientes con las siguientes restricciones:
1. Si un grupo de ASP independientes está asociado con la hebra actual, la colección debe residir en una
ASP del grupo de ASP independientes. No es posible administrar una colección de búsqueda de texto
en la ASP del sistema o en una ASP básica de usuario mientras la hebra está establecida en un grupo
de ASP independientes. Es posible buscar en una colección que existe en la ASP del sistema o en una
ASP básica de usuario, pero dado que ese índice no puede incluir datos del grupo de ASP
independientes, sólo se incluirán los objetos que son accesibles cuando el grupo de ASP es *NONE.
2. Una colección de búsqueda de texto puede indexar cualquier objeto visible desde el espacio de
nombres de grupo de ASP de la colección.
3. Si un conjunto de objetos incluye objetos que existen en el espacio de nombres del grupo de ASP, pero
no en el propio grupo, el tiempo de indexación puede ser significativo si el grupo de ASP
independientes se mueve a otro sistema. Por ejemplo: si se crea una colección en la ASP
independiente 33 para indexar todos los archivos de spool del sistema, y el grupo de ASP se conmuta
a una máquina diferente, todos los archivos de spool de la máquina antigua que no se encuentren en
el grupo de ASP se eliminarán del índice, y se añadirán todos los archivos de spool de la máquina
nueva que no estén en el índice.
Consideraciones sobre la copia de seguridad y restauración de
colecciones de búsqueda de texto
Salvar y restaurar una colección de búsqueda de texto.
Puede realizarse una copia de seguridad y restaurarse una colección de búsqueda de texto salvando y
restaurando la biblioteca del esquema creado para la colección. Durante la restauración, se iniciará de
forma asíncrona una actualización. La actualización rastreará los objetos del sistema y volverá a llenar el
índice.
152
IBM i: OmniFind Text Search Server for DB2 for i
SQLCODE -0196 • SQLCODE -20423
Es necesario poder restaurar el índice de búsqueda de texto contenido en la colección para que la
colección pueda utilizarse. Deben tenerse en cuenta estas consideraciones para restaurar un índice de
búsqueda de texto:
v Todos los productos necesarios deben estar instalados.
v El servidor de búsqueda de texto debe estar disponible.
Mensajes y códigos
Puede visualizar los mensajes y códigos de retorno SQL de OmniFind Text Search for DB2 for i. Los
mensajes se listan por orden numérico.
Mensajes de OmniFind
Puede visualizar los mensajes de OmniFind correspondientes a OmniFind Text Search for DB2 for i. Los
mensajes se listan por orden numérico.
Se añaden mensajes al archivo de mensajes de OmniFind (QDBTSLIB/QOMFMSGF) para los errores
siguientes.
Tabla 40. Mensajes de OmniFind
Número
Tipo
Mensaje
OMF0011
Información
Índice de búsqueda de texto restaurado con opciones de configuración diferentes.
OMF0012
Aviso
El tipo FORMAT para el índice que se crea no es XML. Las búsquedas XML no
están soportadas.
OMF0334
Error
El objeto ''{0}''.''{1}'' que ha especificado no está soportado. Un índice de búsqueda
de texto sólo puede crearse sobre una tabla SQL, un alias SQL o un miembro
simple de un archivo físico.
OMF0358
Error
El usuario actual no tiene autoridad suficiente para realizar la operación
solicitada.
OMF0359
Error
La restauración ha fallado. El servidor de texto para el índice de texto no está
disponible.
SQLCODE -0196 La columna &3 de &1 en &2 no
puede descartarse.
Explicación: Se ha intentado descartar la columna &3.
La columna no puede descartarse porque una vista, un
desencadenante o un índice depende de la columna y
se ha especificado RESTRICT, o la columna forma parte
de la clave de partición.
Respuesta del Usuario: Especifique CASCADE en la
sentencia ALTER TABLE para descartar la columna y
las vistas, restricciones, desencadenantes e índices que
dependen de ella. Si la columna forma parte de la clave
de partición, especifique DROP PARTITIONING en la
sentencia ALTER TABLE para eliminar el
particionamiento de la tabla. Intente de nuevo la
petición.
SQLSTATE: 42817
SQLCODE -5003 No puede realizarse la operación
bajo control de compromiso.
Explicación: Las operaciones siguientes no pueden
realizarse bajo control de compromiso especificando
COMMIT(*CHG), COMMIT(*CS) o COMMIT(*ALL):
v Sentencia DROP SCHEMA.
v Sentencia GRANT o REVOKE sobre un objeto que
tiene un poseedor de autoridad.
v Sentencia CREATE en modalidad de denominación
SQL de un objeto que tiene un poseedor de
autoridad.
v DROP de un índice de búsqueda de texto.
Estas operaciones no pueden comprometerse ni
retrotraerse.
Respuesta del Usuario: Especifique
COMMIT(*NONE) e intente de nuevo la sentencia.
SQLSTATE: 42922
SQLCODE -20423 Se ha producido un error durante
el proceso de búsqueda de texto.
Explicación: Se ha producido un error durante el
proceso de búsqueda de texto de una función
CONTAINS o SCORE. El error se ha producido en el
OmniFind Text Search Server
153
SQLCODE -20424 • SQLCODE -20425
QSYS2.SYSTEXTSERVERS tiene un valor de 1,
que indica que el soporte de búsqueda de
texto se ha detenido.
servidor servidor al utilizar el índice de búsqueda de
texto nombre-índice por el código de razón código-razón.
El testo que describe el problema es: texto.
servidor: nombre o dirección IP del host y puerto del
servidor de búsqueda de texto en el que se ha
detectado el error.
nombre-índice: nombre del índice utilizado en el proceso
de búsqueda de texto.
Nota: incluya el esquema y un punto en el nombre de
índice en una única señal.
código-razón: código de razón devuelto por OmniFind
Text Search Server for DB2 for i.
texto: texto devuelto por OmniFind Text Search Server
for DB2 for i.
Acción del Sistema: La sentencia no puede procesarse.
Respuesta del Usuario: Póngase en contacto con el
administrador del sistema para comprobar que
OmniFind Text Search Server for DB2 for i esté
correctamente instalado.
SQLSTATE: 38H10
Referencia relacionada:
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar
búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de
búsqueda. La función devuelve un resultado que indica
si se ha encontrado una coincidencia.
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar
búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de
búsqueda. La función devuelve una puntuación de
relevancia que mide hasta que punto un documento
coincide con la consulta.
SQLCODE -20424 El soporte de búsqueda de texto
no está disponible por la razón
código-razón.
Explicación: Se ha detectado un problema en una de
las tablas administrativas de búsqueda de texto. El
código de razón es código-razón.
1
Una de las tablas de administración de
búsqueda de texto no se ha encontrado
(QSYS2.SYSTEXTINDEXES,
QSYS2.SYSTEXTCOLUMNS o
QSYS2.SYSTEXTSERVERS).
7
No hay ningún OmniFind Text Search Server
for DB2 for i definido.
Acción del Sistema: La sentencia no puede procesarse.
Respuesta del Usuario: Póngase en contacto con el
administrador del sistema para asegurarse de que el
soporte para la búsqueda de texto esté correctamente
configurado en el sistema.
SQLSTATE: 38H11
Referencia relacionada:
“Tabla de administración QSYS2.SYSTEXTSERVERS” en
la página 115
Puede visualizar dónde están instalados los servidores
de búsqueda de texto mediante la tabla de
administración QSYS2.SYSTEXTSERVERS.
“Tabla de administración QSYS2.SYSTEXTINDEXES”
en la página 112
Puede visualizar información acerca de cada índice de
búsqueda de texto en la tabla de administración
QSYS2.SYSTEXTINDEXES. Cada índice de búsqueda de
texto tiene un nombre, un nombre de esquema y un
nombre de colección asociada en el servidor de
búsqueda de texto.
“Tabla de administración QSYS2.SYSTEXTCOLUMNS”
en la página 114
Puede visualizar información acerca de las columnas de
texto de un índice de búsqueda de texto en la tabla de
administración QSYS2.SYSTEXTCOLUMNS. Cada
índice de búsqueda de texto tiene un ID de índice,
nombres de columna de texto y el nombre de esquema
de la tabla base.
SQLCODE -20425 Búsqueda de texto no permitida
para la columna nombre-columna.
Explicación: Una función de búsqueda de texto
CONTAINS o SCORE ha especificado la columna
nombre-columna de la tabla nombre-tabla en el esquema
de tabla. No existe un índice de texto para esta
columna, por lo que el proceso de búsqueda de texto
no puede ejecutarse.
Acción del Sistema: La sentencia no puede procesarse.
Respuesta del Usuario: Compruebe que la columna y
la tabla estén registradas en OmniFind Text Search
Server for DB2 for i.
SQLSTATE: 38H12
Referencia relacionada:
3
El soporte de búsqueda de texto no se ha
iniciado.
4
La columna STATUS de la tabla
154
IBM i: OmniFind Text Search Server for DB2 for i
“CONTAINS” en la página 40
Puede utilizar la función CONTAINS para realizar
búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de
búsqueda. La función devuelve un resultado que indica
si se ha encontrado una coincidencia.
SQLCODE -20426 • CPI321E
“SCORE” en la página 43
Puede utilizar la función SCORE para realizar
búsquedas en un índice de búsqueda de texto
utilizando criterios especificados en un argumento de
búsqueda. La función devuelve una puntuación de
relevancia que mide hasta que punto un documento
coincide con la consulta.
SQLCODE -20426 Ya se está ejecutando un
procedimiento de administración de
búsqueda de texto conflictivo.
Explicación: En este índice ya se está ejecutando un
procedimiento administrativo de búsqueda de texto
conflictivo, como por ejemplo una actualización.
Acción del Sistema: La sentencia no puede procesarse.
Respuesta del Usuario: Invoque de nuevo el
procedimiento almacenado de administración una vez
finalizado el procedimiento almacenado en ejecución.
SQLSTATE: 38H13
SQLCODE -20427 Se ha producido un error durante
el procedimiento administrativo de
búsqueda de texto.
Explicación: Se ha producido un error durante un
procedimiento administrativo de búsqueda de texto. El
código de razón es código-razón. El testo devuelto es:
texto. El texto del error describe el problema.
Acción del Sistema: La sentencia CALL falla con este
SQLCODE.
Respuesta del Usuario: Solucione el problema
indicado por el error e invoque de nuevo el
procedimiento almacenado administrativo.
SQLSTATE: 38H14
CPF32fa
Operación no permitida en el índice de
búsqueda de texto &2 de &1.
Explicación: Se ha intentado una operación que no
está soportada para un índice de búsqueda de texto.
Los índices de búsqueda de texto no permiten algunas
operaciones que están permitidas en los índices y vistas
tradicionales de DB2.
Si se ha intentado suprimir el índice, la operación
puede haber fallado debido a que el control de
compromiso estaba activo.
Respuesta del Usuario: Realice las operaciones
administrativas de búsqueda de texto mediante los
procedimientos almacenados SQL incluidos en
OmniFind Text Search Server for DB2 for i.
Para obtener más información acerca de los índices de
búsqueda de texto y las restricciones que se les aplican,
consulte la documentación de Information Center:
http://www.ibm.com/systems/i/infocenter/
CPF32fb
La operación en el índice de búsqueda
de texto &2 de &1 no ha podido
realizarse.
Explicación: Se ha intentado una operación en el
índice de búsqueda de texto &2 de &1. La operación
solicitada no es válida actualmente debido al código de
razón &3; los códigos de razón y sus significados son
los siguientes:
1. Un producto necesario no está instalado.
2. El servidor de búsqueda de texto solicitado &4 no
está disponible o no está definido.
3. Se ha intentado una restauración del índice, pero el
índice ya existe. El índice existente no ha podido
modificarse para que coincida con el índice salvado.
4. Un objeto dependiente &5 en &6 de tipo &7 no
existía.
5. Un objeto &5 en &6 de tipo &7 no estaba
disponible.
6. La agrupación de almacenamiento auxiliar (ASP)
para la hebra actual no coincide con la ASP del
índice de búsqueda de texto.
7. Ya existe un índice de búsqueda de texto para la
columna &8, tabla &5 de la biblioteca &6.
Respuesta del Usuario: Corrija el problema e intente
de nuevo la operación.
Para obtener más información acerca de los índices de
búsqueda de texto, consulte la documentación de
Information Center: http://www.ibm.com/systems/i/
infocenter/
CPI321E
Archivo &1 de la biblioteca &2 diferido.
Explicación: El archivo &1 de la biblioteca &2 se ha
diferido durante esta solicitud de restauración con el ID
de diferimiento especificado &4. El archivo se ha
diferido debido al código de razón &3. Los códigos de
razón son:
1. El archivo base &5 de la biblioteca &6 no existía
cuando se estaba creando &1 para la restauración.
2. El archivo &1 no ha podido crearse por alguna otra
razón que no es la ausencia de un archivo base.
Consulte los mensajes anteriores para determinar
por qué ha fallado la creación del archivo.
3. Uno o varios de los miembros del archivo &1 no
han podido crearse. Consulte los mensajes
anteriores para determinar por qué ha fallado la
creación de los miembros.
4. El archivo representa un índice de búsqueda de
texto y el objeto de programa bajo licencia necesario
no existe en el sistema.
5. El archivo representa un índice de búsqueda de
texto y el índice no ha podido volver a crearse.
Respuesta del Usuario: Para el código de razón 1:
restaure el archivo base que falta o utilice el mandato
Restaurar objetos diferidos (RSTDFROBJ) especificando
OmniFind Text Search Server
155
el mismo ID de diferimiento (parámetro DFRID) &4 en
cualquiera de los mandatos utilizados.
Para los códigos de razón 2 y 3: corrija las razones de
la anomalía de creación y luego utilice el mandato
Restaurar objetos diferidos (RSTDFROBJ) especificando
el mismo ID de diferimiento (parámetro DFRID) &4 en
el mandato.
Para el código de razón 5: consulte los mensajes
anteriores del registro de trabajo, corrija los errores y
luego utilice el mandato Restaurar objetos diferidos
(RSTDFROBJ) especificando el mismo ID de
diferimiento (parámetro DFRID) &4 en el mandato.
Información relacionada:
Restaurar objetos diferidos (RSTDFROBJ)
Información sobre licencia de código y exención de responsabilidad
IBM le otorga una licencia de copyright no exclusiva para utilizar todos los ejemplos de código de
programación, a partir de los que puede generar funciones similares adaptadas a sus necesidades
específicas.
SUJETO A LAS GARANTÍAS ESTATUTARIAS QUE NO PUEDAN EXCLUIRSE, IBM Y LOS
DESARROLLADORES Y SUMINISTRADORES DE PROGRAMAS DE IBM NO OFRECEN NINGUNA
GARANTÍA NI CONDICIÓN, YA SEA IMPLÍCITA O EXPLÍCITA, INCLUIDAS, PERO SIN LIMITARSE A
ELLAS, LAS GARANTÍAS O CONDICIONES IMPLÍCITAS DE COMERCIALIZACIÓN, ADECUACIÓN
A UN PROPÓSITO DETERMINADO Y NO VULNERACIÓN CON RESPECTO AL PROGRAMA O AL
SOPORTE TÉCNICO, SI EXISTE.
BAJO NINGUNA CIRCUNSTANCIA, IBM Y LOS DESARROLLADORES O SUMINISTRADORES DE
PROGRAMAS DE IBM SE HACEN RESPONSABLES DE NINGUNA DE LAS SIGUIENTES
SITUACIONES, NI SIQUIERA EN CASO DE HABER SIDO INFORMADOS DE TAL POSIBILIDAD:
1. PÉRDIDA DE DATOS O DAÑOS CAUSADOS EN ELLOS;
2. DAÑOS ESPECIALES, ACCIDENTALES, DIRECTOS O INDIRECTOS, O DAÑOS ECONÓMICOS
DERIVADOS;
3. PÉRDIDAS DE BENEFICIOS, COMERCIALES, DE INGRESOS, CLIENTELA O AHORROS
ANTICIPADOS.
ALGUNAS JURISDICCIONES NO PERMITEN LA EXCLUSIÓN O LA LIMITACIÓN DE LOS DAÑOS
DIRECTOS, ACCIDENTALES O DERIVADOS, POR LO QUE PARTE DE LAS LIMITACIONES O
EXCLUSIONES ANTERIORES, O TODAS ELLAS, PUEDE NO SER PROCEDENTE EN SU CASO.
156
IBM i: OmniFind Text Search Server for DB2 for i
Avisos
Esta información se ha escrito para productos y servicios ofrecidos en Estados Unidos de América.
Es posible que IBM no ofrezca en otros países los productos, servicios o características que se describen
en este documento. El representante local de IBM IBM le puede informar acerca de los productos y
servicios que actualmente están disponibles en su localidad. Cualquier referencia a un producto,
programa o servicio de IBM no pretende indicar ni implicar que sólo pueda utilizarse dicho producto,
programa o servicio de IBM. En su lugar, se puede utilizar cualquier producto, programa o servicio
funcionalmente equivalente que no infrinja ningún derecho de propiedad intelectual de IBM. No
obstante, es responsabilidad del usuario evaluar y verificar el funcionamiento de cualquier producto,
programa o servicio que no sea de IBM.
IBM puede tener patentes o solicitudes de patentes pendientes que cubran la materia descrita en este
documento. La posesión de este documento no le confiere ninguna licencia sobre dichas patentes. Puede
enviar las consultas sobre licencias, por escrito, a la siguiente dirección:
IBM Director of Licensing
IBM Corporation
North Castle Drive
Armonk, NY 10504-1785
Estados Unidos de América
Para las consultas relacionadas con información de doble byte (DBCS), póngase en contacto con el
departamento de propiedad intelectual de IBM de su país o envíe las consultas, por escrito, a:
Intellectual Property Licensing
Legal and Intellectual Property Law
IBM Japan Ltd.
1623-14, Shimotsuruma, Yamato-shi
Kanagawa 242-8502 Japan
El párrafo siguiente no se aplica al Reino Unido ni a ningún otro país donde estas disposiciones sean
incompatibles con la legislación local: INTERNATIONAL BUSINESS MACHINES CORPORATION
PROPORCIONA ESTA DOCUMENTACIÓN "TAL CUAL" SIN GARANTÍAS DE NINGÚN TIPO, NI
EXPLÍCITAS NI IMPLÍCITAS, INCLUIDAS, PERO SIN LIMITARSE A ELLAS, LAS GARANTÍAS DE NO
VULNERABILIDAD, COMERCIALIZACIÓN O IDONEIDAD PARA FINES CONCRETOS. Algunas
legislaciones no contemplan la declaración de limitación de responsabilidad, ni implícitas ni explícitas, en
determinadas transacciones, por lo que cabe la posibilidad de que esta declaración no se aplique en su
caso.
Esta información puede contener imprecisiones técnicas o errores tipográficos. La información incluida en
este documento está sujeta a cambios periódicos, que se incorporarán en nuevas ediciones de la
publicación. IBM puede realizar en cualquier momento mejoras o cambios en los productos o programas
descritos en esta publicación sin previo aviso.
Las referencias hechas en esta publicación a sitios Web que no son de IBM se proporcionan únicamente
por cortesía y de ningún modo deben interpretarse como promoción de dichos sitios Web. Los materiales
de estos sitios Web no forman parte de los materiales de este producto IBM, y el usuario será responsable
del uso que se haga de estos sitios Web.
IBM puede utilizar o distribuir la información que se le proporcione de la forma que considere adecuada,
sin incurrir en ninguna obligación con el cliente.
© Copyright IBM Corp. 2002, 2014
157
Los licenciatarios de este programa que deseen obtener información acerca del mismo con el fin de: (i)
intercambiar la información entre programas creados independientemente y otros programas (incluido
este) y (ii) utilizar mutuamente la información que se ha intercambiado, deben ponerse en contacto con:
IBM Corporation
Software Interoperability Coordinator, Department YBWA
3605 Highway 52 N
Rochester, MN 55901
Estados Unidos de América
Esta información puede estar disponible, sujeta a los términos y condiciones pertinentes, e incluir en
algunos casos el pago de una cantidad.
El programa bajo licencia que se describe en este documento y todo el material bajo licencia disponible
los proporciona IBM bajo los términos de las Condiciones Generales de IBM, Acuerdo Internacional de
Programas Bajo Licencia de IBM o cualquier acuerdo equivalente entre las partes.
Los datos de rendimiento incluidos aquí se determinaron en un entorno controlado. Por lo tanto, los
resultados que se obtengan en otros entornos operativos pueden variar significativamente. Algunas
mediciones pueden haberse realizado en sistemas que estén en fase de desarrollo y no existe ninguna
garantía de que esas mediciones vayan a ser iguales en los sistemas disponibles en el mercado. Además,
es posible que algunas mediciones se hayan estimado mediante extrapolación. Los resultados reales
pueden variar. Los usuarios de este documento deben verificar los datos aplicables a su entorno
específico.
La información concerniente a productos que no son de IBM se ha obtenido de los suministradores de
dichos productos, de sus anuncios publicados o de otras fuentes de información pública disponibles. IBM
no ha probado esos productos y no puede confirmar la exactitud del rendimiento, de la compatibilidad ni
de ninguna otra declaración relacionada con productos que no sean de IBM. Las consultas acerca de las
prestaciones de los productos que no son de IBM deben dirigirse a los suministradores de tales
productos.
Todas las declaraciones relativas a la dirección o intención futura de IBM están sujetas a cambios o
anulación sin previo aviso y representan únicamente metas y objetivos.
Todos los precios de IBM mostrados son precios de minoristas sugeridos por IBM, están actualizados y
están sujetos a cambios sin aviso previo. Los precios de los concesionarios pueden ser diferentes.
Esta información tiene únicamente valor de planificación. La información contenida en esta
documentación está sujeta a cambios antes de que los productos descritos estén disponibles.
Esta información contiene ejemplos de datos e informes utilizados en operaciones comerciales diarias.
Para ilustrarlas de la forma más completa posible, los ejemplos incluyen nombres de personas, empresas,
marcas y productos. Todos estos nombres son ficticios y cualquier parecido con los nombres y direcciones
utilizados por una empresa real es mera coincidencia.
LICENCIA DE COPYRIGHT:
Esta información contiene programas de aplicación de ejemplo en lenguaje fuente, que ilustran las
técnicas de programación en diversas plataformas operativas. Puede copiar, modificar y distribuir estos
programas de muestra de cualquier modo sin pagar a IBM con el fin de desarrollar, utilizar, comercializar
o distribuir programas de aplicación que se ajusten a la interfaz de programación de aplicaciones para la
plataforma operativa para la que se ha escrito el código de muestra. Los ejemplos no se han probado
minuciosamente bajo todas las condiciones. Por lo tanto, IBM no puede garantizar ni dar por sentada la
158
IBM i: OmniFind Text Search Server for DB2 for i
fiabilidad, facilidad de mantenimiento o la función de estos programas. Los programas de ejemplo se
ofrecen "TAL CUAL", sin garantía de ningún tipo. IBM no será responsable de ningún daño derivado del
uso de los programas de ejemplo.
Cada copia o parte de estos programas de ejemplo, así como todo trabajo derivado, debe incluir un aviso
de copyright como el siguiente:
© nombre de la empresa) (año). Partes de este código derivan de programas de ejemplo de IBM Corp.
Sample Programs.
© Copyright IBM Corp. _escriba el año o años_.
Si está viendo esta información en copia software, es posible que las fotografías y las ilustraciones en
color no aparezcan.
Información de la interfaz de programación
Esta publicación de Common Information Model (CIM) documenta las interfaces de programación cuya
finalidad es permitir al cliente escribir programas para obtener los servicios de IBM i.
Marcas registradas
IBM, el logotipo de IBM e ibm.com son marcas registradas o marcas comerciales registradas de
International Business Machines Corp., registradas en muchas jurisdicciones de todo el mundo. Puede
que otros productos o nombres de servicio sean marcas registradas de IBM u otras compañías. Hay
disponible una lista actual de marcas registradas de IBM en la web “Información de marca registrada y
copyright” en www.ibm.com/legal/copytrade.shtml.
Adobe, el logotipo de Adobe, PostScript y el logotipo de PostScript son marcas registradas de Adobe
Systems Incorporated en los Estados Unidos de América o en otros países.
IT Infrastructure Library es una marca registrada de Central Computer and Telecommunications Agency,
que actualmente forma parte de Office of Government Commerce.
Intel, el logotipo de Intel, Intel Inside, el logotipo de Intel Inside, Intel Centrino, el logotipo de Intel
Centrino, Celeron, Intel Xeon, Intel SpeedStep, Itanium, y Pentium son marcas registradas de Intel
Corporation o de sus subsidiarias en los Estados Unidos y/o en otros países.
Linux es una marca registrada de Linus Torvalds en los Estados Unidos de América o en otros países.
Microsoft, Windows, Windows NT, y el logotipo de Windows son marcas comerciales de Microsoft
Corporation en Estados Unidos, otros países o ambos.
ITIL es una marca registrada y una marca registrada de comunidad de Office of Government Commerce
y está registrada en U.S. Patent and Trademark Office.
UNIX es una marca registrada de The Open Group en los Estados Unidos de América o en otros países.
Cell Broadband Engine es una marca comercial de Sony Computer Entertainment, Inc. en Estados
Unidos, otros países o ambos y se utiliza bajo licencia.
Java y todas las marcas registradas y logotipos basados en Java son marcas registradas de Sun
Microsystems, Inc. en los Estados Unidos de América o en otros países.
Los demás nombres de productos y servicios pueden ser marcas registradas de IBM o de terceros.
Avisos
159
160
IBM i: OmniFind Text Search Server for DB2 for i
Índice
A
actualizar la colección 139
ADD_SPLF_OBJECT_SET 124, 131
alta disponibilidad 93
añadir un conjunto de objetos para datos
de archivo spool
ADD_SPLF_OBJECT_SET 124
añadir un conjunto de objetos para un
archivo continuo
ADD_IFS_STMF_OBJECT_SET 131
archivos de registro 74
argumento de búsqueda 40, 43
B
búsqueda 94, 98
búsqueda de texto 3
iniciar 13
búsqueda XML
características 54
gramática de consultas
eliminar un conjunto de objetos
REMOVE_OBJECT_SET 138
eliminar una colección de búsqueda de
texto
SYSTS_DROP_COLLECTION 148
F
formatos de documento
soportados 6
función CONTAINS
ejemplo 53
función SCORE
ejemplo 53
funciones
CONTAINS 40
SCORE 43
funciones de búsqueda de texto
conceptos clave 4
funciones definidas por el usuario
L
lenguaje XPath
llenar 12
mensajes
40
G
cabecera de ampliaciones
colecciones de búsqueda de texto 118
códigos de idioma 8
códigos de retorno SQL 153
colección de búsqueda
SEARCH 141
SYSPROC.SYSTS_CRTCOL 119
colecciones de búsqueda de texto
cabecera de ampliaciones 118
COLLECTION_NAME.UPDATE 139
collection.status 146
comunicación entre cliente y servidor 3
conceptos clave
funciones de búsqueda de texto 4
configurar 12
consultar información sobre conjuntos de
objetos 143
CONTAINS 47
Get_object_status 144
GET_OBJECTS_NOT_INDEXED
gramática EBNF 68
145
H
hardware
requisitos 4
Health Checker 91
herramienta de administración 89
Herramienta de configuración 76
Herramienta de sinónimos 85
Herramienta ServerInstance 90
herramientas de línea de mandatos 76
Health Checker 91
herramienta de administración 89
Herramienta de configuración 76
Herramienta de sinónimos 85
Herramienta ServerInstance 90
D
I
datos XML
indexar 6
desencadenantes 5
determinación de problemas 74
diccionario de sinónimos 85
añadir 85
eliminar 86
IASP para colecciones de búsqueda de
texto
Colecciones de búsqueda de
texto 152
IBM OmniFind Text Search Server
detener 70
iniciar 70
idiomas
soportados 8
indexación asíncrona 5
índice de búsqueda de texto 71, 72, 73
actualizaciones 4, 118
actualizar 14
buscar 15
E
ejemplos de consultas
función CONTAINS
función SCORE 47
47
© Copyright IBM Corp. 2002, 2014
68
M
68
C
índice de búsqueda de texto
(continuación)
creación 4, 118
crear 14
índice de texto 3, 71, 72, 73
instalación 12
instalar 12
153
O
Obtener objetos no indexados 145
OmniFind 3, 12
OmniFind Text Search 12
OmniFind Text Search Server 12
operadores de búsqueda avanzada
función CONTAINS 48
función SCORE 48
P
paquete de diccionarios 8
procedimiento almacenado
SYSPROC.SYSTS_REMOVE 78
SYSPROC.SYSTS_REPRIMEINDEX 80,
81
SYSPROC.SYSTS_VALIDITYCHECK 82
procedimientos almacenados 15
SYSPROC.SYSTS_ALTER 28
SYSPROC.SYSTS_CREATE 19
SYSPROC.SYSTS_DROP 34
SYSPROC.SYSTS_START 15
SYSPROC.SYSTS_STOP 17
SYSPROC.SYSTS_UPDATE 36
proceso lingüístico 8
Chino 9
proceso lingüístico 9
Coreano 9
proceso lingüístico 9
Japonés 9
proceso lingüístico 9
puntuación de relevancia 43
puntuación de texto 7
Q
QDBTS_LISTINXSTS
UDTF 87
QSYS2.SYSTEXTCOLUMNS 114, 117
QSYS2.SYSTEXTCONFIGURATION 116
QSYS2.SYSTEXTINDEXES 112
161
tamaño de documento 15
Text Search for DB2 for i 12
tipos de datos
soportados 7
transacción 98
QSYS2.SYSTEXTSERVERHISTORY 117
QSYS2.SYSTEXTSERVERS 12, 115
QUERY_OBJECT_SET 143
R
recorte de documentos 15
recuperar el estado de colección 146
recuperar estado de objetos
indexados 144
registro del servidor
guardar 75
visualizar 75
rendimiento 94
requisitos del sistema 4
restaurar 71, 72, 73
Restaurar colecciones de búsqueda de
texto
Restaurar colecciones de búsqueda de
texto 152
U
UDTF QDBTS_LISTINXSTS 87
UPDATEAUTOCOMMIT 94, 98
V
visión general del producto 3
volver a llenar la colección de búsqueda
de texto 140
volver a preparar colección 140
S
salvar 71, 72, 73
salvar y restaurar 71, 72, 73
SCORE 47
segmentación basada en diccionario 9
segmentación n-gram 8, 9
servidor de búsqueda de texto IBM 4
servidor de búsqueda de texto
OmniFind 3
búsqueda de texto 2
índice de texto 2
OmniFind 2
servidores de búsqueda de texto 12
sintaxis de argumentos de búsqueda 40
búsqueda de frases 45
búsqueda simple 45
carácter comodín 45
excluir términos 45
incluir términos 45
sintaxis de búsqueda 40
sistema operativo
requisitos 4
software
requisitos 4
soporte de sinónimos 7
SYSIBMTS.SYSTEXTDEFAULTS 111
SYSPROC.SYSTS_CREATE 19
SYSPROC.SYSTS_CREATE_COLLECTION
SYSPROC.SYSTS_CRTCOL 119
SYSPROC.SYSTS_DROP 28, 34
SYSPROC.SYSTS_START 15
SYSPROC.SYSTS_STOP 17
SYSPROC.SYSTS_UPDATE 36
SYSTEXTSERVERS 12
119
T
tablas de administración 111
QSYS2.SYSTEXTCOLUMNS 114, 117
QSYS2.SYSTEXTCONFIGURATION 116
QSYS2.SYSTEXTINDEXES 112
QSYS2.SYSTEXTSERVERHISTORY 117
QSYS2.SYSTEXTSERVERS 115
SYSIBMTS.SYSTEXTDEFAULTS 111
162
IBM i: OmniFind Text Search Server for DB2 for i
Número de Programa: 5733-OMF
Impreso en España
Descargar