Estado del sitio IFIC del TIER­2 Javier Sánchez, A. Lamas Madrid, 5 de Octubre de 2006. IFIC 1 CPU Instalación actual (en CE lcg2ce.ific.uv.es) ● # boxes #cpu/box CPU Si2K/cpu Ksi2K 50 1 Athlon 1.2 GHz 512KB cache, 1GByte SDRAM 133 410 20.5 67 1 Athlon 1.2 GHz 512KB cache, 1GByte SDRAM 133 596 33.2 TOT: 117 53.7 IFIC 2 CPU Nuevos nodos adquiridos: ● # boxes #cpu/box CPU Si2K/cpu Ksi2K Dell PE850: PentiumD 840 3.2 Ghz 2GBytes 667 ECC 42 2 1349 113.3 TOT: 84 113.3 ¿Añadir al antiguo CE o instalar uno nuevo ? TOTAL CPU: 167 KSi2K IFIC 3 Almacenamiento ● Disco (CASTOR): – – stage01: 5 x 960 GiB = 4,7 TiB stage02: 1 x 4,3 TiB = 4,3 TiB Total disco: 9 TiB Cinta usada: 37 TiB IFIC 4 Almacenamiento ● Permanente (copia a cinta): 4.7 TiB – – ● Stager: stage01 Path: /castor/ific.uv.es/grid/atlas 'sólo disco': 4.3 TiB – – IFIC Stage: stage02 Path: /castor/ific.uv.es/grid/atlas/SC4DA 5 Almacenamiento Ambos tipos de almacenamiento usan el mismo catálogo de CASTOR, SRM y GRIDFTP – IFIC SRM y GRIFTP servers modificados para acceder a distintos 'stagers' en función del path 6 Almacenamiento TODO: – – – Upgrade de CASTOR ? Evaluación de DPM (URGENTE) Evaluación de dCache (¿ merece la pena ?) ¡¡ Solucionar el problema de disk­only storage !! IFIC 7 Servicios ● SE (CASTOR) – – – – – – – – IFIC castorgrid01, castorgrid02 (aka castorgrid) castorsrm hsm (catalogo de castor, gestor de volumenes) stage01 (asociado a 5 servidores de disco) stage02 (asociado a 1 servidor de disco) 2 servidores de cintas (c/u controla 2 drives) 1 controlador de la libreria. 1 librería STK 700E de 700 celdas 8 Servicios ● GRID ­ uso general: – – – – – – – – – IFIC 1 CE (dual Athlon) 1 UI 1 BDII 1 RB 1 PROXY 1 MON BOX 2 GRIDFTP 1 SRM 1 Experiment software 9 Servicios ● Dedicado al sistema de producción: – – – ● 1 UI 1 BDII 2 RB Soporte: – 2 Quattor: ● ● Servidor de profiles, dhcp Servidor de software TOTAL 22 máquinas IFIC 10 Instalación SO y middleware ● Actualmente usando QUATTOR – – – ● Poco soporte de EGEE/LCG Mucho retraso en los perfiles Algunos añadidos 'IFIC' Prueba de YAIM – – 1 Glite WMS instalado Varias pruebas de distintos nodos para comparar y crear los perfiles de Glite 3.0 ● ● IFIC No parece adecuado para los WN's Difícil upgrade de software y mantenimiento 11 Entorno ● Ampliado el equipo de aire acondicionado – 2 x 14.5 KW (Total: 60 KW aprox) Causa del retraso en la instalación de nueva CPU IFIC 12 Entorno ● Lineas de UPS al límite: – – – IFIC 1 UPS MGE (20KVA) al 80% 1 UPS IMV (40KVA) al 80% Total potencia consumida estimada: 50 KW (200A) 13 Conclusiones ● CPU: suficiente para el 2007 – – ● Almacenamiento: ampliar para cumplir con las expectativas de principios de 2007 (12 TB = 3 servidores ). – ● Evaluar requerimientos MC/Análisis ¿ Son necesarios varios CE ? ¡¡¡ Clarificar el modelo e implementación !!! Estimar los requerimientos de Aire Acondicionado y electricidad para los próximos 5 años IFIC 14 Conclusiones ● El número de servidores es alto comparado con el de CPUs y disco: – ● Estudiar y evaluar: – – ● ● 160 cajas (CPU) – 6 serv. disco – 22 servidores Redundancia Planes de contingencia ¡¡¡ La herramienta de instalación y mantenimiento de SO y software del futuro no está clara !!! No olvidar la conectividad de red IFIC 15