Elementos Esenciales en la administración de NOC

En un NOC (Network Operations Center) tenemos elementos que deben ser indispensables para la administración y que la misma sea de acuerdo a la buenas prácticas, a continuación los describimos cada uno para que nos permita comprender mejor el porqué son importantes para llevar el NOC a un nivel de proactividad mayor y salir de la zona reactiva, teniendo en cuenta que esto va de la mano con los procesos de mejores prácticas de NOC.

  1. Sistema de Tickets

Le permitirá realizar un seguimiento de todos los problemas abiertos, de acuerdo con el impacto, la urgencia y el técnico asignado para resolver el caso.

      2. Base de conocimiento

Fuente centralizada para todo el conocimiento y documentación a la que pueda acceder todo su equipo. Esta base de conocimiento debería ser una fuente de información fluida para actualizarse continuamente con experiencias y lecciones aprendidas para futuras referencias y mejoras.

    3. Informes

Los informes diarios, semanales y mensuales incluyen todos los incidentes importantes y la causa raíz de cada incidente resuelto.

    4. Monitoreo

Hay dos tipos principales de procesos de monitoreo relevantes para NOC:

    1. Monitoreo de la infraestructura. El monitoreo de la infraestructura debe ser totalmente en tiempo real y estratégico, debe llegar al nivel de servicios debido a que no basta únicamente con conocer la disponibilidad y rendimiento de los equipos sino monitorizar procesos y servicios ejecutándose en los dispositivos al igual que monitoreo de carpetas críticas, archivos importantes incluso URLs y otros monitores especializados.
    2. Comunicación oportuna de eventos críticos. La comunicación es un factor clave en el proceso de monitoreo, debido a que las alertas críticas deben comunicarse oportunamente y a las personas indicadas, de lo contrario el servicio pierde todo el sentido.

   

    5. Automatización de procesos

 La implementación de la automatización de procesos reduce significativamente el tiempo medio de recuperación (MTTR) y ayuda a cumplir con los SLA al contar con un procedimiento para manejar la resolución de incidentes y brindar una respuesta de alta calidad de manera consistente, independientemente de la complejidad del proceso. Ejemplos: eliminación de archivos en disco, ejecución de scripts, reinicio y detención de procesos y servicios, etc.

  1.  

Es importante reconocer que las herramientas son solo el apoyo para llevar a cabo los procesos y extraer la información necesaria para obtener las métricas clave. Finalmente la adopción de los procesos y mejores prácticas permiten optimizar su plataforma de monitoreo para identificar y resolver problemas mucho más rápido con menos MTTR (Tiempo medio para resolver).

¿Qué tan útil ha sido este blog?

¡Haz clic en una estrella para calificarla!

Table of Contents

Facebook
Twitter
LinkedIn