Tesis
Control inteligente de operación en servicios informáticos
Fecha
2016Autor
Alvear Yévenes, Jorge
Institución
Resumen
En la actualidad, los sistemas informáticos prestan servicios que están sometidos a estrictas reglas de negocio, con una obligación de disponibilidad que bordea el 100%.
Casos de ejemplo en talla empresarial, como bancos, líneas aéreas, retail, etc, tienen la obligación de ofrecer una disponibilidad de los sistemas cercana al 99.89, es decir, se permite poco menos de 9 horas de indisponibilidad al año.
Variadas son las causas que generan indisponibilidad, entre las cuales podemos seleccionar: mala intervención (falla humana), fallas de infraestructura (equipos físicos), servicios no controlados (servidores no monitoreados), errores en las aplicaciones y fallas por falta de capacidad.
Evitar incidentes y así mantener una disponibilidad aceptable es tarea fundamental de las áreas de informática y producción, lo que implica tener un control exhaustivo de los servicios informáticos y un conocimiento profundo del comportamiento de cada uno de ellos.
Las tareas centrales en la operación diaria, son minimizar la cantidad de eventos de indisponibilidad (pérdida de servicio), detectar los riesgos de esta, mitigarlos y coordinar procesos de mejora continua, con el objetivo de desarrollar un ciclo virtuoso con respecto al conocimiento obtenido de la plataforma y sus servicios.
Los equipos humanos que administran estas plataformas tecnológicas, deben desarrollar una serie de habilidades y conocimientos para reducir los incidentes con pérdida de servicio, pero el proceso de madurez es lento y no es asistido por herramientas tecnológicas que ayuden a un control efectivo.