La diferencia entre administrar incidentes y administrar problemas

Por José Arias

Corrección de Estilo: Francisco J Ramírez 

Las organizaciones o áreas de TI reciben en mayor o menor proporción, llamadas de clientes y/o usuarios que solicitan soporte al presentarse fallas o incidentes recurrentes que impactan en forma negativa la calidad del servicio de TI que reciben.

En el mejor de los casos, el usuario o cliente recibe indicaciones para continuar trabajando, sin considerar que el incidente se repita en el futuro. Las áreas de TI que actúan solo de manera correctiva (“apagando fuegos”) terminan generando acumulación de trabajo, pues tienen que resolver, de manera simultánea, incidentes anteriores nunca resueltos y los nuevos incidentes; este es el inicio de un “círculo vicioso” (la antítesis de la mejora continua).


Image001
Para revertir y mejorar este escenario, las organizaciones deben conocer la diferencia que existe entre un Incidente y un Problema. ITIL define estos dos conceptos así: 

  • UN PROBLEMA es una condición identificada con frecuencia como el resultado de múltiples incidentes que presentan síntomas comunes. 
  •  UN INCIDENTE es un evento que no es parte de la operación normal del servicio, el cual causa, o puede causar, una interrupción a, o una reducción en, la calidad de ese servicio.

 La diferencia principal entre administrar incidentes y administrar problemas radica en sus obj etivos. La  administración de problemas tiene como meta detectar la causa fundamental de un incidente y generar la solución posterior (prevención). En la administración de incidentes, el propósito es restaurar el servicio en forma rápida y oportuna, con frecuencia haciendo uso de soluciones temporales y no a través de la definición e implementación de una solución permanente.

¿Cuáles son las consecuencias de no Administrar los Problemas?

 De acuerdo a ITIL, los costos de no implementar  la administración de problemas son:

  • Se tiene una organización de soporte meramente reactiva que enfrenta los problemas sólo hasta que el servicio a los clientes se interrumpe.
  • Una organización de usuarios de TI enfrentada a incidentes recurrentes y que pierde la confianza en la calidad de la organización de soporte de TI.
  • Una organización de soporte poco efectiva que enfrenta altos costos y una baja motivación de los empleados, ya que tienen que resolver incidentes similares repetidamente (no se proporcionan soluciones estructurales).

Beneficios de administrar los problemas

  • Mejora la calidad del servicio de TI: La  administración de problemas ayuda a generar un ciclo de rápido crecimiento en la calidad del servicio de TI. Un servicio consistente de alta calidad es bueno para los usuarios de TI y para la productividad y moral de los proveedores de servicios de TI.
  • Reducción del volumen de incidentes: La administración de problemas ayuda a reducir el número de incidentes que interrumpen el desempeño del negocio.
  •  Solución permanente: Reducción gradual en el número e impacto de problemas y errores Conocidos.
  •  Mejora el aprendizaje organizacional: El proceso de administración de problemas se enfoca en el concepto de aprender de las experiencias pasadas. El proceso provee la información histórica para identificar tendencias y los recursos adecuados para prevenir errores reduciendo su impacto, lo que resulta en un incremento en la productividad del usuario.
  •  Mejora la tasa de incidentes resueltos en la primera vez en Service Desk: La administración de problemas permite mejorar el número de incidentes resueltos en un primer contacto del usuario, logrando a partir del registro de las llamadas en la mesa de servicio, una base de conocimiento disponible con la información consistente de incidentes y soluciones temporales a disposición del cliente.

La gestión de incidentes y problemas que se presentan en áreas de TI en una organización, deben estar siempre alineados con las mejores prácticas ITIL y con procesos estructurados para responder en forma eficiente los casos generados en la mesa de servicio, con el fin de mejorar en forma continua la calidad del servicio y la solución a los problemas de TI.

 

Otros Artículos publicados de su interés:

El Checklist de un SLA- Service Level Agreement

Cómo Diseñar Catalogo de Servicios

Recomendaciones Administración CMDB

 

 

Fecha:
 

webCast Gestión de Release

En este webCast contamos con la compañía de Oscar Beltran. Donde nos compartió su conocimiento acerca de la gestión de versiones como un proceso alineado con las  buenas prácticas ITIL, el cual busca generar entregas de producto (nuevos desarrollos o actualizaciones) soportadas en procesos estructurados de planeación, seguimiento y revisión, para validar  el cumplimiento de los objetivos en la definición del servicio. Destacando dentro de los objetivos a cumplir la calidad del lanzamiento, la alineación entre lo con construido  y lo solicitado y el traslado efectivo del conocimiento al cliente para que se empodere de  la gestión del servicio.

Reconociendo la Entrega o Liberación (release) como un grupo de elementos nuevos o modificados que son probados e implementados en el entorno de producción, también se deben identificar los tipos de entrega (release types), el diseño de la entrega (release design option) y la salida a producción del producto.

Considerando la gestión de reléase  como un proceso que nace con la solicitud  de un cambio y que se va transformando en diferentes actividades  hasta convertirse en un plan de versión y entrega de lo acordado.

La adecuada gestión de release permite obtener cambios económicos rápidos y con menor riesgo, logrando una implementación coherente del servicio y  la mejora en el cumplimiento.

Los invitamos  a que nos acompañen en el próximo WEBCAST en las siguiente fecha:

21 de marzo.- Aranda QUERY MANAGER

Registrate en: www.arandasoft.com/webcast 

Fecha: por Aranda SOFTWARE
 

webCast GESTIONANDO PROBLEMAS

En el webCast Gestionando Problemas conocimos que se debe concebir un problema como un obstáculo en la consecución de un fin y enmarcarlo en las mejores prácticas ITIl, como la suma de incidentes reportados en la mesa de servicios de Aranda SERVICE DESK .

La gestión de problemas es un proceso encargado de descubrir y conocer el origen de una falla en la infraestructura de una organización, soportado en el análisis e investigación de la información del caso, para  dar una solución efectiva y acertada del problema generado.

 

El proceso de gestión de problemas incluye diferentes etapas desde la detección de un problema en potencia, la clasificación del problema y los servicios afectados,  la priorización de la falla,  la investigación y análisis del problema,  la definición del problema como error conocido , la resolución parcial o definitiva del problema  y el cierre del proceso. Todas estas etapas son gestionadas por diferentes actores, que en diferentes niveles del proceso interactúan para dar respuesta al problema abierto.

La implementación acertada del proceso de gestión de problemas, permite a la organización reducir el volumen de incidentes, generar soluciones permanentes, mejorar la calidad del servicio y el aprendizaje y conocimiento de la organización

Los invitamos a que nos acompañen en los próximos WEBCAST en las siguientes fechas:

22  de febrero - Mejores prácticas Aranda SOFTWARE METRIX.
7 de marzo -  Gestión de RELEASE.
21 de marzo.- Aranda  RELEASE MANAGER.

Registrate en: www.arandasoft.com/webcast 

 

 

 

 

Fecha: por Aranda SOFTWARE
 

Importancia de la relación de un CI a una incidencia

Por: Diego Fernando Rincón Guevara

Corrección de estilo: Francisco J Ramírez

En el marco de ITIL existen muchos factores que influyen en el proceso de gestión y ciclo de vida del servicio. Al hablar de incidentes se debe empezar por su definición, como una interrupción en el servicio prestado a un usuario o cliente. Este incidente afecta un componente de la organización y debe ser resuelto de manera rápida y oportuna, garantizando la solución del mismo y dando los lineamientos necesarios para evitar que el incidente se repita.

Las herramientas en el mercado donde se registran este tipo de situaciones,  trabajan con base a las mejores prácticas de gestión de servicios, muchas basadas en ITIL. El proceso de incidentes comienza cuando los usuarios reportan un caso a un único punto de contacto. Ejemplo: la caída de una aplicación web, que funciona en un servidor llamado “ZEUS” y que maneja el sistema de ingresos de las personas a un edificio corporativo.

 

Image003
 

Para la mesa de servicios y para la gerencia, es importante conocer estadísticamente, ¿Cuántas veces las personas no pueden ingresar a tiempo al edificio? ¿Por qué el nivel de tiempo de trabajo es relativamente menor algunos días en comparación a otros?. Para entender esta situación se debe conocer el origen del incidente. En nuestro caso, cuando una persona llega al edificio, presenta su identificación al sistema de ingreso y éste no es capaz de procesar la solicitud, se genera la interrupción del servicio. Teniendo en cuenta esto, se notifica a la mesa de servicios para poder solucionar el incidente lo más pronto posible. Cuando el usuario llama a reportar el inconveniente, los especialistas debe tener en conocimiento y registradas las siguientes variables o interrogantes:

  • ¿Qué sistema permite el ingreso a los usuarios al edificio?
  • ¿En qué servidor se encuentra alojado dicha aplicación?
  • ¿Será posible que el  dañó se encuentre en el hardware que controla el software de ingreso?
  • ¿Es este elemento de alto impacto para la organización?

 

El conocer esta información es relevante al momento de registrar el incidente en una herramienta como Aranda SERVICE DESK, porque  puede llevar el control y gestión del caso, los avances de tiempo y acciones realizadas relacionando al elemento, activo o ítem de configuración [1]afectado.

La relación de un elemento de configuración CI en un incidente permite conocer el impacto del CI dentro de la organización a fin de dar celeridad al proceso de solución de casos. Para el ejemplo citado, el control de acceso de un edificio, además de tener el servidor “ZEUS” asociado, puede tener relacionado en una jerarquía inferior una serie de dispositivos o aplicaciones que pueden estar siendo afectados o que directamente puede ser la causa del inconveniente reportado. De esta manera es visible, un análisis rápido y oportuno que permite a la mesa de servicio restablecer el servicio de forma rápida o colocar otro servidor de contingencia para que el acceso al edificio sea restablecido.

A fin de mes, podrá identificar las métricas del proceso como: El número de incidentes que generó el sistema de acceso al edificio y cuántos de éstos incidentes se crearon y tuvieron relación con el servidor “ZEUS”, conocer las diferentes soluciones a los incidentes y establecer qué cambios se realizaron en el elemento (si hubieron) para restablecer el servicio y mejorar el tiempo de vida del elemento, la continuidad del negocio y la operación del mismo.

 



[1] En la gestión de incidentes es importante tener un responsable  encargado de llevar en una base de datos de configuración CMDB (Configuration Management Database), la gestión de cada activo, mostrar las relaciones entre cada uno de esos activos y llevar un historial de todos aquellos que pasan por la organización; desde su compra hasta su baja por finalización de su vida útil. Esto implica que cuando se registre el incidente, se asocie el elemento y los demás actores del proceso puedan  enterarse del inconveniente y la relevancia de lo  reportado por un usuario.

 

Fecha: