2.2. Marco Teórico
2.2.2. Gestión de Incidentes
34 2.2.1.2. Beneficios y ventajas
Los beneficios organizacionales de adoptar las mejores prácticas de ITIL incluyen:
• Alineación fuerte y dinámica negocio y la TI
• Prestación de servicios mejorados y niveles buenos de satisfacción del cliente
• Mejor uso de recursos y reducción de costos.
• Niveles altos de visibilidad de costos y activos de TI.
• Mejor la gestión del riesgo empresarial y la interrupción o falla del servicio.
• Entornos del servicio estable que soporte el cambio constante del negocio
Sustancialmente, el beneficio radica en alinear el área de proceso con el resultado de negocio ambicionado. El objetivo es mejorar la capacidad especializada del proceso, las personas, los proveedores y la tecnología que resguarda el servicio empresarial.
35 para los usuarios, el personal de soporte y el negocio. Los datos recopilados de los incidentes de seguimiento permiten una mejor gestión de problemas y decisiones empresariales. Los modelos permiten al personal de soporte resolver incidentes rápidamente con procesos definidos para el manejo de incidentes. En algunas organizaciones, un personal dedicado tiene la gestión de incidentes como su único papel. En la mayoría de las empresas, la tarea está relegada a la mesa de servicio y sus propietarios, gerentes y partes interesadas. La visibilidad de la gestión de incidentes hace que sea la más fácil de implementar y obtener aceptación, ya que su valor es evidente para los usuarios en todos los niveles de la organización. Todo el mundo tiene problemas que necesitan el personal de soporte o instalaciones para resolver, y su manejo se alinea rápidamente con las necesidades de los usuarios en todos los niveles.
La gestión operativa de incidentes requiere varias piezas clave:
1. Requiere que el proveedor y el cliente acuerden sobre el nivel del servicio, sobre la cual se establezcan los requerimientos y las prioridades a logar, que rutas se van seguir en la escalación y el tiempo promedio para la solución y su respuesta.
2. Es necesario contar con modelos o plantillas de incidentes, que faciliten la resolución de problema de forma eficiente.
3. Es necesario que los incidentes sean categorizados, dado que esto permitirá que los datos sean manejados y mejores recolectados.
4. Se necesita tener acuerdos sobre cuáles serán las prioridades a solucionares considerando el estado de los incidentes, para lo cual es necesario contar con las categorías.
5. Es necesario contar con un proceso que responda específicamente a los problemas mayores.
6. Se necesita tomar acuerdos sobre los roles que cumplirán en el desarrollo de la gestión.
El número cinco en la lista anterior es importante para dicha gestión, dado que el responsable debe resolver el incidente que no se resolvió dentro de los acuerdos de nivel de servicio. En muchas organizaciones, esta
36 persona puede ser un gerente de operaciones de TI o un líder técnico de TI.
2.2.2.1. Función Principal: La mesa de Servicios
Para gestionar los problemas se requiere de un conjunto de funciones, entre las actividades más resaltantes se ubican en la mesa de servicio, a este último también se le refiriere como "mesa de ayuda". Esta mesa se caracteriza por ser la única área de en la cual los usuarios pueden informar los inconvenientes. Sin la mesa de servicio, los usuarios se pondrán en contacto con el personal de soporte, pero sin la previa priorización o la aplicación de los límites de la estructura, dicha situación puede dar lugar a que un incidente de baja prioridad se resuelva antes que uno verdaderamente grave. Los incidentes de baja prioridad, como arreglar una estación de acoplamiento defectuosa, pueden no resolverse durante semanas, mientras que el personal de soporte de TI se encarga de los problemas más urgentes que se les presentan en ese momento. La estructura de la mesa de servicio permite al personal de soporte manejar todos los problemas con la prontitud posible, este tiene la capacidad de transmitir los conocimiento al resto del personal, propicia el desarrollo de estructuras de autoservicio.
Una mesa de servicio está dividida en niveles de soporte. El primer nivel es para problemas básicos, como restablecimientos de contraseñas y resolución de problemas básicos de computadoras. Es más probable que los incidentes de primer nivel se conviertan en modelos de incidentes, ya que las plantillas para crearlos son fáciles y los incidentes se repiten con frecuencia. Por ejemplo, un modelo de plantilla para un restablecimiento de contraseña incluye la categorización del incidente (categoría de "Cuenta" y tipo "Restablecimiento de contraseña", una plantilla de información que el personal de soporte completa (requisitos de nombre de usuario y verificación y enlaces a artículos de la base de conocimientos internos o externos que apoyan el incidente. Los incidentes de nivel uno o
37 de baja prioridad no afecta al negocio de ninguna manera y pueden ser resueltos por los usuarios.
El soporte de segundo nivel implica problemas que requieren más habilidad, capacitación o acceso para completar. Restablecer un token RSA, por ejemplo, puede requerir una escalada de nivel dos. Algunas organizaciones clasifican los incidentes informados por los VIP como de nivel dos para brindar una mejor calidad de servicio a esos empleados. Los incidentes de nivel dos pueden ser problemas de prioridad media, que necesitan una respuesta más rápida de la mesa de servicio.
La asignación correcta de niveles y prioridades ocurre cuando la mayoría de los incidentes caen en el nivel uno / prioridad baja, algunos se ubican en el nivel dos y algunos requieren una escalada al nivel tres. Aquellos que requieren una escalada urgente se convierten en incidentes importantes, que requieren la respuesta de "manos a la obra". Los incidentes mayores son definidos por ITIL como incidentes que representan una interrupción significativa del negocio. Estos son siempre de alta prioridad y merecen una respuesta inmediata por parte de la mesa de servicio y, a menudo, el personal de escalada. En la estructura de soporte en niveles, estos incidentes son de nivel tres y son buenos candidatos para la gestión de problemas.
2.2.2.2. Proceso del Incidente:
En ITIL, los incidentes se ponen en proceso por medio del flujo de trabajo estructurado el cual propicia la eficiencia y buenos resultados para los proveedores y los clientes. ITIL recomienda que el referido proceso debe seguir los siguientes pasos:
1. Identificar el incidente 2. Registrar incidente 3. Categorizar al incidente 4. Priorizar los incidentes 5. Respuesta al incidente
38
▪ Diagnóstico inicial
▪ Escalada de incidentes
▪ Investigación y diagnostico
▪ Resolución y recuperación
▪ Cierre de incidentes
El proceso de incidentes proporciona un manejo eficiente de incidentes, que a su vez garantiza un tiempo de actividad continuo del servicio.
El clico del incidente tiene como primer paso la identificación del incidente. Estos devienen de los usuarios desde diferentes formas que puede acepar la organización. La fuente del informe se encuentra compuesto por caminatas, chats de asistencia, llamadas telefónicas, autoservicio, correos electrónicos, y avisos automatizados, así como el software de monitoreo de red o como también las utilidades de escaneo del sistema. Después de ello, la mesa de servicio procede a decidir si las características comprenden ser una solicitud o un problema, dado que estos dos indicadores pueden manejarse de diferentes maneras.
Después de haberse categorizado como incidente, la mesa de servicio debe registrarlo como un boleto. Este último debe contemplar la información, el nombre del usuario, el contacto, los indicares de temporalidad del incidente (SLA), se debe indicar la priorización y la categorización y demás pasas que contemple la mesa de servicio.
La categorización de incidentes supone ser un paso de suma trascendencia en el procedimiento para gestionar los incidentes.
Categorizar un incidente significa la asignación de una categoría y la determinación de una subcategoría, la finalidad de esta acción yace en facilitar a la mesa de servicio ordenar y modelar incidentes conforme a la categorización y subcategorización. Así también, permite la priorización de cuestiones de manera automática. A modo de ejemplificación, dentro de una empresa x un inconveniente puede ser catalogado "red", pero en consideración a sus características específicas puede ser sub catalogado como "corte de red". Este problema dentro de algunas
39 organizaciones es definido como incidente de alta prioridad, por cuanto la respuesta debe ser mayor. Como tercer paso, se ha de desarrollar un seguimiento preciso, para ello es necesario que los incidentes sean catalogados, para que después puedan emerger patrones de solución. Cuantificar el nivel de frecuencia e incidencia de los incidentes es relativamente sencillo, pero se hace de necesidad que se desarrollen capacitaciones para el manejo del problema. Por ejemplo, es mucho más fácil vender el CFO en un nuevo hardware cuando los datos respaldan la decisión.
La priorización de incidentes es importante para el cumplimiento de la respuesta de SLA. La prioridad se halla supeditada al impacto en la empresa y en los usuarios, así como en la resolución con urgencia. Esta última se define como la rapidez con la cual se resuelve el problema, y el impacto viene a ser la medida extensiva del gran perjuicio que se puede generar.
1. Incidentes prioridad baja. se caracterizan por aquellos que no interrumpen la actividad de los usuarios y el de la empresa y se pueden solucionar, los servicios se mantienen tanto para los usuarios y los clientes.
2. Incidentes de mediana prioridad, se caracteriza por afectar a unos pocos empleados y la interrupción del trabajo es hasta cierto punto. Se evidencia una incomodidad por parte de los clientes y los usuarios.
3. Incidentes prioridad alta. Se caracteriza por afectar a muchos usuarios y clientes, se interrumpe el negocio y afecta de manera negativa la entrega del servicio. Se hallan impactos financieros.
Una vez identificada, categorizada, priorizada y registrada, la mesa de servicio tiene la capacidad de manejo y resolución del incidente. La resolución comprende los siguientes pasos.
1. Diagnóstico inicial: inicia en la descripción del problema que hace el usuario, mismos quien responde a las preguntas de solución ante el inconveniente.
40 2. Escalada de incidentes: refiere cuando un incidente necesita la atención asistencial más avanzada, ya sea enviando un técnico o algún colaborador de asistencia certificada. Sobre esto, ya se había referido que los incidentes mayormente se deben resolver por los trabajadores del soporte de primer nivel y sin dar paso a la escalada.
3. Investigación y diagnóstico: se da lugar cuando se desarrolla la resolución de problemas corroborándose que la conjetura sobre el problema era la correcta. Después de diagnosticar el incidente, se da paso a la aplicación de la solución, ya sea cambiando la configuración del software, haciendo un parche o pidiendo un nuevo hardware.
4. Resolución y recuperación: se da por medio de la confirmación del departamento de servicios quien informa que el servicio fue restaurado al nivel de SLA requerido.
5. Cierre del incidente: la comprende que la incidencia ha sido cerrada y el proceso del incidente finaliza.
41 2.2.2.3. Estados del Incidente:
Los estados reflejan en qué etapa de los procesos se hallan los inconvenientes:
o Primera etapa: califica como “Nuevo”
o Segunda etapa: califica como “Asignado”
o Tercera etapa: califica como “En progreso”
o Cuarta etapa: califica como “En espera o pendiente”
o Quinta etapa: califica como “Resuelto”
o Sexta etapa: califica como “Cerrado”
La calificación como “Estado Nuevo” indica que la mesa de ayuda se hizo conocedor del inconveniente, pero todavía no se asignó un agente.
La calificación como “Estado asignado” significa que el inconveniente ya cuenta con un agente, quien es miembro de la mesa de servicio individual.
La calificación como “Estado en progreso” indica que el inconveniente tiene una asignación a un agente, pero todavía no se tiene resuelto. Este escenario refiere que el agente y el usuario están trabajando activamente en el diagnóstico del problema y en su resolución.
La calificación como “Estado en espera” refiere que el inconveniente necesita de alguna información del usuario, se coloca "en espera" para no pasar los plazos de respuesta de SLA mientras el proveedor facilita la información.
La calificación como “Estado resuelto” hace alusión que la mesa de apoyo dio el visto bueno de la resolución, donde el servicio ya fue restaurado considerando los parámetros de SLA.
La calificación como “Estado cerrado” se refiere a que el inconveniente ya fue resuelto y no existen demás acciones a desarrollarse.
La gestión de incidentes sigue a los inconvenientes por medio de la mesa de servicio para rastrear tendencias en categorías de incidentes y tiempo en cada estado. El componente final de la gestión de incidentes es la evaluación de los datos recopilados.
Los datos de incidentes guían a las organizaciones a tomar
42 decisiones que mejoran la calidad del servicio prestado y disminuyen el volumen general de incidentes informados. La gestión de incidentes es solo un proceso en el marco de operación de servicio.