Article (tiempo de lectura: 6 minuto)

Mejore su talento humano con AIOps

AIOps muestra que la tecnología tiene la capacidad de mejorar la función de las personas en el lugar de trabajo, en vez de debilitarlo.

Jean "JP" Gonzalez / Rackspace, Andreas Möller / Rackspace

Una combinación compleja de optimismo e incertidumbre suele acompañar a una disrupción tecnológica significativa. Y, en este momento, no hay tecnología que prometa más disrupción que la inteligencia artificial (AI), o que amenace con ella, según su punto de vista.

Por cada experto que celebre su potencial transformador para las empresas y para la sociedad en general, otro advertirá sobre los riesgos con los que tendrán que lidiar los empleos cuando las máquinas comiencen a tomar decisiones. Eso sin mencionar las consecuencias morales que veremos cuando esas decisiones afecten la vida y el sustento de las personas.

Estas reacciones son comprensibles y hay mucho para analizar a medida que recorremos este camino. Sin embargo, cuando empiezan a establecerse las aplicaciones de AI en las empresas (principalmente, a través del aprendizaje automático, un subconjunto de la AI), ya vemos oportunidades en donde la AI podría mejorar la función de las personas en el lugar de trabajo, en vez de debilitarlo.

Al reducir el desorden en el torbellino de datos que las empresas y la tecnología ahora generan, los sistemas de AI tienen el potencial de ofrecer información de mejor calidad a los equipos, y de hacerlo más rápido. Gracias al nivel más profundo de conocimiento que se puede extraer de esa información, las empresas pueden tomar mejores decisiones y ofrecer mejores recomendaciones a los clientes.

AIOps marca el camino para el aprendizaje automático

Las operaciones de TI son una de esas áreas en donde empezamos a ver el valor que crea el aprendizaje automático, gracias a la aparición de AIOps.

En los ambientes de TI modernos y cada vez más complejos de la actualidad, en especial, en lo que respecta a la nube, la gestión y el monitoreo centrado en el dominio hacen que sea difícil (o imposible) reunir los conocimientos necesarios para evitar reaccionar a los problemas del sistema.

¿Qué es AIOps?

Por el contrario, AIOps busca automatizar el proceso de descubrimiento entre las funciones de las operaciones de TI y aplica aprendizaje automático para detectar patrones y hacer recomendaciones. Esto significa que además de tener una mejor visibilidad de la disponibilidad, el rendimiento, la gestión y la automatización de servicios, los equipos pueden tener una idea de qué esperar a través de la correlación de eventos y las capacidades de análisis.

AIOps faculta a los equipos de soporte de TI para que no solo respondan a incidencias, sino que además se conviertan en "solucionadores de problemas" colaborativos y creativos. Es poco probable que las máquinas aprendan a colaborar y a resolver problemas a corto plazo, pero el análisis proporcionado por la AI puede convertir a un equipo de TI comprometido en el mejor equipo para resolver problemas.

¿Cómo afectará AIOps a los empleados?

Como es de esperar, AIOps presentará cierto nivel de disrupción para los trabajadores y desafíos únicos para los gerentes de personal. AIOps hará que los empleados de support pronto se vean muy diferentes de cómo se ven ahora. El lado positivo es que, al permitirles a las máquinas manipular los datos y brindar información más profunda sobre las complejas relaciones programáticas y mecánicas, las personas tienen la oportunidad de centrarse en los resultados del cliente.

Intercambio de conocimiento: de qué manera Rackspace usa AIOps

Esta perspectiva se basa en nuestra propia experiencia con AIOps, que les ha permitido a nuestros equipos de support hacer menos trabajo de clasificación y prestar más servicio al reemplazar incidencias de alertas individuales por incidencias de "situaciones" agrupadas.

Desde siempre, un problema en un solo sistema puede activar alertas en varias áreas funcionales y lanzar una incidencia a cada uno de los equipos responsables de ese dominio (como almacenamiento, red, virtualización, SO y aplicaciones).

Ahora, sin embargo, hemos adoptado la solución Moogsoft AIOps, que utiliza sistemas supervisados de aprendizaje automático con "conocimiento" de las topologías de nuestros ambientes para detectar patrones y correlaciones en los problemas de support. Por ejemplo, de forma simultánea, podemos obtener alertas de la web, alertas de la disponibilidad de los servidores y alertas del SO que el sistema puede identificar como provocadas por un dispositivo de red particular. Como el dispositivo de red es probablemente la causa principal, se direccionará la incidencia de la situación al equipo de la red.

En vez de investigar cada incidencia de forma individual, y en silos, el equipo ahora tiene una visión holística ambiental de lo que sucede en los ambientes del cliente y en el ambiente más amplio de Rackspace. Los equipos afectados permanecen informados, pero la resolución del problema comienza, y casi seguro termina, con un solo equipo.

Las personas de esos equipos siguen siendo el factor definitorio en toda respuesta, pero reciben mejor información, por lo que pueden actuar de forma más rápida e inteligente.

¿Qué significa AIOps para los directivos?

Las organizaciones que consideren aumentar las operaciones con este tipo de capacidad de automatización deben comprender plenamente qué significa eso para el negocio y su gente. Es una decisión con conclusiones muy arraigadas en las estructuras y los procesos establecidos.

A simple vista, los líderes que buscan un ROI a corto plazo considerarán la reducción en la mano de obra por incidencia como una posibilidad para reducir el personal. Pero una visión a más largo plazo y con un beneficio potencialmente más grande indicaría que los equipos ahora tienen más tiempo para dedicarle a cada asunto.

Esta es la oportunidad principal para que los directivos mejoren la posición de las personas en el mundo laboral después de la implementación de AI; al mejorar las aptitudes del personal, la carga de trabajo que se presenta puede volverse más compleja. Después de todo, la identificación más precisa de problemas no tiene sentido sin una mejora correspondiente con la velocidad y la calidad de las resoluciones.

Unir la AI con la automatización puede reducir la necesidad de la intervención humana en los problemas repetitivos. Es posible que un miembro directivo llegue a considerar que esta es un área en la que se puede aplicar una reducción del costo de los empleados de tiempo completo. Sin embargo, se presenta la necesidad de contar con empleados de DevOps especializados que tengan un profundo conocimiento de la resolución de problemas técnicos y que puedan programar tareas automatizadas de diagnóstico y resolución. Además, las limitaciones de la AI en el razonamiento causal ocasionan riesgos cuando no se supervisan las acciones de cambio. El uso de aprendizaje automático supervisado y la inclusión de controles de cambio para las acciones sugeridas reducen los riesgos, pero requieren de la intervención humana para proporcionar validación y valores de aprendizaje.  

Los gerentes tampoco son inmunes al cambio. Cuando ya no estén lidiando con las colas de procesamiento de incidencias, deberán salir del estado transaccional y pasar al estado del proyecto. Y cuando el sistema asigne responsabilidad, los gerentes también deberán cambiar sus estilos de trabajo.

Además, la evolución de los roles y de las expectativas requieren una revisión de las medidas de éxito para estos equipos. La cantidad de incidencias cerradas se vuelve menos relevante cuando el valor está en la naturaleza de esa resolución. Para reflejar esto, la tasa de resolución en primera instancia es la métrica clave que mide el rendimiento de la resolución de problemas y el rendimiento del sistema. La resolución en primera instancia responde a la siguiente pregunta: ¿enviamos los problemas a la persona correcta la primera vez?  ¿Se ofrece una resolución válida?

Deben considerarse los efectos en la experiencia del cliente. Por naturaleza, los seres humanos nos oponemos a los cambios, y dominar el cambio a través de la educación es fundamental para poder incorporar de manera exitosa los nuevos procesos operativos en la organización.

Empiece de a poco y logre grandes resultados

Cada empresa será diferente, por lo que se necesita una autoevaluación detallada para identificar áreas iniciales de enfoque al considerar por dónde y cómo empezar con AIOps. Los controladores de llamadas más grandes son los principales candidatos, ya que prometen tener el mayor impacto.

Para Rackspace, esto significó empezar con la pila del cómputo y con parte de la pila de la red con una hoja de ruta, a fin de incorporar la pila de almacenamiento, las nubes públicas y las capas de aplicaciones y seguridad. Pero más allá del momento en que comience, la clave está en establecer una posición primordial que le permita avanzar de forma natural a través de la organización.

En términos de preparación para AIOps, la integridad de los datos es clave. Los algoritmos de aprendizaje automático deben operar en función de los datos de confianza, si bien hay margen para tolerar alguna variación. No es frecuente para una organización con miles de dispositivos contar con datos completamente precisos, por lo que es posible que deba establecer un umbral de lo que es aceptable. En muchos casos, si un conjunto de datos presenta alguna variación que ya se usa a diario, puede continuar utilizándose, pero se sugiere contar con un plan para minimizar aún más cualquier imprecisión.

La paradoja de las personas y el potencial de AIOps

Como hemos visto, la paradoja de AIOps es que para ser una aplicación que promete ayudar a las personas a responder preguntas, plantea muchas preguntas difíciles a las organizaciones sobre dónde y cómo las personas se adaptan a sus procesos y flujos de trabajo.

Lo que las organizaciones decidan hacer con la capacidad humana extra que obtienen gracias a las aplicaciones de aprendizaje automático que ahorran mano de obra en cualquier sector de su organización, no solo en las operaciones de TI, será de vital importancia para su éxito en el futuro.

Creemos que la creación de valor a largo plazo no siempre es el resultado de una reducción en los costos; es más factible que sea producto de maximizar los talentos que distinguen a las personas de las máquinas. AIOps puede ser la mejor oportunidad en mucho tiempo de hacer precisamente eso, al acelerar la creación de una nueva generación de equipos creativos de operaciones de TI para resolver problemas.

Join the Conversation: Find Solve on Twitter and LinkedIn, or follow along via RSS.

Acerca del autor

Ingeniero principalJean "JP" Gonzalez

Como ingeniero jefe de Rackspace, JP lidera la visión y estrategia de AIOps para nuestro proceso de eventos e incidencias de Rackspace. Con más de 20 años de experiencia en cargos de TI en servicios de desarrollo, administración y support, aporta...

Más

Ingeniero principalAndreas Möller

Andreas es un líder técnico talentoso con más de 20 años de experiencia en TI corporativa, retail, manufacturing, telecomunicaciones, protección de contenido y DRM, recuperación ante desastres y continuidad comercial. Es una persona carismática...

Más