Article (leitura de 6 minutos)

Aprimore seus talentos humanos com AIOps

A AIOps mostra que a tecnologia tem o potencial de aprimorar — em vez de prejudicar — o papel dos seres humanos no local de trabalho.

Jean "JP" Gonzalez / Rackspace, Andreas Möller / Rackspace

Uma mistura complexa de otimismo e incerteza costuma acompanhar as revoluções tecnológicas. E hoje, nenhuma tecnologia promete – ou ameaça, dependendo do seu ponto de vista – causar mais ruptura do que a inteligência artificial (IA).

Para cada especialista que comemora o seu potencial de transformação tanto para os negócios quanto para a sociedade em geral, um outro dispara o alarme sobre os riscos que a tomada de decisões pelas máquinas representa para os empregos. Sem falar das implicações morais que resultam quando essas decisões impactam a vida e o sustento das pessoas.

Essas reações são compreensíveis, e há muito para se discutir enquanto trilhamos esse caminho. No entanto, enquanto os aplicativos de IA começam a criar raízes nas empresas (principalmente através de aprendizado de máquina, uma subcategoria da IA), já estamos começando a ver oportunidades para que ela melhore, e não prejudique, o papel dos seres humanos no local de trabalho.

Ao reduzir o ruído no maremoto de dados que os negócios e a tecnologia geram hoje, os sistemas de IA têm o potencial de entregar informações de maior qualidade para as equipes, fazendo isso de forma mais rápida. Com os insights mais aprofundados que podem ser extraídos dessas informações, as empresas podem tomar decisões melhores e oferecer recomendações melhores para os clientes.

AIOps abre caminho para o aprendizado de máquina

As operações de TI estão entre as áreas em que estamos começando a vislumbrar o valor criado pelo aprendizado de máquina, graças ao surgimento de AIOps.

Nos ambientes modernos de TI cada vez mais complexos, especialmente no que diz respeito à nuvem, o monitoramento e o gerenciamento centrados no domínio dificultam (ou impossibilitam) reunir os insights necessários para ir além da reatividade aos problemas de sistema.

O que é AIOps?

Por outro lado, a AIOps busca automatizar o processo de descoberta em todas as funções das operações de TI e aplicar o aprendizado de máquina para detectar padrões e fazer recomendações. Isso significa que, além de maior visibilidade em relação a disponibilidade, desempenho, gestão de serviços e automação, as equipes podem obter uma noção do que há pela frente através da correlação de eventos e capacidades analíticas.

A AIOps possibilita às equipes de suporte ir além da criação de chamados, tornando-se colaborativas e solucionando problemas de forma criativa. É improvável que as máquinas aprendam a colaborar e resolver problemas tão cedo, mas os dados analíticos fornecidos pela IA podem transformar uma equipe de TI engajada em uma central de solução de problemas.

Como a AIOps afeta os funcionários?

É claro que a AIOps trará algum nível de ruptura para os trabalhadores e desafios únicos para os gestores de pessoas. A AIOps significa que os empregos de suporte em breve serão muito diferente de como eles são hoje. O lado bom é que, deixar as máquinas tratarem os dados e fornecerem insights mais aprofundados sobre relações mecânicas e programáticas complexas dá às pessoas a oportunidade de focar nos resultados para os clientes.

Compartilhamento de conhecimento: como a Rackspace usa a AIOps

Este ponto de vista se baseia na nossa própria experiência com AIOps, que permitiu que nossas equipes de suporte fizessem menos trabalho de triagem e fornecessem mais atendimento ao substituir chamados de alerta únicos por chamados agrupados por "situação".

Tradicionalmente, um problema com um único sistema pode acionar alertas em diversas áreas funcionais e disparar um chamado para cada uma das equipes responsáveis por cada domínio (como armazenamento, rede, virtualização, SO e aplicativos).

No entanto, agora adotamos a solução da Moogsoft, que usa sistemas de aprendizado de máquina supervisionados com "conhecimento" das topologias dos nossos ambientes para encontrar padrões e correlações em problemas de suporte. Por exemplo, podemos receber simultaneamente alertas da web, alertas de disponibilidade do servidor e alertas de SO que o sistema pode identificar como tendo sido causados por um dispositivo da rede em particular. Como o dispositivo da rede é provavelmente a raiz do problema, o chamado situacional será encaminhado para a equipe de rede.

Em vez de investigar cada chamado individualmente e de forma isolada, a equipe agora tem uma visão ambiental holística do que está acontecendo tanto nos ambientes dos clientes quanto no ambiente mais amplo da Rackspace. As equipes afetadas continuam informadas, mas a solução do problema começa – e muito provavelmente termina – com uma única equipe.

As pessoas dessas equipes continuam sendo o fator decisivo de qualquer resposta, mas recebem informações melhores para que possam agir mais rápido e de forma mais inteligente.

O que a AIOps representa para a liderança?

As organizações que pensam em ampliar as operações com esse tipo de capacidade de automação precisam compreender plenamente o que ela significa para a empresa e as pessoas. Trata-se de uma decisão que tem consequências profundas para processos e estruturas estabelecidos.

Superficialmente, os líderes que buscam ROI a curto prazo verão uma redução no trabalho por chamado como uma oportunidade de reduzir o número de funcionários. Mas uma visão de longo prazo, que tem um benefício potencialmente maior, pode perceber que as equipes terão mais tempo para dedicar a cada problema.

Essa é a principal oportunidade para que a liderança melhore a posição das pessoas no mundo do trabalho pós-IA. Ao desenvolver as habilidades dos trabalhadores, a carga de trabalho apresentada pode se tornar mais complexa. Afinal, a identificação mais precisa dos problemas não significa nada sem um aperfeiçoamento correspondente na velocidade e na qualidade das resoluções.

Combinar IA e automação pode reduzir a necessidade de intervenção humana para problemas repetitivos. Um líder pode ver isso como uma área para redução de custos com funcionários em período integral, mas tal fato introduz a necessidade de funcionários de DevOps mais qualificados, que tenham um entendimento profundo de solução de problemas técnicos e possam programar as tarefas automatizadas de diagnóstico e remediação. Além disso, as limitações da IA em raciocínio causal oferecem riscos quando ações de mudança não são supervisionadas. O uso de aprendizado de máquina supervisionado e a inclusão de controles de mudança para ações sugeridas reduz os riscos, mas exige intervenção humana para fornecer validação e dados de aprendizagem.  

Os gestores também não estão imunes às mudanças. Quando não estiverem mais lidando com filas de processamento de chamados, eles terão que fazer a transição de um estado transacional para um estado de projeto. E quando o sistema atribui responsabilidades, os gerentes também precisam alterar os estilos de trabalho.

A evolução das funções e expectativas também exige a recalibração das medidas de sucesso para essas equipes. O número de chamados encerrados se torna menos relevante quando o valor está na natureza dessa resolução. Para refletir isso, a taxa de resolução na primeira interação é a métrica essencial, que mede tanto o desempenho da solução de problemas quanto o desempenho do sistema. A resolução na primeira interação reponde à pergunta: estamos mandando os problemas para a pessoa certa na primeira vez?  Elas estão oferecendo uma solução válida?

Os impactos da experiência do cliente precisam ser considerados. Os seres humanos são naturalmente avessos à mudança, e gerenciar a mudança através da educação é essencial para o sucesso da introdução dos novos processos operacionais na organização.

Comece pequeno para crescer

Todas as empresas são diferentes, por isso, é necessária uma autoavaliação detalhada para identificar áreas-alvo iniciais ao considerar onde e como iniciar a AIOps. As maiores fontes de chamadas são os principais candidatos, já que prometem ter o maior impacto.

Para a Rackspace, isso significou começar com a pilha de computação e parte da pilha de rede com um roteiro para incorporar a pilha de armazenamento, nuvens públicas e as camadas de aplicativo e segurança. Mas independentemente de onde você começar, o importante é estabelecer uma posição de base que permita subir pela organização naturalmente.

Em termos de predisposição para AIOps, a integridade de dados é essencial. Os algoritmos de aprendizado de máquina precisam operar sobre dados confiáveis, mas há margem de tolerância para algumas variações. É raro que uma organização com milhares de dispositivos tenha dados totalmente precisos. Por isso, pode ser necessário estabelecer um limite do que é aceitável. Em muitos casos, se um conjunto de dados tiver alguma variação, mas já for usado diariamente, ele pode continuar sendo usado, mas recomenda-se ter um plano para minimizar as imprecisões.

O paradoxo das pessoas e o potencial da AIOps

Como vimos, o paradoxo da AIOps existe porque para um aplicativo que promete ajudar as pessoas a responder questões, ele levanta uma série de perguntas complicadas para as organizações a respeito de onde e como as pessoas se encaixam nos seus processos e fluxos de trabalho.

O que as organizações decidirem fazer com a capacidade humana extra obtida com a economia de trabalho dos aplicativos de aprendizado de máquina – não só nas operações de TI – será crucial para seu sucesso futuro.

Nosso ponto de vista é que a criação de valor de longo prazo muitas vezes não resulta da redução de custos. É mais provável que ela decorra da maximização dos talentos que diferenciam os seres humanos das máquinas. A AIOps pode ser a melhor oportunidade de uma geração para fazer exatamente isso, ao acelerar a criação de uma nova safra de equipes de operações de TI que resolvem problemas de forma criativa.

Participe da conversa: encontre o Solve em Twitter and LinkedIn, ou siga através de RSS.

Sobre o autor

Engenheiro-chefeJean "JP" Gonzalez

Como engenheiro principal da Rackspace, JP lidera a visão e a estratégia de AIOps para o processo de eventos e chamados da Rackspace. Com mais de 20 anos de experiência em funções de TI em serviços de desenvolvimento, gestão e suporte, ele traz...

Leia mais

Engenheiro-chefeAndreas Möller

Andreas é um líder técnico talentoso com mais de 20 anos de experiência atuando em TI corporativo, varejo, manufatura, telecomunicações, proteção de conteúdo e GDD, recuperação de desastres e continuidade de negócio. Apaixonado por pessoas e...

Leia mais