Zum Inhalt springen

Conhecendo o Azure SRE Agent

Anunciado como uma das maiores novidades do Microsof Build 2025, principal evento de tecnologia da empresa. Construído para usar recursos de IA juntamente com LLM, o objetivo do Azure SRE Agent é trazer respostas ágeis e proativas para manutenção de ambientes cloud. Apoiando na resposta de incidentes, a ferramenta tem como premissa reduzir a carga de trabalho de gerenciamento de ambientes cloud produtivos.

Usando LLMs para analisar os logs e métricas para uma análise efetiva e rápida da causa raiz de um problema e sua solução. Em cenários de crescimento da complexidade de ambientes clouds, o correto uso da engenharia de confiabilidade do site, SRE, apresenta-se como uma prioridade para os times responsáveis por manter funcionais, efetivos e confiáveis ambientes cloud em produção.

Image description

Integrado aos recursos de observabilidade e gerenciamento de incidentes como o Agentic DevOps no GitHub Copilot de forma que ele possa monitorar e aprender a integridade dos recursos, lidando com alertas de forma a resolver problemas mais rapidamente.

Principais Recursos
Com o objetivo de ajudar a tornar o ambiente mais confiável, escalável e seguro, o Azure SRE Agent conta com os seguintes recursos.:

Avaliando tendências de uso e desempenho.: avaliando o ambiente de forma contínua, executando em segundo plano 24 horas por dia, 7 dias por semana, o SRE Agent auxilia os times através de respostas a perguntas via prompt para identificação rápida de inconsistências.

Image description

Detecção e correção proativas de vulnerabilidades de Segurança.: Fazendo auditorias frequentes, o SRE Agent verifica uso de versões TLS com suporte por exemplo, assim como executar as operações necessárias para atualizar os recursos com sua aprovação para deixar os mesmos em conformidade.

Image description

Resposta automatizada a incidentes e análise mais rápida da causa raiz.: Executando em conjunto com o Azure Monitor e o PagerDuty por exemplo, o SRE Agent pode atuar na resposta a incidentes, reduzindo o tempo de resposta e auxiliando os times na resolução de incidentes em um tempo menor que os métodos tradicionais.

Image description

Mitigação de Incidentes.: Para normalizar uma aplicação ao seu estado operacional, o SRE Agent pode fazer ações em nome e com aprovação do usuário. Essas açoes podem ser escalar recursos, reiniciar aplicativos e executar rollbacks de aplicativo de forma normalizar uma aplicação de forma mais rápida possível.

Image description

Feche o ciclo com os desenvolvedores.: Após a finalização da investigação, o SRE Agent cria um problema no GitHub, gerando os detalhes da investigação, ajudando os desenvolvedores a corrigir o código-fonte e evitar recorrências subsequentes de um incidente.

Image description

O Azure SRE Agent é um dos recursos novos mais aguardados para estarem disponíveis no Azure para os próximos meses para apoiar os times na gestão de ambientes cloud produtivos e complexos.

Referências.:
https://learn.microsoft.com/pt-br/azure/app-service/sre-agent-overview
https://azure.microsoft.com/en-us/blog/all-the-azure-news-you-dont-want-to-miss-from-microsoft-build-2025/
https://build.microsoft.com/en-US/sessions/DEM550
https://techcommunity.microsoft.com/blog/azurepaasblog/introducing-azure-sre-agent/4414569

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert