Site Reliability Engineer (SRE) / Especialista em Observabilidade

FOX IT


Data: há 6 dias
Cidade: Aveiro, Aveiro
Tipo de contrato: Tempo total
Descrição da Empresa

A Fox IT é uma empresa de Consultoria Portuguesa que está pelo 4º ano consecutivo no TOP das 5% melhores PME´S em Portugal. A nossa Missão é trazer uma nova abordagem ao mercado das TI, promovendo uma troca mais justa entre nós, os nossos consultores e os nossos clientes.

Descrição da Função

Procuramos reforçar a nossa equipa com um(a) profissional experiente para liderar a estratégia de observabilidade da organização, garantindo a padronização, confiabilidade e evolução contínua das práticas e ferramentas de monitorização. Esta pessoa será responsável pela gestão da plataforma Checkmk, integrando-a com outros sistemas e ferramentas, bem como pela definição de métricas, alertas e dashboards críticos para o negócio. Atuará de forma transversal entre equipas técnicas e de negócio, com uma abordagem proativa e foco na melhoria contínua. Responsabilidades:

  • Liderar a estratégia de observabilidade, definindo padrões e boas práticas;
  • Gerir e operar a plataforma de monitoramento baseada em Checkmk (instalação, configuração, tuning e upgrades);
  • Integrar o Checkmk com ferramentas de ITSM, notificação e automação por scripts personalizados e middlewares;
  • Desenhar dashboards e alertas com Checkmk, Grafana e outras soluções;
  • Definir e implementar testes de monitoramento sintético (ex: user journeys, APIs e serviços críticos), preferencialmente com Robot Framework;
  • Identificar e implementar processos de automação e remediação para aumentar a eficiência das equipas técnicas;
  • Promover a documentação e disseminação de conhecimento técnico entre as equipas. Requisitos Técnicos:
  • Sólida experiência prática com Checkmk (instalação, agentes, custom checks, upgrades);
  • Bons conhecimentos de sistemas operacionais Linux e Windows , redes, protocolos e SNMP;
  • Experiência com scripting e automação ;
  • Conhecimentos em AWS, Kubernetes são valorizados.
  • Domínio de ferramentas e conceitos de logs, métricas e tracing (ex: Prometheus, Grafana, ELK, Graylog ) é valorizado
  • Valorizado conhecimentos das ferramentas de Power Platform. Competências Adicionais (Diferenciais):
  • Mais de 5 anos de experiência com observabilidade e monitoramento;
  • Histórico comprovado com Checkmk;
  • Certificações relacionadas a Observabilidade, Monitoração ou DevOps Soft Skills:
  • Capacidade de resolver problemas complexos e propor soluções eficientes.
  • Boa comunicação e trabalho em equipa.
  • Proatividade e capacidade de adaptação a novos desafios.
  • Mentalidade de automação e melhoria contínua. Modelo de trabalho: Remoto (pode haver necessidade de deslocação ao escritório, seja este porto ou Lisboa, dependendo de onde a pessoa estiver. O que nós oferecemos:
  • 25 dias de férias
  • Plano de saúde
  • Formação
  • Oportunidade de desenvolver sua carreira Dá o Salto, Junta-te a Nós! Localização
  • Todo o país, Portugal
Postar um currículo