Site Reliability Engineer (SRE) / Especialista em Observabilidade
FOX IT
Data: há 6 dias
Cidade: Aveiro, Aveiro
Tipo de contrato: Tempo total

Descrição da Empresa
A Fox IT é uma empresa de Consultoria Portuguesa que está pelo 4º ano consecutivo no TOP das 5% melhores PME´S em Portugal. A nossa Missão é trazer uma nova abordagem ao mercado das TI, promovendo uma troca mais justa entre nós, os nossos consultores e os nossos clientes.
Descrição da Função
Procuramos reforçar a nossa equipa com um(a) profissional experiente para liderar a estratégia de observabilidade da organização, garantindo a padronização, confiabilidade e evolução contínua das práticas e ferramentas de monitorização. Esta pessoa será responsável pela gestão da plataforma Checkmk, integrando-a com outros sistemas e ferramentas, bem como pela definição de métricas, alertas e dashboards críticos para o negócio. Atuará de forma transversal entre equipas técnicas e de negócio, com uma abordagem proativa e foco na melhoria contínua. Responsabilidades:
A Fox IT é uma empresa de Consultoria Portuguesa que está pelo 4º ano consecutivo no TOP das 5% melhores PME´S em Portugal. A nossa Missão é trazer uma nova abordagem ao mercado das TI, promovendo uma troca mais justa entre nós, os nossos consultores e os nossos clientes.
Descrição da Função
Procuramos reforçar a nossa equipa com um(a) profissional experiente para liderar a estratégia de observabilidade da organização, garantindo a padronização, confiabilidade e evolução contínua das práticas e ferramentas de monitorização. Esta pessoa será responsável pela gestão da plataforma Checkmk, integrando-a com outros sistemas e ferramentas, bem como pela definição de métricas, alertas e dashboards críticos para o negócio. Atuará de forma transversal entre equipas técnicas e de negócio, com uma abordagem proativa e foco na melhoria contínua. Responsabilidades:
- Liderar a estratégia de observabilidade, definindo padrões e boas práticas;
- Gerir e operar a plataforma de monitoramento baseada em Checkmk (instalação, configuração, tuning e upgrades);
- Integrar o Checkmk com ferramentas de ITSM, notificação e automação por scripts personalizados e middlewares;
- Desenhar dashboards e alertas com Checkmk, Grafana e outras soluções;
- Definir e implementar testes de monitoramento sintético (ex: user journeys, APIs e serviços críticos), preferencialmente com Robot Framework;
- Identificar e implementar processos de automação e remediação para aumentar a eficiência das equipas técnicas;
- Promover a documentação e disseminação de conhecimento técnico entre as equipas. Requisitos Técnicos:
- Sólida experiência prática com Checkmk (instalação, agentes, custom checks, upgrades);
- Bons conhecimentos de sistemas operacionais Linux e Windows , redes, protocolos e SNMP;
- Experiência com scripting e automação ;
- Conhecimentos em AWS, Kubernetes são valorizados.
- Domínio de ferramentas e conceitos de logs, métricas e tracing (ex: Prometheus, Grafana, ELK, Graylog ) é valorizado
- Valorizado conhecimentos das ferramentas de Power Platform. Competências Adicionais (Diferenciais):
- Mais de 5 anos de experiência com observabilidade e monitoramento;
- Histórico comprovado com Checkmk;
- Certificações relacionadas a Observabilidade, Monitoração ou DevOps Soft Skills:
- Capacidade de resolver problemas complexos e propor soluções eficientes.
- Boa comunicação e trabalho em equipa.
- Proatividade e capacidade de adaptação a novos desafios.
- Mentalidade de automação e melhoria contínua. Modelo de trabalho: Remoto (pode haver necessidade de deslocação ao escritório, seja este porto ou Lisboa, dependendo de onde a pessoa estiver. O que nós oferecemos:
- 25 dias de férias
- Plano de saúde
- Formação
- Oportunidade de desenvolver sua carreira Dá o Salto, Junta-te a Nós! Localização
- Todo o país, Portugal
Veja mais empregos em Aveiro, Aveiro