**Sobre a GO.K:** Somos aceleradores de inovação e tecnologia para empresas desde 2009. Focamos em soluções inovadoras que visam impulsionar o crescimento dos negócios e garantir resultados excepcionais aos nossos clientes. Atuamos desde o diagnóstico até a implementação em projetos digitais de alta complexidade técnica e de negócio, em ambientes transacionais, regulados e com forte exigência de qualidade, segurança, performance, observabilidade e governança.
**Contexto:** Atuação dedicada à sustentação de sistemas em produção, com responsabilidade sobre estabilidade, disponibilidade e resposta a incidentes. O papel é atuar em incidentes, entender causa raiz e garantir que o sistema continue operando com qualidade, reduzindo recorrência de problemas.
### Responsabilidades
* Atuar na resolução de incidentes em produção
* Realizar análise de causa raiz (RCA) e implementar correções
* Monitorar e interpretar logs, métricas e alertas
* Executar hotfixes e correções pontuais no código
* Acompanhar e apoiar deploys e releases, mitigando riscos
* Investigar problemas em: APIs / mensageria /integrações com terceiros
* Atuar na correção de dados, quando necessário
* Criar e evoluir runbooks operacionais
* Identificar e atuar em gargalos de performance e falhas recorrentes
* Trabalhar junto a times de produto e engenharia na priorização de bugs e débitos técnicos
* Participar de plantão/on-call, quando aplicável
### Hard Skills (mandatórios)
* Java (17+)
* Spring Boot
* APIs REST (contrato, debug e troubleshooting)
* Arquitetura de microserviços (visão operacional)
* Integrações (REST, eventos, webhooks)
* Banco de dados relacional (PostgreSQL, MySQL ou equivalente)
* análise de queries
* correção de inconsistências
* Mensageria (Kafka, RabbitMQ ou similar): troubleshooting de filas e consumidores
* Observabilidade: logs estruturados / métricas / tracing distribuído
* Tratamento de falhas: timeout / retry / circuit breaker
* Autenticação/autorização (OAuth2, JWT – análise e suporte)
* Containers (Docker) e noções de Kubernetes
* Git (fluxo de PR, hotfix, rollback)
### Soft Skills
* Capacidade de atuar sob pressão em cenários críticos
* Raciocínio analítico forte para diagnóstico
* Comunicação clara e objetiva com times técnicos e não técnicos
* Organização para lidar com múltiplos incidentes/prioridades
* Senso de responsabilidade sobre o ambiente produtivo
### Diferenciais
* Experiência com sistemas de alta disponibilidade e alta volumetria
* Vivência estruturada com gestão de incidentes
* Conhecimento de práticas SRE (SLI, SLO, error budget)
* Experiência com ferramentas como Datadog, Grafana ou Sentry
* Experiência em ambientes cloud
### Atuação
* Foco principal em produção e estabilidade
* Desenvolvimento restrito a correções e melhorias pontuais
* Forte interface com times de desenvolvimento, produto e infraestrutura
* Responsável por reduzir incidentes e aumentar a confiabilidade do sistema