Administrar y escalar ejecutores de GitHub Actions autohospedados mediante Kubernetes
Ayude a expandir la compatibilidad del ejecutor para varias combinaciones de hardware y sistemas operativos, incluidos Linux, Windows, GPU única, GPU múltiple, NVLink y más
Utilice Infraestructura como Código (Terraform y ArgoCD) para implementar y mantener infraestructura tanto local como en AWS
Cree y mantenga imágenes de máquinas virtuales de ejecución mediante HashiCorp Packer
Conecte servicios distribuidos de forma segura mediante mTLS, PKI y HashiCorp Vault
Desarrollar, empaquetar e implementar herramientas Golang personalizadas para respaldar la observabilidad, la estabilidad y la eficiencia de la plataforma.
Configure alertas y monitoreo para identificar y abordar problemas rápidamente, utilizando herramientas como Prometheus y Grafana
Contribuir a las herramientas y bibliotecas de código abierto de las que depende nuestro equipo.
Actualice periódicamente las dependencias de la plataforma y aborde los CVE
Requisitos:
Licenciatura o maestría en Ciencias de la Computación, Ingeniería Informática o un campo relacionado (o experiencia equivalente)
Más de 7 años de experiencia comprobada en infraestructura, DevOps o ingeniería de plataformas
Sólida experiencia en Kubernetes (ejecución, depuración y escalado de cargas de trabajo)
Experiencia con herramientas GitOps (ArgoCD o similar)
Competencia en administración y resolución de problemas de Linux
Experiencia con Infraestructura como Código usando Terraform/Terragrunt
Competencia en Golang, Python y TypeScript
Experiencia práctica con monitoreo, registro y rastreo (Prometheus, Grafana, OpenTelemetry, etc.)
Sólida comprensión de los pipelines de CI/CD, en particular de las acciones de GitHub.
Capacidad para trabajar y colaborar eficazmente con un equipo completamente remoto y distribuido.
Deseables:
Experiencia en instrumentación de telemetría para sistemas distribuidos.
Sólida experiencia en cargas de trabajo de GPU en Kubernetes con experiencia en la escritura de controladores Kubernetes personalizados
Conocimiento profundo de KubeVirt y/o virtualización
Experiencia con ejecutores de GitHub Actions autoalojados
Contribuciones a proyectos de código abierto relacionados con Kubernetes