Provisionar y escalar clústeres AKS/EKS con GPU para inferencia y fine-tuning de modelos, usando módulos Terraform reutilizables.
Automatizar CI/CD de aplicaciones y pipelines LLM con GitHub Actions y Azure DevOps, incluyendo tests de seguridad, performance y validación de prompts.
Implementar observabilidad de extremo a extremo (traces, métricas, logs) con OpenTelemetry y dashboards en Prometheus/Grafana para detectar latencias, uso de tokens y drift de modelos.
Gestionar ciclo de vida de modelos (versionado, promoción, rollback) con MLflow 3 / LLMOps y artefactos en repositorios seguros.
Optimizar costos y cuotas (TPM/RPM) en Azure OpenAI y Bedrock, aplicando auto‑scaling y políticas de rate‑limit.
Colaborar con equipos de Ingeniería y Data Science para integrar nuevos agentes, vectordbs y workflows sin fricción operacional.
Conocimientos requeridos
+5 años en roles DevOps/S...
Ready to Apply?
Join thousands of Americans building their careers