En Layer7 estamos construyendo tecnología en hiperescala, donde cada decisión de ingeniería impacta a millones de usuarios y a las operaciones críticas de bancos, retailers y grandes empresas.
Somos más de 100 profesionales apasionados enfrentando problemas de alta complejidad técnica: desde sistemas distribuidos resilientes hasta plataformas capaces de procesar miles de millones de interacciones al año.
Aquí cultivamos una cultura de alto rendimiento, curiosidad técnica y camaradería real, con espacio para crecer, aprender y mantener un balance sano entre vida personal y profesional.
Si disfrutas resolver problemas difíciles, diseñar sistemas que escalan sin límites y atreverte a innovar con impacto, este es tu lugar.
Responsabilidades del Puesto:
Como Generative AI Engineer de nivel medio, tu misión será diseñar, entrenar e implementar sistemas conversacionales que integren voz, texto y contexto. Trabajarás en estrecha colaboración con los equipos de producto, ingeniería y ciencia de datos, contribuyendo al desarrollo de un pipeline completo de speech-to-speech AI agents.
Tus principales responsabilidades incluirán:
- Diseñar, implementar y optimizar agentes de voz basados en modelos de lenguaje grande (LLMs) y modelos de voz (TTS/STT).
- Desarrollar pipelines de conversación continua (speech→text→LLM→speech) con foco en latencia baja y naturalidad de respuesta.
- Aplicar técnicas de prompt engineering y context management para mantener coherencia, memoria conversacional y control de tono.
- Integrar modelos generativos en entornos backend (FastAPI, LangChain, LangGraph, AutoGen o equivalentes).
- Afinar y evaluar modelos multimodales, incluyendo fine-tuning de TTS (PiperTTS, CosyVoice, Bark) y ASR (Whisper, WhisperX).
- Desarrollar métricas internas de evaluación de diálogo (inteligibilidad, empatía, consistencia contextual).
- Monitorear el desempeño de los modelos en producción y aplicar técnicas de feedback-based optimization.
- Colaborar en la definición de nuevas funcionalidades de agentes de voz, incluyendo integración con telefonía o WebRTC.
Oportunidades de Desarrollo:
- Desarrollar modelos de voz personalizados y comprender la arquitectura de sistemas speech-speech real-time.
- Trabajar con tecnologías de vanguardia: WhisperX, PiperTTS, GPT-4o, Gemini 1.5 Pro, LangGraph, y motores de inferencia acelerados (Groq, ONNX Runtime).
- Diseñar prompt stacks y context planners para agentes autónomos conversacionales.
- Participar en proyectos que combinan IA generativa, emociones y conversación natural, con impacto directo en miles de usuarios.
- Entre otras oportunidades para investigar y proponer las mejores herramientas y técnicas para optimizar los procesos de análisis y documentación.
Ambiente de Trabajo:
Formarás parte de un equipo especializado en IA generativa aplicada a voz y lenguaje, con alto nivel técnico y enfoque ético. Promovemos un entorno de aprendizaje constante, colaboración abierta y responsabilidad compartida. Tendrás autonomía técnica y apoyo continuo para impulsar tus ideas hacia producción.
Habilidades y Competencias Requeridas:
- Dominio avanzado de Python y experiencia en desarrollo de APIs RESTful o WebSocket.
- Experiencia práctica con tecnologías de OpenAI, Whisper, PiperTTS, LangChain, LangGraph, AutoGen o similares.
- Conocimientos sólidos en procesamiento de audio, diarización, embeddings de voz y Voice Activity Detection (VAD).
- Experiencia en MLOps (Docker, entornos virtuales, MLflow, DVC, control de versiones de modelos).
- Experiencia comprobable en despliegue de modelos speech o generativos en entornos reales (mínimo 2 años).
- Habilidad para analizar resultados de modelos generativos y proponer mejoras cuantitativas y cualitativas.
- Capacidad para trabajar en equipo multidisciplinario, con criterio técnico y comunicación efectiva.
Sueldo competitivo, prestaciones de ley y superiores, ambiente de trabajo colaborativo y de aprendizaje.