Job Search and Career Advice Platform
  • Trabajos
  • Cazatalentos
  • Revisión gratuita del currículum
  • Sobre nosotros
ES
10.000+

Jobs in Argentina

Evaluation Scenario Writer - AI Agent Testing Specialist

Mindrift

Argentina
A distancia
ARS 6.500.000 - 9.750.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante
Quiero recibir las últimas vacantes disponibles en Argentina

Corporate Data Officer

Aramco

Neuquén
Presencial
ARS 174.269.000 - 261.404.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

QA Automation SSr

iStorming Argentina

Buenos Aires
Presencial
ARS 9.750.000 - 12.500.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Evergreen - Alliances Operations Reporting Specialist - Assistant Director - EY Global Delivery Ser

Iris Software

Buenos Aires
Presencial
ARS 101.657.000 - 130.702.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Cloud Deployment Manager - AWS

PwC - Global

Buenos Aires
Presencial
ARS 700.000 - 1.000.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante
discover more jobs illustrationDescubre más oportunidades que en ningún otro sitio. Accede a más vacantes

Communications Specialist

ISR Division Systems, LLC

Buenos Aires
Presencial
ARS 87.134.000 - 108.919.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Management Support Senior Specialist

IBM

Buenos Aires
Presencial
ARS 6.500.000 - 9.750.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

EY - Consultor/a Junior en SAP SuccessFactors

Ernst & Young Advisory Services Sdn Bhd

Buenos Aires
Híbrido
ARS 9.750.000 - 12.500.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante
HeadhuntersEntra en contacto con cazatalentos para acceder a vacantes similares

Supervisor de Producción de Colado

Ceta Capital Humano

Buenos Aires
Presencial
ARS 6.500.000 - 9.750.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Compliance Risk Management Sr Analyst

PowerToFly

Buenos Aires
Presencial
ARS 87.134.000 - 116.180.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

BU757 Ejecutivo / a Semi Senior de ventas, Rubro construcción, Gba Oeste, Ituzaingó

Cona Consultores SRL

Municipio de Ituzaingó
Presencial
ARS 6.500.000 - 9.750.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Operario pintor

MINETECH SRL

Malvinas Argentinas
Presencial
ARS 1.500.000 - 6.500.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Data Marketing Specialist

Kuehne+Nagel

Buenos Aires
Presencial
ARS 6.500.000 - 9.750.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Account Payable Manager – US Client

PwC - Global

Vicente López
Híbrido
ARS 1.500.000 - 2.000.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Golang Engineer (Middle) ID47128

AgileEngine

Ciudad de Mendoza
Híbrido
ARS 43.567.000 - 72.613.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

AWS Sales Leader - Strategic Accounts, AGS AWS Sales Leader - Strategic Accounts

Amazon

Buenos Aires
Presencial
ARS 130.701.000 - 174.270.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

AR Experience Manager

Didi

Buenos Aires
Híbrido
ARS 101.657.000 - 130.702.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Desarrollador

The Automation Partner

Tandil
A distancia
ARS 6.500.000 - 9.750.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

SEO Specialist

Cielo Talent

Buenos Aires
A distancia
ARS 58.089.000 - 79.874.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Vendedor de Salón Caba

Springwall

Buenos Aires
Presencial
ARS 1.500.000 - 6.500.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Administración

Grupo Consultores de Empresas

Rafaela
Híbrido
ARS 6.500.000 - 9.750.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Delivery Specialist

Colgate-Palmolive

Buenos Aires
Presencial
ARS 43.567.000 - 72.613.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Representante Técnico de Obras Viales

UMBRAL Capital Humano

Ciudad de Mendoza
Presencial
ARS 70.000 - 90.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Contador/a Semi Senior para empresa del sector supermercadista

Yakú Consultora

Córdoba
Presencial
ARS 600.000 - 800.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Onboarding Specialist

Markem-Imaje

Buenos Aires
Presencial
ARS 72.612.000 - 101.658.000
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante
Evaluation Scenario Writer - AI Agent Testing Specialist
Mindrift
A distancia
ARS 6.500.000 - 9.750.000
A tiempo parcial
Hace 3 días
Sé de los primeros/as/es en solicitar esta vacante

Descripción de la vacante

A technology firm in Argentina seeks a candidate to design realistic evaluation scenarios for LLM-based agents. The role involves creating structured test cases, defining gold-standard behaviors, and analyzing agent performance. Candidates should have a Bachelor's or Master's degree in Computer Science or related fields, strong written communication skills in English, and experience in QA or software testing. This is a flexible freelance role offering competitive rates based on skills and experience.

Servicios

Flexible working hours
Competitive hourly rates
Contribution to advanced AI projects

Formación

  • Good understanding of QA, software testing, data analysis, or NLP annotation.
  • Comfortable with structured formats like JSON/YAML for scenario description.
  • Curious and open to working with AI-generated content.

Responsabilidades

  • Design realistic and structured evaluation scenarios for LLM-based agents.
  • Create test cases to simulate complex human workflows.
  • Define gold-standard behavior and scoring logic to evaluate agent actions.
  • Analyze agent logs and decision paths.

Conocimientos

Test design principles
Written communication skills in English
Python
JavaScript

Educación

Bachelor's or Master's Degree in a related field
Descripción del empleo

This opportunity is only for candidates currently residing in the specified country. Your location may affect eligibility and rates. Please submit your resume in English and indicate your level of English.

At Mindrift, innovation meets opportunity. We believe in using the power of collective human intelligence to ethically shape the future of AI.

What we do

The Mindrift platform connects specialists with AI projects from major tech innovators. Our mission is to unlock the potential of Generative AI by tapping into real-world expertise from across the globe.

About the Role

We’re looking for someone who can design realistic and structured evaluation scenarios for LLM-based agents. You’ll create test cases that simulate human-performed tasks and define gold-standard behavior to compare agent actions against. You’ll work to ensure each scenario is clearly defined, well-scored, and easy to execute and reuse. You’ll need a sharp analytical mindset, attention to detail, and an interest in how AI agents make decisions.

Although every project is unique, you might typically:

  • Create structured test cases that simulate complex human workflows.
  • Define gold-standard behavior and scoring logic to evaluate agent actions.
  • Analyze agent logs, failure modes, and decision paths.
  • Work with code repositories and test frameworks to validate your scenarios.
  • Iterate on prompts, instructions, and test cases to improve clarity and difficulty.
  • Ensure that scenarios are production-ready, easy to run, and reusable.
How to get started

Simply apply to this post, qualify, and get the chance to contribute to projects aligned with your skills, on your own schedule. From creating training prompts to refining model responses, you’ll help shape the future of AI while ensuring technology benefits everyone.

Requirements
  • Bachelor's and/or Master’s Degree in Computer Science, Software Engineering, Data Science / Data Analytics, Artificial Intelligence / Machine Learning, Computational Linguistics / Natural Language Processing (NLP), Information Systems or other related fields.
  • Background in QA, software testing, data analysis, or NLP annotation.
  • Good understanding of test design principles (e.g., reproducibility, coverage, edge cases).
  • Strong written communication skills in English.
  • Comfortable with structured formats like JSON/YAML for scenario description.
  • Can define expected agent behaviors (gold paths) and scoring logic.
  • Basic experience with Python and JS.
  • Curious and open to working with AI-generated content, agent logs, and prompt-based behavior.
Nice to Have
  • Experience in writing manual or automated test cases.
  • Familiarity with LLM capabilities and typical failure modes.
  • Understanding of scoring metrics (precision, recall, coverage, reward functions).
Benefits

Contribute on your own schedule, from anywhere in the world. This opportunity allows you to:

  • Get paid for your expertise, with rates that can go up to $17/hour depending on your skills, experience, and project needs.
  • Take part in a flexible, remote, freelance project that fits around your primary professional or academic commitments.
  • Participate in an advanced AI project and gain valuable experience to enhance your portfolio.
  • Influence how future AI models understand and communicate in your field of expertise.
  • 1
  • ...
  • 58
  • 59
  • 60
  • ...
  • 400

* El índice de referencia salarialse calcula en base a los salarios que ofrecen los líderes de mercado en los correspondientes sectores. Su función es guiar a los miembros Prémium a la hora de evaluar las distintas ofertas disponibles y de negociar el sueldo. El índice de referencia no es el salario indicado directamente por la empresa en particular, que podría ser muy superior o inferior.

Job Search and Career Advice Platform

Impulsopara la búsqueda de empleo

Herramientas
  • Trabajos
  • Evaluación de CV
  • Cazatalentos
  • Ver puestos de trabajo
Empresa
  • Sobre JobLeads
  • Vacantes en JobLeads
  • Aviso legal
  • Prensa
  • Reseñas
Ayuda
  • Ayuda
  • Integración de socios
  • Socios ATS
Social
  • Blog de JobLeads
  • YouTube
  • LinkedIn
  • Instagram
  • Facebook
  • Protección de datos
  • Condiciones comerciales generales

© JobLeads 2007 - 2025 | Todos los derechos reservados