Job Search and Career Advice Platform

Enable job alerts via email!

Software Architect, Applied AI

PowerToFly

Toronto

On-site

CAD 100,000 - 150,000

Full time

Yesterday
Be an early applicant

Generate a tailored resume in minutes

Land an interview and earn more. Learn more

Job summary

A technology-focused company in Toronto is looking for a Software Architect in Applied AI to design scalable, cloud-native services and agentic AI workflows. Candidates should have over 8 years of experience in cloud-native software and AI/ML systems, adept in Python, TypeScript, or Java. This position requires strong communication skills to influence decisions and collaborate with cross-functional teams. An exciting opportunity to contribute to innovative AI solutions awaits successful applicants.

Qualifications

  • 8+ years of experience in building cloud-native software in production.
  • 4+ years of experience in delivering AI/ML-powered systems.
  • Strong proficiency in Python/TypeScript/Java.

Responsibilities

  • Architect and build scalable, secure cloud-native services.
  • Define model strategy across prompting, retrieval, and fine-tuning.
  • Establish evaluation and observability standards.

Skills

Cloud-native software development
AI/ML applications
Python
TypeScript
Java
Communication Skills

Education

Bachelor's or Master's degree in Computer Science or equivalent

Tools

AWS
Azure
GCP
Kubernetes
CI/CD
Job description

Job Requisition ID #25WD94061, Software Architect, Applied AI

Position Overview

If you love building real systems that real customers use—and you get genuinely excited about LLMs, RAG, MCP, and agentic architectures—this role is for you. The Applied AI team in Autodesk’s Data and Process Management (DPM) organization ships Cloud‑Native AI agents that make our Product Data Management (PDM) and Product Lifecycle Management (PLM) workflows smarter and easier. This is a hands‑on architecture role where you’ll design core platform patterns and also write code that lands in production.

French translation to follow! Traduction française à suivre!

Si vous aimez créer des systèmes réels utilisés par de vrais clients et que vous êtes passionné par les LLM, les RAG, les MCP et les architectures agentiques, ce poste est fait pour vous. L’équipe Applied AI de l’organisation Data and Process Management (DPM) d’Autodesk fournit des agents IA natifs du cloud qui rendent nos workflows de gestion des données produit (PDM) et de gestion du cycle de vie des produits (PLM) plus intelligents et plus faciles. Il s’agit d’un poste d’architecte pratique dans lequel vous concevriez des modèles de plateforme de base et écririez également du code utilisé en production.

Responsibilities
  • Architect and build scalable, secure cloud‑native services and agentic AI workflows that run in production.
  • Own the GenAI/ML architecture for production agentic systems: tool‑use, orchestration, state/memory, routing, and multi‑step workflows.
  • Define model strategy across prompting, retrieval (RAG), and fine‑tuning—balancing measurable quality, latency, safety, and cost.
  • Standardize tool/context integrations across internal systems using MCP‑based patterns (or equivalent approaches), enabling teams to ship faster on a shared foundation.
  • Establish evaluation and observability standards (regression tests, monitoring, feedback loops).
  • Set technical direction via reference architectures, best practices, and hands‑on guidance across teams.
  • Partner closely with Product, Security/Privacy, and Engineering leaders to deliver high‑impact features.
Responsabilités
  • Concevoir et construire des services cloud natifs évolutifs et sécurisés ainsi que des workflows d’IA agentique qui fonctionnent en production.
  • Maîtriser l’architecture GenAI/ML pour les systèmes agentics de production : utilisation des outils, orchestration, état/mémoire, routage et workflows en plusieurs étapes.
  • Définir la stratégie du modèle en matière de prompting, de récupération (RAG) et de réglage fin, en faisant des compromis sur la base de critères mesurables tels que la qualité, la latence, la sécurité et le coût.
  • Standardiser les intégrations d’outils/de contextes dans les systèmes internes à l’aide de modèles basés sur MCP (ou d’approches équivalentes), afin de permettre aux équipes de livrer plus rapidement sur une base commune.
  • Établir des normes d’évaluation et d’observabilité (tests de régression, surveillance, boucles de rétroaction).
  • Définir l’orientation technique via des architectures de référence, des bonnes pratiques et des conseils techniques pratiques pour toutes les équipes.
  • Travailler en étroite collaboration avec les responsables des produits, de la sécurité/confidentialité et de l’ingénierie afin de fournir des fonctionnalités à fort impact.
Minimum Qualifications
  • Bachelor’s or Master’s degree in Computer Science, Machine Learning, Data Science, or equivalent practical experience.
  • 8+ years building cloud‑native software in production (distributed systems, APIs, data‑intensive services, reliability and operations).
  • 4+ years delivering AI/ML‑powered systems in production.
  • Experience with traditional ML cloud applications (training pipelines, deployment, monitoring, iteration).
  • Experience with LLM‑based systems (RAG, MCP, agent workflows, fine‑tuned models).
  • Experience with MCP or similar standardized patterns for connecting models to tools and context.
  • Experience deploying and maintaining AI applications in production reliably, monitoring performance, and improving over time.
  • Proficiency in Python/TypeScript/Java with strong engineering fundamentals (testing, code quality, performance, security).
  • Strong communication skills: able to explain trade‑offs clearly and influence decisions without relying on authority.
Qualifications minimales
  • Licence ou master en informatique, apprentissage automatique, science des données ou expérience pratique équivalente.
  • Plus de 8 ans d’expérience dans le développement de logiciels cloud natifs en production (systèmes distribués, API, services à forte intensité de données, fiabilité et opérations).
  • Plus de 4 ans d’expérience dans la mise en production de systèmes basés sur l’IA/l'apprentissage automatique.
  • Applications cloud traditionnelles d’apprentissage automatique (pipelines de formation, déploiement, surveillance, itération).
  • Systèmes basés sur le LLM (RAG, MCP, workflows d’agents, modèles affinés).
  • Expérience avec MCP ou des modèles standardisés similaires pour connecter des modèles à des outils et à un contexte.
  • Expérience dans le déploiement et la maintenance fiables d’applications d’IA en production, la surveillance des performances et l’amélioration au fil du temps.
  • Maîtrise de Python/TypeScript/Java avec de solides connaissances fondamentales en ingénierie (tests, qualité du code, performances, sécurité).
  • Solides compétences en communication : capable d’expliquer clairement les compromis et d’influencer les décisions sans s’appuyer sur son autorité.
Preferred Qualifications
  • Deep experience designing AI evaluation pipelines and production release strategies for AI applications.
  • Experience with AWS/Azure/GCP and modern platform practices (containers, Kubernetes, CI/CD, observability).
  • Experience in PLM/PDM, manufacturing, CAD, or enterprise workflow software.
  • Open‑source contributions, publications, or talks related to distributed systems, ML or GenAI systems.
Qualifications souhaitées
  • Expérience approfondie dans la conception de pipelines d’évaluation de l’IA et de stratégies de mise en production pour les applications d’IA.
  • Expérience avec AWS/Azure/GCP et les pratiques modernes en matière de plateformes (conteneurs, Kubernetes, CI/CD, observabilité).
  • Expérience dans les logiciels PLM/PDM, de fabrication, de CAO ou de workflow d’entreprise.
  • Contributions open source, publications ou conférences liées aux systèmes distribués, aux systèmes ML ou GenAI.
Get your free, confidential resume review.
or drag and drop a PDF, DOC, DOCX, ODT, or PAGES file up to 5MB.