Shire Jobs

Mobile Shire Logo

Job Information

Meta Software Engineer, Systems ML - Frameworks / Compilers / Kernels | Ingénieur logiciel, Systèmes ML, cadres/Compilateurs/Noyaux in Toronto, Ontario

Summary:

In this role, you will be a member of the MTIA (Meta Training & Inference Accelerator) Software team and part of the bigger industry-leading PyTorch AI framework organization. MTIA Software Team has been developing a comprehensive AI Compiler strategy that delivers a highly flexible platform to train & serve new DL/ML model architectures, combined with auto-tuned high performance for production environments across specialized hardware architectures. The compiler stack, DL graph optimizations, and kernel authoring for specific hardware, directly impacts performance and deployment velocity of both AI training and inference platforms at Meta.You will be working on one of the core areas such as PyTorch framework components, AI compiler and runtime, high-performance kernels and tooling to accelerate machine learning workloads on the current & next generation of MTIA AI hardware platforms. You will work closely with AI researchers to analyze deep learning models and lower them efficiently on MTIA hardware. You will also partner with hardware design teams to develop compiler optimizations for high performance. You will apply software development best practices to design features, optimization, and performance tuning techniques. You will gain valuable experience in developing machine learning compiler frameworks and will help in driving next generation hardware software codesign for AI domain specific problems.--------------Dans ce rôle, vous serez membre de l'équipe logicielle MTIA et ferez partie de la plus grande organisation du cadre d'IA PyTorch, à la pointe de l'industrie. L'équipe logicielle de MTIA a développé une stratégie complète de compilateur d'IA qui offre une plateforme très flexible pour former et fournir de nouvelles architectures de modèles DL/ML, combinée à des performances élevées autorégulées pour les environnements de production sur des architectures matérielles spécialisées. La pile de compilateurs, les optimisations de graphes DL et la création de noyaux pour un matériel spécifique ont un impact direct sur les performances et la vitesse de développement des plates-formes d'apprentissage et d'inférence d'IA chez Meta.Vous travaillerez sur l'un des domaines clés tels que les composants du cadre PyTorch, le compilateur et le moteur d'exécution de l'IA, les noyaux de haute performance et l'outillage pour améliorer les charges de travail d'apprentissage automatique sur les plates-formes matérielles d'IA actuelles et de la prochaine génération de MTIA. Vous travaillerez en étroite collaboration avec les chercheurs en IA pour analyser les modèles d'apprentissage profond et les réduire efficacement sur le matériel MTIA. Vous vous associerez également aux équipes de conception de matériel pour développer des optimisations de compilateurs pour obtenir des performances élevées. Vous appliquerez les meilleures pratiques de développement logiciel pour concevoir des fonctionnalités, des techniques d'optimisation et de réglage des performances. Vous bénéficierez d'une expérience précieuse dans le développement de compilateurs d'apprentissage automatique et contribuerez à la conception de logiciels matériels de nouvelle génération pour les problèmes spécifiques du domaine d'IA.-------

Required Skills:

Software Engineer, Systems ML - Frameworks / Compilers / Kernels | Ingénieur logiciel, Systèmes ML, cadres/Compilateurs/Noyaux Responsibilities:

  1. Development of SW stack with one of the following core focus areas: AI frameworks, compiler stack, high performance kernel development and acceleration onto next generation of hardware architectures. | Développement d'une pile de logiciels dans l'un des domaines fondamentaux suivants : Cadre d'IA, pile de compilateurs, développement de noyaux à haute performance et intégration dans les architectures matérielles de la prochaine génération.

  2. Contribute to the development of the industry-leading PyTorch AI framework core compilers to support new state of the art inference and training AI hardware accelerators and optimize their performance. | Contribuer au développement des compilateurs de base du cadre d'IA PyTorch, leader sur le marché, afin de prendre en charge les nouveaux intégrateurs matériels d'IA de pointe en matière d'inférence, d'entraînement et d'optimiser leurs performances.

  3. Analyze deep learning networks, develop & implement compiler optimization algorithms. | Analyse des réseaux d'apprentissage profond, développement et mise en œuvre d'algorithmes d'optimisation des compilateurs.

  4. Collaborating with AI research scientists to accelerate the next generation of deep learning models such as Recommendation systems, Generative AI, Computer vision, NLP etc. | Collaborer avec des chercheurs en IA pour améliorer la prochaine génération de modèles d'apprentissage profond tels que les systèmes de recommandation, l'IA générative, la vision par ordinateur, le traitement automatique des langues, etc.

  5. Performance tuning and optimizations of deep learning framework & software components. | Optimisation des performances du cadre d'apprentissage profond et des composants logiciels.

Minimum Qualifications:

Minimum Qualifications:

  1. Proven C/C++ programming skills | Compétences avérées en programmation C/C++

  2. Bachelor's degree in Computer Science, Computer Engineering, relevant technical field, or equivalent practical experience. | Licence en informatique, en génie informatique, dans un domaine technique pertinent, ou expérience pratique équivalente.

  3. Experience in AI framework development or accelerating deep learning models on hardware architectures. | Expérience dans le développement des cadres d'IA ou dans l'amélioration des modèles d'apprentissage profond sur des architectures matérielles.

Preferred Qualifications:

Preferred Qualifications:

  1. A Bachelor's degree in Computer Science, Computer Engineering, relevant technical field and 12+ years of experience in AI framework development or accelerating deep learning models on hardware architectures OR a Master's degree in Computer Science, Computer Engineering, relevant technical field and 8+ years of experience in AI framework development or accelerating deep learning models on hardware architectures OR a PhD in Computer Science Computer Engineering, or relevant technical field and 7+ years of experience in AI framework development or accelerating deep learning models on hardware architectures. | Un baccalauréat en informatique, génie informatique ou dans un domaine technique pertinent et avoir plus de 12 ans d'expérience dans le développement de cadres d'IA ou d'accélération de modèles d'apprentissage profond sur des architectures matérielles OU une maîtrise en informatique, génie informatique ou dans un domaine technique pertinent et avoir plus de 8 ans d'expérience dans le développement de cadres d'IA ou d'accélération de modèles d'apprentissage profond sur des architectures matérielles OU encore un doctorat en informatique, génie informatique ou dans un domaine technique pertinent et avoir plus de 7 ans d'expérience dans le développement de cadres d'IA ou d'accélération de modèles d'apprentissage profond sur des architectures matérielles.

  2. Knowledge of GPU, CPU, or AI hardware accelerator architectures. | Connaissance des architectures d'accélérateurs matériels de type processeur graphique, unité centrale ou IA.

  3. Experience working with frameworks like PyTorch, Caffe2, TensorFlow, ONNX, TensorRT | Expérience de travail avec des cadres comme PyTorch, Caffe2, TensorFlow, ONNX, TensorRT

  4. OR AI high performance kernels: Experience with CUDA programming, OpenMP / OpenCL programming or AI hardware accelerator kernel programming. Experience in accelerating libraries on AI hardware, similar to cuBLAS, cuDNN, CUTLASS, HIP, ROCm etc. | Noyaux à haute performance pour l'IA : Expérience dans la programmation CUDA, OpenMP/OpenCL ou dans la programmation du noyau d'un accélérateur de matériel d'IA. Expérience dans l'accélération de bibliothèques sur du matériel d'IA, comme cuBLAS, cuDNN, CUTLASS, HIP, ROCm, etc.

  5. OR AI Compiler: Experience with compiler optimizations such as loop optimizations, vectorization, parallelization, hardware specific optimizations such as SIMD. Experience with MLIR, LLVM, IREE, XLA, TVM, Halide is a plus. | OU compilateur d'IA : Expérience dans loptimisation des compilateurs tels que loptimisation des boucles, la vectorisation, la parallélisation, l`optimisation spécifique du matériel tel que SIMD. L'expérience avec MLIR, LLVM, IREE, XLA, TVM, Halide est un plus.

  6. OR AI frameworks: Experience in developing training and inference framework components. Experience in system performance optimizations such as runtime analysis of latency, memory bandwidth, I/O access, compute utilization analysis and associated tooling development. | OU cadres d'IA : Expérience dans le développement de composants de formation et du cadre d'inférence. Expérience dans l'optimisation des performances systèmes, telle que l'analyse de la latence, de la largeur de bande de la mémoire, de l'accès aux E/S, de l'analyse de l'utilisation du calcul et du développement d'outils associés.

Industry: Internet

DirectEmployers