Freelance AI Evaluation Engineer (Python/Full-Stack)
Please submit your CV in English and indicate your level of English proficiency.
Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems. Participation isproject-based, not permanent employment.
What this opportunity involves
You’ll create challenging coding test cases that push AI coding systems to their limits:
- Review and refine realistic coding tasks based on provided production codebases with realistic scope, requirements and information sources
- Write comprehensive functional tests that validate actual end-to-end behavior and edge-cases, not just superficial checks
- Craft “fair but hard” challenges where the AI has all the context it needs, but has to work for it (information scattered across files and external sources, complex reasoning required)
- Analyze AI failures to understand what the model struggles with vs. what it masters
- Iterate based on feedback from expert QA reviewers who score your work on 7 quality criteria
What we look for
This opportunity is a good fit for experienced developers, software engineers, and/or test automation specialists open to part-time, non-permanent projects. Ideally, contributors will have:
- Degree in Computer Science, Software Engineering or related fields
- 5+ years in software development, primarily Python (pytest, async/await, subprocess, file operations)
- Background in Full-Stack development, with an equal focus on building React-based interfaces and robust Back-end systems
- Experience writing tests (functional, integration – not just running them)
- Docker containers (running evaluations locally in containers)
- CI/CD understanding (GitHub Actions as a user: triggers, labels, reading results)
- English proficiency - B2
How it works
Apply → Pass qualification(s) → Join a project → Complete tasks → Get paid
Effort estimate
Tasks for this project are estimated to take 20 hours to complete, depending on complexity. This is an estimate and not a schedule requirement; you choose when and how to work. Tasks must be submitted by the deadline and meet the listed acceptance criteria to be accepted.
Compensation
On this project, contributors can earn up to $50 per hour equivalent , depending on their level and pace of contribution.
Compensation varies across projects depending on scope, complexity, and required expertise. Please note that other projects on the platform may offer different earning levels based on their requirements.
Emplois Recommandés
Project Manager Fonctionnel - F/H/X
Who are we? Amaris Consulting est une société indépendante de conseil et de technologies au service des entreprises. Avec plus de 1000 clients dans le monde, nous déployons des solutions pour …
Chargé d’Affaires Froid (H/F)
Présentation de la société PUZZLE RECRUTEMENT est un cabinet de recrutement spécialisé dans le secteur de la Construction/BTP & Energies. Notre objectif : vous accompagner dans votre recherche de…
Maitresse de Maison H/F
&##128105;⚕️ MEDICOOP FRANCE, L'humain au cœur de l'intérim !&##128105;⚕️ MEDICOOP FRANCE recrute pour un de ses coopérateurs un(e) MAITRE(SSE) DE MAISON H/F en intérim pour un poste dans dive…
Développeur Java Expérimenté - Lyon - Freelance
Taux journalier (TJM): 400 Dans le cadre du renforcement d’une squad IT dédiée aux outils d’avant-vente Crédit Entreprises , une organisation de premier plan du secteur bancaire recherche un dével…
Technicien(e) de maintenance
Aperçu du poste Vous souhaitez rejoindre une entreprise en plein développement, axée sur le talent, qui valorise la sécurité, l'éthique, la qualité, l'innovation et les possibilités d'évolution…
Assistant/e de traitement de données documentaires et cotes de manuscrits - h/f
Description entreprise : L'École normale supérieure de Lyon produit une recherche de haut niveau dans ses 25 laboratoires et forme par la recherche quelque 2500 étudiants dont 500 doctorants. Elle …
CHEF DE CHANTIER FIBRE OPTIQUE BLO - D2 h/f
Le poste : Nous recherchons pour l'un de nos clients, société spécialisée en Réseaux, un Chef de chantier Fibre optique - D2 h/f Rattaché(e) au Conducteur de travaux, vous avez pour mission de g…
Chargé de relations entreprises F/H
A propos de Dynaren: Acteur reconnu de la réparation après sinistre, Dynaren accompagne chaque jour les assurés et les assureurs en s'appuyant sur de fortes exigences de transparence, de rigueur et d…
Egoutier mainteneur d’équipements d’exploitation en réseau d’assainissement (H/F)
Détails de l'offre Famille de métiers Voirie et infrastructures Eau et assainissement …