AI Automation QA
Taguig, Metro Manila, Philippines
AI Automation QA
- 202603409
- Taguig, Metro Manila, Philippines
Description
Key Accountabilities
- Definition and execution of testing and quality assurance strategies for AI‑enabled workflows
- Continuous evaluation and monitoring of system behavior in production environments
- Contribution to auditability, risk management, and continuous quality improvement
Principal Responsibilities
- Define quality criteria and testing strategies for agent workflows, covering accuracy, latency, safety, compliance, and operational risk
- Build automated evaluation harnesses to assess agent performance, including hallucination rates, tool misuse, policy violations, and task success
- Implement continuous production monitoring to detect anomalies, quality degradation, and emerging safety concerns
- Develop and maintain automated test suites using Playwright for UI testing and custom scripts for API and workflow validation
- Apply LLM evaluation frameworks to assess output quality, regression, and system drift over time
- Produce and maintain dashboards and reports that communicate quality metrics and trends to engineering and stakeholders
- Develop and maintain runbooks for common failure modes and contribute to incident response activities
- Collaborate closely with developers to improve prompts, tool definitions, and workflow designs based on test results
- Ensure testing, logging, and monitoring practices align with data privacy, audit, and regulatory requirements
Qualifications
Knowledge, Skills & Experience
Essential
- Minimum 3 years’ experience in QA, test automation, or DevOps roles (or 2 years with direct experience testing AI or ML‑enabled systems)
- Strong Python skills for test automation, evaluation harnesses, and basic data analysis
- High attention to detail, with a focus on issues that materially impact reliability and user trust
- Comfort working with evolving tools, frameworks, and testing practices
- Collaborative mindset, using evidence‑based insights to influence product and engineering decisions
Technical Skills (Required)
- Programming: Python (test automation, evaluation harnesses, data analysis)
- UI Automation: Playwright (end‑to‑end workflow testing)
- AI Evaluation: Deepeval, RAGAS, Evidently.AI (LLM quality, drift, and regression analysis)
- Workflow Testing: API and agent workflow validation using custom scripts
- Monitoring: Production quality monitoring and anomaly detection
Desirable
- Pytest or equivalent testing frameworks
- SQL for querying logs, metrics, or evaluation datasets
- Prometheus, Grafana, or similar monitoring tools
- Familiarity with hallucination detection and AI safety patterns
- CI/CD pipelines and Git‑based workflows
WTW is an Equal Opportunity Employer
D’autres internautes ont également consulté...
Contacts non sollicités
Tous les CV/profils de candidats non sollicités transmis via notre site web ou aux comptes e-mail personnels des employés de Willis Towers Watson sont considérés comme la propriété de Willis Towers Watson et ne sont pas soumis au paiement de frais d’agence. Afin d’agir en qualité d’agence/de cabinet de recrutement autorisé pour le compte de Willis Towers Watson, une telle agence doit disposer d’un contrat formel écrit, en vigueur et signé par un recruteur autorisé de Willis Towers Watson, et entretenir une relation de travail active avec l’entreprise. Les CV doivent être transmis conformément à notre processus de soumission des candidatures, lequel implique une participation active à la recherche en question. De même, pour nos agences/cabinets de recrutement autorisés, si le processus de soumission des candidatures n’est pas respecté, Willis Towers Watson ne versera pas de frais d’agence. Willis Towers Watson est un employeur qui défend l’égalité d’accès à l’emploi. Si vous souhaitez que nous conservions vos coordonnées pour une utilisation ultérieure, veuillez envoyer un e-mail à l’adresse Agency.inquiries@willistowerswatson.com .
Nos bureaux
Nos collaborateurs répondent aux besoins de clients répartis dans plus de 140 pays et marchés à travers le monde. Cela confère une dimension mondiale à tout ce que nous accomplissons, et vous permet de bénéficier de nombreuses opportunités palpitantes de collaboration et de développement professionnel. Explorez la carte ci-dessous pour découvrir où votre carrière pourrait vous mener.