AI Trainer
DataAnnotation · Remoto
- Evaluación avanzada de LLMs con frameworks de calidad y rúbricas multidimensionales: precisión, razonamiento, seguridad y alineación con producto.
- Pipelines de Reinforcement Learning from Human Feedback (RLHF) para mejorar robustez y fiabilidad de IA generativa a gran escala.
- Validación rigurosa de datasets de entrenamiento.
- Colaboración en inglés con equipos internacionales orientados a métricas y mejora continua.
