ChatGPT se perfeccionó sobre GPT-3.five mediante el aprendizaje supervisado y el aprendizaje por refuerzo.[21] Ambos enfoques utilizaron entrenadores humanos para mejorar el rendimiento del modelo de la IA. En el caso del aprendizaje supervisado, se dotó al modelo de conversaciones en las que los formadores jugaban en ambos lados: el usuario y