La falta de transparencia en los datos para entrenar modelos de inteligencia artificial es crítica. A pesar de avances, persiste la opacidad sobre contenido y fuentes de los conjuntos de datos. Los modelos fundamentales, basados en datos extensos de la web, plantean preocupaciones éticas y de privacidad. La divulgación es crucial para abordar sesgos, eliminar contenido perjudicial y evaluar implicaciones legales. A pesar de iniciativas, muchas empresas resisten, citando razones competitivas. Medidas regulatorias y demandas públicas de transparencia son esenciales para responsabilidad y confianza en sistemas de inteligencia artificial.