Common Crawl retirará de su repositorio contenidos editoriales digitales a petición de CEDRO
En enero de 2025, CEDRO solicitó a Common Crawl que eliminara el contenido editorial digital de su repositorio para evitar su uso en la formación de IA. Common Crawl ha aceptado esta solicitud y eliminará las publicaciones de prensa de CEDRO de su base de datos. Las principales preocupaciones de CEDRO son la protección de los derechos de autor, la compensación justa para autores y editores, y la sostenibilidad del periodismo.
Common Crawl es una organización sin ánimo de lucro que ofrece un repositorio abierto de datos de rastreo web. CEDRO cree que si las empresas de IA utilizan contenidos de noticias sin permiso, esto podría perjudicar el modelo de negocio de las organizaciones de medios de comunicación que dependen de contenidos de pago, suscripciones y derechos de licencia.