22/02/2025 • 23:02
Publicacion: Repositorios institucionales y plataformas de inteligencia artificial ¿acceso abierto para todo?
El artículo aborda cómo las empresas tecnológicas extraen datos de los repositorios institucionales de acceso abierto para entrenar modelos de lenguaje sin reconocimiento ni mención. Este uso no autorizado contradice los principios del acceso abierto, sobrecarga infraestructuras y desvincula el conocimiento académico de sus autores. Ante esta problemática, en diciembre de 2024, representantes de varios repositorios universitarios argentinos se reunieron para discutir estrategias de protección. Se propuso crear plataformas federadas, regular el acceso y desarrollar tecnologías propias para preservar la soberanía académica frente a la explotación de la IA comercial.
En el blog de Acceso abierto se publicó un artículo de Gustavo Archuby que discute la problemática de la plataformas de IA, que extraen todos los documentos publicados en los repositorios institucionales y los utilizan para entrenar sus modelos de lenguaje, esto lo hacen sin consentimiento y una vez que tienen sus modelos entrenados los utilizan para vender un servicio de información que compite con los repositorios invisibilizándolos.