¿Usar IA’s es plagio? El fraude de Turnitin

edison and tesla fight over the light bulb1

Análisis del proceso creativo de las IA’s en la redacción de textos y derechos de autor para fines académicos.

Antes que nada, deseo brindarle un saludo para todos mis amigos dodescos, y es que los Dodos tienen una principal característica, que si bien somos los últimos, también podemos ser los únicos. Quiero excusarme de mi ausencia en las redes sociales, o bien de las publicaciones que suelo hacer en mi grupo, ya que motivado a mis investigaciones de grado no tuve oportunidad de sentarme nuevamente a traerles temas de actualidad o interés.

Pero precisamente, motivado a mi investigación tuve la oportunidad de toparme con una situación bastante problemática y a mis ojos bastante reciente dentro de las investigaciones. Para mis lectores que quizás no pertenezcan al mundo académico, deben saber que como requisito para optar a los grados académicos de una institución de educación superior deben presentar (de su autoría) una investigación (bien puede ser individual o grupal) dentro del campo aplicado de su área. Esta investigación dependiendo del rango académico puede venir en diferentes formas; en algunos casos reciben el nombre de tesinas, para algunos institutos basta con la presentación de dicha investigación como un artículo de revista, o bien para instituciones académicas avanzadas y serias (sean de carácter público o privado) la presentación de dicha investigación debe venir bajo la forma de una tesis. Hasta entonces no representaba ningún problema, porque hasta 1982 la elaboración de dichas investigaciones dependían exclusivamente del adecuado uso de las fuentes de información (que en ese entonces se basaba en el uso de todo material bibliográfico, entiéndase todo texto que estaba escrito en papel).  Esto parece relativamente reciente pero no lo es, porque el acuerdo internacional ya previamente había establecido el uso de una serie de normas (en 1929 con las normas APA) para que en un conjunto de estándares o reglas se pudiera codificar la información obtenida por la evidencia racional, y empírica en forma clara, concisa y comprobable.

Traducido en forma simple, se llegó a un acuerdo para que toda información de carácter científico pudiera ser presentada de la misma manera.  Claro que haber resumido todo el párrafo anterior en estas 2 lineas harían que mis lectores se enojaran y me dijeran: ¿Bueno Alfredo, y porque no empezaste por ahí? Se que suena demasiado parsimonioso, o burocrático, pero quiero que entiendan que el titulo de esta publicación tiene un carácter demasiado serio y quiero dejar en claro las bases de una situación relacionada con la evaluación de la credibilidad de una investigación. Y no me preocupa herir susceptibilidades, hablaremos de la evolución de los estudiantes en el carácter de hacer trampa en las investigaciones; y lo que quiero denunciar aquí es como los árbitros son ahora las entidades que están haciendo trampa y se prestan para maniobras que puedan considerarse en algunos parámetros como cuestionables, y llegado el caso lo dejo al juicio publico si se pudieran interpretar como menciona el titulo de esta publicación. Y por ello es necesario ser lo mas detallado posible en toda la información.

Así que pongamos las reglas, una institución le pide a su estudiante de grado superior que haga una investigación para optar a su titulo. Y aquí es donde entra la tentación. El estudiante quiere evadir su trabajo. ¿Como hacer esto? Lo mas lógico es no hacerlo, pero aquí viene otra nueva interrogante. ¿Por qué hacerlo el? podría suceder que el estudiante entra en una actividad ilícita y pide que alguien más lo haga por el.  (Escenario número 1 del mercado negro) el cual es un mercado demasiado rentable y por lo que se sustenta una parte pequeña aunque significativa del mercado de servicios educativos. 

Pero omitamos esta alternativa, ya que puede darse un escenario distinto, la investigación tiene que ser en algún punto demasiado especializada como para confiar que alguien mas lo haga, entonces ¿qué pasaría si no fuera necesario realizarla? ¿qué sucedería si esta investigación ya se encontrara realizada previamente? un estudiante puede incurrir en el robo del material intelectual, sea de manera directa, o indirecta, incluso con el atenuante de hacer el robo “accidental” como lo menciona la empresa cuya nombre habíamos previamente mencionado. (Escenario numero 2 del plagio). 

El tercer escenario es más bien reciente, y va en paralelo con el surgimiento de la introducción en el mercado de la inteligencia artificial y entonces surge el escenario donde para minimizar el trabajo de redacción se le puede pedir asistencia a las herramientas de procesamiento verbal. Y este escenario es un parámetro absolutamente gris. Y es donde quisiera hacer una presentar ciertos aspectos bajo evidencia referenciada que han procedido a condenar el uso de dicha herramienta sometiéndola al rango de crimen. (Escenario número 3 escritura bajo uso de softwares IA’s). 

Aquí sin duda nos seria de utilidad contar con la asistencia de un abogado de derechos de autor, pero estaremos de acuerdo que la interrogante que se presenta es la paradoja del Argos. Si presentar o introducir variaciones de las piezas hace que sea exactamente el mismo barco, o sea una entidad diferente. Entonces si es así, porque no es criminalizada las marcas de ciertos productos como cierta gasesosa de cola negra cuyo nombre no se puede mencionar por aspectos comerciales. Todos sabemos que hay dos o mas marcas de dicho producto, y no es criminal, por ser variaciones y métodos únicos en cada una, entonces ¿por qué debería serlo las variaciones literarias de un texto? Y es aquí donde entra la “hipocresía” de esta empresa que si a su sistema de juicio se comete dicha acción ofrece por un módico precio de mas de 5000 euros al año minimizar el efecto de detección. Y es aquí donde quiero dejar a criterio del publico el juicio. 

Es malo si lo hace una persona, no acreditada, pero no es malo si lo hace una empresa. Y ahora si lo hace un software (no un humano y que no sea de la compañía) también es malo. ¿Cómo se le llama a eso? ¿La única forma que no sea malo ni ilegal es que sea unicamente la empresa quien haga dichas minimizaciones de su detección? Esto es un problema que para demostrar mostrando su importancia y su justificación seguiremos el método científico, planteando las hipótesis y revisando adonde nos lleva la evidencia.

Planteado el problema y las premisas de las mismas la premisa original seria: “¿Usar IA’s es plagio literario?”

Revisemos entonces los antecedentes, una breve cronología histórica, y los eventos mas importantes en paralelo que constan en la base de datos pública sobre las acciones de la empresa.

Turnitin se fundo en 1997 bajo la empresa iParadigms, LLC, para ser precisos entró en funcionamiento el 1 de enero de 1997 aunque no he tenido acceso a informaciones más antiguas al respecto, la primera publicación que señala la preocupación por la integridad y ética de la calidad de información presentada para estudiantes de secundaria, fue presentado en el año 2015, por Daniel Diaz, titulado:

“El uso de Turnitin con retroalimentación mejora la probidad académica de estudiantes de bachillerato*”

La cita y texto de la publicación la pueden leer aqui en Arce, D. D. (2015, 1 junio). El uso de Turnitin con retroalimentación mejora la probidad académica de estudiantes de bachillerato*. https://www.redalyc.org/journal/145/14542676009/html/

El 10 de julio de 2017, la compañía incorporo una nueva herramienta que permitía la revisión de papers y publicaciones. Turnitin introdujo como controlar los potenciales contenidos no originales mediante una comparación de los papers enviados a varias bases de datos que utilizan un algoritmo propietario. Escanea sus propias bases de datos, y también tiene acuerdos de licenciamiento con grandes bases de datos académicas privadas.

No pasó sino aproximadamente 1 año y el 14 de septiembre del 2018 empezó la gran controversia con los procesos de escaneos de plagio sobre autoridades y grandes personalidades públicas.

 Y desde allí empezaron a ampliar su base de datos generando grandes conflictos como los del 11 de marzo de 2020, los grandes conflictos como los de intimidad y los de writecheck

La primera ocurrio cuando la Unión Estudiantil en la universidad Dalhousie habia criticado el uso de Turnitin en las universidades canadienses porque el gobierno estadounidense puede ser capaz de acceder a artículos científicos e información personal en la base de datos bajo el Acta PATRIOTA de los Estados Unidos. La Universidad Mount Saint Vincent fue la primera universidad canadiense en prohibir el servicio Turnitin, en parte debido a implicaciones de la mencionada ley.

En el caso mas delicado que fue el WriteCheck; iParadigms, la compañía detrás de Turnitin, corría otro sitio web llamado WriteCheck​ donde los estudiantes podrían entregar sus artículos científicos para ser evaluados en la misma base de datos utilizada por Turnitin, y determinar si su artículo se detectaría como plagio. Writecheck se retiró del servicio en 2020.7Alex Tabarrok sostiene que «ellos son los caudillos que están armando ambos lados de esta guerra de plagio».

Esto hizo que un autor se preocupara al respecto y presentara una investigacion titulada El dilema de Turnitin: ¿plagian a los universitarios los sistemas antiplagio?”, este se encuentra presente bajo la referencia Becerra, J. (2020, 11 marzo). El dilema de Turnitin: Plagian a los universitarios los sistemas antiplagio? ELMUNDO. https://www.elmundo.es/papel/2020/03/11/5e67ba6ffc6c837c2f8b45be.html

Hare una cita textual del autor con la que me encuentro absolutamente de acuerdo, donde cito:

Hay muy pocas compañías de las que diría esto, pero creo que el planteamiento de Turnitin es depredador e incluso parasitario”. La cita es de Jesse Stommel, profesor de la Universidad Mary Washington y cofundador de Hybrid Pedagogy, una web de acceso abierto especializada en la aplicación de la tecnología a los procesos de enseñanza y aprendizaje.

“Usa en su propio beneficio el trabajo que hacen los estudiantes, su propiedad intelectual, para promover activamente la sospecha y usar su propio trabajo contra ellos”, completa Sean Michael Morris , profesor de Diseño, Tecnología y Aprendizaje de la Universidad de Colorado y cofundador también de la mencionada publicación.

Esto conllevo a otros casos aun mas severos y graves, siendo la denuncia del 29 de abril del 2021, referida en el siguiente enlace: https://groups.google.com/g/boletin-scielo-mexico/c/E1m42jUJhk4?pli=1, titulado:  Publicado en Times Higher Education https://www.timeshighereducation.com/news/academics-fret-turnitin-nears-monopoly-plagiarism-checks “Los académicos se preocupan porque Turnitin se acerca al monopolio de los controles de plagio. La propuesta de adquisición de Ouriginal daría al gigante de la integridad académica la gran mayoría del mercado”.

Esta denuncia  es bastante preocupante que figura con otra ejecutada en el 2008, donde procedo a citar textualmente:

En 2008, la entonces empresa matriz de Turnitin ganó una demanda por infracción de derechos de autor presentada por cuatro estudiantes. Pero Jesse Stommel, crítico de Turnitin y experto en estudios digitales de la Universidad de Mary Washington (Virginia), distingue entre derechos de autor y derechos de uso.

“La propiedad es sólo una parte de la conversación: es lo que se puede hacer con los datos”, dijo el Dr. Stommel. “No sabemos exactamente lo que harán con ellos, pero podemos mirar el ejemplo de otras empresas de tecnologías educativas que han recogido cantidades masivas de datos”.

Citó las declaraciones realizadas en 2019 por Dan Goldsmith, entonces director general de la empresa que desarrolló el sistema de gestión del aprendizaje Canvas, quien supuestamente afirmó tener “la base de datos más completa sobre la experiencia educativa en el mundo”. Nadie más tiene esos activos de datos a su alcance para poder desarrollar… algoritmos y modelos predictivos”.

El Dr. Stommel sugirió que Turnitin no perseguía un monopolio para subir sus precios. “Creo que quieren un monopolio porque quieren normalizar la función del trabajo que hacen. Cuando tienes un grupo de competidores diferentes, se hacen preguntas difíciles entre ellos. Cuando no, se convierte en la norma”.

Ante la justicia y la ley, en toda norma, los estudiantes en la denuncia original del 2008 cometieron fraude, y según ello la compañía seguiría estando autorizada para ejercer su política de discreción de datos dejando saber al usuario la libertad de si desea o no indexar su investigación a su base de datos, pero, el investigador al no hacerlo, su investigación correria el riesgo de ser desacreditada en la norma por incumplir las política de ética de la empresa.

No fue la primera vez y conllevo a la denuncia más grave ejecutada esta vez por el  Dr Ing Miguel Ángel Gallardo Ortiz (PhD), titulado: “TURNITIN LLC denunciado en Comisión Nacional de los Mercados y la Competencia CNMC, Ministerio de Universidades y Ministerio de Ciencia e Innovación”, este expediente judicial se encuentra disponible bajo la referencia adjunta: Ortiz, I. M. Á. G. (s. f.). TURNITIN LLC Denunciado en Comisión Nacional de los Mercados y la Competencia CNMC, Ministerio de Universidades y Ministerio de Ciencia e Innovación. www.linkedin.com. https://www.linkedin.com/pulse/turnitin-llc-denunciado-en-comisi%C3%B3n-nacional-de-los-y/?trk=pulse-article_more-articles_related-content-card&originalSubdomain=es

En esta se plasman claramente los 4 hechos que a su consideración merecen denuncia e intermediación ante la ley, por desgracia queda sujeta a la legislación local bajo la autoridad jurídica de España. Ortiz señala en dicha petición que cito textualmente:

Dr. Ing. Miguel Ángel Gallardo Ortiz PhD, en su propio nombre y derecho y también como presidente y representante legal de la Asociación para la Prevención y Estudio de Delitos, Abusos y Negligencias en Informática y Comunicaciones Avanzadas APEDANICA, al amparo de los artículos 20 y 105 de la Constitución y por lo dispuesto en la Ley 19/2013, de 9 de diciembre, de transparencia, acceso a la información pública y buen gobierno, como mejor proceda, SOLICITA:

1º Coste total y desglosado de los productos y servicios relacionados con TURNITIN LLC o iParadigms o Advance Publications o sus distribuidores o agentes o representantes pagados por la Universidad, incluyendo toda licencia, actualizaciones, equipos o servicios dedicados a detectar plagios.

2º Estadísticas del uso, con el mayor detalle posible, y todo cuanto se ha confiado al TURNITIN con especialísima atención hacia los textos originales e inéditos producidos por profesores o investigadores o alumnos de la Universidad, desde que se dispuso del sistema hasta la fecha de hoy.

3º Datos de todo uso privado o externo del TURNITIN o su servicio que fuera pagado por esta Universidad, tanto con su autorización por convenios, contratos, o acuerdos, como informalmente, en que ese recurso pagado con fondos públicos sea de utilidad con beneficios para particulares o empresas.

Aunque la Ley 19/2013 no requiere justificación o motivación alguna, en aras de la eficacia y para mayor precisión de la solicitud, señalamos y recomendamos uno de los escasísimos artículos críticos hacia el TURNITIN, ya elogiadísimo en miles de publicaciones de quienes ignoran lo que se evidencia en el enlace https://hybridpedagogy.org/resisting-edtech/

También adjuntamos una denuncia dirigida a las autoridades universitarias y a la Fiscalía, aportando indicios racionales y evidencias en varias plataformas que ya están ofreciendo FALSAS AUTORÍAS de TESIS y artículos para publicaciones científicas, anunciándose en Google AdWords. APEDANICA investiga y denuncia tanto esa publicidad como la censura pagada con presunto encubrimiento de hechos con relevancia penal en Google, así como el negocio ilícito de quienes se supone que están detectando plagios, pero sin embargo, están beneficiándose del fraude académico por falsa autoría, o bien, espían textos inéditos recopilados mediante la transmisión internacional de datos del TURNITIN según consta en varias demandas judiciales presentadas en Estados Unidos, completamente ignoradas por las autoridades europeas que, ingenuamente, confiaron a ciegas en iParadigms LLC (que ahora forma parte del complejo entramado de empresas de Advance Publications) hasta el punto de que basta un certificado de TURNITIN para dar por buenos los fraudes y tolerar el espionaje científico internacional más eficaz, con muy obvio ánimo de lucro ilícito. Véase https://cita.es/equipo-redactor-tesis.pdf y también https://cita.es/plagiosos.pdf

La evidencia y los antecedentes no cuestionan la actividad económica de la empresa, solo cuestionan las políticas y métodos que apelan a situaciones bastante irrazonables que sobrepasan por mucho los derechos de las personas y las obras que pretenden proteger.

Y aquí entra el cambio de paradigma. En noviembre del 2022 entro en el mercado las vacantes de inteligencia artificial, las herramientas de procesamiento y análisis de textos, y los esquemas de parafraseo que antes se ejecutaban por seres humanos para minimizar o evadir los radares de Turnitin, ahora representaba perdida de la empresa, (hecho). Si esto de alguna manera le perjudicaba, es casi coincidente que al mismo tiempo las herramientas se les acusara de impedir el procesamiento humano que define el aprendizaje. Y de repente el compás moral convenientemente apuntaba a que el uso de las IA’s representaba una infracción a los derechos de autor, esto viene de los postulados mas conservadores, quienes directamente acusarían el parafraseo como plagio.

Los grandes profesionales en metodología difieren en las opiniones, vale la pena mostrar uno de estas opiniones presentada en la siguiente referencia: BIOESTADISTICO. (2022, 28 mayo). El problema con el Turnitin | la originalidad, el plagio y los resultados [Vídeo]. YouTube. https://www.youtube.com/watch?v=Qh2RZzn0iyY

Actualmente sigue en discusión sobre si el uso de la IA’s debe estar regulado pero lo que se he determinado hasta el momento es de no aceptarse documentos que no hayan sido escritos o inspirados por seres humanos. Esto lo aborde previamente desde una visión conservadora, y al mismo tiempo Turnitin decidio en menos de 6 meses adoptar a su estandar la revision del contenido para ver si este llegaba a ser generado o no por IA’s.

Recientemente fue publicado un articulo titulado “Universidades dudan sobre herramienta para detectar el plagio de Inteligencia Artificial” hecho por Bethan Staton, que aparece bajo esta referencia: Times, F. (2023, 5 abril). Universidades dudan sobre herramienta para detectar el plagio de inteligencia artificial. https://dfmas.df.cl. https://dfmas.df.cl/df-mas/tecno/universidades-dudan-sobre-herramienta-para-detectar-el-plagio-de mencionan una preocupacion tan importante que necesito citar textualmente:

El lanzamiento, sin embargo, ha sido polémico. Algunas instituciones, entre ellas Cambridge, han manifestado que optarán por no participar en el nuevo servicio, según personas familiarizadas con la decisión.

A las universidades les preocupa que la herramienta pueda acusar falsamente a los estudiantes de hacer trampas, implique la entrega de datos de los estudiantes a una empresa privada e impida experimentar con nuevas tecnologías como la IA generativa.

Esas preocupaciones han llevado a la UCISA, el organismo británico de apoyo a la tecnología en la educación, a trabajar con Turnitin para garantizar que las universidades tuvieran la opción de excluirse temporalmente de la función.

Y como es de esperar, Turnitin negó la petición, y es que tiene lógica que hicieran tal cosa, el parafraseo es algo importante que escapa del radar de evaluación de Turnitin, pero no por ello significa que sea ilegal siempre que sea avalado por los métodos que ellos brindan.

Si quisiéramos ponderar esto bajo un marco teórico, y como es importante habría que recurrir a conceptualizar la definición de plagio, encontrándose que hay varios desde la acepción de la RAE, hasta las acepciones comerciales, yo me encuentro de acuerdo con las definiciones de plagio sometidas a las definiciones legales, sin embargo, deben cumplirse ciertas condiciones para que definitivamente algo pueda ser considerado como plagio y los especialistas detallan que el software de turnitin solo evalúa el grado de similaridad, más no define si algo es o no un plagio flagrante, y en este punto, es importante encontrar la autoridad neutral mas relevante que son los jurados, revisores e interpretes, y la esencia humana NUNCA podrá ser sustituida a pesar de incorporar la tecnología de análisis de textos. Puede encontrarse mas información sobre estas definiciones en la siguiente referencia: https://plag.co/plagiarism/types-of-plagiarism.php

Se entiende que una investigación debe estar bajo la protección del marco legal en el marco de derechos de autor, pero, esta a su vez no puede infringir los derechos de otras obras, por lo tanto, esta bien que se revise el formato para que no se incurra en el delito de plagio. Lo que se podría cuestionar es si ahora esta definición debe sumarse  el hecho de si la naturaleza técnica de un escrito puede adjudicarse a un software o a una máquina. Lo que sugiere la evidencia legal es que si para generar dicha información las herramientas tuvieron que usar una información de base cuyo origen no sea señalado, entonces al tomarla y hacer un parafraseo se incurrió en un plagio. 

Esto en principio es una falacia, ya que con o sin la herramienta, se requiere de una información base para poder ejecutar comparaciones o bien hacer aplicaciones, el caso mas destacado podría ser el de Henry Ford, quien JAMAS se adjudicó la patente o derecho de creación sobre el vehículo automotor de 4 ruedas, lo que SI se adjudicó es el descubrimiento y aplicación de la linea de ensamblaje para poder construir sus productos.

CONCLUSIONES:

En este punto los metodólogos sugieren y recomiendan es que si se deba hacer uso de un conocimiento textual este debe y tiene que ser debidamente citado siguiendo las normativas, no se debe parafrasear jamás las referencias bibliográficas, que se adjudiquen excepciones en el software, no se incorporen dichas investigaciones a la base de datos para la protección de los mismos, y que las citas y revisiones de registros solo sean mas exhaustivas y rígidas en el marco teórico.

Sin embargo, no se debe descartar respecto a Turnitin, la posibilidad que ejercen una gran hegemonía por encima las empresas revisoras restantes y que debido a la falta de suficientes metodólogos e interpretes de análisis de revisión de textos, las instituciones no deben tomar a cal y canto los resultados obtenidos de las revisiones del software, por cuanto estos presentan un enorme margen de variabilidad. Y mientras mas técnico sea una investigación mas probable es que el software arroje falsos positivos aun sin ser generados por IA alguna.

                          

Recomendar0 recomendaciones

Publicaciones relacionadas

0 Comentarios
Comentarios en línea
Ver todos los comentarios

¡Descubre los increíbles beneficios de esta valiosa comunidad!

Lector

Escritor

Anunciante