El Grupo de Ingeniería Lingüística del Instituto de Ingeniería de la Universidad Nacional Autónoma de México (UNAM) ha desarrollado una nueva herramienta con la que buscan combatir el plagio digital, detectando las paráfrasis o similitudes entre oraciones de diferentes textos.

‘Símil’, permite categorizar las semejanzas de ideas entre los textos, aunque estas no estén expresadas literalmente con las mismas palabras, lo que no necesariamente dictamina una violación en el derecho de autor, explicó el titular del Grupo de Ingeniería Lingüística (GIL), Gerardo Sierra Martínez.

El equipo puso a prueba a ‘Símil’ con un texto de 27 frases sobre la historia del sushi extraído de Wikipedia, comparándolo con los escritos de expertos, estudiantes y niños a los que les fue proporcionado el mismo texto para que lo parafrasearan.

El sistema de Símil’ realizó una selección de las frases con paráfrasis y las ordenó por colores para mostrar el grado de similitud: rojo para las que tienen mucha cercanía al texto original, amarillo las que tienen un grado menor y gris para las que casi no coinciden.

Ejemplificando el proceso, Sierra Martínez mostró que el texto original mencionaba: “El resultado era un pescado conservado en una pieza y con un olor desagradable”, mientras que la oración parafraseada detectada por ‘Símil’ decía: “Lo que concluyó que el pescado conservado tiene mal olor y en una sola pieza”.

Con este proyecto, el Instituto de Ingeniería busca beneficiar al ámbito académico, haciendo “que los alumnos aprendan a citar lo que toman de otro documento y sepan dar referencias adecuadas”, afirmó el integrante del GIl, quien también enfatizó que el proyecto necesita apoyo financiero para asegurar su continuidad.

Con información de DGCS UNAM.