Publicado 13-11-2009
Noviembre, 2009. Desde que era un niño, el ingeniero Juan Velásquez soñaba con inventar. Y a sus 38 años no puede quejarse: está a punto de lanzar un software que detecta -vía escaneo de toda la web- cuándo un texto ha sido copiado desde otro archivo. Fuente: Qué Pasa
Cuando tenía cinco años, Juan Velásquez fue con su papá a la FISA. Allí, se encontró por primera vez con un computador que le habló. Quedó maravillado con la tecnología. Tanto, que cuando salió del colegio, en 1989, ese recuerdo lo hizo matricularse en Ingeniería Eléctrica en la Universidad de Chile. “Tenía ganas de inventar. Y sabía que allí me iban a dar la opción de hacerlo”, explica.
Comenzó entonces a diseñar programas de computación. Lo hacía por gusto, pero se le daba bien. Tan bien que se puso a estudiar paralelamente Ingeniería en Computación. En 1996, con 23 años, egresó de la universidad con dos títulos y excelentes notas. La misma universidad lo invitó a dar clases. Dos años más tarde, y aprovechando los laboratorios de Beauchef, Juan diseñó el primer programa de conversión de texto a voz que se hizo en Chile. Su sueño de infancia se hizo realidad.
En 2002 decidió meterse de lleno en la investigación. Partió a Japón para hacer un doctorado en Ingeniería de la Información. Con el padre del formato de video MPG, Hiroshi Yasuda como sensei y sin hablar una pizca de japonés, el ingeniero comenzó a diagramar su propia línea de estudio: la minería de datos en la web. “Minar significa extraer la energía de algo. Yo me dediqué a extraer información útil de textos, imágenes, audios o datos de video en la web”, señala. Para 2005, año en que cursó un posdoctorado en Computing Laboratory en la Universidad de Oxford, ya era todo un experto en la materia.
De vuelta en Chile un año más tarde, participó en un proyecto educacional financiado por el gobierno: debió crear un algoritmo capaz de agrupar, bajo determinados parámetros, los puntos de vista de más de 8 mil personas. Para eso, Velásquez decidió que la mejor manera de “leer” las opiniones que cada persona escribió en una hoja era fabricando un minicerebro humano dentro de una computadora. Ése fue su primer acercamiento con el análisis de textos. Y entre sus conclusiones, un hecho claro: el vicio de copiar y pegar desde internet se estaba volviendo recurrente. Cuando en 2007 el senador Alejandro Navarro presentó un proyecto de ley con párrafos enteros extraídos desde Wikipedia, la paciencia de Juan, dice, se acabó.
Junto a un grupo de expertos -doctores en ingeniería, ingenieros, lingüistas, profesores- que se reúnen en los laboratorios de la Universidad de Chile, hoy está creando un software que detecta automáticamente la originalidad de un trabajo o la copia del mismo. El proyecto se llama DOCODE. Y está siendo financiado por Fondef, que ya entregó $236 millones por la idea.
La gracia de DOCODE es descubrir la copia de documentos digitales en español. Para ello, se necesita que varios computadores trabajen en línea para la misma tarea asignada. Si todo sale bien, los resultados se tienen en 30 segundos. Apenas medio minuto para investigar en toda la web si un párrafo es o no original.
Para eso, los investigadores están descifrando qué palabras son las que los alumnos buscan en la web para copiar un trabajo. Además, se incluirán documentos que hoy están en papel: se les hará una versión online para detectar cuándo son plagiados.
La idea tendrá su base de operaciones en la Facultad de Ciencias Físicas y Matemáticas de la Chile. Para activar el software, a los colegios e instituciones interesados se les entregará una clave por la inscripción anual al sistema. Con el dinero recaudado en esta tarea, el equipo de Velásquez espera mantener y financiar la investigación del proyecto. “No tenemos pensado parar. La idea es seguir perfeccionando el software, con actualizaciones periódicas y nuevas versiones”, cuenta.
De aquí a ocho meses, el equipo espera tener el primer prototipo de DOCODE funcionando. Aunque para Juan Velásquez es mucho más que eso: “Ésta es la locura más grande en la que me he metido. Pero es, lejos, la que más me apasiona”.
Deja un comentario