Blog

El Web scraping y la Inteligencia Artificial

viernes, 31 de mayo de 2024

La Autoridad de Control de Protecci贸n de Datos Italiana, m谩s conocida como el Garante, ha publicado recientemente un documento en el que recoge una serie de medidas que deben adoptar los responsables del tratamiento de sitios web para evitar el web scraping sobre datos personales.

El web scraping es un proceso automatizado que se usa para la extracci贸n de datos de sitios web. Su aplicaci贸n a la inteligencia artificial consiste en la recopilaci贸n masiva de datos personales de un sitio web con el objetivo de entrenar modelos de inteligencia artificial generativa.

As铆, con el web scraping surge un problema de protecci贸n de datos personales.

En este sentido, y en cumplimiento del art. 5 del RGPD, las medidas propuestas por el Garante para evitar el web scraping sobre datos personales son las siguientes:

1)聽聽聽聽 Creaci贸n de 谩reas a las que solo se pueda acceder previo registro sin que ello suponga un tratamiento excesivo de datos. De esta manera, lo que se busca es disminuir la cantidad de datos disponibles.

2)聽聽聽聽 Prohibir el scraping en los avisos legales, si bien este solo operar铆a ex-post o como elemento disuasorio. Esta, a diferencia de la anterior, m谩s que una medida t茅cnico-organizativa, es una medida especial-preventiva con efecto disuasorio.

3)聽聽聽聽 Limitar el tr谩fico de red y el n煤mero de solicitudes seleccionando 煤nicamente aquellas provenientes de determinadas direcciones IP para evitar, a priori, un tr谩fico excesivo de datos.

4)聽聽聽聽 Limitar, en la medida de lo posible, el uso de bots para frenar la recopilaci贸n autom谩tica de datos (inclusi贸n de CAPTCHA, uso de robot.txt., incorporaci贸n de contenidos que se quieren proteger dentro de archivos multimedia, etc.)

En conclusi贸n, la IA generativa aporta grandes beneficios, sin embargo, el entrenamiento de sus modelos requiere del tratamiento de una gran cantidad de datos. En consecuencia, los responsables del tratamiento no pueden perder de vista la aplicaci贸n en todo momento de las disposiciones del RGPD, con especial atenci贸n, a la adopci贸n de medidas de seguridad que resulten oportunas a cada caso.

Ver en medio original