Como ya te pudiste dar cuenta, los sistemas de inteligencia artificial y los proyectos que involucran esta tecnología tienen su principal insumo en los datos. Las bases de datos con las que se alimentan o se entrenan estos sistemas de inteligencia artificial pueden estar compuestos por diferentes tipos de datos. Este insumo es esencial para el funcionamiento de algunos sistemas de inteligencia artificial. En efecto, la inteligencia artificial involucra la recolección, el almacenamiento, el análisis, el procesamiento o la interpretación de enormes cantidades de datos, las cuales generan diferentes resultados. La recolección de datos se puede lograr a través de diversos mecanismos, como formularios físicos o digitales, sensores que captan el audio o el video, entre otros. Para que un dato pueda ser usado en un proyecto o en un sistema de inteligencia artificial, debe cumplir con tres características. Primero, deben ser datos confiables. Dentro de esta característica tendremos que identificar de dónde vienen los datos, es decir, de qué fuente provienen. Por ejemplo, pueden ser captados por el proveedor, comprados, licenciados, pueden ser públicos o de acceso público, pueden ser provistos por el cliente. Segundo, deben ser imparciales. En esta característica es importante analizar la ética de los datos. Se debe establecer mecanismos para que los datos utilizados sean analizados de tal manera que se mitigue al máximo la posibilidad de usar información que contenga algún tipo de sesgo, ya sea en su contenido, en su clasificación o en el uso que se le ha dado. Sobre esta característica, es importante resaltar que actualmente se han establecido algunos mecanismos de control previo o posterior, como la rendición de cuentas y las auditorías, para documentar las pruebas y cambios al modelo, dependiendo de los datos que usan para alimentarlo. Y tercera, deben ser relevantes. Sobre esta característica, es importante resaltar que en diversos mecanismos de regulación y autorregulación, se menciona que los datos usados para alimentar el modelo deben representar a la población, es decir, deben ser una muestra significativa para presentar algún tipo de predicción. De igual forma, deben ser relevantes para el contexto en el que se aplica el modelo. Por ejemplo, si estoy creando un modelo para predecir las zonas de potencial crimen en una ciudad, los datos que debo usar son los datos de esa ciudad y no la de una ciudad en el exterior. Pero entonces, ¿qué tipos de datos pueden usarse para entrenar un sistema de inteligencia artificial? Las bases de datos que alimentan los modelos de inteligencia artificial pueden contener datos de carácter personal u otros que no sean personales. Por ejemplo, para Colombia, un dato personal es cualquier información vinculada o que pueda asociarse a una o varias personas, naturales, determinadas o determinables. Por ejemplo, mi imagen es un dato personal. Con ello, cabría preguntarse si a través de la seudonimización y la anonimización, como medidas tecnológicas para desvincular al titular, es requisito tener y conservar la autorización del mismo. Ya que, a través de estas técnicas, se busca realizar el tratamiento de datos personales de manera tal que ya no pueda atribuirse a un interesado sin utilizar información adicional. Siempre que dicha información adicional figure por separado y esté sujeta a medidas técnicas y organizativas destinadas a garantizar que los datos personales no se atribuyen a una persona física, identificada o identificable. Una vez organice los tipos de datos que tengo, debo revisar si en mi jurisdicción, país, existe alguna limitación para el uso de datos personales. Por ejemplo, en la mayoría de los países de Latinoamérica necesito revisar si cuento o no con la autorización del titular. Además, debemos revisar si dentro de esta autorización están incluidos los tratamientos que se pretenden realizar. Desde tu rol en la organización, pregúntate, ¿para qué se recogieron estos datos? ¿Qué tipos de datos están solicitando? ¿Cuál es el origen de los mismos? Y qué tipo de medidas de seguridad se toman para el manejo de los datos. Como parte íntegra de tu organización, revisa qué dice la política de privacidad y qué restricciones o límites existen para su recolección, almacenamiento, transmisión o compra de datos. El escándalo Clearview es, sin duda, un ejemplo de cómo no se debe hacer reconocimiento facial. También, hay que tener en cuenta que una de las peores y más descabelladas cosas de Clearview, se esconde en la política de privacidad. Clearview, es un sistema de reconocimiento facial que afirma haber creado enormes bases de datos con más de 3.000 millones de rastros etiquetados mediante la controvertida práctica de extraer fotos de redes sociales. En el 2020, se supo que la empresa estadounidense había ofrecido servicios de prueba a la policía en Australia, concretamente, en Queensland, Victoria y la policía federal australiana. Los informes sugieren que más de 2.000 organismos policiales de todo el mundo habían utilizado los servicios de Clearview a principios del 2020. Es relevante, entonces, preguntarse, ¿podría usarse sin el consentimiento del titular, los datos recolectados a través de mecanismos de scrapping o crawling en redes aparentemente, abiertas al público? Este uso de la inteligencia artificial para el reconocimiento facial a partir de diversas fotos, ha sido cuestionado en algunos países debido a las implicaciones en materia de privacidad. La Autoridad de Protección de Hamburgo, emitió una orden en contra de la compañía que eliminara los datos de sus connacionales. Ello, bajo el argumento de que la base de datos de perfiles biométricos en la que se realizan las búsquedas de Clearview, es ilegal en virtud del Reglamento General de protección de datos, más conocido como D-GIPA. Si bien la autoridad ordenó a Clearview que borrará los valores "hash" matemáticos que representaban el perfil del demandante, no ordenó a Clearview que borrará sus fotos capturadas. La orden restringida que se emitió, solo protege al denunciante individual, porque no es una orden que cubra a todos los países de la Unión Europea. En el mismo sentido, la oficina del comisionado de información del Reino Unido, ICO, ha multado provisionalmente a esta empresa con 17 millones de libras esterlinas por infringir las leyes de protección de datos. Según esta oficina, Clearview, no informó a los ciudadanos que estaba recogiendo miles y millones de fotos, entre otras transgresiones. Otros países como Australia y Canadá han iniciado investigaciones sobre la materia. Así, por ejemplo, en diciembre del 2021 la autoridad francesa también ordenó a Clearview que dejara de procesar los datos de los ciudadanos y le dio dos meses para eliminar los datos que tenía, pero no mencionó ninguna sanción económica. Mientras que Italia impuso una sanción de 20 millones de euros a Clearview, con sede en Estados Unidos, lo cual denota problemas de jurisdicción en esta materia. Con este caso pudimos abordar el reconocimiento facial y las implicaciones en materia de protección de datos, privacidad y autodeterminación informática. Ahora pregúntate, ¿son las fotos consideradas como datos personales? Y de ser afirmativa tu respuesta, sin importar la jurisdicción ahora pregúntate, ¿Cuántas veces has compartido sin su consentimiento, fotos de tus amigos y familiares? Abordemos ahora algunas conclusiones y recomendaciones para el uso de datos en reconocimiento facial. En primer lugar, la advertencia contra la fe ciega en la tecnología y un enfoque no crítico al libre flujo de información. En segundo lugar, recordemos que el uso inicial previsto en la recolección de datos, generalmente, no es el único ni el último uso. Y, finalmente, en tercer lugar revisa la seguridad e individualidad para encontrar un balance entre el interés de la sociedad y el interés particular.