Lo que no se cuenta sobre los espacios de datos compartidos: ni son espacios físicos ni tampoco son espacios virtuales
Asaltan las dudas de cuánto tiempo vamos a seguir insistiendo en utilizar términos laxos para explicar qué son los espacios de datos compartidos y para qué sirven, antes de que nos demos cuenta de que la industria puede no estar por la labor, porque no le encuentra sentido si se presenta así.
Qué son los espacios de datos compartidos
Usar la expresión "espacios de datos" a secas no es muy convincente. Espacio de datos es el disco duro de nuestro portátil, la nube de nuestra organización, o el datalake que le hemos montado a un cliente para un proyecto. Pero no nos estamos refiriendo a esos espacios de datos. De hecho, no nos estamos refiriendo a ningún espacio concreto, sino al conjunto de los datos que están disponibles para los usos que sus tenedores hayan determinado al publicarlos, se encuentren almacenados donde se encuentren.
Digo tenedores porque puede que quien los ponga a disposición no sea el poseedor, ni el originador, sino un intermediario que actúa en nombre de ellos como un corredor de bolsa da servicio a sus clientes colocando los depósitos.
La nube de la Comisión
Los espacios de datos no son espacios físicos ni tampoco son espacios virtuales sino que son espacios sociotécnicos donde se garantiza que los datos se publican y se utilizan de acuerdo con unas reglas predeterminadas. Socio significa que hay una normativa de publicación y de acceso, que se cumple con la regulación, y que se garantiza que los datos siempre se emplean de acuerdo con las condiciones expresadas por el tenedor; para todo ello existe la certificación correspondiente. Eso se denomina soberanía en el argot de los espacios de datos compartidos, y no se corresponde a otros tipo de soberanía sobre los datos, como puede ser que los datos estén almacenados en infraestructuras residentes en determinado territorio para que cumplan las leyes de ese territorio.
Los datos pueden estar en cualquier sitio; en nuestro ordenador, en los sistemas de una organización, en la nube de un proveedor menor, o en la nube de uno de los grandes proveedores internacionales. Todos ellos pueden utilizar los componentes técnicos y adherirse a las reglas de participación para integrarse en los espacios de datos.
Aquellos datos que crean que merezcan la pena ser publicados porque les causa rentabilidad monetaria o intangible, lo serán, mientras que otros que no cumplan esas expectativas, quedarán ocultos.
Yo no comparto mis datos porque me los copian
No, ni yo tampoco. Pero es que no estamos hablando de eso. En el grupo de Industria de Gaia-X España se ha emitido una encuesta en la que se pregunta a los encuestados voluntarios si estarían dispuestos a compartir datos con sus proveedores y cuáles. Si hay una respuesta que sea sí, me gustaría conocer a esa persona tan osada.
El objetivo de los espacios de datos compartidos, pese al equívoco nombre, no es que los datos se trasieguen entre los agentes participantes para que resulten copiados infinidad de veces, y todo el mundo pueda conocer claves del negocio de terceros.
Cuando se habla del potencial de la compartición de datos no se refiere a la exposición de datos de negocio que hoy día está reservada, y lo seguirá estando, a intercambio de información en las interfaces de negocio, o en las cadenas de agente dominante que obliga a los sucesivos niveles de proveedor a informarle fielmente para hacer determinados seguimientos.
Se refiere, por el contrario, a nuevos servicios que van a ofrecer unas terceras partes que van a poder trabajar con datos diversos para dar nuevos servicios. Y prácticamente siempre, sin necesidad de desentrañar las características de los datos, es decir, la atribuibilidad que reventaría todo secreto industrial o profesional. Para ello, hay diversas técnicas de anonimización; la preferencia por trabajar con datos agregados, o entrenamiento de modelos de IA de modo opaco.
Vamos a aprender a preguntar
Entonces, si preguntamos en las empresas: ¿estarían dispuestos a que unos proveedores de servicio utilizaran sus datos de forma agregada, sin copiarlos, sin desvelar su origen (sin conocerlo, de hecho) con el fin de entrenar herramientas que luego le van a proporcionar mejores o nuevos servicios, inclusive con la posibilidad de que haya una compensación, ya sea directamente de pago, o de rebaja en los servicios?
- ¿Admitiría que una empresa de seguridad informática conociera las prácticas de sus empleados, por medio del análisis de unos datos que usted recoge, y que se almacenan de modo no atribuible con el fin de ofrecerle mejores productos o servicios relativos a la seguridad informática? Teniendo en cuenta que si, al igual que usted, otras empresas lo admitieran, el potencial de mejora se incrementaría considerablemente.
- ¿Admitiría usted que un proveedor de servicios utilizara los datos de entradas y salidas de vehículos de su almacén para que, junto con los de otras empresas del mismo polígono industrial, se conociera el flujo de entrada y salida, y, con ello, se pudiera ordenar el tráfico en las inmediaciones, o facilitar la agregación de carga para los operadores logísticos, sin que ello diera pistas a sus competidores de cómo le va el negocio?
- ¿Admitiría que una empresa dedicada a servicios de recursos humanos utilizara los datos de su personal, convenientemente anonimizados –le va la ley en ello– para segmentar mejor sus servicios y que, de esa manera, pudiera ofrecerle mejores perfiles, dependiendo de la evolución del negocio, de la dinámica de la formación profesional, de los vaivenes del mercado laboral en general? Y ello gracias a que esta empresa es capaz de utilizar tanto los datos de su empresa como los de otras empresas, pero también datos públicos, ya sean de fuentes abiertas, o de open data de las administraciones.
El valor del dato no se le supone
Quienes promueven estos escenarios novedosos de compartición de datos deben ser tan exigentes consigo mismos a la hora de explicar las ventajas efectivas de este modo de compartir datos como de explicar que los componentes técnicos se encuentran en fase de desarrollo y prueba. Hoy solo se puede aspirar a realizar pruebas de concepto en las que se demuestre la viabilidad, y que los agentes se encuentren cómodos con los nuevos conceptos y las nuevas prácticas.
Esta es la labor en la que se ha enfrascado TECNALIA en los últimos meses. Ha lanzado proyectos de diverso tamaño en varios sectores; smart cities, logística urbana, salud, industria... Ha afinando los aspectos técnicos de las tecnologías disponibles, que cambian día a día. Y promueve la confianza en los agentes que intervienen, ayudándolos también en la identificación de los datos valiosos, en su disponibilización, y en la comprensión de las posibilidades de explotación que se abren gracias a ello.
Sin dejar de repetir que, en este caso, compartir no significa regalar nada.