Are data more like oil or sunlight? The question highlights the many different faces of data
The Economist [2020], "Are data more like oil or sunlight? The question highlights the many different faces of data", The Economist, London, 20 de febrero, https://www.economist.com/special-report/2020/02/20/are-data-more-like-o...
Conforme la economía de los datos se vuelve más importante, proliferan las analogías mediante las cuales se busca explicarla. Se suele comparar a los datos con el petróleo (y se dice que aquellos serán el “combustible del futuro”), con los rayos solares (pues estarán en todos lados) y con las infraestructuras (como las carreteras, que requieren de inversión pública o de nuevas instituciones que los regulen). La multiplicidad de metáforas para reflexionar sobre los datos da cuenta de lo multifacética que es la economía de los datos.
Los debates sobre los datos se extienden en el campo de la teoría económica a su definición como bienes privados (como el petróleo), bienes públicos (como la luz solar) o “bienes de club” (un punto intermedio). Los datos son “no rivales”: pueden ser utilizados simultáneamente por muchas personas sin que esto limite el uso por otros. Pero también son “excluyentes”, pues tecnologías como la encriptación controlan quién tiene acceso a ellos. Estas características ponen de relieve que no existe sólo una economía de los datos, sino varias formas más o menos diferenciadas, cada una con su propia ideología. La pregunta es si alguna de ellas se convertirá en dominante o si, como sucede en el mundo físico, el mundo virtual será una mezcla de los tres.
La metáfora del petróleo es la más popular para pensar los datos. Como el petróleo, los datos deben ser refinados para que sean útiles. En la mayoría de los casos, los datos deben ser limpiados y clasificados para que puedan ser usados; esto ha dado lugar a una industria global que emplea a cientos de miles de personas, en la mayoría de los casos en países donde se pagan bajos salarios. Una vez clasificados, los datos son utilizados para entrenar algoritmos que servirán para servicios de inteligencia artificial.
La metáfora del petróleo es útil también porque el conocimiento que se extrae de los datos una vez “refinados” suele ser ampliamente comerciado. Un ejemplo de ello es el mercado de publicidad en línea, donde los datos se compran y venden con base en un perfil digital sumamente detallado de cada usuario. La información personal de los usuarios también es vendida a bancos, empresas de telecomunicaciones, aseguradoras, entre otras. Otras empresas, como Google y Facebook no suelen vender sus datos, pero venden los resultados ya procesados sobre quién es el mejor objetivo para determinada publicidad.
A pesar de sus usos rentables, los datos no se han convertido en un “nuevo tipo de activo”, como predijo el Foro Económico Mundial en 2011. La mayor parte de las series de datos nunca cambia de manos y los intentos por volverlos más comerciables no han sido exitosos. A esto se suma que algunas empresas manufactureras están impulsando que los datos generados en sus procesos y por sus productos tengan derechos de propiedad intelectual.
Aunque los datos suelen ser pensados como una mercancía, muchos tipos de datos, como las series de datos corporativas, no suelen ser intercambiables. Como las características, extracción y confiabilidad de cada tipo de datos es tan diferente, resulta difícil para compradores y vendedores fijar un precio. Por otra parte, el valor de cada serie de datos depende mucho de quién la controla: lo que para una empresa puede ser simple desperdicio de datos, para otra puede ser una mina de oro digital. Un problema adicional es la definición de los derechos de propiedad sobre los datos. Por ejemplo, ¿a quién corresponde la propiedad de los datos por el emparejamiento de dos personas en una aplicación de citas? ¿A la pareja, a la aplicación?
Aunque es poco probable que los datos se comercialicen con tanta amplitud como el petróleo, algunas empresas tecnológicas están intentando facilitar su venta. Por ejemplo, Amazon Web Services (la rama de computación en la nube de Amazon) habilitó recientemente en su plataforma un “mercado” donde se pueden comprar y vender datos.
Conforme el símil con el petróleo muestra más limitaciones, la comparación con la luz solar u otros bienes públicos ha ganado adeptos (se les conoce como el movimiento de los “datos abiertos” [“open-data” movement]). Quienes son partidarios de esta metáfora se preguntan: si los datos no son un bien comerciable, ¿no sería mejor asegurar que se utilicen de la manera más amplia posible? Desde su perspectiva, tratar a los datos como un bien público ayudaría a maximizar la riqueza social.
Recientemente, algunas empresas han comenzado a publicar grandes series de sus datos, en lo que se conoce como ”open-data initiative”. Entre estas se encuentran Microsoft y Waymo, la empresa de Alphabet (matriz de Google) que desarrolla vehículos autónomos. Estas empresas consideran que la “democratización de los datos” servirá para que investigadores externos puedan formular preguntas relevantes sobre sus tecnologías.
Aunque plantea temas interesantes, la comparación de los datos con la luz solar como bienes públicos también tiene sus limitaciones. Las regulaciones cada vez más estrictas sobre privacidad (como la Regulación general de protección de datos de la Unión Europea) y la poca voluntad de las empresas para hacer públicas sus mejores series de datos limitan que los datos sean concebidos como bienes públicos.
Algunas nuevas tecnologías y métodos de procesamiento, conocidos como “tecnologías de división de datos” [data-dividing technologies] harán más sencillo que los datos puedan ser utilizados sin violar la privacidad de las personas. The Economist destaca la “encriptación homomórfica” [homomorphic encryption], que permite que los algoritmos procesen datos sin desencriptarlos, y las cadenas de bloques [blockchains], que son bases de datos especiales que permiten administrar de manera detallada quién puede acceder a ciertos datos y rastrear quién lo ha hecho. Estas tecnologías permitirán a los usuarios tener mayor control y privacidad sobre los datos que generan.
Las tecnologías de división de datos son promovidas por quienes piensan a los datos como una infraestructura. En esta analogía, se piensa a las series de datos como carreteras digitales. Algunas de ellas son autopistas privadas y otras son carreteras públicas. Adicionalmente, según los partidarios de esta posición, algunas series de datos tendrían que ser “operadas como recursos digitales compartidos gestionados en un ‘club’ por usuarios”. Para llegar al lugar deseado, comúnmente es necesario transitar por distintos tipos de carreteras.
Para crear estos “bienes de club”, no bastan las tecnologías. Se necesitan instituciones que administren esos datos: fideicomisos de datos, cooperativas de datos, entre otras. Estas instituciones serían las encargadas de crear estructuras de gobernanza para organizar el acceso a los datos de tal forma que se tome en consideración los intereses de quienes producen y usan algún tipo particular de datos. Aunque están dando sus primeros pasos, estos “clubes de datos” están surgiendo en distintos lugares del mundo: el Suiza, hay una cooperativa llamada MIDATA que recolecta y gestiona los datos sobre la salud de sus miembros; en Taiwán, el gobierno está promoviendo el uso de datos colaborativos, en particular sobre asuntos ambientales.
Estos proyectos aún son pequeños y un inconveniente es que muchos de ellos dependen del presupuesto público, lo que plantea serias dudas sobre la posibilidad de que sobrevivan en el ecosistema de la economía de los datos. Los impulsores de los “clubes de datos” consideran que su éxito y supervivencia depende de que haya voluntad política y un entendimiento sobre la necesidad de crear alternativas a las grandes plataformas en línea, que tratan a los datos que recolectan como si fueran suyos.
Dadas sus respectivas limitaciones, ninguno de los tres tipos de economía de los datos tendrá un dominio absoluto, sino que tenderán a coexistir. El peso específico de cada una de estas economías de los datos es distinto en diferentes lugares. En Estados Unidos, por ejemplo, los datos son tratados como el petróleo: quien los extrae, se apropia de ellos. China es, según The Economist un “ejemplo extremo de un lugar donde los datos son tratados como bienes públicos”, pues el gobierno los controla e impulsa la creación de bases de datos comunes. En Europa, en cambio, algunas entidades reguladoras comienzan a ver a los datos como infraestructura; la nueva Comisión Europea tiene planes para impulsar la creación de fideicomisos de datos [data trusts].
Podría parecer que esta decisión de la Unión Europea es una manera de perpetuar su rezago en las tecnologías digitales. No obstante, algunos consideran que si las personas y las empresas confían en las infraestructuras de datos europeas, compartirán más y mejores datos, lo que se traducirá en más y mejores servicios para toda la población. Los reguladores confían que una economía de los datos más justa podría ser también competitiva.
Según la consultora Strategy&, las ventas globales en el mercado de publicidad en línea fueron de 178 mil millones de dólares en 2018.
En un artículo previo (fichado aquí: http://let.iiec.unam.mx/node/1383), The Economist se adhería plenamente a la analogía según la cual los datos son como el petróleo. Tres años después, modificando el discurso, el semanario británico amplía la mirada y da cuenta del carácter multifacético de los datos y de lo que llama “la economía de los datos”. La discusión sobre la naturaleza de los datos digitales y sobre sus características ofrece una sugerente invitación a complejizar nuestro entendimiento sobre las grandes corporaciones digitales y a mirar con mayor detalle las características de los datos en sus distintos momentos: extracción, tráfico, procesamiento y utilización.