When data is capital: Datafication, accumulation, and extraction

Cita: 

Sadowski, Jathan [2019], “When data is capital: Datafication, accumulation, and extraction”, Big Data & Society, 7 de enero, https://doi.org/10.1177/2053951718820549

Fuente: 
Artículo científico
Fecha de publicación: 
Enero, 2019
Tema: 
¿Por qué los datos deben ser considerados como capital? Dinámica, tendencias e implicaciones del capital-datos como un elemento central del capitalismo del siglo XXI.
Idea principal: 

Jathan Sadowski es investigador en el Emerging Technologies Research Lab de la Universidad de Monash en Australia. Su trabajo se enfoca en la economía política de los sistemas digitales. Su libro más reciente es Too Smart: How Digital Capitalism is Extracting Data, Controlling Our Lives and Taking Over the World (MIT Press, 2020).

Introducción

Los datos se han vuelto esenciales para cada vez más sectores del capitalismo contemporáneo. Actualmente, las empresas “tratan a los datos como una forma de capital”. Hace apenas unos años, las empresas preferían no guardar grandes cantidades de datos para evitar los costos vinculados a su almacenamiento. La situación ha cambiado y hoy día las empresas buscan recolectar la mayor cantidad de datos posibles.

El impulso por acumular datos está modificando la manera de hacer negocios y de gobernar. Los datos son un factor clave en muchas decisiones corporativas (como la compra de Whole Foods por Amazon o la compra de WhatsApp por Facebook) y gubernamentales. En suma “los datos –la acumulación de datos– es un componente central de la economía política en el siglo XXI”.

El autor plantea que los datos deben ser analizados como una forma de capital sin la cual muchas tecnologías y organizaciones contemporáneas no podrían operar ni generar valor. Esta propuesta contrasta con el abordaje dominante, que suele considerar a los datos como una mercancía. Para Sadowski, analizar los datos como una forma de capital y no como una mercancía permite comprender de mejor manera la dinámica del capitalismo digital, la importancia de la extracción de los datos, los imperativos que la motivan y las formas en que se crea valor a partir de estos. “En lugar de concebir a la recolección de datos simplemente como una manera de producir y obtener mercancías que de alguna manera serán convertidas en valores monetarios, la datificación toma forma como un régimen de economía política motivado por la lógica de la acumulación y circulación perpetua de capital (datos)”.

Capitalismo motivado por los datos [Data-driven capitalism]

Múltiples autores han acuñado distintos términos para referirse a la relación entre los datos y el capitalismo: capitalismo de vigilancia (Foster y McChesney, Zuboff), capitalismo informacional (Fuchs), capitalismo comunicativo (Dean), capitalismo de plataformas (Srnicek) e iCapitalismo (Duff). Aunque estos términos y sus implicaciones no son idénticos, comparten temas y conclusiones comunes, de los cuales Sadowski destaca y retoma tres: 1) los datos son valiosos y creadores de valor [value-creating]; 2) la recolección de datos influye en cómo se comportan las empresas y los gobiernos; 3) los sistemas de datos están llenos de relaciones de inequidad, extracción y explotación.

Las organizaciones modernas (empresas y gobiernos) están sujetas a un imperativo por extraer todos los datos posibles, de todas las fuentes y por todos los medios. Satisfacer este “imperativo por los datos” no sólo implica recolectar datos pasivamente, sino crearlos activamente mediante la vigilancia de personas, lugares, procesos y objetos, así como de las relaciones entre ellos. Para ilustrar, Sadowski cita las formulaciones de dos empresas tecnológicas: Cisco manifiesta su interés por construir “el internet de todo” [the Internet of Everything]; IBM, por su parte, sostiene que “hoy día todo está hecho de datos”. Para el autor, afirmaciones como estas no deben ser naturalizadas pues no reflejan lo que sucede en el mundo, sino que ordenan y construyen la manera en que lo entendemos e interactuamos con él.

Es usual que los estudiosos de la “economía digital” hagan referencia a la “minería de datos” [data mining]. Sadowski considera que esa referencia es engañosa, pues asume que los datos ya existen en el mundo y sólo deben ser descubiertos, como el petróleo o los minerales. Por tanto, el autor considera que es más adecuado referirse a “manufactura de datos”. Las empresas suelen alimentar la retórica según la cual los datos son una especie de “recurso natural” disponible para que cualquiera los extraiga. Al hacerlo, reclaman todos los aspectos de la realidad para transformarlos en datos, apropiárselos y así obtener ganancias.

El imperativo por transformar todo en datos y la búsqueda de nuevas fuentes de datos recuerda a los modos imperialistas de acumulación descritos por Rosa Luxemburg. Para el capitalismo es necesario encontrar nuevas fuentes de valor y nuevos espacios para vender sus mercancías que le permitan superar las contradicciones internas que lo conducen a la crisis. Para Rosa Luxemburg esta práctica consistía en la expansión del capitalismo hacia territorios donde las relaciones de producción no eran capitalistas. Pero también podría significar someter a la lógica capitalista a aspectos de la vida que previamente no estaban monetizados. Esta dinámica de “colonialismo de datos” es característica de empresas como Facebook y Google.

Los “estudios críticos sobre los datos” han mostrado que la producción, distribución y uso de los datos da lugar a una economía política emergente con amplias implicaciones sociales. En ese marco, Sadowski busca responder a las preguntas: ¿cuál es la forma económica de los datos? ¿Cómo puede derivarse valor de los datos? ¿Por qué importa la recolección de los datos? Responder a esas preguntas permite comprender mejor la forma y dinámica de los datos en el capitalismo contemporáneo.

Capital-datos [Data capital]

Para Sadowski es necesario reflexionar sobre los datos (en su creación, recolección y circulación) como capital, pues las empresas y gobiernos los tratan como tal. Para examinar las características de lo que denomina "capital-datos" [data capital], el autor retoma dos teorías del capital: la de Karl Marx y la de Pierre Bourdieu.

Para Marx, el capital es valor que se valoriza, dinero que incrementa su magnitud. Lo que motiva al ciclo del capital es el valor de cambio; este ciclo no tiene término, pues el capital requiere estar siempre en circulación para valorizarse. Marx distingue dos formas de capital para la producción de plusvalor: capital constante (medios de producción: fábricas, maquinaria, materias primas, etc.) y capital variable (los costos para contratar a los trabajadores).

Basándose en el análisis de Marx, Bourdieu teorizó dos formas de capital distintas del “capital económico” (aquel que es directamente convertible en dinero y que está institucionalizado en derechos de propiedad). La primera es el capital cultural, que es una representación de la clase social a la cual las personas pertenecen y contribuye a su estatus. El capital social se refiere a la red de relaciones sociales de que dispone una persona y que pueden representar la posibilidad de participar en grupos privilegiados. Tanto el capital cultural como el capital social son formas “disfrazadas” del capital económico y en ciertas circunstancias son convertibles a este.

Tras precisar qué entienden Marx y Bourdieu por capital, Sadowski discute dos análisis comunes sobre cuál es la forma económica de los datos. Por un lado, están quienes consideran que los datos son una “materia prima digital” necesaria para la producción de mercancías. Medios como The Economist forman parte de esta interpretación al considerar a los datos como el “nuevo petróleo”. Por otra parte, están quienes consideran que los datos son “una mercancía producida por el trabajo digital de las personas” al usar las plataformas y dispositivos digitales. Ambas formas de analizar los datos (como materias primas y como productos del trabajo digital) discuten la relación entre “capital real” y mercancías en la economía digital (esto es, se enmarcan en la conceptualización de Marx sobre el capital económico).

A partir de Bourdieu, Sadowski sugiere que los datos deben ser pensados como una forma de capital que es distinta del capital económico, pero tiene sus raíces en él. “El capital-datos es más que conocimiento sobre el mundo; son bits discretos de información que son registrados digitalmente, procesables en máquinas, fácilmente aglomerados, y altamente móviles. Al igual que el capital social y el capital cultural, el capital-datos es convertible, bajo ciertas condiciones, a capital económico”. No obstante, no todo el valor que se puede derivar de los datos asume necesaria o principalmente la forma monetaria. El capital-datos está institucionalizado en las infraestructuras (dispositivos inteligentes, plataformas online, centros de datos, etc.) de recolección, almacenamiento y procesamiento de información.

Una característica importante del capital-datos es que la recolección de datos comparte la misma lógica que la acumulación de capital tal como fue descrita por Marx: los datos pueden ser recolectados y circulados en un movimiento siempre renovado; la recolección de datos es un fin en sí mismo; su proceso no conoce límites. En el capitalismo digital, el imperativo es recolectar y circular datos de manera constante y en una escala cada vez mayor.

Así como la motivación de los capitalistas no es obtener ganancias de una transacción singular sino el movimiento incesante de generación de ganancias, en el capitalismo digital “los capitalistas no se preocupan por el uso inmediato de un punto de datos o de alguna colección singular, sino por el flujo incesante de creación de datos”. De hecho, en la mayoría de los casos las empresas recolectan datos sin tener un uso específico para ellos y es sólo posteriormente, a partir del procesamiento de los propios datos, como se les encuentra alguna aplicación útil. Aunque en algunos casos, las condiciones necesarias para convertir el capital-datos en capital económico no se darán, eso no detiene el ciclo incesante de acumulación de datos.

Las grandes empresas tecnológicas suelen tratar a los datos como si existieran en un espacio transnacional que rebasa las fronteras y la gobernanza nacionales. Esto se traduce en que una empresa puede recolectar información personal en Estados Unidos, almacenarla en Taiwán y venderla en Europa. Los detractores de la soberanía digital nacional argumentan que cualquier restricción a los flujos de datos entorpece la innovación tecnológica y el crecimiento económico. Algunos acuerdos comerciales como el Tratado Transpacífico de Cooperación Económica buscan impulsar el libre flujo de datos entre países y continentes.

Sadowski considera que el capital-datos no usurpará el lugar de la financiarización. Por el contrario, está creando nuevas fuentes de valor y nuevas herramientas de acumulación. “Wall Street y Silicon Valley están convergiendo en torno al capital-datos como una nueva frontera de la acumulación y la circulación”.

Derivando valor del capital-datos

Hasta esta parte del texto se ha analizado a los datos de manera general para argumentar que se trata de una forma de capital. No obstante, no todas las industrias recolectan el mismo tipo de datos ni los usan de la misma manera. Por tanto, resulta necesario preguntarse qué tipo de datos se recolectan, cómo se usan y cómo se deriva valor a partir de ellos. Aunque es común enfatizar los datos de los usuarios (como su geolocalización, sus preferencias, etc.), esa no es la única fuente de la que se pueden obtener datos. En esta sección, el autor delinea seis maneras principales en que los datos son usados para crear valor.

1. Los datos son usados para construir perfiles de las personas e identificarlas como objetivos. Es el modelo de negocios de muchas empresas de internet que recolectan datos de las personas, las categorizan en segmentos de mercado y les ofrecen publicidad personalizada. También lo utilizan los bancos para definir a quién asignar un crédito y las consultorías políticas para saber quién es susceptible de modificar sus intenciones de voto si recibe un determinado mensaje.

2. Los datos son usados para optimizar sistemas. En este caso, los datos pueden servir para volver más eficientes y productivos los procesos, así como para reducir los desperdicios. Para ello, se requiere que se instalen sensores en máquinas, infraestructuras, objetos domésticos, etc., para monitorear su funcionamiento y ajustarlo.

3. Los datos son usados para administrar y controlar cosas. Al acumular datos sobre un determinado objeto, se sabe más sobre él y la capacidad para ejercer poder sobre él se potencia. Esta forma de usar los datos es muy diversa y puede ir desde el seguimiento de la dieta de una persona para mejorar su alimentación hasta la supervisión de patrones de tráfico en una ciudad para gestionar cómo millones de personas se mueven en el espacio. Los datos pueden usarse para informar la toma de decisiones por parte de los humanos o para alimentar sistemas automatizados para que tomen decisiones en tiempo real.

4. Los datos son usados para modelar probabilidades. Al disponer de grandes series de datos sobre temas muy diversos, muchas empresas y organizaciones pretenden predecir el futuro mediante herramientas probabilísticas. Por ejemplo, algunos departamentos de policía utilizan estos sistemas predictivos para saber dónde hay altas probabilidades de que se cometa un crimen y quién lo puede cometer.

5. Los datos son usados para mejorar productos y servicios y para construir otros nuevos. Como se mencionó antes, los datos no siempre se recolectan con objetivos predefinidos sino que en muchas ocasiones las posibles aplicaciones surgen del propio análisis de datos y de encontrar correlaciones entre ellos. Un ejemplo son las mejoras y actualizaciones de los servicios en internet a partir de la información recabada de los usuarios.

6. Los datos son usados para aumentar el valor de los activos. Algunos activos como edificios, vehículos o maquinaria tienden a depreciarse por el deterioro que experimentan con el tiempo. No obstante, según el autor, actualizar activos con tecnologías inteligentes que recolectan datos sobre su uso ayuda a ampliar su vida útil y a combatir el ciclo de deterioro y depreciación. “En lugar de depreciarse, los activos inteligentes pueden mantener y aumentar su valor. O, si no incrementan su valor, al menos pueden hacer más lento su deterioro”.

Extracción de datos

Cuando se habla de “recolección” o “minería” de datos, se crea la imagen de que los datos ya existen en el mundo como algo listo para ser cosechado y de que se trata de un acopio neutral. En contraste, analizar el proceso como extracción de datos permite enfatizar la naturaleza explotadora de la “datavigilancia”. Al hablar de extracción de datos, se vuelve más claro que se trata de prácticas que en muchos casos se dan de manera engañosa, sin consentimiento significativo y sin una compensación justa para quienes son productores y fuentes de esos datos.

Mucho del capital-datos más valioso se extrae de las personas: sus identidades, preferencias, comportamientos, información personal, etc. En consecuencia, la acumulación creciente de datos implica sistemas cada vez más invasivos que están integrados en todo tipo de objetos, desde electrodomésticos hasta infraestructura urbana. La lógica de la acumulación de datos transforma todos los objetos en máquinas de producción, recolección y transmisión de datos. “Para las empresas, mucho del valor producido por las tecnologías ‘inteligentes’ no necesariamente proviene de la venta del bien, sino de su uso”, pues es ahí donde pueden recolectar datos. “Así, en lugar de existir sólo como una mercancía para ser vendida, un dispositivo inteligente se convierte (tal vez primordialmente) en un medio para la producción de datos”. En consecuencia, para muchas empresas el nuevo modelo de negocios centrado en los datos consiste en reducir al mínimo los precios de sus mercancías para ampliar su base de usuarios, aumentar su flujo de datos y así generar las condiciones para maximizar sus ingresos en el largo plazo. La lógica de la acumulación de datos se ha convertido en la fuerza impulsora de muchas decisiones clave para empresas y gobiernos.

El autor alude al tema del consentimiento en la extracción de los datos. Las empresas tecnológicas establecen contratos unilaterales, no negociados y no negociables con sus usuarios. La no aceptación de esos contratos por parte de los usuarios equivale a que las empresas les nieguen el acceso a sus servicios. Por ello, difícilmente se les puede considerar acuerdos libres y voluntarios, pues una de las partes no tiene forma de plantear sus propios términos. Además, es común que las empresas incluyan cláusulas sospechosas en esos contratos; por ejemplo, cláusulas en las cuales los usuarios renuncian a los derechos de propiedad de sus datos y que limitan a los usuarios la capacidad de decidir qué tipos de datos se extraen y cómo se usan.

La forma en que las empresas tecnológicas extraen datos no está fundada en el consentimiento (y menos aún en formas robustas de consentimiento informado) sino, en el mejor de los casos, en la conformidad. Así, Sadowski concluye que “cuando una cosa es tomada sin consentimiento, la llamamos ‘robo’”. Esto es así aunque no se trate de un objeto material sino de la información de las personas.

Posteriormente, aborda el tema de la compensación justa [fair compensation] por la información. Es difícil asignar un precio a la información personal debido a que distintos tipos de datos son valorados de manera diferenciada entre empresas e industrias. Además, el valor de los datos aumenta conforme se incrementa su cantidad, pues pueden encontrarse correlaciones entre ellos. Así, aunque probablemente los datos de un individuo aislado no podrían ser convertidos en capital, la agregación de datos de miles o millones de personas puede ser inmensamente valiosa. Aún reconociendo la dificultad de fijar un precio a los datos, Sadowski sostiene que se puede juzgar lo justo de una compensación con dos criterios: 1) qué tipo de compensación se ofrece por los datos; 2) por la diferencia entre la compensación de quienes produjeron los datos y el valor obtenido por los “capitalistas de los datos”.

La compensación comúnmente se da en forma de acceso a los servicios de las empresas de internet. Estas empresas no cobran en dinero por el uso de sus servicios, pero reciben los datos de los usuarios como pago. Aunque algunas personas pueden considerar que acceder a la plataforma de Facebook o al buscador de Google puede ser una compensación justa a cambio de sus datos, no se debe perder de vista que hay muchas más empresas que recolectan, usan y venden datos de los usuarios sin que estos lo sepan siquiera. La mayoría de las empresas no compensan de ninguna manera a los usuarios.

Sadowski considera que el valor que las grandes empresas tecnológicas obtienen del capital-datos es enorme y que compensan con poco o nada a quienes producen esos datos. En muchos casos (como en las empresas del sector financiero, aseguradoras y manufactureras) los datos que usan son creados por los usuarios mientras llevan a cabo sus actividades. “Esas empresas están acumulando miles de millones de dólares en plusvalor del ‘trabajo digital’ hecho por las personas [...] mientras pagan poco o nada a cambio”. Para algunos autores, este proceso es equivalente a la acumulación originaria o acumulación por desposesión, en la cual el capitalismo coloniza tiempos y espacios que anteriormente no estaban mercantilizados. Cuando una persona no recibe una compensación justa a cambio de su trabajo, se llama explotación. Por lo antedicho, siempre según Sadowski, en la extracción de datos tienen lugar prácticas de explotación.

Por último, Sadowski señala que la extracción de datos no es homogénea. La clase social incide en qué datos se extraen, cómo y por qué razón. Algunos datos se obtienen preponderantemente de ciertos grupos sociales. En contrapartida, hay ciertos grupos que no están representados en las series de datos por su condición de clase o raza. El autor considera que es necesario un análisis más profundo sobre la "desigualdad de la extracción de datos".

Conclusión

Los datos son un componente central en la economía política del siglo XXI. Siguiendo algunos argumentos de Marx y Bourdieu, Sadowski consideró que el capital debe ser analizado como una forma de capital que es distinta del capital económico pero que echa sus raíces en él. La recolección de datos es, al igual que la acumulación de capital, un ciclo perpetuo en crecimiento incesante. Bajo esta lógica, el mundo entero es concebido como una reserva potencialmente infinita de datos y la recolección de datos se convierte en un imperativo que influye en las decisiones más importantes de empresas y gobiernos. Puesto que las empresas están sujetas a este imperativo de acumulación de datos, la información personal de los individuos es tratada sin ningún respeto por el consentimiento y la compensación.

En lugar de hablar de “minería” o de “recolección”, Sadowski considera que es más adecuado hablar de extracción de datos. Hablar de extracción de datos permite desplazar el énfasis de la privacidad y seguridad hacia la desigualdad y explotación que caracterizan a la “economía política de los datos contemporánea”. Concebir las prácticas mediante las cuales las empresas se apropian de datos como extracción puede servir para ofrecer mejores respuestas políticas y regulatorias para poner límites a prácticas invasivas de acumulación de datos de las empresas, así como a limitar qué tipos de datos pueden recolectar y cuánta información puede poseer una empresa, tanto en términos agregados como sobre individuos. El autor sostiene que incluso algunos datos podrían ser considerados como “infraestructuras públicas”. Son necesarias reformas y alternativas al “capitalismo de los datos”.

El artículo no sostiene (como hacen los ejecutivos e ingenieros de Silicon Valley) que con el capitalismo de datos todo ha cambiado y es completamente novedoso. Por el contrario, se afirma que el capitalismo de datos es más bien un cambio de énfasis: es la transición hacia una nueva forma de capital y nuevos métodos de acumulación. "La datificación [...] es una nueva frontera de acumulación y una siguiente etapa en el capitalismo".

Para Sadowski, existen múltiples similitudes entre el capital-datos y el capital financiero: ambos buscan maximizar la apropiación de valor al utilizar métodos complejos de circulación de capital; ambos utilizan sistemas opacos que eluden la supervisión; utilizan su influencia política para evitar la regulación; llevan a cabo prácticas explotadoras y predatorias. Además, existen múltiples conexiones entre el capital-datos y el capital financiero: los bancos utilizan series de datos personales para la asignación hiper-individualizada de créditos y en Wall Street se usan algoritmos para transacciones financieras de "alta frecuencia" en las cuales el capital circula de manera extremadamente acelerada. El capital-datos no sustituirá al capital financiero, sino que ambos se retroalimentan y lo seguirán haciendo. Las teorías y métodos usados para analizar el capitalismo financiero y las tecnologías de la información deben ser sintetizadas para estudiar las dinámicas e implicaciones de la “datificación como un régimen de economía política”.

Nexo con el tema que estudiamos: 

El texto plantea importantes reflexiones sobre el carácter de los datos desde una perspectiva de economía política. Su caracterización de los datos como capital ofrece contrapuntos relevantes con las perspectivas dominantes, que los conciben como mercancías o como materias primas.