Dark Data

Definición: 

Definición de Dark Data

 

En Marketing Digital, el dark data, conocido también como datos ocultos, es un tipo de datos no estructurados, sin etiqueta y sin explotar que se encuentra en los repositorios de datos y no han sido analizados o procesados.

El Dark Data  es parte del big data, ya que, de todos los datos recopilados, son a los que no se les da uso y quedan olvidados.

Es por eso por lo que también se le llama dusty data, porque son datos que no se utilizan para nada y “acumulan polvo”.

¿Dónde se encuentra el dark data?

La mayor parte de los datos ocultos son recabados por una empresa desde orígenes que no se analizan.

Estos son en su mayoría datos desestructurados, esto es que no están almacenados en fuentes con una estructura conocida.

La mayoría de las empresas almacenan este tipo de datos solo por el cumplimiento de la normativa del tratamiento de datos.

La analogía del iceberg para el Dark Data

La analogía del iceberg es muy acertada en este caso debido a que, de la base de datos que recopila una empresa, se aprovecha solo una pequeña parte, como un 10% y el 90% restante son datos que permanecen ocultos.

De ese 90% solo un 20% son datos que no tienen valor para ser analizados y el 70% restante es Dark Data.

Razones por las que existe el Dark Data

Si solo el 10% tiene valor de análisis y el 20% es inútil, cabe preguntarse por qué razón no se aprovechan el 70% de los datos incluidos en el Dark Data.

Hay tres razones principales que hacen que existan estos Datos Ocultos o Dark Data:

  • Que esos datos no se estén recopilando por falta de interés o por falta de herramientas para su análisis.
  • Que esos datos si que estén recopilados pero que sean de difícil acceso en el momento en el que se necesiten
  • Que los datos estén recopilados y disponibles pero que aún no se hayan analizado.

¿Qué datos pueden englobarse en la categoría de Dark Data?

Estos son los tipos de datos que guarda una empresa y que pueden considerarse Dark Data:

  • Archivos de registro
  • Archivos multimedia
  • Informaciones de cuentas
  • Información al cliente
  • Archivos financieros
  • Datos de antiguos empleados
  • Datos sin procesar
  • Correspondencia electrónica

Según los analistas de IBM, «aproximadamente el 90 por ciento de los datos generados por la mayoría de los sensores y las conversiones A-to-D en el mercado nunca se utiliza».

Ir arriba