Definición:
Big Data es un término amplio para conjuntos de datos tan grandes o complejos que las aplicaciones tradicionales de procesamiento de datos no son suficientes. Engloba el análisis, la captura, la autentificación de datos, búsqueda, intercambio, almacenamiento, transferencia, visualización, consulta y privacidad de la información. El término a menudo se refiere simplemente a la utilización de análisis predictivo u otros determinados métodos avanzados para extraer valor de los datos, y rara vez para definir a un determinado tamaño de conjunto de datos. La exactitud en el Big Data puede conducir a la toma de decisiones con más confianza.
Table of Contents
El tamaño del big data
Los sistemas de gestión de base de datos relacionales y los sistemas de visualización de datos y estadísticas a menudo tienen grandes dificultades para manejar un gran volumen de datos. Este trabajo requiere algún software que se ejecute masivamente en paralelo en decenas, cientos o incluso miles de servidores. Lo que se considera big data varía dependiendo de las capacidades de los usuarios y sus herramientas y también de sus capacidades de expansión.
El tamaño del Big Data «tamaño» aún no ha sido definido completamente, ya que puede variar desde unas pocas docenas de terabytes a muchos petabytes. Estos enormes volúmenes de datos requieren un conjunto de técnicas y tecnologías con nuevas formas de integración para revelar las percepciones de los conjuntos de datos que son diversas, complejas y de gran escala.
El big data se define siguiendo el modelo de las “3Vs” (volumen o cantidad de datos), la velocidad (velocidad de entrada y salida de datos) y la variedad (variedad de tipos de datos y fuentes).
Características adicionales del Big Data
Las 3Vs se han ampliado a otras características complementarias del Big Data:
- Volumen: el Big Data no sirve como ejemplo; sólo para observar y analizar lo que sucede.
- Velocidad: el Big Data a menudo está disponible en tiempo real.
- Variedad: el Big Data se basa en texto, imágenes, audio y vídeo; además de que completa las piezas que le faltan a través de la fusión de datos.
- Machine Learning: el Big Data a menudo no pregunta por qué y simplemente detecta patrones.
- Huella digital: el Big Data es a menudo un subproducto sin costo de la interacción digital.
Términos relacionados