¿Que es Big Data?

0

Estudiando sobre BigData me encontré con un artículo de Maté (2010) quien hace referencia a la gran cantidad de información que se genera día a día, la cual, puede ser estructurada, semiestructurada y no estructurada.

En dicho artículo se plantea una introducción divulgativa a todos los nuevos términos que tienen que ver con dicha información, tales como MapReduce, Hadoop y computación en la nube, además analiza las estructuras más conocidas para el tratamiento de los big data, así como las cuestiones legales y éticas.

Para explicar los antecedentes del big data, el autor explica que, aquella información que antes se procesaba en Excel creció exponencialmente, por lo que, surgieron los sistemas de gestión de bases de datos relacionales (RDBMS) que utilizan consultas estructuradas con lenguaje SQL, sin embargo, estos nuevos sistemas resultan todavía insuficientes para tratar los datos que llegan a generarse en empresas de caracter digital e internacional, como son: facebook, twitter, entre otras.

Los investigadores de Google Ghemawat et al (2003) diseñaron e implementaron el sistema de ficheros de Google (GFS) como un sistema de ficheros distribuido y escalable para aplicaciones intensivas de datos. Enseguida Dean y Ghemawat (2008) crearon la herramienta MapReduce para Google.

Otra herramienta para tratar información masiva es Hadoop (para Yahoo). Se trata de una plataforma de software que permite escribir con facilidad y ejecutar aplicaciones que procesan ingentes cantidades de datos.

Algunos ejemplos del uso de estas tecnologías son: Yahoo (Hadoop), Facebook (Hadoop) y Amazon (JAVA y API de streaming).

Por otra parte, el término computación en la nube es una solución de las tecnologías de la información (IT) para ofrecer recursos y servicios sobre internet.

¿Qué es Big Data?

El estudio publicado por McKinsey Global Institute (MGI) en junio de 2011 define el término Big Data como: "conjuntos de datos cuyo tamaño va más allá de la capacidad de captura, almacenamiento, gestión y análisis de las herramientas de base de datos".

Luego en Gartner (2012) definió big data como "activos de información caracterizados por su volumen elevado, velocidad elevada y alta variedad, que demandan soluciones innovadoras y eficientes de procesado para la mejora del conocimiento y la toma de decisiones en las organizaciones".

Las V del Big Data

Algo curioso que sucede con algunos conceptos nuevos es que los autores se valen de recursos didácticos para describir sus características de una forma sencilla. Esto se puede apreciar en distintas áreas, por ejemplo: Las 4 Ps del marketing digital, Las 4 Rs de los medios sociales, Las 5 Ss en las organizaciones, Las 5 Cs del trabajo en equipo y Las 7 Cs del marketing de contenidos, por mencionar algunas.

El Big Data no es la excepción, por lo que, partiendo de la definición de Gartner (2012) se identifican las primeras 3 V del Big Data: Volumen, velocidad y variedad, sin embargo, a lo largo del tiempo, se han integrado más V's que representan curiosamente otras características destacadas de este concepto.

A continuación se describen las 7 V del Big data:

1. Volumen: Los datos que se obtienen de los usuarios en un sitio web puede ser prácticamente ilimitada.

2. Velocidad: Se procesan datos, incluso en tiempo real.

3. Variedad: La información digital puede ser textos, imágenes, videos, presentaciones, multimedias, juegos, por mencionar algunos. Por otra parte, el canal de procedencia de los datos puede ser tabletas, smartphones, laptops y ordenadores, entre otros.

4. Veracidad: Se refiere a la capacidad de los métodos y herramientas disponibles para separar la información que es útil y desechar el resto.

5. Valor

6. Visualización

7. Viabilidad

Ley de Protección de Datos

La obtención, tratamiento y explotación de los big data plantea importantes cuestiones de índole legal. El antecedente legislativo más conocido es la Ley de Protección de Datos.

Recientemente, Pulido (2014) en la lección inaugural del curso 2014-2015 en la UAM ha identificado las siguientes cuestiones éticas sobre los big data: privacidad, transparencia, pérdida de identidad, discriminación y castigo anticipado y peligro de exclusión.

Se cree que en los próximos años existirá una licencia para la conducción de datos para tratar y analizar datos con las pertinentes responsabilidades penales, de forma parecida a la licencia que se utiliza para conducir un automovil.

¿Cómo se mide la información?

La unidad básica de medida para la información digial en términos computacionales es el bit, el cual se conoce como lenguaje máquina y se puede representar con un cero o un uno.

Luego el conjunto de 8 bits, corresponde a un byte, que puede ser una combinación de ceros y unos para formar un caracter del teclado, por ejemplo la letra "A" es representada con el conjunto siguiente en lenguaje máquina: 01000001.

Al conjunto de 1024 bytes, se le conoce como Megabyte (MB). Una canción de 3 minutos equivalen a 4 MB aproximadamente.

De aquí en adelante, las unidades de medida se van agrupando de 1024 en 1024 para formar unidades más grandes, que son: Gigabytes, Terabytes, Petabytes, Exabytes, Zettabytes, Yottabytes y Xerabytes.


Referencias bibliográficas

Maté, C. (2010). Big data. Un Nuevo paradigma de análisis de datos. http://gc.scalahed.com/recursos/files/r161r/w24969w/Recursos/153A.pdf

Ortiz, M., Joyanes, L. y Giraldo, L. (2016). Los desafíos del marketing en la era del big data. http://gc.scalahed.com/recursos/files/r161r/w24969w/Recursos/Desafiosdelmarketing.pdf

Gil, D. (2014). Big Data y marketing digital: una relación imprescindible. http://gc.scalahed.com/recursos/files/r161r/w24969w/Recursos/BigData_y_marketing_digital.pdf




¿Cómo referenciar este artículo?

Tirado, Marcial. (07 de julio de 2022). ¿Qué es Big Data? https://campomarketing.com/2022/07/que-es-big-data.html

Tal vez te interesen estas entradas

No hay comentarios