Big Data: Cómo gestionar grandes volúmenes de información

Por Robert Guzmán 31/05/2012



Las grandes organizaciones manejan un volumen de datos cada vez mayor, que crece cada año de manera exponencial. El tratamiento de cantidades de información tan grandes requiere de tecnologías “Big Data”, fuertemente arraigadas en Estados Unidos y con un gran potencial aún por explotar en nuestro país.


El término Big Data hace referencia al conjunto de tecnologías y herramientas que permiten resolver los diferentes tipos de limitaciones asociadas al tratamiento de volúmenes de datos del orden de exabytes (≈1.000 petabytes = 1.000 millones de gigabytes). Las principales organizaciones internacionales manejan millones de gigabytes de información de sus clientes, proveedores, productos y operaciones, generados a partir de información comercial, transacciones, redes sociales, blogs, páginas web, sensores, entre otras fuentes de información. Según el informe de GARTNER de 2011 sobre Big Data, el volumen de datos generados cada año crece de forma exponencial en todos los sectores. Tal es la velocidad con la que aumenta dicho volumen de información, que “el 90% de la información existente, ha sido generada en los últimos dos años” (Fuente: IBM informe “Del reto al éxito: la transformación del marketing en la era digital”).


Según el informe de 2011 realizado por MCKINSEY GLOBAL INSTITUTE sobre el aumento del volumen de información a escala mundial en 2010, se generaron y almacenaron más de 6.500 petabytes de datos (≈6.500 millones de gigabytes). Además, dicho informe prevé un crecimiento de un 40% anual, con Norteamérica y Europa a la cabeza.


Dado el volumen de datos generados, tanto las empresas como la administración pública, se ven en la necesidad de contar con una tecnología capaz de almacenar, procesar y analizar dicha información de manera rápida y eficiente, con el menor coste posible.

Desde principios del 2000, Google viene trabajando con tecnologías que solventan estas barreras técnicas, mediante el uso de herramientas optimizadas que permiten manejar una gran cantidad de datos a una velocidad mayor, y de manera más eficiente y económica. Yahoo!, entre 2006 y 2008, inspirándose en las herramientas desarrolladas por Google, crea Hadoop, una tecnología Open Source que usa extensivamente en su negocio.

Hadoop ha tenido una gran acogida a nivel internacional por su robustez, fiabilidad y carácter gratuito. Según GIGAOM, “La mayoría de las grandes empresas a nivel mundial están, al menos, experimentando con esta tecnología”Algunas de estas compañías son TelefónicaBank of AmericaEbayFacebook, Tuenti o Twitter, que hacen uso de tecnología Big Data basada en Hadoop desde hace varios años. Son sólo un ejemplo de tantas grandes compañías que precisan soluciones para almacenar y procesar el elevado volumen de datos que manejan, sin que sea necesaria una gran inversión en infraestructura. Facebook y Yahoo cuentan con los mayores cluster de Hadoop del mundo, en concreto, Yahoo cuenta con un centro de procesamiento de datos con alrededor de 42.000 máquinas que almacenan un volumen de información en torno a los 200 millones de gigabytes.

Facebook Data Center en Prineville (Oregón)

En España, las tecnologías Big Data están irrumpiendo con mucha fuerza, dotando a las compañías de nuevas armas de venta en un entorno de mercado muy competitivo. Uno de los exponentes técnicos en este entorno es PRAGSIS, compañía española líder en soluciones Big Data a través de su plataforma Open Source BIDOOP basada en la tecnología HadoopDavid Millán (Head of Big Data Solutions en PRAGSIS) explica de forma sencilla las razones por las que contar con una plataforma de gestión de grandes volúmenes de datos como BIDOOP:

“Las empresas, y la sociedad en su visión más amplia, están generando un mar de información del que se está procesando y analizando menos de un 15%. La información es un valioso activo que las empresas tienen que aprender a analizar y explotar en su totalidad para conseguir ser más competitivas en un mercado cada vez más complicado y saturado. El análisis exhaustivo de la información generada por las empresas, ayuda a reducir costes, a maximizar el beneficio y, sobre todo, a generar nuevos negocios no imaginados hasta la fecha. BIDOOP ofrece nuevas dimensiones y posibilidades empresariales pues ayuda a canalizar, procesar e interpretar grandes volúmenes de información de diversa índole. Si además añadimos que BIDOOP es de código abierto, que no hay que abonar licencias de ningún tipo y que se sustenta en hardware de bajo coste, las ventajas y beneficios son aún mucho mayores.”

La tecnología BIDOOP, ofrece la solución a las barreras tecnológicas que plantea el tratamiento de datos a gran escala, una herramienta de calidad, fiable y de bajo coste. Con esta plataforma, Pragsis se posiciona como el principal referente a nivel nacional en tecnologíasBig Data. Próximamente, Pragsis ampliará sus horizontes con la apertura de sus nuevas sedes en México y Brasil.


Fuente: Nota de prensa

No hay comentarios:

Publicar un comentario

Si tienes algún aporte, duda o comentario sobre este post dínoslo en los comentarios.

 
Diseñado por RDConnection.net | Diseñada para RDConnection.net | Robert Guzman