• Ventas: 1-800-961-2888
  • Servicio: 1-800-961-4454

Grandes volúmenes de datos en la nube abierta


Rackspace® Private Cloud, impulsada por OpenStack®, ayuda a reducir los costos y mejorar la eficiencia operativa

1. Introducción

El grupo de Inteligencia Comercial Empresarial (EBI, por sus siglas en inglés) de Rackspace® es un equipo central que agrega, gestiona y proporciona inteligencia comercial sobre datos de varias fuentes de datos indispensables para empresas. Para seguir el ritmo del crecimiento y la infraestructura tecnológica de los clientes, EBI quiso consolidar los volúmenes de crecimiento rápido para la creación de informes, tendencias y análisis. Este caso práctico destaca cómo la EBI de usó la Rackspace Private Cloud Software para impulsar una solución de grandes volúmenes de datos basada en la nube mientras que reduce los costos y mejora la eficacia operativa.

2. Transformación de bytes en inteligencia comercial

El depósito de datos heredados consiste en soluciones de proveedores de bases de datos en servidores dedicados. Los puntos de datos incluyen datos de cuentas, información de uso y facturación del cliente, con una interoperabilidad de un conjunto de herramientas de inteligencia comercial de Informática y Qlikview. Desde un nivel operativo, todos los datos se vuelven inmanejables una vez que la información como las mediciones de apoyo, el monitoreo y la respuesta se producen desde dispositivos, dedicados virtuales y de nube.

La creación de informes diarios se convirtió en un proceso que lleva tiempo y utiliza muchos recursos, solo se produce por la noche y con un punto de datos con 24 horas de retardo. Los costos de licencias de bases de datos comerciales y hardware estaban aumentando de manera desproporcionada mientras que el equipo de EBI trabajaba con los administradores de la base de datos para incrementar rápidamente la capacidad durante las horas pico. Por último, la configuración heredada no pudo manejar muy bien los datos no estructurados y el equipo quería ser capaz de aplicar varias de las mejores tecnologías (por ejemplo, columnar, noSQL, SQL) solas o combinadas dependiendo del tipo y tamaño de datos que querían almacenar y analizar.

Para continuar sirviendo a las empresas en forma eficiente y efectiva, la EBI reunió los requisitos para una solución nueva. Nombrada la Red Cómputo Analítico (ACG, por sus siglas en inglés), la solución actuaría como la piedra angular para la EBI y necesitaba ser capaz de:

  • Albergar un grupo de datos en crecimiento constante recolectados en distintos formatos, estructurados y sin estructura, de unidades empresariales múltiples dentro de Rackspace
  • Reducir e incrementar los recursos en forma rápida y dinámica para satisfacer las demandas empresariales eficientemente
  • Agregar recursos nuevos sobre la marcha sin tener que esperar un aprovisionamiento nuevo de hardware durante las horas pico
  • Ejecutar varias de las mejores tecnologías de volúmenes de datos para almacenar, gestionar, analizar y distribuir datos en una plataforma de tecnología
  • Permitir que el equipo de EBI se aparte de los aumentos de cargos de licencias de bases de datos comerciales
  • Usar API abiertas para facilitar la integración y el acceso programático con otros sistemas empresariales y herramientas de BI
  • Respaldar los requisitos de seguridad y cumplimiento de normas de Rackspace
  • Adoptar tecnologías de nube abierta y código abierto

Teniendo en cuenta todos esos requisitos, el equipo de EBI de Rackspace luego evalúo las siguientes opciones:
  
Opción 1: Mantenga el curso
Ventajas

  • Interrupción mínima a corto plazo para proyectos existentes y usuarios finales
  • No se necesita capacitación adicional
  • Podía seguir aprovechando el servicio técnico de proveedor

Desventajas

  • Los costos de las licencias aumentaron a medida que se incrementaron los volúmenes de datos
  • Servicio de administración de base de datos (DBA, por sus siglas en inglés) para los recursos distribuidos en múltiples bases de datos OLTP y bases de datos de BI.
  • Escalabilidad de sistemas: ampliar el sistema actual junto con los volúmenes de datos crecientes lleva mucho tiempo
  • Las tecnologías actuales no ofrecen servicio técnico para grandes volúmenes de datos
  • Los productos de base de datos comerciales heredados no incrementan ni reducen el rendimiento con el volumen de datos. Para hacer que estos productos se expandan se necesita un complejo espacio de ocupación con servidores agrupados. Además, ambos proveedores recomiendan su propia infraestructura y tecnología de base de datos de propiedad privada.

Opción 2: Compre un dispositivo de procesamiento paralelo pasivo (MPP, por sus siglas en inglés)
Ventajas

  • Alto rendimiento
  • Diseñado expresamente para cargas de trabajo de BI
  • Interoperabilidad con conjuntos de herramientas de BI existentes
  • Cartera grande de clientes de BI con un amplio conjunto de características proporcionado por proveedores

Desventajas

  • Costos altos relacionados con el ambiente actual, incluyendo los costos para adquirir los dispositivos, cargos de configuración, licencias, mantenimiento, capacitación, etc.
  • Configuraciones de hardware y motores de bases de datos de propiedad privada

Opción 3: Ejecución de aplicaciones de BI heredadas en software de virtualización comercial
Ventajas

  • Más eficiente que ejecutar un hardware físico
  • Un poco de elasticidad para "incrementar" las máquinas virtuales y expandir el espacio ocupado
  • Migración relativamente fácil de aplicaciones de BI heredadas para infraestructura virtualizada

Desventajas

  • Capacidades limitadas de "contraer" y compartir recursos en comparación con un ambiente de nube
  • Cargos adicionales por licencia
  • Preocupaciones de desarrollar y no quedar atado a un software de virtualización comercial de propiedad privada y con licencia

Opción 4: Solución de código abierto integral en Rackspace Private Cloud Ventajas

  • Permite reducir y retroceder más rápido que en el hardware en silos o servidores virtualizados
  • Una oferta tecnológica completa de código abierto, lo que evita ataduras con proveedores
  • Habilidad para aprovechar el hardware estándar
  • Sin costos por licencia de software
  • Sacar ventaja de la innovación rápida en plataformas de código abierto debido a la participación y contribución de la comunidad
  • Habilidad para aprovechar recursos de nube pública cuando sea apropiado

Desventajas

  • Capacitación de programadores y usuarios finales en tecnologías nuevas
  • Migración grande
  • Debe desarrollar, comprar o encontrar adaptadores para herramientas de BI

 

3. La elección: Solución de código abierto integral en Rackspace Private Cloud


Estos requisitos llevaron a que la EBI diseñe y desarrolle una oferta basada en tecnologías de código abierto, desde infraestructura hasta software de grandes volúmenes de datos, para permitir expansiones o reducciones rápidas. La plataforma de infraestructura subyacente que eligieron fue Rackspace Private Cloud, impulsada por OpenStack®, en conjunto con Cassandra, Hadoop y PostgreSQL. La solución se denominó Red Cómputo Analítico o ACG.

La ACG es una plataforma de software de gestión de grandes volúmenes de datos creada en el software Rackspace Private Cloud. Como beneficio principal, proporciona una solución unificada y flexible para almacenar, analizar, distribuir y presentar los datos basándose en un tipo de datos (estructurados o no estructurados), operación (almacenamiento o análisis de datos) y la experiencia del consumidor (científico de datos que accede mediante API o analista de mercadotecnia que usa herramientas de BI para generar informes).

4. Los resultados

• Ahora la EBI puede procesar terabytes de datos por día en tiempo real o cuando se necesite
• Las tareas de proceso que llevaban seis días en el sistema heredado se redujeron a tres horas
• Las herramientas de BI existentes se pueden aprovechar al personalizar las PI ANSI SQL y se pueden agregar las tecnologías tradicionales mediante extensiones
• La ACG redujo la necesidad de dos administradores adicionales
• Las tendencias y la creación de informes de datos mejorados se utilizan en la actualidad para mejorar las capacidades del servicio técnico y la experiencia para clientes de Rackspace

5. Conclusión

Al crear una sola plataforma integral usando tecnologías de código abierto, la Red Cómputo Analítico del equipo de Inteligencia Comercial Empresarial puede manejar el almacenamiento, el análisis y la distribución de datos, a escala y de manera oportuna. Las herramientas para grandes volúmenes de datos disponibles en la actualidad ayudaron a resolver el problema pero se necesitaron formas nuevas de pensar en la estructura, los procesos y los datos subyacentes para que sea una realidad. La ACG, que se creó usando Rackspace Private Cloud, impulsada por OpenStack, Hadoop, Cassandra y otras herramientas, dio como resultado velocidades de procesamiento de datos y una reducción significativa en el total de inversión de capital y costos operativos en curso. Las unidades empresariales múltiples en Rackspace ahora pueden tomar decisiones casi en tiempo real que pueden beneficiar en forma directa a los clientes de Rackspace.







© 2011-2013 Rackspace US, Inc.

Excepto cuando se indique lo contrario, el contenido de este sitio está bajo una licencia Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License


Ver especificaciones de licencia y DESCARGO DE RESPONSABILIDAD