Simplificando el análisis de Big Data con un software de código abierto
2 de noviembre de 2015 — Durante el IoT Day en San Francisco, Intel discutió el crecimiento continuo de un ecosistema alrededor de Trusted Analytics Platform (TAP), incluyendo soluciones que están siendo implementadas con Levi Strauss & Co* y Honeywell*. TAP es un proyecto de código abierto, Iniciado por Intel, que simplifica y acelera la creación de aplicaciones seguras y de alto rendimiento para el análisis de Big Data en entornos de nube, que pueden integrarse en una solución IoT completa. Diseñada para desarrolladores y científicos de datos, TAP reduce los costos de desarrollo y el time-to-market. Es la plataforma ideal para una amplia gama de sectores de actividad tales como salud, venta por menor e industria. Intel divulgó previamente proyectos pilotos con Penn Medicine*, Icahn School of Medicine at Mount Sinai* y Oregon Health & Science University* (OHSU).
Cada organización puede ganar una ventaja competitiva, aumentar la eficiencia operacional o garantizar la lealtad de los clientes mediante el análisis de datos. Sin embargo, muchas se ven impedidas por la falta de competencia en ciencia de datos necesaria para implementar una solución de análisis de Big Data y administrar la complejidad de una infraestructura para grandes volúmenes.
TAP incluye las herramientas, algoritmos y mecanismos necesarios para hacer más fácil para desarrolladores la colaboración con científicos de datos en un entorno compartido, llevando a cabo un análisis avanzado. TAP usa un software de código abierto con recursos de seguridad y rendimiento mejorado por hardware. La plataforma ofrece una solución completa con tres capas principales:
- Capa de datos que incluye Apache Hadoop*, Spark* y otros componentes de datos optimizados para rendimiento y seguridad.
- Capa de análisis que incluye un kit de herramientas para ciencia de datos que simplifica el desarrollo de modelos y una estructura extensible para crear APIs predictivas.
- Capa de aplicación que incluye un entorno de ejecución gestionado para aplicaciones de nube nativas.
Colaboración con integrantes del mercado
TAP ha sido probada por científicos de datos en proyectos pilotos de varias organizaciones y es ideal para diversos sectores de actividad tales como salud, venta por menor, gas & energía e industria.
- Levi Strauss & Co.: La marca icónica está trabajando con Intel para utilizar tecnologías que mejoren la experiencia de los compradores en las tiendas. TAP permite que Levi Strauss & Co recoja datos de inventarios en las tiendas vía etiquetas RFID y realce análisis de datos. El análisis puede ayudar a Levi Strauss a mejorar la experiencia del comprador a través de la mayor precisión de los datos. Por ejemplo, puede entender mejor cuales artículos pueden estar fuera de su lugar dentro de una tienda.
- Honeywell:
- Penn Medicine*:
- Icahn School of Medicine at Mount Sinai*: Icahn School of Medicine at Mount Sinai está explorando la posibilidad de aplicar los avances en la ciencia de datos al descubrimiento de fármacos terapéuticos a través del programa DrugGraph. Usando TAP, la escuela puede reducir enormemente la complejidad del proceso de análisis de grandes volúmenes de datos y alcanzar rápidamente –y al menor costo- el descubrimiento de nuevas terapias con drogas; mejorar los resultados en los pacientes reduciendo reacciones a la droga; y reducir los costos del tratamiento al predecir nuevos usos para los compuestos actuales.
- Oregon Health & Science University (OHSU): Intel y OHSU están desarrollando la “Collaborative Cancer Cloud”,» una solución de análisis de Big Data para medicina de precisión, que permite a los hospitales compartir de forma segura datos genómicos de pacientes, para viabilizar potencialmente descubrimientos y, así, salvar vidas. OHSU está utilizando TAP para administrar con seguridad datos de pacientes recogidos de dispositivos vestibles, laboratorios y encuestas en una localidad central. El despliegue recoge más de 3 millones de registros cada día, que son añadidos a más de 360 millones de registros ya en el sistema. Los científicos de datos de OHSU están utilizando TAP para analizar los datos y encontrar nuevas formas de determinar la situación general de salud del individuo.
TAP cuenta con el soporte de una variedad de socios incluyendo Accenture*, Arcadia*, Cask*, Cloudera*, Conduce*, DataRobot*, DeepSense*, H20*, Infosys*, Koverse*, Objectivity*, Silicon Valley Data Science*, Skymind*, Talena* y Typesafe*. TAP también está siendo pruebo para implementación en varias infraestructuras de nube pública incluyendo Amazon Web Services* (AWS*), Rackspace * y OVH.com*.
Declaraciones
«Penn Medicine está trabajando con Intel para revolucionar los cuidados con la salud mediante el uso de análisis avanzado para predecir enfermedades en el paciente antes de que los médicos puedan encontrar», dijo Mike Draugelis, científico principal de datos de Penn Medicine. «Hoy estamos siempre iterando, siempre volviendo a decir que no podemos mejorar este modelo y preguntando si algo satisface las demandas de nuestros médicos. Con soluciones de código abierto y basadas en la nube como la Trusted Analytics Platform, tenemos el potencial para proporcionar a nuestros clínicos y científicos de datos una plataforma para desarrollo y prueba donde podemos rápidamente crear, explorar y desplegar nuestras aplicaciones analíticas.»
«En Mount Sinai, somos buenos en desarrollar algoritmos de Big Data para modelado gráfico, pero hacerlos ejecutar a escala es muy difícil», dijo Dr. Joel Dudley, director de Informática Biomédica de Icahn School of Medicine at Mount Sinai. «Usar Trusted Analytics Platform con Intel realmente solucionó ese problema, nos permitiendo implementar estos algoritmos de una manera muy escalable. Esta es una propuesta de valor única. Podemos nos enfocar en el aspecto científico de nuestro proyecto DrugGraph sin nos preocupar con la ampliación y las limitaciones del volumen de los datos. «
«OHSU y Intel se han comprometido a trabajar juntas para promover progresos científicos dirigidos a la comprensión de los orígenes de las enfermedades», dijo Adam Margolin, Ph.D., director de biología computacional en Oregon Health & Science University. «Para hacer eso, necesitamos herramientas de información robustas y seguras capaces de manejar los sorprendentes volúmenes de datos generados en el proceso. La Trusted Analytics Platform es un ejemplo del tipo de herramienta de nueva generación que será esencial para nuestro trabajo.»