Swami Sivasubramanian gibt Einblicke in die Zukunftssicherung, Vernetzung und Demokratisierung von Daten

by Ken Pagano, Senior Customer Solutions Architect, Onica by Rackspace Technology

a man,Swami Sivasubramanian, with glasses and wearing a suit presenting

 

Dies war meine dritte Reise zu AWS re:Invent, und in diesem Jahr kam ich mit einem Fokus auf Datenanalyse und Data Science an, in der Hoffnung, ein tieferes Verständnis für Situationen zu erlangen, für die unsere Kunden uns häufig engagiert haben. Die Technik-Veranstaltungen, für die ich mich angemeldet habe, taten genau das, aber ich war noch mehr beeindruckt von der Nachfrage nach diesen Sitzungen. Die meisten, wenn nicht alle, waren bis auf den letzten Platz gefüllt. Die Themen waren sehr unterschiedlich, aber in den meisten Veranstaltungen, an denen ich teilnahm, gab es einige Gemeinsamkeiten. Dabei wurde unter anderem erörtert, wie Daten in ETL-Pipelines schnell verarbeitet werden müssen, bevor sie an Wert verlieren, wie Unternehmen bei der Verarbeitung großer Datenmengen auf Skalierbarkeit achten müssen und wie die Demokratisierung von Daten aussieht. Diese Themen tauchten heute Morgen während der Keynote von Swami Sivasubramanian wieder auf.

Sivasubramanian, Vice President of Data and Machine Learning bei AWS, ging mit farbenfrohen Analogien der Neurowissenschaften und des menschlichen Gehirns noch einen Schritt weiter und nutzte die Lektionen alter indischer Stämme, die Baumwurzeln züchteten, um Brücken über Täler zu errichten. Insgeheim war ich jedoch fasziniert von den Parallelen, die er in seinem Vortrag darüber zog, wie Daten in Organisationen mit dem menschlichen Denkprozess verglichen werden können und wie die Hindernisse innerhalb von Organisationen verhindern, dass Daten, die natürlicherweise in Silos gespeichert werden, durch analytische Pfade fließen.

Sivasubramanian ging in seiner Keynote auf drei Hauptthemen ein, die als moderne Datenstrategien für alle Unternehmen geeignet sind. Das erste Thema war die Zukunftssicherheit einer Datengrundlage, um schwere Lasten zu beseitigen, das zweite war das Bindegewebe zwischen Silos und das dritte die Demokratisierung von Daten im gesamten Unternehmen, wobei er sich auf die gleichen aufschlussreichen Analogien bezog, mit denen er begann.

Zu Beginn der Sitzung wurde die erste große Ankündigung von Amazon Athena für Apache Spark gemacht, eine neue Fähigkeit von Athena für interaktive Analysen auf Apache Spark, die es den Benutzern ermöglicht, Anwendungen für Spark über eine vereinfachte Notebook-Schnittstelle in der Konsole oder APIs von Athena zu erstellen. Wenige Minuten später wurde auch Amazon DocumentDB Elastic Clusters angekündigt, das eine Skalierung und Verarbeitung einer beliebigen Anzahl von Lese-und Schreibanforderungen mit geringen bis gar keinen Ausfallzeiten ermöglicht.

Der erste Gastredner war Rathi Murthy, CTO der Expedia Group und Präsident von Expedia Product & Technology. Murthy sprach darüber, wie ihr Unternehmen das Reiseverhalten seiner Kunden und die Bedürfnisse seiner Partner als Katalysator nutzt, um nicht nur das eigene Unternehmen, sondern auch die Reisebranche selbst zu verändern. Murthy sprach über die Leistungsfähigkeit von Daten und Innovationen. Sie erzählte, wie ihr Team Service für KI und Machine Learning wie HA-Konfigurationen von EKS, DynamoDB und SageMaker nutzt, um fast 600 Milliarden KI-Vorhersagen pro Jahr zu treffen, die auf über 70 Petabyte Daten basieren, und wie sie 360.000 Permutationen einer Seite einer ihrer Marken haben, um die Skalierung zu demonstrieren. Sie demonstrierte die Innovation ihres Geschäftsmodells für Reisebuchungen, das die Kundenerfahrung durch Empfehlungen und Vorhersagen in Verbindung mit Flugrouten verbessert, so dass Kunden ihre Reisen mit Zuversicht buchen können.

Wir haben auch erfahren, dass Geospatial ML für Amazon SageMaker jetzt integrierte Visualisierungstools und vortrainierte neuronale Netze für häufige Anwendungsfälle unterstützt. Auf diese Ankündigung folgte ein zweiter Gastredner, Kumar Chellapilla, GM, ML/AI Services, AWS, der überzeugend demonstrierte, wie maschinelles Lernen und leicht verfügbare Satellitenbilder dabei helfen können, Naturkatastrophen vorherzusagen und Notfallzeiten mithilfe von Geodaten zu verwalten, um lebensrettende Entscheidungen für Ersthelfer zu treffen.

Ich war auch begeistert, als ich erfuhr, dass die AWS Machine Learning University jetzt auch Schulungen für Pädagogen anbietet, ein Train-the-Trainer-Programm, das Stipendien vergibt, die Bildungseinrichtungen helfen sollen, mit der Nachfrage nach Machine Learning Schritt zu halten. AWS prognostiziert, dass das Wachstum von KI und Service für Machine Learning zu einer so großen Nachfrage führen wird, dass sie bald das Angebot an Pädagogen in diesem Bereich übertreffen wird. Man könnte argumentieren, dass dies bereits geschehen ist, aber diese Programmankündigung unterstreicht die Bedeutung, welche die Praxis von Machine Learning in unserem Bereich bereits hat.

Shikha Verma, Head of Product, Amazon DataZone, demonstrierte, wie Datenproduzenten und Konsumenten — z. B. Analysten, Wissenschaftler und Ingenieure — innerhalb einer einheitlichen Zone verwaltet werden können, um Ressourcen zu verwalten und gemeinsam zu nutzen, für die es normalerweise schwierig ist, Berechtigungen zu vergeben oder Zugriff zu gewähren.

Anna Berg Asberg, Global VP, R&D, AstraZeneca, gab eine überzeugende und herzliche Präsentation darüber, wie AstraZeneca Daten und KI und Machine Learning nutzt, um das Leben von Patienten zu schützen. Sie sprach über die enorme Größe der Genomdatenbank, die 25 Petabyte Daten über das globale AWS-Netzwerk nutzt, und darüber, wie ihre Umgebung Step Functions, Lambda und AWS Batch zur Optimierung ihrer Rechenlasten und Amazon S3 für die Speicherung verwendet. Über 110 Milliarden an statistischen Tests können in weniger als 30 Stunden durchgeführt werden, was zu verwertbaren Erkenntnissen für Wissenschaftler führt. Asberg erläuterte auch, wie Patientendaten, Tumorgewebedaten und medizinische Bilder zusammengeführt werden, um Muster bei Patienten zu erkennen und Vorhersagen für sie zu treffen, und dass es in diesem Bereich ein explosives Wachstum gibt. Ihre Hauptbotschaft konzentrierte sich darauf, wie Unternehmen Daten demokratisieren müssen, indem sie SageMaker und Service Catalog nutzen, um MLOps-Umgebungen in nur wenigen Minuten zu erstellen.

Abschließend verwies Sivasubramanian auch auf die Zeit, die durch den Aufwand verloren geht, wenn Organisationen und Teams versuchen, Daten über Silos hinweg manuell zu verbinden. Dieser Aufwand erfordert oft sehr komplexe ETL-Prozesse (Extrahieren, Transformieren und Laden). Jedes Mal, wenn ein Unternehmen eine neue Datenabfrage durchführen möchte, muss es ein anderes Modell für Machine Learning und eine andere ETL-Datenpipeline dafür erstellen. Aus diesem Grund investiert AWS in eine Zero-ETL-Zukunft, damit die Datenintegration nahtlos erfolgen kann und Unternehmen nicht jedes Mal Datenpipelines manuell erstellen müssen, wenn dies geschieht.

Die abschließenden Gedanken Sivasubramanians für die Sitzung bezogen sich darauf, was es für eine Organisation braucht, um aussagekräftige Einblicke in Daten zu schaffen. Er erklärte: „Es sind Einzelpersonen, die letztendlich diese Funken erzeugen, aber es liegt in der Verantwortung der Führungskräfte, sie mit einer datengesteuerten Kultur zu befähigen, um ihnen zu helfen, dorthin zu gelangen.“  Stellen Sie sich vor, welche Erkenntnisse Ihr Unternehmen mit der richtigen Grundlage für die Datenanalyse gewinnen kann.

Erfahren Sie mehr über Onica von Rackspace Technology