Google Machine Learning: Die Nutzung von KI war noch nie so einfach

Das maschinelle Lernen (ML) gibt es schon seit Jahrzehnten, aber anfangs war es für Unternehmen fast so unzugänglich wie die Raketenwissenschaft. Der Aufbau künstlicher Intelligenz (KI), die Bilder erkennen oder Vorhersagen über den Erfolg eines neuen Produkts treffen konnte, erforderte erhebliche Investitionen. Die ersten neuronalen Netze waren eher mathematische Experimente als Lösungen, die auf reale Probleme anwendbar waren. Lange Zeit verhinderte der Mangel an verfügbarem Wissen und an leistungsfähiger Hardware, dass KI einem breiten Publikum zugänglich wurde.

Aber die Trends ändern sich, und die Google-Lösungen für maschinelles Lernen spielen eine große Rolle.

Eine immense Menge an Informationen wird ständig verarbeitet, während kostenlose Online-Kurse die Grundlagen der Datenwissenschaft vermitteln. Um eine ML-Initiative zu starten, müssen Sie nicht bei Null anfangen. Es gibt mindestens vier große Konkurrenten, die Machine Learning as a Service (MLaas) anbieten, das einfach zu nutzen ist.

Google Machine Learning Services, Microsofts Azure ML, IBMs Watson und Amazon Web Services AI sind führend auf dem Markt. MLaaS umfasst die Infrastrukturlösungen, die von Cloud-basierten Plattformen angeboten werden, und geht mit KI-Funktionen noch einen Schritt weiter. Neben der Verarbeitung und Speicherung von Daten werden auch automatische Klassifizierungen und Vorhersagen möglich. Für die Erstellung eines benutzerdefinierten Modells und dessen anschließendes Training und Einsatz ist nur ein kleines Team von Datenwissenschaftlern erforderlich. Die Verwendung eines vorgefertigten, trainierten Modells ist sogar noch einfacher und erfordert möglicherweise keine Programmierkenntnisse.

Von den führenden MLaaS-Anbietern gibt dieser Blogbeitrag einen Überblick über die verschiedenen Optionen, die Google Machine Learning Services bieten.

Google Maschinelles Lernen

Google ist einer der Pioniere der KI-Forschung. Der Tech-Riese hat seine Position 2014 mit der Übernahme von DeepMind weiter gestärkt. Das britische Unternehmen für maschinelles Lernen brachte eine große Konzentration von KI-Talenten zu Google und ermöglichte es dem Unternehmen, etwa tausend Deep-Learning-Projekte zu verfolgen. Die meisten davon sind in die bekannten Google-Dienste wie Gmail, YouTube, Maps, Translator und - natürlich - Search integriert. Andere sind Teil von MLaaS-Produkten und können parallel zu der von der Google Cloud Platform bereitgestellten Infrastruktur genutzt werden.

Ein früherer, hoch automatisierter Dienst war die Prediction API, die grundlegende Klassifizierungs- und Regressionsmodelle über eine REST-API bereitstellte. Diese Lösung wurde am 30. April 2018 abgeschafft, da sie nicht populär genug war und von anderen Diensten überholt wurde. An ihre Stelle trat die Cloud Machine Learning Engine zusammen mit Cloud AI. Sie richten sich mit ihren hochgradig anpassbaren Optionen vor allem an Datenwissenschaftler, während eine einfachere Lösung, AutoML, ebenfalls in den Startlöchern steht.

ML Engine

Die ML-Engine ist ein leistungsfähiger Satz von Tools für Datenwissenschaftler und Ingenieure. Sie nutzt die Open-Source-Bibliothek TensorFlow und unterstützt außerdem scikit-learn, Keras und XGBoost. Während TensorFlow die Flexibilität der ML Engine deutlich erhöht, hat sie etwas von der Benutzerfreundlichkeit ihres Vorgängers verloren. Dafür macht TensorFlow die ML-Engine fähig zum Deep Learning; außerdem ist sie hochgradig anpassbar und optimiert. Die Entwickler der Softwarebibliothek, das Team von Google Brain, haben sich zum Ziel gesetzt, die Erstellung von ML- und numerischen Berechnungsmodellen zu vereinfachen.

Die Beherrschung des neuronalen Netzwerk-Frameworks war vielleicht kein sofortiger Erfolg; die Lernkurve ist dramatisch und steil. Aber da die fortschrittlichen mathematischen und Optimierungsalgorithmen sofort einsatzbereit sind, ist es viel einfacher, ein maßgeschneidertes Modell zu implementieren. Vorkenntnisse im Bereich der künstlichen Intelligenz sind von Vorteil, aber nicht zwingend erforderlich, wie das Beispiel dieses japanischen Gurkenbauern zeigt. Makoto Koike, ein ehemaliger Designer für eingebettete Systeme, lernte die Verwendung von TensorFlow anhand von Tutorials und Beispielcode. Schon bald wandte er sein eigenes Deep-Learning-Modell an, um Gurken anhand ihrer Größe, Form und Verzerrung in Preiskategorien zu sortieren.

Neben der umfangreichen Dokumentation ermöglicht TensorFlow Hub auch einige Abkürzungen zu großartigen Ergebnissen. Die Bibliothek bietet eine große Auswahl an wiederverwendbaren ML-Modulen und Transfer Learning (TL). Der TL-Prozess beschleunigt die Trainingsphase und arbeitet mit einem kleineren Datensatz.

Andere Vorteile

Aber die ML Engine ist viel mehr als nur TensorFlow. Das HyperTune-Tool vereinfacht, automatisiert und beschleunigt das Training und lässt Sie Ihre Modelle in Gruppen verwalten. Die Plattform bietet eine großartige Skalierbarkeit bis hin zu riesigen Datenmengen, dank des automatischen Lastausgleichs der Google-Infrastruktur.

Und schließlich ist eines der Alleinstellungsmerkmale der ML Engine ihre Integration mit Google Cloud Dataflow. Die Verbindung dieser beiden Dienste ermöglicht es Ihnen, Google Cloud Storage, BigQuery oder andere Cloud-basierte Speicher in Ihre Infrastruktur einzubinden. So können Daten aus diesen Quellen gelesen und das Ergebnis ebenso einfach geschrieben werden. Weder Batches noch Streams sind ein Hindernis.

Cloud AI APIs

Neben dem hohen Maß an Anpassungsmöglichkeiten, das die Google Machine Learning Engine bietet, gibt es auch vorgefertigte Optionen für den Einsatz. Cloud AI bietet verschiedene REST-APIs, die als Bausteine für intelligente Anwendungen dienen. Die Modelle sind implementiert, optimiert, vortrainiert und getestet, bieten aber bei Bedarf noch Anpassungsmöglichkeiten. Auf die Personalisierung von Modellen mit den Funktionen von AutoML gehen wir später in diesem Beitrag ein. Sowohl die APIs als auch AutoML ermöglichen es Ihnen, Ihr Projekt mit KI zu versorgen, ohne dass Sie über ML-Kenntnisse verfügen müssen.

Die Blöcke von Cloud AI sind in drei Kategorien unterteilt, die jeweils menschenähnlichen Fähigkeiten entsprechen. Sight besteht aus der Cloud Vision API und der Video Intelligence API. Sprache deckt Übersetzungen und natürliche Sprache ab, während Konversation sich um die Umwandlung von Text und Sprache und die Erstellung von Konversationsschnittstellen kümmert. Schauen wir uns einige interessante Anwendungsfälle für einzelne Module und deren Kombinationen an.

Cloud Vision API

Wäre es nicht cool, wenn Sie Ihr Telefon auf eine Jacke richten könnten, die Ihnen gefällt, und sofort deren Marke und Preis wüssten?

Die Cloud Vision API ist nicht nur in der Lage, Bilder wie süße Katzen, alte Damen oder gewalttätige Inhalte zu klassifizieren. Sie kann auch Gesichtsausdrücke erkennen und Angst so genau erkennen, wie sie eine Banane und ein Croissant unterscheiden kann. Neben der Qualitätskontrolle einer Produktionslinie auf fehlerhafte Teile und der Überprüfung der Kundenzufriedenheit kann Vision API auch handgeschriebenen Text lesen.

Versuchen Sie einmal, ein Straßenschild im Ausland zu scannen! In Verbindung mit der Translation API kann Ihre Anwendung diesen mysteriösen Text übersetzen und Ihnen helfen, den Weg zu finden.

Cloud Video Intelligence API

Die Cloud Video Intelligence API kennzeichnet Videos auf ähnliche Weise und generiert durchsuchbare Metadaten. Sie erleichtert die Suche nach dem genauen Zeitpunkt eines Unfalls in Hunderten von Stunden an Überwachungsdaten.

Die Entity Detection zeigt Ihnen, ob ein schwarzer Cadillac auf dem Parkplatz stand, ohne dass Sie sich das Video ansehen müssen. Oder Sie können einfach zum Stan-Lee-Auftritt zurückspringen, wenn Sie ihn in einem Marvel-Film verpasst haben.

Cloud Translation API

Die Cloud Translation API tut genau das, was ihr Name sagt: Sie erkennt die Sprache und übersetzt sie in eine andere. Die spannendsten Anwendungsfälle entstehen, wenn der Übersetzer mit einer anderen API zusammenarbeitet. Zum Beispiel erstellt Speech-To-Text Untertitel für ein Video, das ins Spanische übersetzt wird. Mit Text-To-Speech kann die frisch erstellte Übersetzung dann sogar vertont werden. Gleichzeitig könnte die Natural Language API eine detaillierte Analyse der angesprochenen Themen und der Stimmung des Sprechers hinzufügen.

Auch wenn die APIs viele Anforderungen erfüllen, kann es sein, dass sie einem komplexeren Bedarf nicht gerecht werden. Ohne ein Data-Engineering-Team ist ein TensorFlow-basiertes Projekt vielleicht unerreichbar. In diesem Fall kommt AutoML zur Rettung.

Cloud AutoML

Die AutoML-Dienste basieren zwar immer noch auf den generischen Implementierungen der vorgefertigten Google Machine Learning APIs, verfügen aber auch über eine grafische Benutzeroberfläche (GUI). Über die GUI können Sie das Modell mit Trainingsdaten füttern, die für Ihre Branche spezifisch sind. Für den Prozess sind keine ML-Kenntnisse erforderlich, aber die Genauigkeit der Ergebnisse wird erheblich gesteigert.

AutoML befindet sich derzeit im Beta-Stadium und erweitert die Vision-, Natural Language- und Translation-APIs. In der kurzen Zeit seit Februar 2018 haben sich bereits einige interessante Anwendungsfälle ergeben. Einer der ersten Teilnehmer der Alpha-Version war der Einzelhändler Urban Outfitters. Er nutzte Vision AutoML, um die Suchoptionen in seinem Online-Katalog zu verfeinern. Visuelle Hinweise wie Ausschnitte und Stoffmuster tauchen normalerweise nicht in den Artikelbeschreibungen auf. Und die Standard-API von Vision ist nicht in der Lage, sie zu erkennen. Dennoch beeinflussen sie die Wahl des Kunden, so dass es eine große Verbesserung ist, dass sie mit AutoML zu durchsuchbaren Merkmalen geworden sind.

BigQuery ML

Ein weiterer erwähnenswerter Dienst in Googles KI-Suite ist BigQuery ML, der sich an Analysten richtet. Die Betaversion ermöglicht es Ihnen, ML-Modelle mit Hilfe von Standard-SQL-Anweisungen zu erstellen. Dadurch entfällt die Notwendigkeit der Kodierung und der Fortschritt wird beschleunigt, da die Daten nicht verschoben werden müssen. BigQuery ML ist über die Web-UI, die REST-API, die Befehlszeile und externe Tools mit einfachen Regressions- und Klassifizierungsoptionen verfügbar.

Schlussfolgerungen

Diese Google Machine Learning Services beweisen, dass CEO Sundar Pichai es todernst meint, wenn er von der Demokratisierung der KI spricht. Mit der ML-Engine und TensorFlow bietet Google feinkörnige Lösungen für Dateningenieure. Die Cloud AI APIs bieten Entwicklern und Datenwissenschaftlern vorgefertigte, leicht einsetzbare Dienste. BigQuery ML eröffnet Analysten neue Möglichkeiten, während AutoML die Grenzen für jeden Nutzer erweitert. Bald werden immer mehr Unternehmen von ML profitieren, da es zunehmend verfügbar wird.

Let's talk!