2018-08-14 07:21:10

Put Machine Data to Work

Christian Lutz

Christian Lutz

Crate.io hat vor Kurzem eine internationale Series-A-Finanzierung in der Höhe von elf Millionen Dollar erhalten. Das Unternehmen will das Geld für die Weiterentwicklung der Datenmanagementlösung für IoT- und Maschinendaten sowie die weltweite Vermarktung nutzen.

Wir haben mit Crate-Mitgründer und CEO Christian Lutz über die Herausforderungen im IoT-Datenmanagement, Industrie 4.0 und die Neuerungen beim Vorarlberger Vorzeige-Startup gesprochen.

NetzWerker.News: Hallo Christian, danke, dass du dir Zeit nimmst. Bevor wir uns der Technik widmen, vielleicht ein paar kurze Worte zu Dir und Eurem Unternehmen.

Christian Lutz: Hallo Mathias, danke für die Einladung. Mein Partner Jodok Batlogg und ich haben Crate 2013 gegründet und bereits 2014 unsere Datenbank CrateDB Open-Source auf Github zur Verfügung gestellt. Unser Produkt ist eine Echtzeit SQL-Datenbank, die für die Verarbeitung von IoT- und Machine-Data optimiert ist. Anders als es der deutsche Begriff vielleicht vermuten lassen könnte, umfasst dies alle möglichen Daten, die automatisiert von Sensoren und Geräten gesammelt werden. Das schließt neben Produktionsdaten beliebige Zeitreihen oder auch Informationen von Wearables, GPS-Empfänger oder ähnlichen Anwendungen mit ein. Wir sind also überall da im Einsatz, wo die Verarbeitung von Big-Data gefordert ist.

Ihr habt in kurzer Zeit eine rasante Entwicklung hingelegt und internationale Kapitalgeber von dem Investment überzeugt. Wie erklärst Du diesen Erfolg?

IoT und die Verarbeitung von Big-Data sind ein explodierender Markt, die dahinter stehende Technik ist allerdings alles andere als trivial. Konventionelle Systeme sind nur bedingt in der Lage, die neuen Anforderungen zu erfüllen. Das gilt insbesondere auch für die Datenbank. Wir steigen mit unserer Lösung da ein, wo andere ihre Grenzen finden. Der Markt hat dies schnell honoriert. Inzwischen haben wir Präsenzen in unserer Heimat Dornbirn, in Berlin,San Francisco und New York.

Du sagst, ihr spezialisiert euch auf Machine-Data. Worin liegt die Herausforderung dabei?

Die Herausforderung liegt in der, wie wir es nennen, “Firehose of Data”, also den immensen Mengen und unterschiedlichen Ausprägungen der erhobenen Daten. Ähnlich wie mit Hochdruck Wasser aus einem Feuerwehrschlauch schießt, feuern Sensoren, Geräte und Computer gleichzeitig einen ganzen Schwall komplexer Datensätze, die ein Datenmanagementsystem bewältigen muss. Es ist ja nicht nur beispielsweise ein einzelner Temperaturwert, sondern die gesamte Notation der Quelle, die im sogenannten JSON-Dokument hinterlegt ist. Die muss in der Datenbank in Echtzeit gespeichert und für die Weiterverarbeitung verfügbar gemacht werden. Um das allerdings zu bewerkstelligen, benötigt man normalerweise mindestens zwei oder drei unterschiedliche Datenbanken. Für die Speicherung der immensen Datenmengen eine NoSQL-Datenbank und fürrelationale Daten eine SQL-Datenbank. Traditionelle Datenbanken können also nicht angemessen mit Machine-Data umgehen. Das war der Ursprungsgedanke für die Gründung von Crate. Und selbst vor vier Jahren bedeutete “Big-Data” noch gar nichts im Vergleich zu den Datenströmen von heute.

Andere Datenbanken geraten also an ihre Grenzen, wenn es darum geht, IoT- und Maschinendaten zu verarbeiten. Was macht CrateDB denn anders als die Konkurrenz?

Richtig. Je größer eine Datenmenge und parallele Last ist, desto eher stoßen SQL-Datenbanken an ihre Grenzen. Sie erfordern allerdings oft einen hohen finanziellen Aufwand und sind sehr komplex in der Wartung. No-SQL eignet sich zwar für größere Datenmengen, bietet aber keine Möglichkeit, Standard-SQL zu verwenden. SQL ist allerdings die Lingua Franka der Industrie, daher war es uns wichtig, dass Ingenieure keine neue Programmiersprache lernen müssen, um mit Crate zu arbeiten.

Im Gegensatz zu reinen Cloud-Lösungen kann CrateDB bei gleichbleibender Funktionalität auch hybrid oder direkt auf dem Gerät - on the edge - laufen. CrateDB ist ein hochskalierbarer, verteilter Columnar-Store mit Standard-SQL-Interface. Unterhalb der SQL-Engine benutzt CrateDB NoSQL-Technologie auf Basis von Lucene für Indizierung und Clustering. Dadurch kombiniert CrateDB die Vorteile von sowohl NoSQL- als auch SQL-Datenbanken.

Die CrateDB SQL-Engine unterstützt auch komplexe Abfragen, selbst über verschachtelte Datenstrukturen hinweg und zeigt dabei eine hervorragende Performance. Das ist ein wesentlichen Vorteil von CrateDB gegenüber herkömmlichen NoSQL-Alternativen. CrateDB ist ausgelegt für viele parallellaufende Schreibe- und Lesevorgänge; dadurch ist CrateDB in IoT-Umgebungen, in denen genau diese Funktionen gebraucht werden, ein vielfaches schneller und günstiger im Betrieb als die Konkurrenz.

Ihr habt kürzlich die Crate Machine Data Platform vorgestellt. Sie richtet sich explizit an Industrieunternehmen und IoT-Plattformen. Wieso sollten sie nicht weiterhin eure Open-Source-Datenbank nutzen?

Stichwort: Time-to-Value. Mit der neuen Crate Machine Data Platform wollen wir Unternehmen die möglichst schnelle und unkomplizierte Nutzung von Maschinendaten ermöglichen. Wir nehmen ihnen den sonst zeitaufwändigen Aufbau von Sensorenanbindungen und den Betrieb des Echtzeit-Datenmanagementsystems ab. Die Crate Machine Data Platform ist als Cloud-Native-Stack und als gehostetes Angebot über Azure oder als On-Premise-Installation verfügbar. Anders als bei der CrateDB müssen sich Nutzer nicht um das Hosting kümmern. Der Funktionsumfang, den sich beide Lösungen teilen, umfasst unter anderem die Datenanreicherung zur Erzeugung bereinigter, konsistenter und analytischer Datensätze, eine skalierbare Datenübermittlung in Hochgeschwindigkeit, eine Echtzeit-Datenanalyse, Visualisierung rollenbasierte Zugangskontrolle sowie verschlüsselte und authentifizierte Zugriffe sowie operationale Trigger und Alarme. Speicher für inkrementelle Backups, ein umfangreiches Monitoring und Logging erleichtern Administratoren das Leben.

Wie schätzt du die Entwicklung der Branche ein?

Datenmanagementsysteme wie Crate werden in Zukunft immer wichtiger werden. Das gilt insbesondere für den analytischen Sektor, um die Herausforderung immer größerer Datenmengen zu bewältigen. Mit dieser Idee einer hoch skalierbaren, verteilten Datenbank, wie es bereits der Ansatz der NoSQL-Datenbank ist, kombiniert mit der standardisierten SQL-Abfragesprache, liefert Crate ein wichtiges Werkzeug für sämtliche Anwendungsbereiche und Industrien, in denen Daten eine Rolle spielen.

Herzlichen Glückwunsch übrigens zu der erfolgreichen Finanzierungsrunde. Wohin mit dem Geld?

Wir werden die 11 Millionen Dollar in den nächsten zwei Jahren vor allem in das Team investieren. Wir haben aktuell 30 Mitarbeiter, von denen rund die Hälfte in Österreich tätig ist. In den Niederlassungen Berlin, San Francisco und New York wird das Team stark ausgebaut, vor allem in Sales, Pre-Sales und Marketing. In Dornbirn, wo unser Technologie-Herz schlägt, wird als Engineering-Standort massiv ausgebaut.

Schön zu hören, dass ihr der Heimat treu bleibt. In diesem Sinne, vielen Dank für deine Zeit, Christian.

Über Christian Lutz:

Christian ist Mitgründer und Geschäftsführer von Crate.io. Er ist seit 15 Jahren als erfolgreicher Serial Entrepreneur und Operational Manager mit umfangreichen Kenntnissen in den Bereichen Internet, Telekommunikation, mobiles Internet, Software, Medien und Konsumgüter tätig.

Christian baute mehrere Softwarefirmen erfolgreich auf, darunter Enterprise-Delivery-Plattformen und große Verbraucherportale. Darunter sind beispielsweise sms.at, uboot.com oder Impossible Project.

Er studierte Wirtschaftsingenieurwesen an Technischen Universität Wien. Außerdem absolvierte er 2009-2011 an der Harvard Business School das Owner/President Management Program.

Über Crate.io

Crate.io ist der Entwickler der CrateDB, einer verteilten Open-Source-Datenbank, die Skalierbarkeit und Performance von NoSQL mit der Leistungsfähigkeit und Einfachheit von Standard-SQL verknüpft. Dafür entwickelt, um insbesondere IoT- und Maschinendaten-Applikationen zu unterstützen, ist Crate.io für containerisierte Umgebungen optimiert. Crate wurde im Juni 2013 von Jodok Batlogg, Christian Lutz und Bernd Dorn gegründet. Crate.io hat seinen Hauptsitz in San Francisco und Niederlassungen in Berlin, New York City und Dornbirn, Österreich.

CrateDB kann Millionen an Datenpunkten pro Sekunde aufnehmen und gleichzeitig Terabytes an Daten in Echtzeit verarbeiten. So können verschiedenste Datenstrukturen bearbeitet und komplexe Abfragen durchgeführt werden, beispielsweise Zeitreihen, Geodaten, Textsuche und maschinelles Lernen.

mat

Druckversion

Zum Thema