Cloud

Die Cloud ist nicht nur kosteneffizienter als unternehmenseigene Server, sie bietet Unternehmen auch die Grundlage für die Entwicklung neuester, schnell skalierbarer Produkte und Geschäftsmodelle. Das stärkt ihre Innovationskraft und Wettbewerbsfähigkeit.

Wir sehen die Cloud als Schlüsseltechnologie für die Beschleunigung der digitalen Transformation. Welche Cloud (AWS vs Azure) oder Cloud-Architekur für den jeweiligen Anwendungsfall notwendig ist, gilt es detailliert zu prüfen.

Data Lake

Der Begriff Data Lake steht für einen sehr großen Datenspeicher. Er beinhaltet im Gegensatz zu normalen Datenbanken Daten in ihrem ursprünglichen Rohformat.

Ein Data Lake lässt sich aus den verschiedensten Quellen speisen. Die Daten können strukturiert oder unstrukturiert sein und müssen vor der Speicherung nicht validiert oder umformatiert werden. Neben text- oder zahlenbasierten Daten kann ein Data Lake auch Bilder, Videos oder andere Datenformate aufnehmen.

Erst wenn die Daten benötigt werden, erfolgt die Strukturierung und gegebenenfalls die Umformatierung der betroffenen Daten.

Ein Data Lake lässt sich aufgrund seiner riesigen Informationsmenge für flexible Analysen einsetzen. Die aus den verschiedenen Quellen stammenden Daten sind für viele verschiedene Anwendungen und Analysen nutzbar.

Wie genau ein Data Lake aufgesetzt werden soll und in welchen Schritten, hängt maßgeblich an den jeweiligen Anforderungen

Auch Cloud Services wie Azure Data Lake und Amazon Web Services (AWS) stehen für die Umsetzung eines Data Lakes zur Verfügung.

Science Factory

Konzentrieren Sie sich auf Ihre Data Science-Anwendungsfälle.

Verwenden Sie die Werkzeuge und Technologien, die Sie lieben.

Pergola kümmert sich um alles andere!

Die Data Science Factory ist in drei Säulen aufgebaut und unterstützt in allen Data Science-Anwendungsfälle. 

Lab

Wählen und starten Sie Ihre personalisierten Umgebungen für Entwicklungs- oder Analysearbeiten, so viele wie Sie benötigen, so maßgeschneidert und angepasst, wie Sie möchten. Lab wird automatisch für verschiedene Workloads bereitgestellt und optimiert. Es bietet eine breite Palette von Technologien und Frameworks für modernste Softwareentwicklung und Data Sciences Anwendungen.

Data

Verbinden Sie Ihre Anwendungen mit einem metadatengesteuerten und vollständig indizierten Repository von Datenquellen, von Flat Files bis hin zu Live-Streaming-APIs, die vollständig gesichert und nachverfolgbar sind. Bearbeiten Sie die Daten, die Sie benötigen, veröffentlichen Sie diese.

Pipeline

Bereitstellen und Veröffentlichen von Web-Frontends, Dashboards oder API-Diensten und komplexen End-to-End-Workflows von der Entwicklung bis zur Produktion in einer beliebigen Sprache oder einem beliebigen Framework.

Es läuft vollautomatisch, versioniert, nachvollziehbar und reproduzierbar.