Microsoft Azure Data Factory

Azure Data Factory ist der ETL-Clouddienst von Azure für die serverlose Datenintegration und Datentransformation mit horizontaler Skalierung. Der Dienst bietet eine Benutzeroberfläche ohne Code für die intuitive Erstellung sowie Überwachung und Verwaltung über eine zentrale Konsole. Sie können vorhandene SSIS-Pakete auch per Lift & Shift in Azure übertragen und bei voller Kompatibilität in ADF ausführen.

areto MS Partner Gold Data Analytics white comp logo 1

Was ist Azure Data Factory?

In Zeiten von Big Data werden unorganisierte Rohdaten häufig in relationalen, nicht relationalen und anderen Speichersystemen gespeichert. Für sich genommen mangelt es den Rohdaten allerdings an Kontext bzw. an der nötigen Aussagekraft, um von Analysten, Datenspezialisten oder Entscheidungsträgern in Unternehmen sinnvoll genutzt werden zu können.

Für Big Data ist ein Dienst zur Orchestrierung und Operationalisierung von Prozessen erforderlich, mit dem diese enormen Rohdatenmengen in verwertbare geschäftliche Erkenntnisse verwandelt werden. Azure Data Factory ist ein spezieller verwalteter Clouddienst für diese komplexen Hybridprojekte mit ETL (Extrahieren, Transformieren und Laden), ELT (Extrahieren, Laden und Transformieren) und Datenintegration.

Die Azure Data Factory-Plattform ist der cloudbasierte ETL- und Datenintegrationsdienst, mit dem Sie datengesteuerte Workflows erstellen können, um Datenverschiebungen und -transformationen bedarfsgesteuert zu orchestrieren. Mit Azure Data Factory können Sie datengesteuerte Workflows (so genannte Pipelines) erstellen und planen, die Daten aus unterschiedlichen Datenspeichern erfassen. Sie können komplexe ETL-Prozesse erstellen, bei denen Daten visuell mit Datenflüssen oder mit Computediensten wie Azure HDInsight Hadoop, Azure Databricks und Azure SQL-Datenbank transformiert werden.

Außerdem können Sie Ihre transformierten Daten in Datenspeichern, z. B. Azure Synapse Analytics, veröffentlichen, damit sie von BI-Anwendungen (Business Intelligence) genutzt werden können. Über Azure Data Factory können Rohdaten letztendlich in aussagekräftigen Datenspeichern und Data Lakes organisiert und für bessere geschäftliche Entscheidungen genutzt werden.

Wie funktioniert Azure Data Factory ?

Data Factory enthält eine Reihe von verbundenen Systemen, die eine umfassende End-to-End-Plattform für Datentechniker bilden. Dieser visuelle Leitfaden enthält eine umfassende Übersicht über die Architektur von Data Factory

Azure Data Factory beschleunigt die Datentransformation

Azure Data Factory Datentransformation areto Microsoft Partner

Data Factory bietet eine codefreie Datenintegrations- und Transformationsebene, die all Ihre Initiativen für digitale Transformation unterstützt.

  • Mit Azure Data Factory versetzen Sie Anwender ohne Programmiererfahrung und Datentechniker in die Lage, Geschäftsprozesse und IT-gestützte Analysen/Business Intelligence voranzubringen.
  • In Azure Data Factory bereiten Sie Daten vor, erstellen Sie ETL- sowie ELT-Prozesse,  orchestrieren und überwachen Sie Pipelines ganz ohne Code. Der verwaltete Dienst Apache Spark™ ist für die Codegenerierung sowie -wartung zuständig.
  • Beschleunigen Sie mit Azure Data Factory mit intelligenter zielbasierter Zuordnung die Transformation , durch die Kopieraktivitäten automatisiert werden.

Modernisieren Sie SSIS mit Azure Data Factory

Azure Data Factory unterstützt Unternehmen bei der Modernisierung von SSIS.

  • Mit dem Azure-Hybridvorteil lassen sich Kosteneinsparungen von bis zu 88 Prozent erzielen.
  • Mit der Azure Data Factory nutzen Sie den einzigen vollständig kompatiblen Dienst, mit dem Sie ganz einfach alle SSIS-Pakete in die Cloud verlagern können.
  • Dank dem Bereitstellungs-Assistenten sowie einer ausführlichen Dokumentation mit schrittweisen Anleitungen ist die Migration denkbar einfach.
  • Durch den Einsatz von Azure Data Factory können Sie Ihre Vision von hybriden Big Data- und Data Warehousing-Initiativen verwirklichen , indem Sie diese mit Datenpipelines in der Data Factory-Cloud kombinieren.
Azure Data Factory SSIS Modernisierung areto Microsoft Partner

Azure Data Factory - Konnektoren

ms azure data factory areto MS Partner

Die Datenerfassung aus mehreren unterschiedlichen Quellen kann kosten- und zeitaufwändig sein, manchmal auch mehrere Lösungen erfordern. Azure Data Factory bietet einen einzelnen Dienst mit nutzungsbasierter Bezahlung. Sie haben folgende Möglichkeiten:

  • Wählen Sie aus mehr als 90 integrierten Konnektoren, um Daten aus Big Data-Quellen wie Amazon Redshift, Google BigQuery, HDFS, Enterprise Data Warehouses wie Oracle Exadata, Teradata, SaaS-Anwendungen wie Salesforce, Marketo und ServiceNow sowie allen Azure-Datendiensten zu erfassen.
  • Nutzen Sie die volle Kapazität der zugrunde liegenden Netzwerkbandbreite mit einem Durchsatz von bis zu 5 GB/s.

Azure Synapse Analytics und Azure Data Factory

Mit Azure Data Factory erfassen Sie Daten aus lokalen, hybriden und Multicloud-Quellen. Der nächste Schritt: Transformieren Sie diese in Azure Synapse Analytics.

  • Daten in der vertrauten Data Factory-Oberfläche innerhalb von Azure Synapse-Pipelines integrieren.
  • Transformieren und analysieren Sie Daten mit Datenflüssen in Azure Synapse Studio – ganz ohne Programmierung.
azure synapse architecture Microsoft Partner areto

Azure Data Factory - weltweite Cloudzentren

azure data factory security portal areto Microsoft Partner
  • Greifen Sie in mehr als 25 Regionen weltweit auf Azure Data Factory zu, um Datencompliance, Effizienz und niedrige Kosten für ausgehenden Netzwerkdatenverkehr zu gewährleisten.
  • Azure Data Factory wurde gemäß HIPAA, HITECH, ISO/IEC 27001, ISO/IEC 27018 und CSA STAR zertifiziert.
  • Unter Verwendung einer verwalteten Identität und eines Dienstprinzipals stellen Sie eine sichere Verbindung mit Azure-Datendiensten her.
  • Speichern Sie Ihre Anmeldeinformationen mit Azure Key Vault.
    Ein verwaltetes virtuelles Netzwerk bietet eine isolierte und hochsichere Umgebung zum Ausführen Ihrer Datenintegrationspipelines

Die Vorteile von Azure Data Factory

Benutzerfreundlich

Mit Azure Data Factory rehosten Sie SQL Server Integration Services (SSIS) mit ein paar Klicks, außerdem erstellen Sie codefrei ETL- / ELT-Pipelines mit integrierter Git- sowie CI/CD-Unterstützung.

Kosteneffizient

Mit Azure Data Factory nutzen Sie einen vollständig verwalteten, serverlosen Clouddienst, der bedarfsgesteuert skaliert sowie nutzungsbasiert abgerechnet wird.

Leistungsstark

Azure Data Factory bietet zur Erfassung aller lokalen und SaaS (Software-as-a-Service)-Daten mehr als 90 integrierten Konnektoren. Nutzen Sie die bedarfsgesteuerte Orchestrierung und Überwachung.

Intelligent

Azure Data Factory bietet autonomes ETL, um die betriebliche Effizienz zu steigern und Integratoren ohne Programmiererfahrung zu unterstützen.

aretos Microsoft Azure Referenzarchitektur

Die von areto entwickelte Referenzarchitektur bietet viele Vorteile.

Die Verwendung der Referenzarchtiketur von areto bietet den Kunden architektonische Best Practices für die Entwicklung und den Betrieb zuverlässiger, sicherer, effizienter und kostengünstiger Systeme in der Cloud. aretos Architekturlösungen werden dabei konsequent an Microsoft Best Practices gemessen, um so den Kunden den höchsten Nutzen zu liefern.

Die areto Referenzarchitektur basiert auf fünf Säulen: Operational Excellence, Sicherheit, Zuverlässigkeit, Leistungseffizienz, Kostenoptimierung.

Operational Excellence
optimale Gestaltung von Betrieb und Monitoring der Systeme sowie kontinuierliche Verbesserung unterstützender Prozesse und Verfahren

Security
Schutz von Informationen, Systemen, Anlagen, Risikobewertungen und Strategien zur Risikominderung

Kostenoptimierung
Maximierung des ROI durch den kontinuierlichen Prozess der Verbesserung des Systems über seinen gesamten Lebenszyklus.

Zuverlässigkeit
Gewährleistung von Sicherheit, Notfallwiederherstellung, zur Geschäftskontinuität, da Daten an mehreren redundanten Standorten gespiegelt werden.

Leistungseffizienz
effiziente Nutzung von Computerressourcen, Skalierbarkeit um kurzfristige Anforderungspeaks zu erfüllen, Zukunftsfähigkeit

Wieso Microsoft ?

2021 CIPS MQ areto AWS Partner

Gartner, Magic Quadrant for Cloud Infrastructure & Platform Services, Raj Bala, Bob Gill, Dennis Smith, Kevin Ji, David Wright, 27 July 2021. Gartner and Magic Quadrant are registered trademarks of Gartner, Inc. and/or its affiliates in the U.S. and internationally and is used herein with permission. All rights reserved. Gartner does not endorse any vendor, product or service depicted in its research publications, and does not advise technology users to select only those vendors with the highest ratings. Gartner research publications consist of the opinions of Gartner’s research organization and should not be construed as statements of fact. Gartner disclaims all warranties, expressed or implied, with respect to this research, including any warranties of merchantability or fitness for a particular purpose.

gartner mq for cloud ai developers

This graphic was published by Gartner, Inc. as part of a larger research document and should be evaluated in the context of the entire document. The Gartner document is available upon request from AWS. Gartner does not endorse any vendor, product or service depicted in its research publications, and does not advise technology users to select only those vendors with the highest ratings or other designation. Gartner research publications consist of the opinions of Gartner’s research organization and should not be construed as statements of fact. Gartner disclaims all warranties, expressed or implied, with respect to this research, including any warranties of merchantability or fitness for a particular purpose.

Mit den Microsoft-Expertenteam von areto zur data driven company!

Überholen Sie den Wettbewerb durch schnellere und bessere Entscheidungen!

Finden Sie heraus, wo Ihr Unternehmen aktuell auf dem Weg zur data-driven-company steht.
Wir analysieren den Status Quo und zeigen Ihnen, welche Potenziale vorhanden sind.
Wie wollen Sie starten?

kostenfreie Beratung & Demotermine

Haben Sie schon eine Strategie für Ihre zukünftige Micrsoft Data Analytics-Lösung? Nutzen Sie bereits die Vorteile moderner Cloud Plattformen und Automatisierungen? Gern zeigen wir Ihnen Beispiele, wie unsere Kunden die agilen und skalierbaren Microsoft-Lösungen von areto bereits nutzen.

Workshops / Coachings

Sie erhalten in unseren Microsoft Workshops und Coachings das nötige Know-how z.B. für den Aufbau einer modernen Cloud-Strategie oder eines IBCS-konformen Reportings mit Power BI . Das areto Microsoft-TrainingCenter bietet eine breite Auswahl an Lerninhalten.

Proof of Concepts

Ist Azure für uns richtig? Sind die Rahmenbedingungen dafür geeignet? Welche Voraussetzungen müssen geschaffen werden? Proof of Concepts (POCs) beantworten, diese und weitere Fragen. So starten Sie bestens vorbereitet in Ihr Projekt.

Microsoft Azure Data Factory Know-how Videothek

Azure Data Factory and Customer Churn Story

Azure Data Factory Stringify data flow transformation

How to delete missing source rows from your target database using data flows

Azure Data Factory Data Flows for SQL Developers

Data Wrangling in Microsoft Azure Data Factory

PaaSport to Paradise: Azure SQL Database + SSIS in Azure Data Factory

Nutzen Sie Ihre Daten. Entdecken Sie Chancen. Gewinnen Sie neue Erkenntnisse.

florian grell areto consulting

Wir freuen uns darauf mit Ihnen zu sprechen!

Florian Grell
Teamlead Microsoft
Telefon: +49 221 66 95 75-0
E-Mail: Florian.Grell@areto.de

Kurze Einführung in Azure Data Factory

Herstellen einer Verbindung / Sammeln von Daten

In Unternehmen sind verschiedene Arten von Daten in unterschiedlichen Quellen gespeichert (lokal, in der Cloud, strukturiert, unstrukturiert als auch teilweise strukturiert), meist gehen alle in unterschiedlichen Intervallen, mit unterschiedlicher Geschwindigkeit ein.

Der erste Schritt bei der Erstellung eines Informationssystems für die Produktion umfasst das Herstellen der Verbindung mit allen erforderlichen Daten- sowie Verarbeitungsquellen, z.B. SaaS-Dienste (Software-as-a-Service), Datenbanken, Dateifreigaben und FTP-Webdienste. Der nächste Schritt umfasst das Verschieben der Daten an einen zentralen Ort zur weiteren Verarbeitung. Ohne Data Factory müssen Unternehmen benutzerdefinierte Komponenten für die Datenverschiebung erstellen oder benutzerdefinierte Dienste schreiben, um diese Datenquellen und die Verarbeitung zu integrieren. Das Integrieren bzw. Verwalten dieser Systeme ist teuer und aufwändig. Häufig fehlen für Unternehmen geeignete Überwachungs- , Warnfunktionen sowie die Steuerungsmöglichkeiten eines vollständig verwalteten Diensts.

Mit Data Factory können Sie die Kopieraktivität in einer Datenpipeline nutzen, um Daten sowohl aus lokalen als auch aus cloudbasierten Quelldatenspeichern zur weiteren Analyse in einen zentralen Datenspeicher in der Cloud zu verschieben. Beispielsweise können Sie Daten in Azure Data Lake Storage sammeln und später transformieren, indem Sie einen Azure Data Lake Analytics-Computedienst verwenden. Außerdem können Sie Daten in Azure Blob Storage sammeln und später per Azure HDInsight Hadoop-Cluster transformieren.

Transformieren / Erweitern

Wenn Daten in einem zentralisierten Datenspeicher in der Cloud vorliegen, können Sie die gesammelten Daten mit ADF-Zuordnungsdatenflüssen verarbeiten oder transformieren. Mit Datenflüssen können Datentechniker Graphen für die Datentransformation erstellen sowie verwalten, die unter Spark ausgeführt werden, ohne mit Spark-Clustern oder der Spark-Programmierung vertraut sein zu müssen.

Falls Sie das manuelle Codieren von Transformationen vorziehen: ADF unterstützt externe Aktivitäten zur Ausführung Ihrer Transformationen mit Computediensten, z. B. HDInsight Hadoop, Spark, Data Lake Analytics, Machine Learning.

CI/CD und Veröffentlichung

Data Factory verfügt über vollständige Unterstützung von CI/CD für Ihre Datenpipelines per Azure DevOps und GitHub. Dies ermöglicht Ihnen das inkrementelle Entwickeln und Bereitstellen Ihrer ETL-Prozesse vor der Veröffentlichung des fertigen Produkts. Nachdem die Rohdaten in einem für Unternehmen nutzbaren Format vorliegen, laden Sie sie mit Azure Data Warehouse, Azure SQL-Datenbank, Azure CosmosDB oder einer anderen Analyse-Engine, auf die Ihre Benutzer in ihren Business Intelligence-Tools verweisen können.

Überwachen

Nachdem Sie Ihre Pipeline für die Datenintegration erfolgreich erstellt und bereitgestellt haben um einen geschäftlichen Nutzen aus den optimierten Daten zu ziehen, können Sie die geplanten Aktivitäten als auch Pipelines auf Erfolgs- und Fehlerraten überwachen. Azure Data Factory bietet integrierte Unterstützung für die Pipelineüberwachung per Azure Monitor, API, PowerShell, Azure Monitor-Protokolle und Integritätsbereiche im Azure-Portal.

Allgemeine Konzepte

Ein Azure-Abonnement kann über mindestens eine Azure Data Factory-Instanz (bzw. Data Factory) verfügen. Azure Data Factory besteht aus den folgenden Hauptkomponenten:

  • Pipelines
  • Aktivitäten
  • Datasets
  • Verknüpfte Dienste
  • Datenflüsse
  • Integration Runtimes

Zusammen stellen sie die Plattform dar, auf der Sie datengesteuerte Workflows mit Schritten zum Verschieben sowie Transformieren von Daten zusammenstellen können.