Azure Data Lake Storage

Description du service

Data Lake est un service de stockage proposé dans Azure pour stocker énormément de fichiers. On peut le considérer comme un puit de stockage.

Data Lake Storage Gen2 est en GA (General Availability) depuis le 11.10.2019. Data Lake Storage Gen2 est la combinaison de 2 services: Azure Blob storage et Azure Data Lake Storage Gen1. Une évolution en quelque sorte. En fait DLS Gen2 bénéficie des features de Azure Blob Storage en terme de pricing et de failover capabilities.

Data Lake Storage est basé sur un Storage Account ainsi qu’un nom unique dans l’ensemble des services Azure. En effet, le service Data Lake Storage déployé aura un fqdn de type < nom du DLS >.azuredatalakestore.net

Les services Open Source supportés par Data Lake Storage (Gen 2) sont les suivants:

  • HDInsight, 3.6+
  • Hadoop, 3.2+
  • Cloudera, 6.1+
  • Azure Databricks, 5.1+
  • Hortonworks, 3.1.x++

Data Lake Storage Gen2 est supporté par pas mal de services Azure, pour plus d’informations, il faut se reporter à l’article suivant: Integrate Azure Data Lake Storage with Azure services La liste indiquée ci-dessous présente les services supportés au moment de la rédaction de cet article (cette liste peut évoluée):

  • Azure Data Factory
  • Azure Databricks
  • Azure Event Hubs capture
  • Azure Logic Apps
  • Azure Search
  • Azure Stream Analytics
  • DataBox
  • HDInsight
  • IOT
  • Power BI
  • SQL Data Warehouse
  • SQL Server Integration Services (SSIS)

Deploying

Pricing

Pour obtenir plus d’informations sur le pricing de ce service, il faut se reporter à l’article suivant: []()

Ressources

Last update 15.10.2019