Aller au contenu principal

Connecteur de destination Snowflake

Le connecteur de destination Snowflake charge les données extraites et transformées par DataSync dans une base de données Snowflake. Snowflake est une base de données OLAP entièrement gérée dans le cloud, conçue pour le traitement par lots et les gros volumes de données. DataSync prend en charge l'authentification par paire de clés pour Snowflake, qui s'appuie sur une clé publique et une clé privée plutôt que sur un mot de passe.

L'architecture de Snowflake fait que certaines fonctionnalités standards des bases de données se comportent différemment. Snowflake n'accepte ni déclencheurs ni index, et n'applique les contraintes NULL et NOT NULL que sur les tables standards. Lors de l'ajout d'une table source Snowflake à une extraction, les index de la source d'origine ne sont donc pas conservés, et aucun index ne peut être créé manuellement par la suite.

Une fois la connexion de destination configurée, l'étape suivante consiste à créer une extraction pour définir quelles données charger et selon quelles règles.

Stockage et traitement des données dans Snowflake

  • Le stockage et le calcul sont séparés et évoluent indépendamment l'un de l'autre.
  • Les données sont automatiquement partitionnées en blocs de 50 à 100 Mo, stockés dans un format colonnaire. Chaque partition conserve ses valeurs minimale et maximale, ce qui permet à Snowflake d'ignorer les partitions non pertinentes lors d'une requête.
  • Les requêtes s'exécutent en parallèle sur plusieurs nœuds de calcul plutôt que sur une seule machine.

Créer la connexion de destination dans DataSync

  1. Connectez-vous à DataSync.
  2. Depuis l'écran d'accueil, sélectionnez Connexions.
  3. À côté de Connexions de destination, cliquez sur Nouveau.
  4. Sélectionnez Snowflake.
  5. Complétez toutes les propriétés de connexion requises.
  6. (Facultatif) Dans le panneau Autres propriétés de la connexion, cliquez sur Ajouter une propriété et définissez les paramètres supplémentaires nécessaires.
  7. Cliquez sur Enregistrer.

Propriétés de la connexion

PropriétéDescription
DescriptionNom unique attribué à la connexion. Exemple : Snowflake.
CompteIdentifiant de compte complet. Dans Snowflake, ouvrir le sélecteur de compte, sélectionner le compte, puis View Account Details. L'identifiant apparaît sous identifiants de compte. Exemple : xy12345.us-east-1.
Base de donnéesNom de la base de données dans laquelle écrire les données. Exemple : AnalyticsDB.
Mode d'authentificationMéthode d'authentification pour la connexion.
  • Basic pour une authentification par nom d'utilisateur et mot de passe.
  • KeyPair pour l'authentification par paire de clés. Snowflake exige une paire de clés RSA d'au moins 2048 bits.
Nom d'utilisateurBasic uniquement Nom d'utilisateur de la base de données Snowflake.
Mot de passeBasic uniquement Mot de passe associé à ce compte. Le type d'utilisateur doit être LEGACY_SERVICE. Snowflake abandonne progressivement l'authentification Basic à facteur unique, à utiliser uniquement en l'absence d'autre option.
Utilisateur cléKeyPair uniquement Nom d'utilisateur de la base de données Snowflake associé à la clé publique.
Fichier de clé privéeKeyPair uniquement Chemin vers le fichier de clé privée associé à la clé publique.
Phrase de passeKeyPair uniquement Mot de passe protégeant le fichier de clé privée. Laisser vide si la clé n'est pas chiffrée.
Délai d'attenteDurée en secondes avant l'expiration d'une tentative de connexion ou d'une exécution de requête.
Mode non sécuriséDésactive les vérifications de liste de révocation de certificats. À utiliser uniquement comme solution temporaire en cas d'interruption de service liée à OCSP.
Désactiver la réessaiDésactive les nouvelles tentatives automatiques pour les requêtes HTTP ayant échoué vers les points de terminaison de l'API Snowflake.
Max HTTP RetriesNombre maximum de tentatives pour les requêtes HTTP ayant échoué lorsque les nouvelles tentatives sont activées. Plage : 1 à 999. Valeur par défaut : 7.
Délai d'attente de réessaiDurée totale en secondes allouée aux requêtes couvertes par la politique de nouvelles tentatives. Valeur par défaut : 300.

Autres propriétés de la connexion

Ce panneau permet d'ajouter des propriétés de chaîne de connexion qui ne figurent pas dans le panneau Propriétés de la connexion. Pour les valeurs sensibles comme les mots de passe, choisissez le type Crypté. La valeur reste alors masquée dans l'interface et stockée de façon chiffrée côté serveur.

PropriétéDescription
PropriétéPropriété de la chaîne de connexion définissant l'action ou le comportement. Exemple : ReadOnly.
ValeurValeur associée à la propriété. Exemple : True.
TypeVisibilité de la valeur : Visible ou Crypté.

Exemple de configuration avec authentification par paire de clés

Connexion de destination Snowflake avec authentification par paire de clés dans DataSync
Connexion de destination Snowflake avec authentification par paire de clés entièrement configurée dans DataSync, avec toutes les propriétés et tous les paramètres complétés.