Aller au contenu principal

Connecteur de source MongoDB

Le connecteur source MongoDB permet à DataSync de récupérer les données d'une instance MongoDB et de les charger dans un entrepôt de données. DataSync propose deux modes d'authentification : Basic et NoAuth. MongoDB stocke les données sous forme de documents imbriqués. Le connecteur peut convertir automatiquement les objets imbriqués en colonnes distinctes, ce qui facilite leur exploitation dans l'entrepôt de données.

Une fois la connexion source créée, configurez la connexion de destination pour finaliser l'installation.

remarque

L'extraction de consolidation n'est pas disponible pour les connexions source MongoDB.

Créer la connexion source dans DataSync

  1. Connectez-vous à DataSync.
  2. Depuis l'écran d'accueil, sélectionnez Connexions.
  3. À côté de Connexions de la source, cliquez sur Nouveau.
  4. Sélectionnez MongoDB.
  5. Complétez toutes les propriétés de connexion requises.
  6. (Facultatif) Dans le panneau Autres propriétés de la connexion, cliquez sur Ajouter une propriété et définissez les paramètres supplémentaires nécessaires.
  7. Configurez les paramètres avancés selon votre environnement, notamment le Type de suivi.
  8. Cliquez sur Enregistrer.

important

MongoDB peut stocker des colonnes contenant des tableaux de valeurs. Dans ce cas, DataSync peut mal estimer la taille de la colonne, ce qui peut entraîner une troncature des données lors de l'extraction. Pour éviter ce problème, définir la précision sur MAX pour ces colonnes dans la table de destination.

Propriétés de la connexion

PropriétéDescription
DescriptionNom unique attribué à la connexion. Exemple : MongoDB.
ServeurNom du serveur ou adresse IP du serveur MongoDB. Exemple : mongodb.exemple.com.
PortNuméro de port pour la connexion MongoDB. Valeur par défaut : 27017.
Base de donnéesNom de la base de données MongoDB à laquelle se connecter. Exemple : DonnéesVentes.
Mode d'authentificationBasic pour une authentification par nom d'utilisateur et mot de passe stockés dans la base de données MongoDB, ou NoAuth pour les connexions ne nécessitant aucune authentification.
Nom d'utilisateurBasic uniquement Identifiant de connexion stocké dans la base de données MongoDB. Exemple : mongoUtilisateur.
Mot de passeBasic uniquement Mot de passe associé à ce compte.
Base de données d'authentificationBasic uniquement Nom de la base de données utilisée pour l'authentification, si différente de la base de données indiquée dans le champ Database. Exemple : admin.
Aplatir les objetsConvertit les propriétés des objets imbriqués en colonnes distinctes. Si désactivée, les objets imbriqués sont retournés sous forme de chaînes JSON.
Activer TLS/SSLSécurise la connexion par chiffrement SSL/TLS. Nécessite un certificat SSL valide.
Accepter les certificats de serveur non validesAccepte tous les certificats du serveur lorsque SSL/TLS est activé. Non recommandé, car cela expose la connexion à des risques de sécurité.
Profondeur de balayage des lignesNombre de lignes analysées pour déduire le schéma de la collection. Une valeur plus élevée produit un schéma plus précis mais peut ralentir la connexion initiale. Valeur par défaut : 1000.
VerbositéContrôle le niveau de détail écrit dans le journal. Chaque niveau inclut tout ce qui précède plus des informations supplémentaires.

  • 1 enregistre les requêtes, les nombres de lignes, les heures de début et de fin d'exécution ainsi que les erreurs.
  • 2 ajoute les requêtes de cache et les en-têtes HTTP.
  • 3 ajoute les corps de requête et de réponse.
  • 4 ajoute la communication au niveau du transport.
  • 5 ajoute toutes les commandes d'interface.
Activer le poolingActive le pooling de connexions, qui conserve un ensemble de connexions ouvertes et les réutilise entre les extractions au lieu d'ouvrir une nouvelle connexion à chaque fois. Réduit la charge et améliore les performances lorsque plusieurs extractions s'exécutent en même temps.
Délai d'inactivité du poolTemps d'inactivité maximal en secondes avant qu'une connexion soit retournée au pool.
Taille maximale du poolNombre maximum de connexions autorisées dans le pool en même temps.
Temps d'attente du poolTemps d'attente maximal en secondes pour obtenir une connexion avant qu'une erreur ne soit générée.

Exemple d'aplatissement des objets

MongoDB stocke les données sous forme de documents imbriqués, ce qui signifie qu'un même enregistrement peut contenir des objets à l'intérieur d'autres objets. Lorsque Aplatir les objets est activée, DataSync décompose ces propriétés imbriquées en colonnes individuelles, ce qui facilite les requêtes et l'analyse des données dans l'entrepôt de données.

Dans cet exemple de document de vente, les champs client et livraison contiennent chacun des propriétés imbriquées :

{
"numéroCommande": 10592,
"client": { "id": 456, "nom": "Acme Corp" },
"livraison": { "ville": "Paris", "région": "Île-de-France" }
}

Activée

Avec Aplatir les objets activée, chaque propriété imbriquée devient sa propre colonne :

numéroCommande 10592
client.id 456
client.nom Dupont SA
livraison.ville Paris
livraison.région Île-de-France

Autres propriétés de la connexion

Ce panneau permet d'ajouter des propriétés de chaîne de connexion qui ne figurent pas dans le panneau Propriétés de la connexion. Pour les valeurs sensibles comme les mots de passe, choisissez le type Crypté. La valeur reste alors masquée dans l'interface et stockée de façon chiffrée côté serveur.

PropriétéDescription
PropriétéPropriété de la chaîne de connexion définissant l'action ou le comportement. Exemple : ReadOnly.
ValeurValeur associée à la propriété. Exemple : True.
TypeVisibilité de la valeur : Visible ou Crypté.

Paramètres avancés

Ces paramètres déterminent la façon dont le connecteur suit les modifications de données, gère l'heure et la région, et traite les enregistrements pendant l'extraction. Ajustez-les selon votre environnement MongoDB afin que les résultats restent exacts et cohérents.

ParamètreDescription
Type de suiviMéthode de suivi des modifications de données : Aucun ou Date.
RegionParamètre régional du connecteur, si la configuration l'exige.
Fuseau horaireFuseau horaire correspondant à l'environnement MongoDB.
Décalage de tempsDécalage d'actualisation en secondes pour compenser les écarts de synchronisation lors de la sélection des enregistrements. Minimum 0, maximum 3600.
Taille du lotNombre d'enregistrements traités par lot lors de l'extraction. Des lots plus grands peuvent améliorer les performances mais consomment davantage de mémoire. La valeur par défaut est 2000, le maximum est 10000. À ajuster selon la vitesse du réseau et les performances du disque. La valeur par défaut convient dans la plupart des cas.

Exemple de configuration

Connexion source MongoDB dans DataSync
Connexion source MongoDB entièrement configurée dans DataSync avec authentification Basic, avec toutes les propriétés et tous les paramètres complétés.