Connecteur de source MongoDB
Le connecteur source MongoDB permet à DataSync de récupérer les données d'une instance MongoDB et de les charger dans un entrepôt de données. DataSync propose deux modes d'authentification : Basic et NoAuth. MongoDB stocke les données sous forme de documents imbriqués. Le connecteur peut convertir automatiquement les objets imbriqués en colonnes distinctes, ce qui facilite leur exploitation dans l'entrepôt de données.
Une fois la connexion source créée, configurez la connexion de destination pour finaliser l'installation.
L'extraction de consolidation n'est pas disponible pour les connexions source MongoDB.
Créer la connexion source dans DataSync
- Connectez-vous à DataSync.
- Depuis l'écran d'accueil, sélectionnez Connexions.
- À côté de Connexions de la source, cliquez sur Nouveau.
- Sélectionnez MongoDB.
- Complétez toutes les propriétés de connexion requises.
- (Facultatif) Dans le panneau Autres propriétés de la connexion, cliquez sur Ajouter une propriété et définissez les paramètres supplémentaires nécessaires.
- Configurez les paramètres avancés selon votre environnement, notamment le Type de suivi.
- Cliquez sur Enregistrer.
MongoDB peut stocker des colonnes contenant des tableaux de valeurs. Dans ce cas, DataSync peut mal estimer la taille de la colonne, ce qui peut entraîner une troncature des données lors de l'extraction. Pour éviter ce problème, définir la précision sur MAX pour ces colonnes dans la table de destination.
Propriétés de la connexion
| Propriété | Description |
|---|---|
| Description | Nom unique attribué à la connexion. Exemple : MongoDB. |
| Serveur | Nom du serveur ou adresse IP du serveur MongoDB. Exemple : mongodb.exemple.com. |
| Port | Numéro de port pour la connexion MongoDB. Valeur par défaut : 27017. |
| Base de données | Nom de la base de données MongoDB à laquelle se connecter. Exemple : DonnéesVentes. |
| Mode d'authentification | Basic pour une authentification par nom d'utilisateur et mot de passe stockés dans la base de données MongoDB, ou NoAuth pour les connexions ne nécessitant aucune authentification. |
| Nom d'utilisateur | Basic uniquement Identifiant de connexion stocké dans la base de données MongoDB. Exemple : mongoUtilisateur. |
| Mot de passe | Basic uniquement Mot de passe associé à ce compte. |
| Base de données d'authentification | Basic uniquement Nom de la base de données utilisée pour l'authentification, si différente de la base de données indiquée dans le champ Database. Exemple : admin. |
| Aplatir les objets | Convertit les propriétés des objets imbriqués en colonnes distinctes. Si désactivée, les objets imbriqués sont retournés sous forme de chaînes JSON. |
| Activer TLS/SSL | Sécurise la connexion par chiffrement SSL/TLS. Nécessite un certificat SSL valide. |
| Accepter les certificats de serveur non valides | Accepte tous les certificats du serveur lorsque SSL/TLS est activé. Non recommandé, car cela expose la connexion à des risques de sécurité. |
| Profondeur de balayage des lignes | Nombre de lignes analysées pour déduire le schéma de la collection. Une valeur plus élevée produit un schéma plus précis mais peut ralentir la connexion initiale. Valeur par défaut : 1000. |
| Verbosité | Contrôle le niveau de détail écrit dans le journal. Chaque niveau inclut tout ce qui précède plus des informations supplémentaires.
|
| Activer le pooling | Active le pooling de connexions, qui conserve un ensemble de connexions ouvertes et les réutilise entre les extractions au lieu d'ouvrir une nouvelle connexion à chaque fois. Réduit la charge et améliore les performances lorsque plusieurs extractions s'exécutent en même temps. |
| Délai d'inactivité du pool | Temps d'inactivité maximal en secondes avant qu'une connexion soit retournée au pool. |
| Taille maximale du pool | Nombre maximum de connexions autorisées dans le pool en même temps. |
| Temps d'attente du pool | Temps d'attente maximal en secondes pour obtenir une connexion avant qu'une erreur ne soit générée. |
Exemple d'aplatissement des objets
MongoDB stocke les données sous forme de documents imbriqués, ce qui signifie qu'un même enregistrement peut contenir des objets à l'intérieur d'autres objets. Lorsque Aplatir les objets est activée, DataSync décompose ces propriétés imbriquées en colonnes individuelles, ce qui facilite les requêtes et l'analyse des données dans l'entrepôt de données.
Dans cet exemple de document de vente, les champs client et livraison contiennent chacun des propriétés imbriquées :
{
"numéroCommande": 10592,
"client": { "id": 456, "nom": "Acme Corp" },
"livraison": { "ville": "Paris", "région": "Île-de-France" }
}
- Activée
- Désactivée
Activée
Avec Aplatir les objets activée, chaque propriété imbriquée devient sa propre colonne :
numéroCommande 10592
client.id 456
client.nom Dupont SA
livraison.ville Paris
livraison.région Île-de-France
Désactivée
Avec Aplatir les objets désactivée, les propriétés imbriquées restent à l'intérieur d'une chaîne JSON :
numéroCommande 10592
client {"id": 456, "npm": "Dupont SA"}
livraison {"ville": "Paris", "région": "Île-de-France"}
Autres propriétés de la connexion
Ce panneau permet d'ajouter des propriétés de chaîne de connexion qui ne figurent pas dans le panneau Propriétés de la connexion. Pour les valeurs sensibles comme les mots de passe, choisissez le type Crypté. La valeur reste alors masquée dans l'interface et stockée de façon chiffrée côté serveur.
| Propriété | Description |
|---|---|
| Propriété | Propriété de la chaîne de connexion définissant l'action ou le comportement. Exemple : ReadOnly. |
| Valeur | Valeur associée à la propriété. Exemple : True. |
| Type | Visibilité de la valeur : Visible ou Crypté. |
Paramètres avancés
Ces paramètres déterminent la façon dont le connecteur suit les modifications de données, gère l'heure et la région, et traite les enregistrements pendant l'extraction. Ajustez-les selon votre environnement MongoDB afin que les résultats restent exacts et cohérents.
| Paramètre | Description |
|---|---|
| Type de suivi | Méthode de suivi des modifications de données : Aucun ou Date. |
| Region | Paramètre régional du connecteur, si la configuration l'exige. |
| Fuseau horaire | Fuseau horaire correspondant à l'environnement MongoDB. |
| Décalage de temps | Décalage d'actualisation en secondes pour compenser les écarts de synchronisation lors de la sélection des enregistrements. Minimum 0, maximum 3600. |
| Taille du lot | Nombre d'enregistrements traités par lot lors de l'extraction. Des lots plus grands peuvent améliorer les performances mais consomment davantage de mémoire. La valeur par défaut est 2000, le maximum est 10000. À ajuster selon la vitesse du réseau et les performances du disque. La valeur par défaut convient dans la plupart des cas. |
Exemple de configuration
