Extraction, Transformation et Chargement

FONTE ZOOM:
Pour extraire des données à partir d'un environnement opérationnel et à ce hermodeleren de manière informative dans un environnement physique de l'information délocalisée, il faut se appuyer sur un logiciel spécial: logiciel ETL.

ETL

À un moment donné, le besoin de décentraliser les données centrales dans un ODS ou de les placer dans un entrepôt de données. Avant toute forme d'extraction, la lumière peut voir la décentralisation devrait être le lieu lui-même. Pour cela, la société se appuiera sur un outil que l'on appelle ETL. ETL signifie Extraction, Transformation et Chargement. Un processus ETL consiste donc à l'extraction de données à partir d'un système source, l'enrichissement en charge certaine logique et des données transformées dans un nouvel environnement. Il ya en fait deux processus qui pourraient être ajoutées à la définition de l'ETL, et en particulier l'indexation ?? ou l'indexation - et analyse ?? ou d'analyser. Depuis les données sont déjà dans la base de données située au moment de l'indexation, l'indexation ne est généralement pas inclus dans la définition standard des ETL. En outre, l'analyse a lieu dans un stade ultérieur, pour la même raison, et est considéré comme une donnée séparément. Ce type d'analyse n'a rien à voir avec tout type d'analyse d'affaires, mais est strictement un processus technique qui se applique uniquement dans un environnement SGBD basée sur les coûts.

Choix

Lors de la sélection d'un outil d'ETL, il est important qu'il est en mesure d'apporter les trois principaux processus du processus ETL pour une conclusion réussie. Indexation et analyse est spécifique à la base et pourraient par la suite être faites par vos propres scripts. Une première génération d'outils d'ETL étaient générateurs de code, qui possède les scripts générés qui ont ensuite été lancé via procédures batch sur la base de ce qu'on appelle les métadonnées. Souvent vu ces outils obsolètes ou à peu de transformation, de sorte que la logique devrait être déplacé vers le système source ?? par extraction ?? ou à l'entrepôt de données ?? dans les rapports. Une nouvelle génération d'outils prévoit la possibilité d'inclure les transformations les plus complexes dans le processus avec un minimum de programmation. Il suffit logique de paramétrer le traitement efficace est complètement boîte noire. La «boîte noire» principe pourrait être simplifie la définition de la logique est de perdre ne nécessite un certain degré de flexibilité, et par l'un devient ainsi dans une large mesure dépend du fournisseur.

Investissement

outils ETL sont généralement très coûteux et son achat est souvent précédée par de longues évaluations et des comparaisons, en particulier lorsque les données de plus petits projets d'entrepôt sont concernés. Il existe des solutions moins chères sur le marché, en particulier dans la catégorie des générateurs de code, mais ils nécessitent généralement beaucoup d'ajustements pour être inclus dans la structure de l'entreprise. Exemples d'outils sont Pervasive, Ascential DataStage, Ab Initio, Oracle Warehouse Builder et de l'informatique. Cependant, il ya encore beaucoup à investir dans le marché et il est donc conseillé de prendre le temps de l'étude, et de trouver l'outil qui convient le mieux à leurs propres entreprises et les moindres ajustements demande.

In-house développement

L'option reste bien sûr ouvert à tout dans leur propre département informatique programmer, mais le coût de la force de travail supplémentaire qui en résulte, sera dans la plupart des cas supérieurs à ceux de ne importe quel outil d'ETL. L'effort ne se limite pas à la programmation efficace, mais est souvent précédée par un grand nombre d'étude préliminaire relative à l'étude d'un aspect quelconque du flux ETL. La décision de faire un outil ou d'acheter ?? la marque célèbre ou acheter principe - est une société totalement dépendante, mais se appuie toujours sur certains aspects fondamentaux. Tout d'abord, la complexité de la transformation de données, et la qualité des données de base à prendre en compte. Qui déterminera la nature des transformations, et donc aussi immédiatement clair si un générateur de code est ou ne est pas suffisant. Un autre aspect important est le volume de données que le flux passera ETL. Certains logiciels est tout simplement trop léger pour les charges dites vrac. Une recherche se concentre sur.
VOIR AUSSI:
  1.  
  2.  
  3.  
Sans commentaires

Laisser un commentaire

Code De Sécurité