Analyse de bureau ad hoc

FONTE ZOOM:
Analyse de bureau ad hoc est la première étape vers la décentralisation des données opérationnelles. Des concepts tels que les SAO et l'entreposage de données sont importantes et, lentement mais sûrement, un système parallèle est développé pour alimenter les besoins d'information des utilisateurs. Cet article se concentre sur le pourquoi de cette duplication et les conséquences importantes qui vont avec, telles que la planification et la synchronisation.

ODS

La décision de séparer les données opérationnelles du système OLTP est souvent prise pour des raisons techniques et est en elle-même une décision assez facile. Réflexion sur l'architecture est plus difficile car il dépend principalement de la présentation des données extraites.

Est le fins fonctionnelles, en particulier dans une forme de reporting opérationnel, mais à un niveau plus global que les récupérations d'écran, nous allons construire un magasin de données opérationnelles dite ou ODS. Un ODS peuvent être considérés comme une copie de l'environnement d'exploitation, mais l'information qui est limitée dans le temps. Il permet de signaler au même niveau, mais contrairement à la base de données originale ?? aussi appelé le système source - les données restent beaucoup moins de temps disponible. Dans la pratique, cette règle est trop souvent négligée. Une fois les données a été copié à partir du système source reste qu'ils siègent généralement. Ne pas tomber dans le long terme dans le même problème qui a donné lieu à la construction de l'ODS, il est essentiel que, il est prévu une méthode de stockage correct. Cette question est abordée dans ce livre un peu plus loin plus en détail.

La construction d'un ODS est techniquement en principe une opération simple car le granaliteit correspond aux données parfaitement que des données sur le système source. Ce est donc une parfaite synchronisation des dossiers à enregistrement en fonction de la création et de l'information de l'événement mutationnel entre les deux systèmes. Bien que la disponibilité des données est quelque peu limitée dans le temps, cette haute granaliteit apporte encore quelques limitations avec elle. Chaque rapport à un niveau supérieur, il faudra le regroupement des données en ligne, de plus longues durées d'extraction apporteront. Nous pouvons donc dire que l'ODS ne est pas vraiment adapté pour le reporting analytique.

Entrepôt de données

On souhaite néanmoins aller dans cette direction, il en résulte une nécessité de développer un entrepôt de données. Comme mentionné un entrepôt de données est un modèle de la structure de l'entreprise, contrairement à un ODS, qui est un modèle de la structure de base de données. Dans un entrepôt de données obtient un rapport entièrement sur le principe de fonctionnement et on ira pétrir comme si la structure de OLTP selon les besoins en information. Bien que les capacités analytiques dans une telle architecture sont beaucoup plus étendues, il y aura ?? en ce qui concerne les données - mais encore être travaillé avec un niveau de détail relativement faible. Cette exigence est due à la nature ad hoc de certaines formes de rapports, où, auparavant, pas toujours connus tout aussi clair dans quelle direction ils veulent prendre. Plusieurs pistes doivent donc être disponibles, ce qui implique un processus qui se traduit par plus de données.

Interaction

Un ODS et un entrepôt de données peuvent coexister, même sur le même serveur, pour permettre tout type de rapports. Il est pour le département informatique pour rendre le utilisation combinée aussi transparente que possible pour l'utilisateur d'affaires. Depuis un ODS Fed ?? ?? est de 1 à 1 une relation avec le système de traitement transactionnel en ligne, il est parfaitement possible de déplacer les données extraites, à son tour, être utilisé pour alimenter l'entrepôt de données. Depuis l'ODS contient essentiellement moins de données que le système source, et sa situation isolée de l'environnement d'exploitation, il est inutile de surcharger le système OLTP deux fois avec le même extraction. Il est beaucoup plus facile à utiliser l'ODS comme un système de source pour l'entrepôt de données, en particulier depuis l'agrégation requis dans l'entrepôt de données peut être réalisée beaucoup plus rapidement et efficacement par l'intermédiaire de l'ODS. Il est, bien entendu, indispensable que les deux systèmes ont le même type d'informations. La figure 1 illustre ce principe.

Synchronisation et planification

Il va sans dire que les données qui sont mis à disposition est nécessaire pour connecter l'environnement de l'information à l'intérieur de ceux-ci, qui est situé à l'intérieur des tables OLTP. Ils doivent être synchronisés avec d'autres mots entre les systèmes.

Lorsque une synchronisation ODS en soi semble une tâche simple, parce que le granaliteit se intègre parfaitement avec l'autre dans les deux systèmes en principe. Cette simplicité est certes affaibli par un éventuel problème de retard de données ?? ou des données retardent. Il doit être faite entre le traitement synchrone et asynchrone des transactions. Un traitement synchrone implique que toute transaction dans le système OLTP est répété immédiatement à la deuxième système, dans ce cas sur les SAO. Les données sont donc ignorer avec un intervalle de quelques millisecondes identiques dans les tables des deux systèmes. Contenu et la disponibilité loin cela semble très intéressant, si ce ne était que l'un dépend pendant les données opérationnelles de traitement deux systèmes. Encore une fois, la nécessité de sortie commencera à interférer avec l'entrée et il est essentiel que ce soit évitée. Un traitement asynchrone qui évite la double dépendance, mais ne provoque un certain retard dans la disponibilité des données dans les ODS. Si nous supposons que, après ce traitement une autre opération suit vers l'entrepôt de données, puis nous nous sommes immédiatement confrontés à une double retard. Il va sans dire que la mise à jour d'un entrepôt de données sera toujours un traitement asynchrone, depuis le granaliteit ni la structure permettent une approche synchrone.

Traitement asynchrone de plomb à la programmation, ce qui est un aspect important dans la construction d'un environnement de l'information. Tous les emplois ?? souvent appelée emplois ?? devront être distribués correctement sur la disponibilité du système. Si l'outil de planification prévue devrait être intégrée autant que les dépendances possibles entre eux, de sorte que la qualité et la cohérence des données à tout moment peuvent être garanties. Nous nous présentons un processus de charge d'un entrepôt de données consiste à traiter un fichier à la facturation et une autre tâche qui traite un fichier dans lequel les nouveaux clients sont enregistrées. Si les deux emplois sans aucune forme de dépendante être prévue est parfaitement possible que, après des problèmes de perception de la clientèle soudainement données factures existent dans l'entrepôt de données qui se réfèrent à des clients qui ne ont pas encore été inclus dans la table de dimension. Il en résulte des conditions de jointure qui ne sont plus valables et le manque d'informations de facturation rapports. Alors que là pour ce qui concerne les faits il suppose que les données ont été entièrement mis à jour.

retard des données est inévitable dans les opérations de traitement asynchrone, il est alors important que le niveau du retard est déterminée correctement. Souvent un environnement d'information qui est destiné mis à jour quotidiennement pour ad hoc ou semi-fins opérationnelles, et souvent ?? nuit pour limiter la charge sur le système autant que possible de la source. Cependant, la détermination du retard précédemment en fonction de l'information doit alors reste du système. Cela n'a aucun sens de mettre à jour des données sur un niveau quotidien, qui sera utilisé par semaine. Dans le cas de charges en vrac, où d'énormes volumes de données ont besoin d'être rechargée, un petit retard, mais très sage, même si l'information est utilisée seulement après une période plus longue. Ce traitement incrémentiel est alors seulement être faite avec l'intention de soulager le système.

En outre, le contenu des données joue un rôle. Si l'entreprise seule facture mensuelle est un travail quotidien d'exister qui cherche de nouvelles factures, lorsque vous savez que cela ne peut jamais exister. Scheduling est principalement la recherche d'un bon compromis entre les données et le système doit possibilités techniques. Toutefois, la cohérence des données sont toujours central.
VOIR AUSSI:
  1.  
  2.  
  3.  
Sans commentaires

Laisser un commentaire

Code De Sécurité