Data Mining dans un environnement de l'information

FONTE ZOOM:
Un terme qui est mentionné très souvent lorsque nous parlons de Business Intelligence Data Mining. Il est associé à d'autres aspects tels que la purification et l'enrichissement des données et en raison de sa complexité à l'une des plus difficiles à comprendre les termes au sein de la BI. Une clarification est en ordre.

Chasse au trésor

L'exploration de données peut être définie comme ?? acquérir une recherche d'informations utiles au sein d'une base de données existante, la connaissance avec l'intention ??. Dans la littérature, l'exploration de données est souvent mentionné dans la base de données Knowledge Discovery. Outre l'enrichissement de la connaissance pure KDD comprennent également le nettoyage ?? ?? ou purifier de fichiers et d'enrichir les données avec des informations utiles. L'exploration de données fait dans une certaine mesure avec la technique de HOLAP) car il commence aussi à partir d'un certain point de vue et les informations regardant en bas. Mais tandis que l'extraction de données orientée vers les données dimensionnelles, certaines situations peuvent demander à rechercher l'information à un niveau beaucoup plus faible, comme au niveau de l'analyse ad hoc de bureau ou même au niveau du reporting opérationnel.

En théorie, le processus KDD commence lors de la construction d'un entrepôt de données, suivie d'extraction de connaissances et interprétation logique. Contrairement à la construction classique d'un entrepôt de données, qui est basé sur les données et la présentation des processus d'affaires spécifiques est un entrepôt de données qui est conçu pour l'extraction de données précédemment construit à partir d'un point de vue stratégique. Nous pouvons dire que l'entreposage de données globale a un objectif mondial, alors que la tentative d'exploration de données est assez pour atteindre un objectif très spécifique.

CRM

L'application la plus courante de l'exploration de données est de construire un entrepôt de données de CRM. CRM signifie Customer Relationship Management et permet de maintenir une base de données centrale de la clientèle qui est accessible à toutes les parties intéressées au sein de la société. Il garantit l'existence d'un dossier unique pour chaque client au sein de la structure de l'entreprise et fournit des renseignements complets et exacts en tout temps être tenus à jour. Pour garantir l'unicité des données à chaque livraison des données du client utilisées procédures dites de déduplication. Sur la base de la donnée d'adresse fournie est déterminé si oui ou non un client est présent dans le système, et si les données doivent être ou ne pas être enrichi avec des informations supplémentaires. Les procédures de duplication comprennent souvent des algorithmes complexes qui tiennent compte de l'orthographe, la phonétique et le mariage. Un entrepôt de données CRM ne est certainement pas juste apporter dans une ligne avec l'entrepôt de données traditionnelle et est donc rarement abordé dans ce sens.

Les données externes et de nettoyage

Pas toutes les données provenant de l'intérieur de l'entreprise. Ce est certainement le cas dans l'affaire CRM, en particulier dans les grandes entreprises. Une base de données client dispose d'un modèle standard avec une structure fixe pour l'enregistrement comprend les adresses et numéros de téléphone. Ainsi, très souvent, est passé à l'acquisition de fichiers de données contenant des informations d'adresse à l'égard de certains groupes cibles. En raison de la diversité des sources d'information, il est clair que les fichiers eux-mêmes ont rarement ou jamais la même structure physique. Les champs se rencontrent dans la plupart des cas au modèle standard, mais souvent il ya une incohérence dans la structure détaillée. Nous pensons, entre autres, sur l'ordre des champs ou à un licenciement ou manque d'information. En plus des données structurées au sein de la base de données de sorte qu'ils seront confrontés à diverses formes de données non structurées, qui d'une manière correcte devront trouver leur chemin dans le système. Cela ne signifie pas que les clients qui proviennent des données relationnelles au sein de la société sont déjà parfaitement structurés pour une utilisation dans un entrepôt de données de CRM. En outre, ces données, dans la plupart des cas, devront passer par un cleansing- et / ou une procédure d'enrichissement. Les données des clients relationnelles car il ont été combinées avec des données externes dans son ensemble en données utilisables, précises et achevées.

Application: mailings

L'utilisation ultime de grandes quantités de données à la clientèle se trouve surtout dans l'environnement de marketing, où les adresses achetés forment souvent la base pour l'envoi de mailings publicitaires. Afin de maintenir le coût du processus aussi faible que possible de diffusion et de maintenir une communication professionnelle avec les clients, il est essentiel qu'un certain expédition sera envoyé qu'une seule fois à une adresse particulière. Par conséquent, les procédures de duplication sont l'un des aspects les plus importants au sein de l'ensemble du processus de frais d'utilisation. Cette forme d'affrontements d'exploration de données dans sa première phase quelque peu avec la définition générale, qui stipule que les connaissances doit être recherché afin d'être considéré comme tel. Lorsque vous postez processus suit généralement cette connaissance à un stade ultérieur, en fonction des réactions aux envois. Une évaluation groupée des réponses indique généralement les domaines d'intérêt et à son tour conduit à des hypothèses qui pourraient être la base pour la poursuite des recherches. Le résultat est un catalogue de milliers de différents modèles de pensée, qui peut être impossible d'obtenir avec des outils d'analyse classiques. On peut donc dire que la connaissance est collectée à chaque résultat d'analyse d'un mailing.

Application: cotes d'évaluation

Un autre exemple de l'exploration de données est d'évaluer audience à une société de production de télévision. Les notations sont dans une certaine mesure similaire aux résultats d'une enquête, mais que le produit dans cette situation est déjà épuisé. Une évaluation de l'auditoire a irrévocablement affecter la programmation car elles montrent le motif d'intérêt des téléspectateurs. Le passé devrait conduire l'avenir dans la bonne direction.

Figure 1 illustre comment une gestion des flux d'exploration de données ressemble dans les lignes générales. Nous partons d'un objectif stratégique qui aboutira aux actions fondées sur les connaissances acquises à partir de l'information fournie.
VOIR AUSSI:
  1.  
  2.  
  3.  
Sans commentaires

Laisser un commentaire

Code De Sécurité