Recherche sémantique: méthodes anciennes et nouvelles de la recherche en ligne (partie 1)

FONTE ZOOM:
Analyse récursive du sens des mots structuré recherche en ligne et évaluation de la conception des résultats plus efficacement en méthode de recherche sémantique

L'exploration des résultats du moteur de recherche répertorie en fonction du contenu des informations utiles à devenir un jeu de patience. Méthodes de recherche sémantiques peuvent raccourcir le temps des recherches en ligne et ainsi optimiser l'évaluation des résultats de contenu. telles que les recherches en ligne pour les moteurs de recherche classiques comme Google, Yahoo, MSN, cependant, fournissent souvent trop de résultats.

La marée de résultat rend chercheurs en ligne compliqué de faire des informations décisionnelles identifié.

Base linguistique de la méthode sémantique
La méthode de détermination de la teneur en détectant les couches de sens est connu de la linguistique et explicite que le sens des textes est décrite par l'annotation de contenu.

Avec l'annotation des textes web sont liés à l'idée d'optimiser la qualité des recherches en ligne, ce est à dire de faire la lisibilité des requêtes efficace et plus courte dans le temps.

Nouvelle méthodologie: l'annotation du contenu Web
Aux fins de l'annotation de documents Web sont des applications logicielles bilingues et plus. RDF et OWL sont deux langages de description de documents Web.

Avec un éditeur web comme Protege-OWL vous pouvez pour votre site web Créez une ontologie et se qualifier pour des recherches sémantiques. Mais ce est seulement utile si vous utilisez un moteur de recherche, qui appuie l'évaluation des ontologies.

La préparation du cadre de l'importance de l'ontologie au contenu web devient beaucoup de temps et peut être effectuée précisément par les connaisseurs sujets / auteurs de la nomenclature.

Intégrer ontologies dans les pages Web
CHAUSSURE est un langage d'inclure une couche de sens dans les pages Web. La langue de la chaussure peut être considéré comme un précurseur de contenu organisé World Wide Web.

Afin de représenter les ontologies dans les pages Web, il ya deux approches à choisir. Il peut être utilisé "Annotator connaissances", pour décrire les sites Web avec des significations sans modifier le contenu HTML. Le "Knowledge Annotator" une applet Java est créé, qui est intégré dans le code HTML. Les informations et le téléchargement de "Annotator connaissances» fournit l'Annotator SHOE des connaissances.

La deuxième façon est grâce à l'intégration de balises spécifiques chaussure dans une page Web. Pour cette suite propose Z balises de langue, utilise laquelle une couche de sens doit être inscrit dans les pages Web.

Qualité supérieure Recherche par méthode de recherche sémantique
Derrière méthodes de recherche sémantiques sont les théories mathématiques qui analysent le mot-clé comme une collection de significations. Plusieurs significations renvoient d'une certaine façon à l'expression de recherche.

Par exemple, le terme de recherche "maison de famille" peut être décrit par significations comme "appartement", "porche", "cour avant», etc.

Une collection de significations indiquées pratiquement le mot de recherche, sans la nécessité d'être appelé. Un mot de recherche, une phrase, une information est accessible en écriture par plusieurs significations se complètent mutuellement. Ce est un processus beaucoup plus intense que si la recherche des notions plus ou moins librement perçus le contenu des pages Web à décrire. Le Web sémantique est basée sur l'idée que tout le contenu qui sera géré sur Internet, pour les rendre identifiables pour les ordinateurs.

Les idées de Berners-Lee visent à la localisation de toutes les connaissances sur l'Internet par des méthodes scientifiques dans lequel la recherche en intelligence artificielle depuis de nombreuses années. Si toutes les connaissances sur l'Internet sur ses significations, à ses bases sémantiques, pourrait être recyclé, alors cerveaux électroniques seraient en mesure de significations autonome enregistrer et reproduire la connaissance humaine, sans intervention humaine.

Très facile et rapide, il ne se produit pas. Bien que dans le Websphäre une couche de sens peut être alimenté par des ontologies et donc le passage de Web 2.0 au Web 3.0 semble a ouvert la voie, il faudra des années jusqu'à ce qu'une représentation sémantique de tout contenu sur l'Internet a prévalu.

Dans de nombreux domaines sont les approches à une représentation sémantique de contenu sur Internet existe, mais les régimes de balises meta pour le contenu des pages Web a description longue non encore épuisé.

Les balises Meta de description de pages Web
Métadonnées est entré dans l'en-tête des pages web afin de décrire le contenu. Les règlements pour les pages Web décrivant le contenu sont couverts par la Dublin Core. En développant un modèle qui permet la syntaxe des métadonnées RDF est présenté dans la syntaxe lisible, RDF. RDF est un modèle pour décrire les métadonnées, qui est favorisée par le W3C pour décrire le contenu Web. Une ressource est définie comme un objet, l'information qui est décrite par un URI.

Qui n'a pas concepteurs de sites Web balises META doivent préciser qui inséré dans l'en-tête des pages HTML / XML décrire le contenu qui y figurent? Classiques robots de recherche capturer des pages sur les balises meta Web et de les envoyer au mot-clé base de données d'index du moteur de recherche.

De l'océan des entrées d'index et de pages vues compté Google a créé ses arbres de recherche.

Que le concept de la description du site est venu par méta-tags dans l'année, tout le monde reconnaît que la recherche en ligne prend. De plus en plus compliqué de trouver des informations utiles dans la collecte de l'inondation des pseudo-publicité, les demandes de blog naïfs et autres voleurs de temps va.

Opérateurs de premier plan tels que Google, Yahoo et Microsoft ont reconnu que longtemps caressé, technologies des moteurs de recherche mondialement utilisés sont déplacées progressivement. Parce qu'il se déroule étape par étape un changement de motivation de régime de balise meta pour le Web sémantique. Premières approches qui permettent d'améliorer la qualité des requêtes des moteurs de recherche qui sont déjà présents.

Exemple: Custom Search sur Google

Google offre aux utilisateurs inscrits la "Custom Search» pour. Comme "Standard Edition" est libre, comme "Premium Edition" payer les entreprises clientes à partir de 100 dollars par an. Pour Google offre une méthode de recherche optimisé qui est basé sur la spécification de certains sites administration ,, indexation et synonyme.

Meta Tags dans la pratique
La méthode largement appliquée, mais pas à jour de décrire des pages Web par les balises meta et design web ou pages web se fait manuellement par les auteurs.

Cette autorisation de la description du contexte de sites effectue également aujourd'hui à l'abus et de l'incompréhension. Afin d'atteindre ce site, nous le répertorions possible dans les moteurs de recherche, manipulant une information de balise meta dans le code HTML des pages web. Ce est un droit de ne pas le contenu, mais les balises Meta qui promettent augmenté le classement des moteurs de recherche.

Web 3: Détection automatique de l'importance du contenu du site
Dans le Web sémantique, qui est également publiée sous le titre "Web 3" manipulations seront inclus dans les pages web du passé. Dans l'ère du Web sémantique sont des voitures de mathématiques de machine, appelé ordinateur, vous en mesure de saisir l'importance de l'information de chaque sites Web. Les sites web doivent pas être décrites par une collection de mots plus longs non structurée terme, mais par les descriptions qui se rapportent les uns aux autres et forment un sens.

Exemple:

  • Vous êtes dans un moteur de recherche «Ordinateur» désigne, on trouve pêle-mêle des références dans lequel le mot de recherche est contenu.
  • Après une recherche sémantique est une «ontologie de condition préalable. L'ontologie contient des mots, termes, l '"ordinateur" se réfèrent au mot de recherche, dans ce cas, que des termes comme «mémoire DIMM carte mère» ou «carte Ethernet".
balises de chaussure:
,,,,,,,,,,,,,,,,,,,,,.

Utilisation des instances de langue de la chaussure et les relations peuvent être définis qui permettent une description exacte du contenu de pages Web.

Évolution temporelle et perspectives
En 2006 une discussion entre les représentants de Google et Tim Berners-Lee était sur le problème ci-dessus serait, que les utilisateurs d'Internet ont dû gagner pour la révocation par la création d'ontologies couches de sens dans les pages Web. Google a ensuite critiqué l'approche à une machine arrangierbaren Internet de significations. La technologie compliquée, avec sa référence à la recherche sur l'intelligence artificielle parlait à ceux qui tirent des avantages concrets de méthodes sémantiques de représentation moderne de la connaissance. Vue d'une partie II

Ce qui était vrai en 2006 se applique également 2009. Bien qu'il existe des approches occasionnelles pour réformer recherche des moteurs de recherche sémantique. Dans la deuxième partie, de nouveaux moteurs de recherche sur une base sémantique, tels que Bing, Semager, mais également des solutions d'entreprise telles de ConWeaver ou le projet allemand Theseus sont présentés. Pourquoi la recherche sémantique est maintenant un pouvoir et peut se attendre à l'avenir, une démonstration impressionnante du moteur de recherche Wolfram Alpha.

Vue de la partie III Quels sont les avantages et les inconvénients Google "Recherche personnalisée» par rapport aux méthodes de recherche sémantique, a mis dans la partie III.
VOIR AUSSI:
  1.  
  2.  
  3.  
Sans commentaires

Laisser un commentaire

Code De Sécurité