Chaque webmaster sait que pour que les gens commencent à visiter sa ressource à partir des moteurs de recherche, celle-ci doit être indexée. À propos de ce qu'est l'indexation de sites, comment elle est effectuée et quelle est sa signification, nous le dirons dans cet article.
Qu'est-ce que l'indexation ?
Ainsi, le mot « indexation » signifie en soi entrer quelque chose dans le registre, un recensement des matériaux qui sont disponibles. Le même principe s'applique à l'indexation des sites. En fait, ce processus peut également être appelé entrer des informations sur les ressources Internet dans la base de données des moteurs de recherche.
Ainsi, dès que l'internaute saisira une autre phrase dans le champ de recherche Google, le script lui renverra un résultat, comprenant le titre de votre site et sa brève description, que nous voyons ci-dessous.
Comment se fait l'indexation ?
L'indexation elle-même ("Yandex" est, ou Google - ne joue pas un rôle) est assez simple. L'intégralité de la toile Internet, centrée sur la base de données d'adresses IP dont disposent les moteurs de recherche, est analysée par de puissants robots - des "araignées" qui collectentdes informations sur votre site. Chacun des moteurs de recherche en possède un grand nombre et ils fonctionnent automatiquement 24 heures sur 24. Leur tâche est d'aller sur votre site et de "lire" tout le contenu qu'il contient, tout en saisissant les données dans la base de données.
Par conséquent, en théorie, l'indexation des sites ne dépend pas beaucoup du propriétaire de la ressource. Le facteur décisif ici est le robot de recherche qui vient sur le site et l'explore. C'est ce qui affecte la rapidité avec laquelle votre site apparaît dans les résultats de recherche.
Termes d'indexation ?
Bien sûr, il est avantageux pour chaque webmaster que sa ressource apparaisse le plus rapidement possible dans les résultats de recherche. Cela affectera, d'une part, les modalités d'amener le site aux premières positions, et, d'autre part, le début des premières étapes de monétisation du site. Ainsi, plus tôt le robot de recherche "mange" toutes les pages de votre ressource, mieux c'est.
Chaque moteur de recherche a son propre algorithme pour entrer les données du site dans sa base de données. Par exemple, l'indexation des pages dans Yandex s'effectue par étapes: les robots analysent constamment les sites, puis organisent les informations, après quoi la soi-disant «mise à jour» a lieu, lorsque toutes les modifications prennent effet. La régularité de ces événements n'est pas établie par l'entreprise: ils ont lieu une fois tous les 5 à 7 jours (en règle générale), mais ils peuvent avoir lieu à la fois 2 et 15 jours à l'avance.
Dans le même temps, l'indexation du site dans Google suit un modèle différent. Dans ce moteur de recherche, de telles « mises à jour » (mises à jour de base) ont lieu régulièrement, par conséquent, attendez à chaque fois que les robots saisissent les informations dans la base de données, puis ilsera commandé tous les quelques jours, pas besoin.
Sur la base de ce qui précède, nous pouvons tirer la conclusion suivante: les pages dans Yandex sont ajoutées après 1 à 2 "mises à jour" (c'est-à-dire en 7 à 20 jours en moyenne), et dans Google, cela peut se produire beaucoup plus rapidement - littéralement dans la journée.
Dans le même temps, bien sûr, chaque moteur de recherche a ses propres particularités quant à la façon dont l'indexation est effectuée. Yandex, par exemple, a un soi-disant "fast bot" - un robot qui peut entrer des données dans le problème en quelques heures. Certes, il n'est pas aisé de lui faire visiter votre ressource: il s'agit principalement d'actualités et d'événements divers et médiatisés se développant en temps réel.
Comment entrer dans l'index ?
La réponse à la question de savoir comment indexer votre site dans les moteurs de recherche est à la fois simple et complexe. L'indexation des pages est un phénomène naturel, et si vous n'y pensez même pas, mais que vous gardez simplement votre blog, en le remplissant progressivement d'informations, les moteurs de recherche "avaleront" parfaitement votre contenu au fil du temps.
Une autre chose est lorsque vous avez besoin d'accélérer l'indexation des pages, par exemple, si vous avez un réseau de soi-disant "satellites" (sites conçus pour vendre des liens ou placer des annonces, dont la qualité est généralement moins bonne). Dans ce cas, vous devez prendre des mesures pour que les robots remarquent votre site. Les éléments suivants sont considérés comme courants: ajouter l'URL du site à un formulaire spécial (il s'appelle "AddUrl"); faire passer l'adresse de ressource dans les répertoires de liens; ajouter une adresse aux répertoiressignets et plus encore. Il existe de nombreuses discussions sur les forums SEO sur le fonctionnement de chacune de ces méthodes. Comme le montre la pratique, chaque cas est unique, et il est difficile de trouver plus précisément les raisons pour lesquelles un site a été indexé en 10 jours, et l'autre en 2 mois.
Comment accélérer l'accès à l'index ?
Cependant, la logique derrière l'insertion plus rapide d'un site dans l'index est basée sur la création de liens vers celui-ci. On parle notamment de la mise en place d'URL sur des sites gratuits et publics (favoris, annuaires, blogs, forums); sur l'achat de liens sur des sites importants et populaires (en utilisant l'échange Sape, par exemple); ainsi que l'ajout d'un sitemap au formulaire addURL. Il existe peut-être d'autres méthodes, mais celles qui ont déjà été répertoriées peuvent être appelées en toute sécurité les plus populaires. Rappelons, en général, que tout dépend du site et de la chance de son propriétaire.
Quels sont les sites indexés ?
Selon la position officielle de tous les moteurs de recherche, les sites qui passent par une série de filtres entrent dans l'index. Personne ne sait quelles exigences ces derniers contiennent. On sait seulement qu'avec le temps, ils s'améliorent tous de manière à filtrer les pseudo-sites créés pour gagner de l'argent en vendant des liens et d'autres ressources qui ne contiennent pas d'informations utiles pour l'utilisateur. Bien sûr, pour les créateurs de ces sites, la tâche principale est d'indexer au maximum les pages (pour attirer des visiteurs, vendre des liens, etc.).suivant).
Quelles sont les ressources interdites par les moteurs de recherche ?
Sur la base des informations précédentes, nous pouvons conclure quels sites sont les plus susceptibles de ne pas entrer dans les SERP. La même information est exprimée par les représentants officiels des moteurs de recherche. Tout d'abord, il s'agit de sites contenant du contenu non unique, généré automatiquement et qui n'est pas utile pour les visiteurs. Viennent ensuite les ressources contenant un minimum d'informations, créées pour vendre des liens, etc.
Vrai, si vous analysez les résultats des moteurs de recherche, vous pouvez y trouver tous ces sites. Par conséquent, si nous parlons de sites qui ne seront pas présents dans les résultats de recherche, nous devons noter non seulement le contenu non unique, mais également un certain nombre d'autres facteurs - de nombreux liens, une structure mal organisée, etc.
Masquer le contenu. Comment désactiver l'indexation des pages ?
Les moteurs de recherche explorent tout le contenu du site. Cependant, il existe une technique par laquelle vous pouvez restreindre l'accès des robots de recherche à une section particulière. Cela se fait à l'aide du fichier robots.txt, auquel réagissent les "araignées" des moteurs de recherche.
Si ce fichier est placé à la racine du site, l'indexation des pages se fera selon le script qui y est écrit. En particulier, vous pouvez désactiver l'indexation avec une seule commande - Disallow. En plus de cela, le fichier peut également préciser les sections du site auxquelles cette interdiction s'appliquera. Par exemple, pour interdire l'index de tout le site, il suffit de préciserune barre oblique "/"; et pour exclure la rubrique « boutique » des résultats de recherche, il suffit de préciser la caractéristique suivante dans votre fiche: « /boutique ». Comme vous pouvez le voir, tout est logique et extrêmement simple. L'indexation des pages se ferme très facilement. En même temps, les robots de recherche visitent votre page, lisent robots.txt et n'entrent pas de données dans la base de données. Ainsi, vous pouvez facilement manipuler pour voir certaines caractéristiques des sites dans la recherche. Parlons maintenant de la façon dont l'index est vérifié.
Comment puis-je vérifier l'indexation des pages ?
Il existe plusieurs façons de savoir combien et quelles pages sont présentes dans la base de données Yandex ou Google. La première - la plus simple - consiste à définir la requête correspondante dans le formulaire de recherche. Cela ressemble à ceci: site:domen.ru, où au lieu de domen.ru vous écrivez, respectivement, l'adresse de votre site. Lorsque vous faites une telle demande, le moteur de recherche affichera tous les résultats (pages) situés à l'URL spécifiée. De plus, en plus de répertorier simplement toutes les pages, vous pouvez également voir le nombre total de documents indexés (à droite de la phrase "Nombre de résultats").
La deuxième méthode consiste à vérifier l'indexation des pages à l'aide de services spécialisés. Il y en a maintenant un grand nombre, on peut les appeler désinvolte xseo.in et cy-pr.com. Sur ces ressources, vous pouvez non seulement voir le nombre total de pages, mais également déterminer la qualité de certaines d'entre elles. Cependant, vous n'en avez besoin que si vous avez une compréhension plus approfondie de ce sujet. En règle générale, ce sont des outils de référencement professionnels.
À propos de l'indexation "forcée"
J'aimerais aussi écrire un peu sur le soi-disantIndexation « forcée », lorsqu'une personne essaie de faire entrer son site dans l'index en utilisant diverses méthodes « agressives ». Les optimiseurs ne recommandent pas de faire cela.
Les moteurs de recherche, à tout le moins, remarquant une activité excessive associée à une nouvelle ressource, peuvent imposer une sorte de sanctions qui affectent négativement l'état du site. Par conséquent, il est préférable de tout faire pour que l'indexation des pages soit la plus organique, progressive et fluide possible.