Mauvaise recherche: termes de recherche de sexe populaires

Les gens aiment le sexe. Ils aiment tellement le sexe qu'ils passent beaucoup de temps à le chercher en ligne. Allez comprendre. (Vous pouvez dire que je suis sur le point de me plonger dans des choses vraiment sophistiquées et capiteuses ici ...)

Les chercheurs Ogi Ogas et Sai Gaddam ont récemment publié un livre, Un milliard de mauvaises pensées, détaillant leur analyse de 400 millions de recherches qu'ils ont collectées à partir du moteur de recherche Dogpile. Sur ces 400 millions de recherches, 13% (55 millions) concernaient du contenu érotique.

Comment ces 55 millions de recherches se sont-elles déroulées? Découvrons-le… mais examinons également la méthodologie de ces chercheurs pour voir si leurs résultats valent le papier sur lequel ils sont imprimés. (Si vous ne le pensez pas, vous avez probablement raison.)

Voici donc ce que les gens recherchent sur Dogpile en ce qui concerne leurs intérêts sexuels. Notez que les termes ci-dessous sont la catégorie générale de recherche pour cet intérêt, qui comprend toutes sortes de permutations des termes. Ces permutations (telles que «seins» pour les seins) ne sont pas énumérées ci-dessous; utilise ton imagination.

  1. Jeunesse - 13,5 pour cent
  2. Gay - 4,7 pour cent
  3. MILF (maman que j'aimerais baiser) - 4,3 pour cent
  4. Seins - 4,0 pour cent
  5. Épouses infidèles - 3,4 pour cent
  6. Vagins - 2,8 pour cent
  7. Pénis - 2,4 pour cent

Garbage In, Garbage Out

Il y a un vieux dicton dans la programmation informatique - GIGO: Garbage In, Garbage Out. Cela s'applique également à toute entreprise scientifique, qui ne vaut que pour les données que vous choisissez d'analyser. Si vous commencez avec un ensemble de données dont la généralisation ou la valeur est discutable, vous pouvez vous retrouver à tirer des conclusions qui ont peu de rapport avec la réalité.

Dans ce cas, il y a un énorme problème avec les données de recherche que ces chercheurs ont compilées. Ils ne viennent pas de Google ni même de Bing. Ils proviennent d'un moteur de recherche peu connu appelé "Dogpile" qui n'est même pas un moteur de recherche. Ce qu'est Dogpile est simplement un moteur d'agrégation des résultats de recherche de Google, Yahoo et Bing (puisque Bing fournit désormais à Yahoo leurs données de recherche, je ne sais pas pourquoi il existe encore cette différenciation).

Ce n'est pas la même chose qu'une recherche effectuée sur Google via Google.com ou une recherche effectuée sur Bing via Bing.com. Vous devez en fait vous rendre sur le site Web de Dogpile pour obtenir ces résultats - des résultats qui ont formé l'ensemble de données pour les chercheurs actuels. Si vous effectuez une recherche sur Google.com, votre recherche n'aurait pas été analysée par ces chercheurs (ce qui est logique, étant donné que Google et Bing ne mettent pas les données collectées sur les recherches à la disposition des chercheurs).

Ce qui rend probablement Dogpile peu utilisé, c'est le fait qu'il mélange les annonces de recherche sponsorisées avec les résultats de recherche organiques sans pratiquement aucun indice visuel. Une petite impression à la fin de chaque résultat de recherche vous permet de savoir s'il s'agit d'un résultat «sponsorisé» ou non - par exemple, une annonce. Dans une recherche de «dépression» sur Dogpile, 14 des 20 premiers résultats de recherche étaient des publicités - pas exactement quelque chose que la plupart des gens ordinaires accepteraient très longtemps.

Les personnes à la recherche de contenu en ligne ont depuis longtemps décidé d'abandonner l'utilisation des moteurs de recherche qui tentent de mêler la publicité aux résultats réels. La raison est simple: les gens cliquent sur une publicité lorsqu'ils sont intéressés par le produit ou le service proposé. Ils n'aiment pas être amenés à cliquer sur ce qu'ils pensaient être un résultat de recherche, seulement pour découvrir qu'il s'agissait d'une annonce déguisée.

Alors, qui utilise Dogpile? Qui sait, mais ce n’est certainement pas un utilisateur d’Internet grand public. Alors que plus de 150 millions de personnes utilisent Google et 90 millions utilisent Bing.com, les maigres 2 à 3 millions de personnes par mois de Dogpile sont dérisoires en comparaison et représentent bien moins de 0,05% du marché total des moteurs de recherche.

Pouvez-vous mener une enquête sur un si petit ensemble de données et essayer d'utiliser de la fumée et des miroirs pour donner l'impression que vous avez fait le même genre de recherche révolutionnaire que le Kinsey Institute a fait dans les années 1950 et 1960? Vous pouvez certainement.

Par exemple, Ogi Ogas et Sai Gaddam ont déclaré avoir analysé 400 millions de recherches sur Internet. Mais comparez ce nombre aux 3 milliards de recherches effectuées chaque jour, selon Hitwise, une société d'analyse en ligne. Soudain, 400 millions - bien qu'apparemment un nombre impressionnant dans le vide - semblent beaucoup moins impressionnants lorsqu'ils sont placés dans une sorte de contexte de données. 400 millions de recherches, c'est l'équivalent de ce qui est effectué en environ 3 heures. En un jour.

Le contexte est, bien sûr, tout ce qui concerne les ensembles de données, en particulier lorsque ces ensembles de données sont susceptibles d'être biaisés d'une manière que vous n'avez jamais pris la peine d'enquêter. Dans ce cas, l'ensemble de données est biaisé par l'utilisation du moteur de recherche Dogpile - un minuscule moteur de recherche de niche qui est plus probablement utilisé que non par un certain sous-ensemble de la population qui diffère du reste de la population.

Alors prenez cette liste avec un grain de sel. C'est intéressant, mais je ne suis pas sûr que cela reflète la population en général. Et cela ne vaut certainement pas la peine d’acheter un livre complet qui explore cet ensemble de données défectueux.

!-- GDPR -->