Google’s automagische Sitelinks, soms een beetje zwarte magie ;)

Geplaatst op 12 september 2008 door Frank Bosma onder 3voor12, google, zoekmachine
Tags: , ,

\'Kijk en Luister\' linkt naar geschiedenis.vpro.nl

Fervent Frank-ly.nl blogger Frank Meeuwsen attendeerde ons op een eigenaardigheid als je googlet op ‘3voor12‘. Onder het allereerste zoekresultaat, 3VOOR12 – Home, worden een aantal extra linkjes getoond, de zogeheten Google Sitelinks. Het linkje ‘Kijk en Luister’ linkt echter niet zoals verwacht naar de 3VOOR12 Kijk en Luister pagina, maar naar een artikel op VPRO’s Geschiedenis website. ‘Kijk en Luister’ wordt echter ’Kijk en Huiver’ voor menig Marketing & Communicatie afdeling als blijkt dat het een artikel over Hasj betreft!?

Een leuke 1 april grap, ware het niet dat het nu al 12 september is :)

Sitelinks?
Google Sitelinks zweven al zo’n 2 jaar onder de top zoekresultaten, maar wellicht is het vanwege bovengenoemde ‘bug’ handig onze kennis even op te frissen. Google beantwoordt de meeste vragen over Sitelinks al op z’n ‘Helpcentrum voor webmasters‘. Google’s systemen analyseren de linkstructuur van je site om kortere routes te vinden die gebruikers tijd besparen om de informatie te vinden die ze zoeken. Volautomatisch en algoritmisch worden er Sitelinks gegenereerd en alleen wanneer Google denkt dat ze handig zijn voor de gebruiker verschijnen ze onder het zoekresultaat. Er moeten wel minstens 3 Sitelinks beschikbaar zijn. Daarnaast verschijnen de links voornamelijk bij een autoriteit op het gebied van de gegeven zoekterm.

Hebben we enige invloed?
Zeker handig die extra links, en volautomatisch scheelt weer werk aan een webmasters kant, maar kunnen we er dan wel invloed op uitoefenen, voor als het misgaat bijvoorbeeld? Oktober vorig jaar heeft Google aan z’n Webmasterhulpprogramma’s de mogelijkheid toegevoegd om als webmaster inderdaad een klein beetje invloed uit te oefenen en wel door het kunnen blokkeren van bepaalde Sitelinks. Dat is dan ook echter meteen de enige invloed die je hebt en daarnaast wordt zo’n Sitelink maar 90 dagen geblokkeerd. Bovendien moet je de betreffende site eerst aanmelden om de hulpprogramma’s van Google te kunnen gebruiken en daarvoor moet je bewijzen dat je de eigenaar bent door het plaatsen van een te verifiëren stukje code in (of een bestand op) de website.
Bijkomend voordeel zijn dan wel de overige handige hulpprogramma’s, zoals

  • Bekijk de meest uitgevoerde zoekopdrachten die jouw site naar voren halen
  • Hoe ziet de Googlebot je site, welke inhoud valt hem op?
  • Welke sites linken allemaal naar jouw site?
  • Ondervindt Google problemen bij het doorzoeken van je site?

Algoritme
Genoeg reclame voor Google :) , er zijn namelijk nog steeds wat vragen over de Sitelinks. Met name wanneer ze ververst worden, zodat de ‘Kijk en Luister’ link hopelijk binnenkort gefixed is. Of moeten we toch maar gaan blokkeren? Daarnaast uiteraard de grote vraag, hoe werkt het algoritme nu precies?  Er doet wat dat laatste betreft genoeg speculatie de ronde op het web. Blogger Bill Slawiski baseert zijn speculaties echter op een door Google in 2006 aangevraagd patent genaamd ‘Systems and methods for providing search results‘ , waarin een gedeelte staat over het retourneren van zoekresultaten waarbij in ieder geval één van de zoekresultaten wordt begeleid door een groepje extra links. Je raadt het al, de Sitelinks. Volgens het patent linken deze links naar pagina’s die de gebruikers hoogstwaarschijnlijk zouden willen bezoeken. Volgens Bill bepaalt Google welke pagina’s dat zijn aan de hand van logbestand analyse om o.a. te kijken:

  • Hoe vaak een pagina bezocht is
  • Hoe lang een bezoeker op de pagina bleef
  • Of de bezoeker gescrolled heeft, of geklikt op een link zonder gescrolled te hebben
  • Hoe hoog de pagina scoort wat betreft informatieve waarde in relatie tot de gegeven zoekterm
  • Of het waarschijnlijk is dat een gebruiker een aankoop doet op de pagina(indien relevant)
  • Welke overige informatie er is die aan kan geven of iemand geïnteresseerd zou kunnen zijn in deze pagina

De loggegevens hiervoor kunnen komen van de zoekmachine zelf, het gebruik van de Google browser toolbar (wie heeft hem nog? :)), maar uiteraard ook uit het veel gebruikte gratis Google Analytics statistieken programma, waarmee Google data vergaart voor een hoop van de bovengenoemde punten.

Om terug te komen op 3VOOR12; één van de Sitelinks heeft als titel Audio/Video en linkt naar de Audio/Video pagina van de festivalsite van Pinkpop 2008 op 3VOOR12. Best een slimme link. Niet direct bereikbaar vanaf de 3VOOR12 homepage, maar wel één van de meest bezochte ’sites’ dit jaar onder 3VOOR12 en dus een interessante extra link voor iemand geïnteresseerd in 3VOOR12.

Toekomst
Het patent concludeert (aantekening [0060]) met de opmerking dat in de toekomst de website eigenaar ook de mogelijkheid zou kunnen krijgen om aan Google kenbaar te maken wat de meest interessante pagina’s zijn op zijn/haar site. Een kleine stap in die richting is uiteraard al gedaan doordat Google het Sitemap protocol ondersteunt. Een webmaster kan een zogheten sitemap XML bestand op z’n site plaatsen waarin hij aangeeft uit welke pagina’s de site bestaat. Per pagina kan onder anderen nog worden aangegeven hoe vaak de pagina wijzigt, wanneer hij voor het laatst is gewijzigd, maar ook het relatieve belang t.o.v de andere pagina’s. De homepage is vaak belangrijker dan de disclaimer pagina om maar wat te noemen. Google, maar ook andere zoekmachines kunnen deze sitemap vervolgens gebruiken om de site beter te doorzoeken. De genoemde ‘relatieve belang’ eigenschap zou in principe kunnen voorzien in wat het Google patent onder aantekening [0060] beschrijft.

Dooie mus
Okay, een hoop gegoogle, maar nog steeds niet uitgezocht waarom nu de link naar het Geschiedenis artikel verschijnt als ‘Kijk en Luister’ Sitelink voor 3VOOR12. Iemand anders inmiddels een idee? Ik denk dat we het nog even aanzien, maar daarna toch maar de Blokkeer functie van het Webmasterhulpprogramma inschakelen. Je kan hier tevens aangeven waarom je de betreffende Sitelink wilt blokkeren, dus als ik in die comments nou de vraag stel hoe ze aan die link zijn gekomen?…

Lees meer:

16 Reacties op “Google’s automagische Sitelinks, soms een beetje zwarte magie ;)”

  1. Ha Frank,
    Leuk en interessant artikel, dank daarvoor!
    En over die link ‘Kijk en luister’, mja, inderdaad vreemd. De linktekst is goed, maar de link is niet goed. Ik denk een foutje van Google (is dat dan mogelijk? - blijkbaar).

    Maar ik ga nog even verder zoeken, wellicht is het te verklaren, maar mijn eerste reactie is: niet te verklaren :)

    Of er zou ooit een fout in de 3 voor 12 website gezeten moeten hebben die de link Kijk en Luister naar die Hasj site leidde…

  2. frank zegt:

    Hoi Reinout!
    “Of er zou ooit een fout in de 3 voor 12 website gezeten moeten hebben”

    Haha, ja, een soort Rick Rollin’, maar dan de Joint Rollin’ versie ;) En dan komt net Google langs met indexeren…

  3. Interessant artikel zeg…

    Inderdaad vreemd van google, maar…

    Wat wel interessant is, is dat:
    http://geschiedenis.vpro.nl/programmas/afleveringen/16305180/

    inderdaad naar een artikel over hasj gaat, maar vervang je “geschiedenis” door “3voor12″ dan kom je wel degelijk bij “kijk en luister” uit:

    http://3voor12.vpro.nl/programmas/afleveringen/16305180/

    De link structuur van /geschiedenis en 3voor12 is kennenlijk hetzelfde. Google kijkt alleen naar het domein [vpro.nl] en maakt, blijkbaar, geen onderscheid tussen de subdomeinen. Aangezien de meeste vpro sites op een subdomein draaien, zou dit misschien wat kunnen verklaren…

    Groeten,

    Bjørn

  4. f.bosma zegt:

    @Bjørn Heei, dat is interessant! Hmmm, klinkt ook heel aannemelijk. Waarom het geschiedenis subdomein dan nog de voorkeur krijgt is de vraag, maar om Google hierop te attenderen is misschien wel een goed idee. Thanks!

    Overigens wordt er op het eind van het hasj artikel wel gepraat over Jazz musici en het gebruik van drugs in die kringen, dus er is nog wel een beetje een muzikale link :)

  5. Ha Frank en Bjørn,

    Na de reactie van Bjørn ben ik weer verder gaan kijken en kwam tot de volgende link:

    http://3voor12.vpro.nl/programmas/afleveringen/16305180

    HASJ HASJ HASJ!

    Vergelijk die eens met:

    http://3voor12.vpro.nl/programmas/afleveringen/16305180/

    KIJK EN LUISTER!

    Voilá! We got him!
    Beide 3voor12 subdomeinen.

    Wat een / al wel niet kan doen.

    Mijn eerste reactie was zo gek nog niet, blijkbaar gaat er iets niet goed bij jullie doorverwijzing van subdomeinen en pageID’s van programma’s.

    Hoe kwam ik hierbij?

    Een simpele search op site:vpro.nl op hasj 3voor12 vrpo.

    http://www.google.nl/search?hl=nl&client=firefox-a&rls=org.mozilla%3Anl%3Aofficial&hs=NdF&q=site%3Avpro.nl+3voor12+vpro+hasj&btnG=Zoeken&meta=

    Groet!
    Reinout

  6. Frank Bosma zegt:

    @Reinout Haha, we zijn er bijna. Jouw zoektocht heeft mij ook weer geïnspireerd.

    De meeste VPRO sites zijn namelijk gebaseerd op het Content Management Systeem MMBase. Hierin worden objecten opgeslagen onder een bepaalde noemer zoals, afbeelding, aflevering, teaser, categorie. De MMBase VPRO sites delen dezelfde database en derhalve ook dezelfde ‘noemers’. Als je URL’s rechtstreeks met databae ID’s aanroept is er op deze manier kruisbestuiving mogelijk.

    VB, 3VOOR12 in de Noorderlicht site:
    http://noorderlicht.vpro.nl/afleveringen/39949885/
    vs waar het programma eigenlijk thuishoort:
    http://3voor12.vpro.nl/programmas/afleveringen/39949885

    Of de In Europa aflevering http://ineuropa.nl/jaar/1906/?episode=36625022
    in /Geschiedenis vormgeving:
    http://geschiedenis.vpro.nl/afleveringen/36625022/

    Zo krijg je dus het /Geschiedenis artikel http://geschiedenis.vpro.nl/afleveringen/39739841/ in 3VOOR12:
    http://3voor12.vpro.nl/programmas/afleveringen/39739841

    Het is inderdaad zo dat de laatste / ervoor zorgt of de pagina al dan niet crashed. Ook moet voor elke site de juiste content van het MMBase object ingevuld zijn.

    Dit verklaart in ieder geval waarom sommige VPRO content in een onjuist lijkende context geplaatst kan worden, maar nog niet waarom de Kijk en Luister link specifiek naar het Hasj artikel op het geschiedenis subdomein linkt :)

    Het moet wel een erg populair of interessant artikel zijn en zolang het daar bij de Sitelinks blijft staan, blijven mensen erop klikken, wat weer een mooi(e) vicieuze cirkel / sneeuwbaleffect oplevert.

    Ik verklaar nu wel de kruistocht geopend op het vinden van leuke kruisbestuivende VPRO content ;)

  7. Sanne Smeets zegt:

    Zo kwamen wij er onlangs achter dat omroep.nl een artikel had geschreven over hun special over de Ramadan.
    http://portal.omroep.nl/?nav=liawiXsHEnCwNtHejB

    Daarin stond ergens vermeld: zie het dossier Islam van Holland Doc en er werd gelinkt naar http://www.hollanddoc.nl/dossiers/24782312/

    Holland Doc heeft geen dossier Islam, dit is informatie van /Geschiedenis die bij Holland Doc ‘naar boven komt’.

    Maar ook interessant is om te zoeken via de zoekmachine van documentaire-website Holland Doc naar speelfilmregisseur Tim Burton: http://www.hollanddoc.nl/artikelen/23225942/
    (Cinema.nl doet ook mee…)

    Interessante wegen van MMbase!
    groet
    Sanne

  8. Haha, prachtig systeem dat MMbase, zo kan je zelf contentmashen :)

    Trouwens, de sitelinks lijken nu goed te staan.

    Hasj heeft zelfs een eigen link gekregen :)

    Het gekke is dat de eerste link ‘Kijk en luister’ nu een witte pagina oplevert…

    Kijk en Luister
    DJ-sets
    Artiesten
    Hasj Voorpagina
    Audio/Video
    Doe Mee
    Nieuws en achtergronden

    Meer resultaten van vpro.nl »

  9. This post has been very helpful to me. I’ve just started a self-hosted blog and this article helped much. thank you!

  10. I’m boy new to the web and also needed to read up on this subject.

  11. Like a whole lot of some,now could be our first-time submitting the following,My partner and i absolutely want your site and also might be utilised typically.

  12. I’m sorry my spouse and i skipped the blogrollage concerning me personally, Suzi. you happen to be now inside the roll!

  13. My partner and i?m probably to ubscribe for the give food to. Let me appreciate if you maintain on this certain in the future.

  14. I genuinely like your site!! Amazing, wonderful articles! Thanks for creating time for it to try this

  15. We only couldnt preserve your site prior to praoclaiming that we really loved the beneficial specifics you offer inside your guests… Will most likely be back typically to verify on high on brand-new posts

  16. I began studying the idea I can definitely not use it straight down until lastly I concluded the idea.

Laat een reactie achter