Milyen Sitemap-ot használjak?

Nem elegendő, hogy elkészül egy honlap, de el kell érni, hogy látogatók is jöjjenek az oldalra, ehhez pedig tudatnunk kell a keresőkkel, hogy elkészült az oldalunk és bizony tartalommal is feltöltöttük. Na, itt jön képbe az oldaltérkép, vagyis a Sitemap.
Az oldaltérkép szerepe az évek alatt változatlan maradt, de a hagyományos értelemben vett oldaltérképek egyre kevésbé találhatók meg az oldalakon. Ez többek között azért is van mert a látogatók nagy része megtanult navigálni az oldalakon és megtalálja amit akar.

A régi oldaltérkép fogalmát az XML szerkezetű oldaltérképek kezdik átvenni. Ezek azok az oldaltérképek, amik a kereső robotok számára készülnek. Most megismerkedünk pár fajtával, hogy kicsit mindenki képben legyen melyiket mikor érdemes használni és hogyan.

XML Sitemaps Protokoll - vagyis a Google Sitemaps


A világ elsőszűmú keresője 2005-bemn vezette be a saját szabványát, amelynek alapját az XML szabványok nyújtják. Azóta a legtöbb kereső motor használja és érti ezt a szabványt tehát egyértelműen ez a legfontosabb oldaltérkép szerkezet, amire biztosan szükségünk lesz mikor elkészült a honlapunk. Azért hogy a keresők megtalálják az oldaltérképünket két dolgot tehetünk, az egyik, hogy a Google Webmaster Tools-ba beregisztráljuk az oldalunkat és feltöltjük az XML-t vagy, ami ennél is fontosabb, hogy létrehozzuk a robots.txt-nket, amibe az alábbi sorokat véssük:

User-agent: *
Sitemap: http://www.example.com/sitemap.xml

Amit fontos tudni:

  • a robots.txt-ben egymás alá több oldaltérképet is megadhatunk
  • egy oldaltérkép maximum 50000 bejegyzést tartalmazhat és max 10M lehet
  • maximum 1000 oldaltérképet linkelhetünk be
  • UTF8-as kódolást használjunk

Most hogy ezeket tudjuk, lássuk miből is áll egy ilyen oldaltérkép. A minta jelenleg két oldalt tartalmaz, de ennek alapján mindenki tudja, hogy is kell kinézzen.
 http://www.napfenyapartman.com/ 2011-08-20T16:32:20+00:00 weekly 1.00 http://www.napfenyapartman.com/&lang=hu 2011-08-20T16:32:20+00:00 weekly 0.80

Az oldaltérképet generálhatjuk automatikusan PHP-val, erre számos példát találhatunk a neten, de bátran nekiugorhatunk mi is hiszen nem olyan nehéz. A kigenerált fájlt mindig az oldalunk gyökér könyvtárába helyezzük el és lehetőleg sitemap.xml néven. Amenyiben online szeretnénk generálni a legjobb alkalmazást a http://www.xml-sitemaps.com nyújtja 500 hivatkozásig ingyenesen! Amennyiben többet akarunk indexelni a 20 dollárt megéri a program, amit akárhányszor feltelepíthetünk és használhatunk plusz a frissítéseket is megkapjuk örök életünkben.

TEXT Sitemap


A leg egyszerűbb oldaltérkép, sok haszna nincs, de jó tudni, hogy van ahol ilyet kérnek. Az alapja hogy egy egyszerű TXT fájlba soronként berámoljuk az összes linket, ami az oldalunkon van.


Amit fontos tudni:

  • A Yahoo szereti nagyon főleg ha urllist.txt néven helyezzük el
  • UTF8-ba mentsük le
  • Minden térkép maximum 50000 hivatkozást tartalmazhat

http://www.example.com/
http://www.example.com/some-directory/


XHTML / HTML Sitemap


Fontosságukat tekintve azért említjük meg őket, mert gyakorlatilag az összes robot és a legtöbb böngésző vígan elboldogul velük. Ezek a fájlok olyanok mintha az oldalunknak csinálnánk egy másik oldalt, amire összegyűjtjük tömören linkekben miről is van szó. Az XHTML és a HTML között egyértelműen csak a header deklarálásában van különbség. A példánkban XHTML-es verziót mutatunk be, amitől a HTML-es annyiban különbözik, hogy így kezdődik:

Amit fontos tudni:

  • A HTML alapú térképeket generálhatjuk PHP vagy más programmal is
  • Akármennyi linket elhelyezhetünk benne


  This is a site map
  
    

header of XHTML site map

site map paragraph with links


ROR Sitemap (RSS Sitemap)


Végül, de nem utolsó sorban érdemes megemlíteni az RSS oldaltérképeket, amelyek közül a ROR kiterjesztett Sitemap-ok kezdenek leginkább uralni. Egyelőre nem minden kereső támogatja ezeket, de a Google már jó néven veszi, ha elhelyezünk egy ror.xml-t a gyökérkönyvtárunkban és a következő formátumban töltjük fel:
 Feeds World News Feed World Info http://www.acme-news.com/world/rss.xml    
      Feed rss 2.0 2005-12-02T11:05:00-08:00 hour USA News Feed USA News http://www.acme-news.com/usa/rss.xml    
      Feed rss 2.0 2005-12-02T11:05:00-08:00 hour

Ezen kívül a ROR igen sok mindenre alkalmas, hiszen videóktól kezdve az eseményeken át egészen a galériákig számos paraméterrel tudathatjuk a kereső számára, hogy mit is talál az adott oldalon. Bővebben a ROR-ről a honlapján, vagyis ide kattintva olvashattok, ahol minta példák is vannak dögivel. http://www.rorweb.com/

Összegzés


Alapvetően egyelőre a legfontosabb a Google által preferált XML Sitemap, ha ez megvan, akkor az már sikernek tekinthető! Fontos, hogy a robots.txt-be helyezzük el a hivatkozását.
Előre mutató kezdeményezés a ROR XML, ami valószínűleg előbb utóbb kiváltja a sima XML sitemap-okat, hiszen sokkal jobban specifikálja egy oldal tartalmát és így nem magának a Google-nak kell eldöntenie mit is talált, hanem mindössze csak ellenőriznie kell a beküldött adatok helyességét. Ez azonban még a jövő egyelőre használjuk a sima sitemap.xml-eket és 3-6 nap alatt a Google végig olvassa az oldalunkat biztosan.
Milyen Sitemap-ot használjak?

#totalstudio