logologo

Um was handelt es sich bei XML-Sitemaps?

XML- (Extensible Markup Language) Sitemaps sind Textdateien, in denen alle URLs einer Webseite aufgelistet sind. Den eingetragenen URLs können weitere Informationen zugeschrieben werden. Zu diesen Metadaten zählen beispielsweise das Datum des letzten Updates und Versionen in verschiedenen Sprachen.

Gesteigert wird die Effizienz der Suchmaschinen-Bots beim Crawlen und Indizieren des Seitencontents.

Zwar kann nicht garantiert werden, dass die Verwendung der XML-Sitemaps zur Indexierung führt. Allerdings kann durch die Verwendung dieser Dateien die Wahrscheinlichkeit dazu gesteigert werden. Dies gilt insbesondere dann, wenn nicht alle Seiten intern verlinkt sind.

Folgend sehen Sie ein Beispiel einer XML-Sitemap.

screenshot_1

Sitemap-Tags

<urlset> – Die Sitemap beginnt und endet mit diesem Tag. Momentaner Protocol-Standard.

<url> – Haupttag für alle URL-Einträge.

<loc> – Enthält die absolute URL/Ressourcenzeiger der Seite.

<lastmod> – Gibt das Datum der letzten Änderung im Format JJJJ-MM-TT an.

<changefreq> – Enthält Informationen zur Änderungshäugkeit einer Datei.

<priority> – Zeigt die Bedeutung einer Datei für die Seite auf einer Skala von 0.0 bis 1.0 an.

<xhtml:link> – Enthält im vorliegenden Fall Einzelheiten zu Alternativ-URLs mit Seiteninhalten in
anderen Sprachen.

Beachten Sie folgendes:

  • Pflicht-Tag: Ioc-Tag
    Optionale Tags: Lastmod, changefreq, priority
  • Stellen Sie XML-Sitemaps in das Root Directory Ihrer Seite.
  • In Sitemaps sollten nur kanonische URLs eingefügt werden. Vermeiden Sie Weiterleitungen und Domains, welche zu Fehlermeldungen führen.
  • Für URLs besteht eine Höchstlänge von 2048 Zeichen.
  • Changefreq-Tags sollten nicht täglich geändert werden, auch wenn dies Google ein Update vortäuscht. Doch Updates werden normalerweise nicht täglich durchgeführt, und das wissen auch die Suchmaschinen. Mit dem Vortäuschen erhöhen Sie lediglich die Wahrscheinlichkeit, dass Ihre Seite von Google & Co. ignoriert wird.
  • Die in der Sitemap aufgeführten URLs müssen auf demselben Host sein.
  • Zur Erstellung von Sitemaps können Sie eine Vielzahl an Tools verwenden.

Sitemap-Indexdatei

Für den Fall, dass Sie mehrere Sitemaps für Ihre Webseite verwenden: Jede der Maps muss in einem gemeinsamen Verzeichnis aufgeführt werden. Dieses Verzeichnis ist das Sitemap Index File. Hier ein Beispiel:

.

screenshot_2

Die maximale Anzahl an URLs, welche in eine Sitemap passen, ist 50 000. Haben Sie auf Ihrer Webseite allerdings mehr URLs, werden mehrere Sitemaps erforderlich. Gleiches gilt, wenn die Dateigrösse  10 MB übertrifft.

Um die 10 MB nicht zu überschreiten, können Sie auch diese Dateien gzip-komprimieren. Auf diese Weise spart man Bandbreite. Allerdings muss beachtet werden, dass die Datei auch nach der Dekompression nicht grösser als die maximalen 10 MB wird.

Sitemap Index Datei Tags im Verzeichnis

<sitemapindex> – Steht am Anfang und Ende einer XML-Sitemap und schließt alle individuellen Sitemaps ein.

<sitemap> – Enthält Angaben zu Einzel-Sitemaps.

Beachten Sie, dass ein Sitemap Index File nicht mehr als 50 000 XML-Dateien listen kann.

Unterstützung von XML-Sitemaps

XML-Sitemaps können Sie in mehreren Dateiformaten erstellen. Die seitenspezifischen Sitemaps helfen Suchmaschinen-Bots, die Inhalte schneller zu erkennen.

Folgende Dateiformate können in Sitemaps verwendet werden:

  • HTML
  • Video
  • Bilder
  • Inhalt für mobile Endgeräte
  • Nachrichten

Mit folgenden Tools können Sie Sitemaps erstellen

Erstellung von XML-Sitemaps mit CMS-Plug-ins

Schemata und Validierung für Sitemaps

Um eine funktionelle Sitemap zu erstellen, brauchen Sie XML-Schemata (XSD) für Sitemaps 0.9. Zudem können Sie alle unterstützten Erweiterungen der Sitemaps und deren Elemente und Attribute nutzen. Die Schemata unterscheiden sich je nach Typ der Sitemap und Art der Datei:

Sobald Sie mit der Erstellung der Sitemap fertig sind, können sie die Funktionalität prüfen. Einfach geht dies mit folgenden Tools:

Um die Sitemap vorab zu prüfen, klicken Sie auf „Sitemap prüfen/hinzufügen“ und geben die URL der Sitemap ein.

sitemap
search-console

Beachten Sie, dass die Option ebenfalls dazu dient, die Sitemap an Google zu senden. Zudem sollten Sie folgendes zur Robots.txt-Datei hinzufügen, um die Aufmerksamkeit von Suchmaschinen-Bots zu erlangen:

Sitemap: http://example.com/sitemap.xml

Diese Zeile kann an einer beliebigen Stelle in der robot.txt-Datei eingefügt werden. Der Grund dafür ist, dass diese Direktive vom user-agent-String unabhängig ist. Nach jedem durchgeführten Update können Sie bei Google, mit der bereits genannten Option „Sitemap prüfen/hinzufügen“, die Sitemap neu registrieren.

Kurze Zwischennotiz: Die Sitemap kann auch als HTTP-Request eingereicht werden. Um dies zu tun, müssen Sie lediglich diese URL verwenden:

<searchengineURL>/ping?sitemap=<sitemapURL>

Dazu folgendes Beispiel:

http://www.google.com/webmasters/tools/ping?sitemap=http://www.yoursite.com/sitemap.xml

Der Abschnitt nach ping?sitemap= müssen Sie URL-endcoden

www.google.com/webmasters/tools/ping?sitemap=http%3A%2F%2Fwww.yoursite.com%2Fsitemap.xm

Dieses HTTP-Request können Sie beispielsweise mit wget oder cURL senden.

Bilder-Sitemap

Bei einer hohen Anzahl an Bildern lohnt sich das Erstellen einer eigenen Image-Sitemap, wie in nachstehendem Beispiel:

screenshot_3

Tags-Verzeichnis für Image-Sitemaps

Auch hier erstellen Sie ein Verzeichnis für die Sitemaps.

<image:image> – Enthält alle Bilder-URLs. Liste kann bis zu 1000 Bild-URLs umfassen.

<image:loc> – Gibt Bild-URL an.

<image:caption> – Enthält Bildunterschrift (optional).

<image:geo_location> – Enthält den geografischen Ort des Bilds (optional).

<image:title> – Gibt den Titel des Bildes an (optional).

<image:license> – Enthält die URL bez. der Urheberrechte/Verwendungslizenz des Bildes (optional).

Es besteht keine Garantie, dass alle Seiten Ihrer Webseite indiziert werden, selbst wenn diese in der Sitemap aufgeführt sind. Eine gute Sitemap hat allerdings den Vorteil, dass sie etwaige Indizierungs-Probleme identifizieren kann.

Um herauszufinden, welche Seite tatsächlich von den grossen Suchmaschinen indiziert wurde, können Sie die Google Search Console und Bing Webmaster Tools nutzen. Sind dort nur wenige Ihrer Seiten auffindbar oder nimmt deren Zahl stark ab, sollten Sie Ihre Sitemap genau überprüfen. Es könnten Probleme mit robots.txt-Dateien, doppelten Inhalten oder Weiterleitungen bestehen.

Zur Identifizierung der Fehlerquelle können Sie viele Tools verwenden, wie beispielsweise Screaming Frog. Diese Tools überprüfen alle in der Sitemap aufgelisteten Seiten und prüfen diese auf Fehler.

Überblick über die Sitemaps

Unter „Sitemaps“ haben Sie einen Überblick über alle Ihre Sitemaps. Zudem sehen Sie hier direkt, welche der Maps bereits bei Google registriert und über die Google Search Console gefunden werden können. Zudem werden weitere Informationen angegeben, wie URL-Infos mit deren Sitemap-Typ, durchgeführten Updates und aufgetretenen Problemen. Überdies wird die Anzahl der Seiten angegeben, die insgesamt und in jedem einzelnen Sitemap eingerichtet sind und indiziert wurden.

Sobald Sie die Sitemap oder die Buttons anklicken, können Sie die Map erneut prüfen oder nochmals abschicken.

search-console27