Google Sitemaps und internationale Magento-Shops mit mehreren Domains

Google Webmaster Tools helfen die Indizierung eines Shops zu überwachen und zu kontrollieren. Wenn Sie einen internationalen Magento-Shop betreiben/einrichten, der unter verschiedenen Top-Level-Domains erreichbar sein soll, müssen einige Details bei der Verwaltung von Sitemaps beachtet werden.

Die sitemap.xml ist dabei sehr hilfreich und kann von Magento automatisch erstellt werden: Katalog > Google Sitemap.

Auch wenn Magento bei der Sitemap-Erstellung ein Feld für den Dateinamen anbietet, muss die XML-Datei unbedingt sitemap.xml heißen. Bei Verwendung eines anderen Namens, z. B. sitemap_de.xml, bekommt man eine seltsame Fehlermeldung:

Pfad „…“ ist nicht verfügbar und kann nicht verwendet werden.

Englische Version:

Path „…“ is not available and cannot be used.

Die Sitemaps für die verschiedenen Shops der gleichen Magento-Installation können in verschiedenen Unterverzeichnissen des Shop-Verzeichnisses erstellt werden:

  • sitemap/en/sitemap.xml
  • sitemap/de/sitemap.xml

Die Sitemaps sollen in die robots.txt eingetragen werden:

Sitemap: /sitemap/sitemap.xml

Da unter verschiedenen Shop-Domains die gleiche Datei robots.txt vorliegt, können mehrere Sitemaps in der robots.txt eingetragen werden. Laut sitemaps.org: Sitemaps & Cross Submits muss in diesem Fall der vollständige Domainname eingetragen werden:

Sitemap: http://www.mein-shop.de/sitemap/de/sitemap.xml
Sitemap: http://www.mein-shop.de/sitemap/en/sitemap.xml

Dabei ist es unerheblich, welche der Shop-Domains hier verwendet wird; Auch diese Variante wäre zulässig:

Sitemap: http://www.mein-shop.de/sitemap/de/sitemap.xml
Sitemap: http://www.mein-shop.com/sitemap/en/sitemap.xml

Wenn Sie unter der jeweiligen Shop-Domain jeweils die passende Sitemap unter der gleichen URL verwenden wollen, lässt sich dies über eine .htaccess-Weiche realisieren:

sitemap/.htaccess

RewriteEngine on

RewriteCond %{HTTP_HOST} ^(www.)?mein-shop.de$
RewriteRule sitemap.xml de/sitemap.xml [L]

RewriteCond %{HTTP_HOST} ^(www.)?mein-shop.com$
RewriteRule sitemap.xml en/sitemap.xml [L]

RewriteRule .* / [L]

robots.txt

Sitemap: /sitemap/sitemap.xml

Die beiden Sitemaps befinden sich weiterhin in den Unterverzeichnissen en und de:

  • sitemap/en/sitemap.xml
  • sitemap/de/sitemap.xml
  • sitemap/.htaccess

Mit der .htaccess-Weiche können wir die Sitemap unter http://www.mein-shop.de/sitemap/sitemap.xml und unter http://www.mein-shop.com/sitemap/sitemap.xml (ohne Angabe der Unterverzeichnisse en bzw. de) aufrufen und bekommen die sitemap.xml jeweils aus dem passenden Unterverzeichnis ausgegeben.

Damit die Sitemap regelmäßig automatisch erneuert wird, kann dazu ein Magento-interner Cronjob konfiguriert werden:
System > Konfiguration > Katalog: Google Sitemap > Einstellungen für die Erstellung

Die Voraussetzung, dass die Sitemap dann tatsächlich automatisch erstellt wird, ist der regelmäßige Aufruf der cron.php bzw. cron.sh im Hauptverzeichnis von Magento durch Crontab.

Um Ihren Shop vor DDoS-Attaken durch häufigen Aufruf von cron.php zu Schützen, sollten die Zugriffsrechte der cron.php so konfiguriert sein, dass sie nicht im Browser aufgerufen werden kann. Alternativ kann sie z.B. in cron123.php umbenannt werden (der Inhalt von cron.sh muss angepasst werden).

Gerne beraten und unterstützen wir Sie bei der Suchmaschinenoptimierung Ihres Online-Shops.

Dieser Beitrag wurde unter Tutorials abgelegt und mit , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

Schreib einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *