SMF 1.0.6 SEO

Started by schoeppchen, March 29, 2006, 06:46:21 AM

Previous topic - Next topic

schoeppchen

Hallo,

ich verzweifele noch. Habe jetzt etliche Forenpostings hier gelesen, leider nirgends eine Lösung gefunden.

Problem: Google indiziert meine Seiten (http://www.linuxhelpforum.de/) nicht!

Was habe ich bisher getan: Option "Zeige URLs ohne "?"" im Admin Panel geschaltet, Google Sitemap angelegt (http://www.linuxhelpforum.de/sitemaps.php)

Leider weigert sich Google noch meine Seiten zu indizieren. Hintergrund ist vermutlich, dass Robots keine Cookies zulassen, also wird bei SMF die PHPSESISONID angehängt, das wiederum stört Google anscheinend massiv, so dass er bei mir den Spiderprozess abbricht und mich in Google überhaupt nicht listet (auch nicht mit Seiten, die er schon gespidered hat).

Kennt hier jemand eine saubere Lösung?

willi1

hast Du mittlerweile eine Lösung würde mich auch brennend Interessieren

kann doch nicht sein das wir die einzigen sind im German Forum die eine Sitemap einbinden wollen

bitte meldet euch!!!  ;)

lg

André

willi1

hat denn keiner von Euch eine Idee oder einen Tipp?

ich habe die sitemap.php bei google eingetragen und bekomme immer die Meldung

URL is not allowed

ich dachte eigentlich das google eine xml Datei braucht aber so wie ich das hier im Forum gelesen habe ist das wohl anders, aber vielleicht habe ich das auch nur falsch verstanden weil mein englisch nicht so gut ist.

das wäre echt super vielen dank im vorraus

lg

André

schoeppchen

Quote from: willi1 on April 16, 2006, 12:32:49 AM
hat denn keiner von Euch eine Idee oder einen Tipp?

ich habe die sitemap.php bei google eingetragen und bekomme immer die Meldung

URL is not allowed

Die sitemap.php muss genau auf gleicher Ebene zur URL liegen, die du an Google submittest.

An meinem Beispiel: Die Seite sitemaps.php auf http://www.linuxhelpforum.de soll bei Google eingetragen werden, dann muss diese unter http://www.linuxhelpforum.de/sitemaps.php verfügbar sein und nicht wie in dem Tutorial auf der Seite beschrieben in einem Unterverzeichnis. Kopiere also die sitemaps.php in dein Rootverzeichnis welches du bei Google Sitemaps angibst und ändere oben den Include-Pfad zur SSI.php (bei mir da im Document-Root also in require_once('SSI.php');).

Hoffe das hilft, bei mir gings danach.

Gelistet werde ich "natürlich" weiterhin nicht in Google :(

mediman

Quote from: schoeppchen on March 29, 2006, 06:46:21 AM
Hallo,

ich verzweifele noch. Habe jetzt etliche Forenpostings hier gelesen, leider nirgends eine Lösung gefunden.

Problem: Google indiziert meine Seiten (http://www.linuxhelpforum.de/) nicht!

Was habe ich bisher getan: Option "Zeige URLs ohne "?"" im Admin Panel geschaltet, Google Sitemap angelegt (http://www.linuxhelpforum.de/sitemaps.php)

Leider weigert sich Google noch meine Seiten zu indizieren. Hintergrund ist vermutlich, dass Robots keine Cookies zulassen, also wird bei SMF die PHPSESISONID angehängt, das wiederum stört Google anscheinend massiv, so dass er bei mir den Spiderprozess abbricht und mich in Google überhaupt nicht listet (auch nicht mit Seiten, die er schon gespidered hat).

Kennt hier jemand eine saubere Lösung?

Googles Spider und zwar alle Versionen, entfernen selbstständig die SID´s.
Ich vermute mal deine Sitemap ist fehlerhaft.
Bei mir werden alle Posts innerhalb kürzester Zeit gelistet.

Unbedingt überprüfen, ob

1. Der Host nicht von Google gesperrt ist, so z.B. durch Googlebombingversuche
2. Eine eventuell vorhandene robots.txt korrekt ist.
3. In der Index.template.php die Metas korrekt sind.
4. Ob die Sitemap korrekt ist.

P.S. die Sitemap ist zwar nützlich, aber keine Bedingung für die Indizierung des SMF´s.

Infos zu Sitemaps gibt es hier:
http://www.google.de/webmasters/sitemaps/docs/de/about.html

mediman
My Projects: http://ticker-oase.de 
Please do not PM me with support requests.

mediman

Quote from: schoeppchen on April 16, 2006, 04:20:34 AM
Gelistet werde ich "natürlich" weiterhin nicht in Google :(

Google nimmt sich teilweise recht lange Zeit beim Listen.
Im Übrigen empfehle ich die Benutzung des OAI-PMH Protokolls als Sitemap.
My Projects: http://ticker-oase.de 
Please do not PM me with support requests.

mediman

Thema "URL not allowed"

Bitte die google docs lesen:

QuoteWie bei anderen Sitemaps müssen sich die URLs auf der gleichen Website und an der gleichen Verzeichnisposition oder unterhalb der baseURL befinden. Wenn Sie beispielsweise http://www.example.com/oaiserver als baseURL hinzufügen, würden die folgenden URLs als gültig betrachtet:

    * http://www.example.com/
    * http://www.example.com/samples.html
    * http://www.example.com/images/

Würden Sie jedoch http://www.example.com/dataprovider/oaiserver hinzufügen, würde keine dieser URLs als gültig betrachtet.
My Projects: http://ticker-oase.de 
Please do not PM me with support requests.

schoeppchen

Hallo,

Quote from: mediman on April 16, 2006, 04:24:39 AM
Unbedingt überprüfen, ob

1. Der Host nicht von Google gesperrt ist, so z.B. durch Googlebombingversuche

Wie kann ich das tun?

Quote from: mediman on April 16, 2006, 04:24:39 AM2. Eine eventuell vorhandene robots.txt korrekt ist.

Ja, diese wird korrekt von Google ausgewertet (sagt er ja auch im Google Sitemaps Konto). Siehe http://www.linuxhelpforum.de/robots.txt

Quote from: mediman on April 16, 2006, 04:24:39 AM3. In der Index.template.php die Metas korrekt sind.

Ich habe folgende (siehe http://www.linuxhelpforum.de/):


<meta name="DESCRIPTION" content="Das Linux Help Forum hilft Einsteigern, Fortgeschrittenen und Experten in den alltäglichen Administrationsfragen rund um Linux, UNIX und BSD.">
       
<meta name="Abstract" content="Linux Help Forum - Nutzer helfen Nutzern - www.linuxhelpforum.de - Hilfe für Linux auf deutsch und englisch">
       
<meta name="Page-Topic" content="Linux">
       
<meta name="Keywords" content="linux, unix, help, howto, redhat, suse, gentoo, red-hat, debian, ubuntu, knoppix, woody, sarge, etch, installation, support, mysql, apache, postgresql, iptables, LPIC">
       
<meta name="language" content="de">
       
<meta name="ROBOTS" content="INDEX,FOLLOW">
       
<meta name="REVISIT-AFTER" content="3 days">
       
<meta name="AUTHOR" content="Oliver Neumann">
       
<meta name="PUBLISHER" content="Oliver Neumann">
       
<meta name="IDENTIFIER-URL" content="http://www.linuxhelpforum.de">
       
<meta name="DC.Title" content="linuxhelpforum.de">
       
<meta name="DC.Subject" content="Linux Help Forum - Nutzer helfen Nutzern - www.linuxhelpforum.de">
       
<meta name="DC.Description" content="Linux Help Forum - Nutzer helfen Nutzern - www.linuxhelpforum.de">
       
<meta name="DC.Publisher" content="Oliver Neumann">
       
<meta name="DC.Identifier" content="http://www.linuxhelpforum.de">
       
<meta name="DC.Language" content="de">


Siehst du da etwas auffällig falsches, was Google dazu bewegen könnte das Spidern zu verhindern?

Quote from: mediman on April 16, 2006, 04:24:39 AM4. Ob die Sitemap korrekt ist.

Laut Google Sitemaps habe ich keine Crawling- oder Blockingfehler, er scheint sie also zu akzeptieren. Meine Sitemap ist verfübar unter http://www.linuxhelpforum.de/sitemaps.php - siehst du hier irgendwas was schief laufen könnte?

mediman

Zu 1.

Wenn die Sitemaptestdatei durchgeht, ist deine URL nicht gesperrt.

Zu 2.

erledigt

Zu 3.

Bitte unbedingt in den Metas die deutschen Umlaute als Entities darstellen.

Die Sitemap benötigt bei mir, wenn ich sie wie Google aufrufen möchte, sehr lange.
Unter Umständen führt das zu Timeouts ...
Syntaktisch ist sie aber korrekt.
My Projects: http://ticker-oase.de 
Please do not PM me with support requests.

schoeppchen

Quote from: mediman on April 16, 2006, 04:42:08 AM
Zu 3.

Bitte unbedingt in den Metas die deutschen Umlaute als Entities darstellen.

Sind da denn Umlaute drin? ;)

mediman

Quote from: schoeppchen on April 16, 2006, 04:49:06 AM
Quote from: mediman on April 16, 2006, 04:42:08 AM
Zu 3.

Bitte unbedingt in den Metas die deutschen Umlaute als Entities darstellen.

Sind da denn Umlaute drin? ;)

;)
My Projects: http://ticker-oase.de 
Please do not PM me with support requests.

schoeppchen

Könnte es denn sein, dass meine Seite deshalb nicht gelistet wird, weil innerhalb vom Google Suchindex keine Seite auf mich verweist?

Siehe: http://www.google.de/search?hl=de&q=allinurl%3Ahttp%3A%2F%2Fwww.linuxhelpforum.de&btnG=Google-Suche&meta=

mediman

Das verlängert zumindest die Zeit, bis deine Seite erstmals indiziert wird.
Auswirkung auf ein Ranking hat es in jedem Fall.

My Projects: http://ticker-oase.de 
Please do not PM me with support requests.

mediman

Ruf mal deine Sitemap in einem Textbrowser auf ...
Lynx sollte reichen ...
My Projects: http://ticker-oase.de 
Please do not PM me with support requests.

schoeppchen

Quote from: mediman on April 16, 2006, 04:55:51 AM
Ruf mal deine Sitemap in einem Textbrowser auf ...
Lynx sollte reichen ...

Ich denke ich weiß, worauf du hinaus willst. Textbrowser können nicht mit UTF-8 kodierten Files umgehen. Aber könnte das der Fehler sein? Schließlich soll ich ja laut Google Sitemaps eine UTF-8 kodierte Datei auswerfen, oder?

mediman

Das UTF-8 ist korrekt, aber die Responsetime ist schon deftig ...
My Projects: http://ticker-oase.de 
Please do not PM me with support requests.

schoeppchen

Quote from: mediman on April 16, 2006, 05:10:22 AM
Das UTF-8 ist korrekt, aber die Responsetime ist schon deftig ...

Wie hoch ist die bei dir? Ich kriege die Datei extrem schnell (quasi Realtime). Habe das eben mal getestet mit einem RAW Request über meine TDSL 2000 Leitung, da kam die Datei direkt.

mediman

Wenn ich deine Datei hole, dann bekomm ich teilweise RT´s von 2000ms.
Jetzt grad geht es wieder sehr schnell.

Aber, wie gesagt, wenn in deinem Sitemapaccount keine Fehler gemeldet werden, dann musst du einfach warten bis Google sich mal auf deine Seite geht und los gehts ...
My Projects: http://ticker-oase.de 
Please do not PM me with support requests.

schoeppchen

Quote from: mediman on April 16, 2006, 06:29:18 AM
Aber, wie gesagt, wenn in deinem Sitemapaccount keine Fehler gemeldet werden, dann musst du einfach warten bis Google sich mal auf deine Seite geht und los gehts ...

Leider nein - Google holt die sitemaps.php täglich ab (sehe ich im access.log), allerdings geht er danach nicht weiter. Es wird keine weitere Seite abgerufen!

willi1

QuoteDie sitemap.php muss genau auf gleicher Ebene zur URL liegen, die du an Google submittest.

An meinem Beispiel: Die Seite sitemaps.php auf http://www.linuxhelpforum.de soll bei Google eingetragen werden, dann muss diese unter http://www.linuxhelpforum.de/sitemaps.php verfügbar sein und nicht wie in dem Tutorial auf der Seite beschrieben in einem Unterverzeichnis. Kopiere also die sitemaps.php in dein Rootverzeichnis welches du bei Google Sitemaps angibst und ändere oben den Include-Pfad zur SSI.php (bei mir da im Document-Root also in
Code:

require_once('SSI.php');

).

Hoffe das hilft, bei mir gings danach.



danke für die Antworten,

ich glaube ich bin zu blöd das ist bei mir ja nicht nur die sitemaps.php das ist ja ein ganzer Ordner mit mehreren Files
das sieht bei mir jetzt wie folgt aus

http://www.alko-hohl.de/smf/sitemaps/sitemaps.php

so habe ich das bei google eingetragen ich habe im rootverzeichnis

unter

http://www.alko-hohl.de/sitemap.xml

noch eine andere sitemap liegen macht das was kenne mich da leider noch nicht so gut aus benutze Joomla 1.0.8
und eine Bridge um das Forum einzubinden weiß nicht ob das hilft.

Wofür sind denn die anderen Dateien in dem sitemaps Ordner

danke für eure hilfe jetzt kommt ein bißchen licht ins dunkle

lg

André



Advertisement: