News:

SMF 2.1.6 has been released! Take it for a spin! Read more.

Main Menu

indirizzo sitemap pre google

Started by ivanom., February 20, 2013, 05:26:30 AM

Previous topic - Next topic

ivanom.

Scusate ho installato la mod SMFPacks SEO v1.0 - NIBOGO e ho creato la sitemap spuntando appunto sitemap xml da inviare a google, ma qual'è l'indirizzo appunto da inìviare nei webmaster tool,  qualcosa tipo sito/forum/indexsitemap dove la trovo?

Darknico

Dovrebbe essere credo : WWW.TUOSITO.EXT/index.php?action=sitemap
oppure : WWW.TUOSITO.EXT/sitemap/xml

Scusa ma non conosco la mod, ho cercato alla veloce
Magari un link al sito e faccio alcune prove..
Italian SMF - Supporto Italiano per la board SMF - Ci trovate tutti li!! :)


ivanom.

Ok Darknico ti linko l'indirizzo della sitemap (l'ho trovato)
http://psicologaonlinesalerno.it/forum/index.php?action=sitemap;xml
in essa come vedi ho dedicato questo al forum

Disallow: /forum/*sort=*
Disallow: /forum/*msg*
Disallow: /forum/index.php?action=activate*
Disallow: /forum/index.php?action=admin*
Disallow: /forum/index.php?action=calendar*
Disallow: /forum/index.php?action=emailuser*
Disallow: /forum/index.php?action=findmember*
Disallow: /forum/index.php?action=help*
Disallow: /forum/index.php?action=helpadmin*
Disallow: /forum/index.php?action=login*
Disallow: /forum/index.php?action=mlist*
Disallow: /forum/index.php?action=modifykarma*
Disallow: /forum/index.php?action=pm*
Disallow: /forum/index.php?action=post*
Disallow: /forum/index.php?action=printpage*
Disallow: /forum/index.php?action=profile*
Disallow: /forum/index.php?action=recent*
Disallow: /forum/index.php?action=register*
Disallow: /forum/index.php?action=reminder*
Disallow: /forum/index.php?action=search*
Disallow: /forum/index.php?action=unread*
Disallow: /forum/index.php?action=unreadreplies*
Disallow: /forum/index.php?action=verificationcode*
Disallow: /forum/index.php?action=who*
Disallow: /forum/index.php?action=stats*
Disallow: /forum/index.php?theme*
Disallow: /forum/index.php?*wap*
Disallow: /forum/index.php?*wap2*
Disallow: /forum/index.php?*imode*
Disallow: /index.php?*rss*
Disallow: /forum/Themes/
Disallow: /forum/Sources

Allow: /forum/index.php?action=sitemap;xml


A questo punto ho un paio di domande da porre:
1- questa riga:
Disallow: /forum/*msg* esclude i messaggi (tipo mp) vero?
2-nella prima parte del robots.txt dedicata a wordpress ho messo
sitemap:........
dovrei fare lo stesso anche con
Allow: /forum/index.php?action=sitemap;xml cambiandola in Sitemap: /forum/index.php?action=sitemap;xml ?
vorrei avere un parere se secondo te ci sono errori grossolani o altre cose su cui posso essere penalizzato nell'indicizzazione...
ti sarei grato se mi dessi la  tua opinione  O:) io purtroppo non sono un esperto. Grazie mille!

Darknico

dei robots purtroppo non sono molto informato...
Italian SMF - Supporto Italiano per la board SMF - Ci trovate tutti li!! :)


emanuele

Qualcosa non funziona in quel mod:
http://psicologaonlinesalerno.it/forum/index.php?action=sitemap;b=8
link preso da qui.

Quote from: ivanom. on February 20, 2013, 07:15:04 AM
in essa come vedi ho dedicato questo al forum
...???...non son sicuro di capire...

Quote from: ivanom. on February 20, 2013, 07:15:04 AM
A questo punto ho un paio di domande da porre:
1- questa riga:
Disallow: /forum/*msg* esclude i messaggi (tipo mp) vero?
No.
msg è un'abbreviazione usata da SMF per individuare un messaggio senza conoscere il topic.
Normalmente ogni link ad un messaggio di SMF appare nella forma:
http://www.simplemachines.org/community/index.php?topic=498007.msg3494587#msg3494587
Dove hai sia l'id del topic (498007), sia l'id del messaggio (3494587).
Inciso: per come è messa credo elimini tutti i messaggi dato che msg compare "ovunque".
msg è un'abbreviazione che ti permette di arrivare al link sopra senza conosce l'id del topic:
[code]http://www.simplemachines.org/community/index.php?msg=3494587


Quote from: ivanom. on February 20, 2013, 07:15:04 AM
2-nella prima parte del robots.txt dedicata a wordpress ho messo
sitemap:........
dovrei fare lo stesso anche con
Allow: /forum/index.php?action=sitemap;xml cambiandola in Sitemap: /forum/index.php?action=sitemap;xml ?
vorrei avere un parere se secondo te ci sono errori grossolani o altre cose su cui posso essere penalizzato nell'indicizzazione...
ti sarei grato se mi dessi la  tua opinione  O:) io purtroppo non sono un esperto. Grazie mille!
E' completamente inutile l'"allow" nel robot.txt, il robot.txt funziona sui "disallow". Nel senso che i bot già hanno le pagine che vogliono ottenere, e robot.txt gli dice quelle che *non devono* aprire.
E' la sitemap che dice ai bot "c'è anche questo". ;)


Take a peek at what I'm doing! ;D




Hai bisogno di supporto in Italiano?

Aiutateci ad aiutarvi: spiegate bene il vostro problema: no, "non funziona" non è una spiegazione!!
1) Cosa fai,
2) cosa ti aspetti,
3) cosa ottieni.

ivanom.

Ok ho fatto delle correzioni, grazie per l'aiuto. In pratica la sitemap del forum non è indispensabile se esiste la sitemap del sito la quale contiene l'indirizzo del forum. In pratica io ho segnalato a google e altri, l'url http://psicologaonlinesalerno.it/forum e poi ho creato la sitemap e quindi inviata. Forse non c'è bisogno di creare quella per il forum, o sarebbe meglio (altrimenti qul'è la ragione per cui esistono mods per la loro creazione)? ::)

questo è il robots.txt che ho adesso:

User-agent: *
Disallow: /wp-
Disallow: /cgi-bin/
Allow: /wp-content/uploads/
Disallow: /wp-content/
Disallow: /trackback/
Disallow: /feed/
Disallow: /comments/

Disallow: /forum/*sort=*
Disallow: /forum/index.php?action=activate*
Disallow: /forum/index.php?action=admin*
Disallow: /forum/index.php?action=calendar*
Disallow: /forum/index.php?action=emailuser*
Disallow: /forum/index.php?action=findmember*
Disallow: /forum/index.php?action=help*
Disallow: /forum/index.php?action=helpadmin*
Disallow: /forum/index.php?action=login*
Disallow: /forum/index.php?action=mlist*
Disallow: /forum/index.php?action=modifykarma*
Disallow: /forum/index.php?action=pm*
Disallow: /forum/index.php?action=post*
Disallow: /forum/index.php?action=printpage*
Disallow: /forum/index.php?action=profile*
Disallow: /forum/index.php?action=recent*
Disallow: /forum/index.php?action=register*
Disallow: /forum/index.php?action=reminder*
Disallow: /forum/index.php?action=search*
Disallow: /forum/index.php?action=unread*
Disallow: /forum/index.php?action=unreadreplies*
Disallow: /forum/index.php?action=verificationcode*
Disallow: /forum/index.php?action=who*
Disallow: /forum/index.php?action=stats*
Disallow: /forum/index.php?theme*
Disallow: /forum/index.php?*wap*
Disallow: /forum/index.php?*wap2*
Disallow: /forum/index.php?*imode*
Disallow: /index.php?*rss*
Disallow: /forum/Themes/
Disallow: /forum/Sources

Sitemap: http://psicologaonlinesalerno.it/sitemap_index.xml

dovrebbe andare meglio. che ne pensi?

emanuele

Quote from: ivanom. on February 21, 2013, 07:53:07 AM
In pratica la sitemap del forum non è indispensabile se esiste la sitemap del sito la quale contiene l'indirizzo del forum.
In pratica la sitemap del forum che hai attualmente non funziona e quindi oltre che inutile è controproducente...

Quote from: ivanom. on February 21, 2013, 07:53:07 AM
In pratica io ho segnalato a google e altri, l'url http://psicologaonlinesalerno.it/forum e poi ho creato la sitemap e quindi inviata. Forse non c'è bisogno di creare quella per il forum, o sarebbe meglio (altrimenti qul'è la ragione per cui esistono mods per la loro creazione)? ::)
Per lo stesso motivo per cui c'è il karma? :P
Un sito fatto bene non ha bisogno di sitemap, google può usarla comunque, ma sarà sempre lui a decidere cosa leggere e cosa no.
Ad ogni modo, ripeto la sitemap che hai al momento non funziona, quindi è peggio che non averla, perché se google si fidasse solo di quella non troverebbe niente.

Quote from: ivanom. on February 21, 2013, 07:53:07 AM
dovrebbe andare meglio. che ne pensi?
Non ho ancora chiaro se hai capito a cosa serve il robot.txt o no. Ho la vaga impressione che tu (come molti altri) consideri (erroneamente) il robot.txt una sorta di controllo di accesso al sito per i crawler. E' così?
Se è così ti smonto subito e ti dico che non è così. Il robot.txt è una cosa facoltativa in entrambi i sensi: ci può essere (quindi facoltativo per te che puoi metterlo o no) e può essere usato (facoltativo per i crawler che possono semplicemente ignorarlo ed accedere a quello che vogliono loro.

E' questo in linea con quel che tu pensi sia il robot.txt?


Take a peek at what I'm doing! ;D




Hai bisogno di supporto in Italiano?

Aiutateci ad aiutarvi: spiegate bene il vostro problema: no, "non funziona" non è una spiegazione!!
1) Cosa fai,
2) cosa ti aspetti,
3) cosa ottieni.

ivanom.

QuoteHo la vaga impressione che tu (come molti altri) consideri (erroneamente) il robot.txt una sorta di controllo di accesso al sito per i crawler. E' così?
yess! ho ricevuto il messaggio grazie!

emanuele

Detto questo, se vuoi *bloccare* l'accesso a certe pagine allora devi usare "htaccess". Questo file istruisce il webserver a nemmeno servire tali pagine a "qualcuno" (puoi basarti anche sul user-agent per individuare i bot, non 100% efficace (e potenzialmente controproducente in alcuni casi), ma può tornare utile).


Take a peek at what I'm doing! ;D




Hai bisogno di supporto in Italiano?

Aiutateci ad aiutarvi: spiegate bene il vostro problema: no, "non funziona" non è una spiegazione!!
1) Cosa fai,
2) cosa ti aspetti,
3) cosa ottieni.

Advertisement: