martes, diciembre 11, 2007

Blogger: Sitemaps mejorados

Los usuarios de Blogger que usemos las Herramientas para Webmasters de Google y hayamos agregado un sitemap para ayudar a que el buscador nos detecte mejor, tenemos limitaciones propias del servicio ya que, por un lado, nos vemos obligados a usar la dirección de los feeds que sólo contiene los últimos 25 posts y por otro, si usamos el redireccionamiento de Feedburner, lo que nos mostrará en los últimos tiempos es que se detectan una serie de errores.



En general, dice URL no permitida, por ejemplo:

http://feeds.feedburner.com/~r/Vagabundia/~3/195879678/blips.html

El proceso de añadir un sitemap es sencillo, en todo caso, aunque hay una referencia al tema en un viejo post, vale la pena repetirlo porque es algo que permitirá una mejor indexación. Así que vuelvo sobre esa entrada original de El Zulo:

"Un sitemap es una pequeña porción de datos que se inserta en cualquier dominio o página web y que sirve para que los buscadores indexen mejor los contenidos que generamos. No es imprescindible: tarde o temprano las "arañas" encontrarán cualquier cosa que se encuentre en internet. De todas formas, debido al inmensurable número de páginas (que crece a ritmo de vértigo cada día), las "arañas" tienen mucho trabajo, por lo que si creamos nuevos contenidos (y si nuestra web tiene poco "peso" en internet) puede que estos tarden en estar indexados en los motores de búsqueda (si alguien busca algo sobre lo que acabas de escribir, pues no te va a encontrar)."

Un sitemap es una forma de comunicarle a esos robots los cambio que se producen sin tener que esperar que estos los detecten.

Para crear uno en Blogger, lo primero que debemos hacer es ir al Centro para webmasters de Google y de allí vamos a la sección Herramientas para Webmasters (debemos acceder con nuestra cuenta de Google o de Gmail).

En la opción Añadir un Sitio, colocamos la dirección URL del nuestro blog y aceptamos.

Google exige que el sitio sea verificado (que seamos sus administradores) así que vamos a Verificar Sitio y en las opciones, elegimos Agregar una etiqueta META. Copiamos el código que nos da y lo pegamos en la plantilla, inmediatamente después de la etiqueta <HEAD>. Guardamos la plantilla y ahora sí, hacemos click en Verificar. Ahora, Google se tomará su tiempo y en unos días lo habrá agregado.

Una vez que esto ocurra, nuevamente vamos a Herramientas para Webmasters y allí, agregaremos el sitemap (Añadir un Sitemap Web General) de nuestro sitio pero, como no tenemos, le daremos la dirección de cualquiera de nuestros feeds, por ejemplo:

http://nombre.blogspot.com/atom.xml

Como no hay restricciones respecto a la cantidad de sitemaps usados, podemos agregar ambos:

http://nombre.blogspot.com/atom.xml
http://nombre.blogspot.com/rss.xml



Eso es todo, otra vez a esperar.

Hasta acá no hay problema pero, el redireccionamiento de Feedburner nos complica un poco. La solución es sencilla y nos la dan en Digital Expiration. Eliminamos el sitemap y cambiamos la dirección (o agregamos otro y cuando funcione, eliminamos el viejo) pero, esta vez lo hacemos añadiéndole un parámetro:

http://nombre.blogspot.com/atom.xml?redirect=false

El siguiente problema es más engorroso de resolver: los feeds de Blogger sólo admiten los últimos 25 posts.

Pero, ya que podemos agregar parámetros, los usamos. Por ejemplo:
http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=100

Enviará 100 posts y si tenemos más:

http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=100 http://nombre.blogspot.com/atom.xml?redirect=false&start-index=101&max-results=100

Es decir, agregamos tantos sidemaps como post querramos indexar. El valor de 100 es un valor tentativo ya que aparentemente, el valor máximo permitido es 500 así que, personalmente, he probado con:

http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
http://nombre.blogspot.com/atom.xml?redirect=false&start-index=501&max-results=500
http://vagabundia.blogspot.com/atom.xml?redirect=false&start-index=1001&max-results=500

Al principio, y hasta tanto Google las verifique, aparecerán como pendientes pero, los datos ingresados fueron aceptados lo que indica que la URL y los parámetros son correctos.


En unos días, todos los sitemaps estarán en funcionamiento y la cantidad de URLs enviadas será significativamente mayor.


Hay una última alternativa que apareció recientemente publicada en Google Webmaster Central Blog. Allí, nos dicen que tenemos la posibilidad de crear un sitemap real (hay muchas heramientas online que nos ayudarán a hacerlo) y alojarlo en un servidor distinto del de nuestro sitio.

Esta, era una restricción importante que se implementaba por razones de seguridad. Cada sitemap (un archivo XML) debía estar alojado en el sitio al que hacía referencia. Esto era lo que nos impedía tener uno de estos archivos en Blogger, no hay manera de alojar el archivo.

Aparentemente, ahora, un sitemap puede tener referencias a URLs diferentes al sitio donde está alojado siempre que pertenezcan a nuestra propia cuenta. Para usar esta opción, seguimos el procedimiento habitual pero también añadimos el sitio donde alojamos el sitemap. Google aceptará que contengan direcciones de cualquiera de nuestros sitios registrados.

¿Es confuso? Aquí hay más información.

36 comentarios:

La Blogueria

Muchas gracias, hacía tiempo que buscaba el cordón de Ariadna en los sitemaps.
¡Saludos!

Vistos Buenos

Hola, Buenos trucos has puesto, sobre el que me encanto fue el de LightWindow, es perfecto, he venido viendo los otros trucos como el VideoBox, E/O, pero este es perfecto es muy multifuncional.
Saludos!!!

JMiur

La Blogueria:
Uso sitemapas hace tiempo pero esto para mi fue una novedad y realmente se nota la diferencia.

Vistos Buenos:
Tiene razón, a mi también me parece que LightWindow, es perfecto y lo he adoptado definitivamente, me ha permitido simplificar muchas cosas y eliminar muchos otros scripts que usaba.

Alejandro

Genial.

Estoy probando lo de los 500, ya se verá que pasa en estos días... :-).

JMiur

Estaba a punto de mandarte un mail ara comentarte sobre esto porque es un tema que siempre te ha preocupado.

Parece funcionar bien pero sería bueno que lo evaluaras.

Alejandro

Gracias JMiur.

Lo voy a seguir de cerca, lo que se me ocurre es utilizar el site:urldelblog para ver si las paginas indexadas suben o bajan.

Pero por lo que tengo entendido, si esto no funciona... no ocasionaría mayores problemas. Además si la herramienta de Google da el OK con el sitemaps... quiere decir que está bien.

Hay que ver que pasa... le estamos enviando en vez de 25 post, 500 o más. Sólo eso.

La opción del sitempas en otro servidor tampoco es mala. Pero por ahora quería probar lo de los 500, para ver qué pasa.

:-)

JMiur

Tal como decís, mal no hace y lo de comparara con site:urldelblog me pareció una buena idea.

Por ejemplo, vi los archivos de todos los meses,cosa que antes no veía y todos los posts , incluyendo los primeros del 2006.

kyubiT

Muy bueno esto...

lo he realizado ayer y ya noto mucho la diferencia con y sin sitemaps...

salu2

JMiur

Sí, yo también, ahora que he mirado lo que dice Alejandro, me di cuenta de eso.

Alejandro

Ahora noto que agregaron una opción de ''detalles'' que te detalla el número de páginas indexadas del sitemaps. Por el momento el sitemaps de 500 parece estar en proceso de análisis (no aparecen errores de ningún tipo), parece ser algo normal.

Un sitemaps de los de antes (de 26), muestra en detalles 26 URL indexadas.

JMiur

Acabo de ver esa opción, en mi caso, para uno de los 3 sitemaps dice:

Enviado: 06-dic-2007
Última descarga en Google: 12-dic-2007
Total de URL en el Sitemap: 501
URL indexadas del Sitemap: 471
No se han encontrado errores ni advertencias.

Pepiche

Hola JMiur,

Una consulta,solamente hay que agregar esto para generar el sitemap?:

http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500

Solamente,o hace falta algo más??

Un saludo!

Pepiche.

JMiur

Exacto, Pepiche, sólo eso e indexa hasta 500 posts.

Pepiche

Gracias por el dato,JMiur,mañana meteré manos a la obra ;)

Un abrazo!

Carlos Soler

Genial JMiur, me rompia los sesos para crear el sitemap de blogger y no lo conseguia, escribire una referencia a este Post de como hacerlo, en un Post que escribi sobre Webmaster de Google. Saludos

JMiur

Gracias por el comentario, Carlos.

Alejandro

Con noticias sobre el tema: me demoró un poco pero los sitemps funcionaron. De 665 URL enviadas dice que indexo 629, así que no está nada mal (esos otros que al parecer no figurarn se perdieron en la matrixs) :-).

En vez de usar dos de 500, usé 4 de 200... sólo por probar, pero en definitiva es lo mismo. Los 4 con OK y URLs indexadas, aunque en ningún caso indexó el 100% de las URLs enviadas, por ejemplo de 201 enviadas indexaba 197, etc.

JMiur

Mi experiencia es similar, obviamente, parece que los sitemaps pueden tener cualquier número de URLs (hasta 500) así que la división no es importante.

Y, como en tu caso, nunca se indexaron todas, algunas, se pierden en el camino ¿por qué? no tengo idea, tal vez, si uno pudiera saber cuáles faltan podría llegarse a una conclusión pero no sé como averiguarlo fácilmente.

A su Imaginación

Todavia no logro entender a cabalidad este sistema, me es confuso =(

JMiur

Simplemente hará que Google indexe mejor tu sitio y, por lo tanto habrá más resultados en el buscador.

Francisco José

Soy un poco corto pero perdonemen, ¿que sitemaps es el que tengo que dejar para que encuentren mejor mi blog? Yo he agregado todo los sitemaps que había aquí escrito...

JMiur

En realidad, el sitemap sólo es uno pero, como Blogger no lista todos los post sino hasta 500, cuando se tienen más posts es necesario agregar otros.

En cualquier caso, la herramienta de Google te dirá si el sitemap ingresado es correcto y te dirá la cantidad de direcciones URL indexadas.

Carmen M

Tio, te amo, por fin la informacion de sitemaps que buscaba, todo funciona..., gracias. El cordon de Ariadna...precioso. Ahora seguire mi lucha con wordpress, para una amiga, que tiene el de gratis sin servidor y nos estamos volviendo locas para enviar un sitemap, algun truco tiene que haber;D, Gracias y creo que me hago devota de tu blog. Hasta pronto!

JMiur

Me alegro que te sirviera, Camen :)

En Wordpress.com el problema es similar, hay que usar los feeds. Puedes fijarte en estos dos posts a ver si ayudan: AQUÍ y AQUÍ

yeayu

Gracias tio, andaba dandole vueltas a l problema..

JMiur

Me alegro que te haya sido útil, yeayu :)

martinica

Hola,
al fin he conseguido que google indexe mis páginas.

He escrito un post en mi blog para que la información se difunda. Creo que en google no lo explican nada bien, y toda la ayuda a los demás será positiva.

He incluido un enlace a tu post.
Por si quieres verlo:
http://elblogdemartinica.blogspot.com/
2008/04/quiero-aparecer-en-google.html

Gracias por tu post

JMiur

Es verdad, Martinica, justamente por eso, es bueno difundir las cosas que vamos "descubriendo".

matius

Muchas gracias por el excelente post.

Otra cosa creo que el maximo resultado de los feeds no llega a 500, al menos a mi no me responde la consulta.

Yo lo he seteado a 400.

Y segun tengo entendido el máximo numero de entradas mostradas en el FEED estándar es de 26.

Muchas gracias.

JMiur

Es un tema confuso, hay versiones varias al respecto. La oficial dice que el límite es 100 pero, en la práctica 500 es aceptable. Nunca escuché sobre el número 26.

Joni B.

Una pregunta amigo, yo tengo mi blog en un dominio .com, el proceso es el mismo, me gustaria saber eso.

Saludos.

JMiur

Sí, Joni, si usas Blogger, es lo mismo, ya sea que tengas un dominio propio o no.

Joni B.

Ok, muchas gracias por el dato, me ha sido muy util.

Saludos.

Alan

A mí también el atom me daba un máximo de 26 (¿serán 25 posts ya la home?). De todos modos, ya lo cambién con esta información que diste. Muchas gracias.

JMiur

Número extraño el 26 así que suena lógico lo de 25 + el home. De cualquier forma, cambiándola como dice el post, anda perfecto; indudablemente, debe ser algún tipo de limitación del mismo Blogger.

Diego Arenas

Buena informacion yo tenia un problema con lo de las url no permitidas pero lo logre solucionar :D

Diego Arenas

Agregar un comentario ...