Blogger: Sitemaps mejorados

Los usuarios de Blogger que usemos las Herramientas para Webmasters de Google y hayamos agregado un sitemap para ayudar a que el buscador nos detecte mejor, tenemos limitaciones propias del servicio ya que, por un lado, nos vemos obligados a usar la dirección de los feeds que sólo contiene los últimos 25 posts y por otro, si usamos el redireccionamiento de Feedburner, lo que nos mostrará en los últimos tiempos es que se detectan una serie de errores.



En general, dice URL no permitida, por ejemplo:

http://feeds.feedburner.com/~r/Vagabundia/~3/195879678/blips.html

El proceso de añadir un sitemap es sencillo, en todo caso, aunque hay una referencia al tema en un viejo post, vale la pena repetirlo porque es algo que permitirá una mejor indexación. Así que vuelvo sobre esa entrada original de El Zulo:

"Un sitemap es una pequeña porción de datos que se inserta en cualquier dominio o página web y que sirve para que los buscadores indexen mejor los contenidos que generamos. No es imprescindible: tarde o temprano las "arañas" encontrarán cualquier cosa que se encuentre en internet. De todas formas, debido al inmensurable número de páginas (que crece a ritmo de vértigo cada día), las "arañas" tienen mucho trabajo, por lo que si creamos nuevos contenidos (y si nuestra web tiene poco "peso" en internet) puede que estos tarden en estar indexados en los motores de búsqueda (si alguien busca algo sobre lo que acabas de escribir, pues no te va a encontrar)."

Un sitemap es una forma de comunicarle a esos robots los cambio que se producen sin tener que esperar que estos los detecten.

Para crear uno en Blogger, lo primero que debemos hacer es ir al Centro para webmasters de Google y de allí vamos a la sección Herramientas para Webmasters (debemos acceder con nuestra cuenta de Google o de Gmail).

En la opción Añadir un Sitio, colocamos la dirección URL del nuestro blog y aceptamos.

Google exige que el sitio sea verificado (que seamos sus administradores) así que vamos a Verificar Sitio y en las opciones, elegimos Agregar una etiqueta META. Copiamos el código que nos da y lo pegamos en la plantilla, inmediatamente después de la etiqueta <HEAD>. Guardamos la plantilla y ahora sí, hacemos click en Verificar. Ahora, Google se tomará su tiempo y en unos días lo habrá agregado.

Una vez que esto ocurra, nuevamente vamos a Herramientas para Webmasters y allí, agregaremos el sitemap (Añadir un Sitemap Web General) de nuestro sitio pero, como no tenemos, le daremos la dirección de cualquiera de nuestros feeds, por ejemplo:

http://nombre.blogspot.com/atom.xml

Como no hay restricciones respecto a la cantidad de sitemaps usados, podemos agregar ambos:

http://nombre.blogspot.com/atom.xml
http://nombre.blogspot.com/rss.xml



Eso es todo, otra vez a esperar.

Hasta acá no hay problema pero, el redireccionamiento de Feedburner nos complica un poco. La solución es sencilla y nos la dan en Digital Expiration. Eliminamos el sitemap y cambiamos la dirección (o agregamos otro y cuando funcione, eliminamos el viejo) pero, esta vez lo hacemos añadiéndole un parámetro:

http://nombre.blogspot.com/atom.xml?redirect=false

El siguiente problema es más engorroso de resolver: los feeds de Blogger sólo admiten los últimos 25 posts.

Pero, ya que podemos agregar parámetros, los usamos. Por ejemplo:
http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=100

Enviará 100 posts y si tenemos más:

http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=100 http://nombre.blogspot.com/atom.xml?redirect=false&start-index=101&max-results=100

Es decir, agregamos tantos sidemaps como post querramos indexar. El valor de 100 es un valor tentativo ya que aparentemente, el valor máximo permitido es 500 así que, personalmente, he probado con:

http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
http://nombre.blogspot.com/atom.xml?redirect=false&start-index=501&max-results=500
http://vagabundia.blogspot.com/atom.xml?redirect=false&start-index=1001&max-results=500

Al principio, y hasta tanto Google las verifique, aparecerán como pendientes pero, los datos ingresados fueron aceptados lo que indica que la URL y los parámetros son correctos.


En unos días, todos los sitemaps estarán en funcionamiento y la cantidad de URLs enviadas será significativamente mayor.


Hay una última alternativa que apareció recientemente publicada en Google Webmaster Central Blog. Allí, nos dicen que tenemos la posibilidad de crear un sitemap real (hay muchas heramientas online que nos ayudarán a hacerlo) y alojarlo en un servidor distinto del de nuestro sitio.

Esta, era una restricción importante que se implementaba por razones de seguridad. Cada sitemap (un archivo XML) debía estar alojado en el sitio al que hacía referencia. Esto era lo que nos impedía tener uno de estos archivos en Blogger, no hay manera de alojar el archivo.

Aparentemente, ahora, un sitemap puede tener referencias a URLs diferentes al sitio donde está alojado siempre que pertenezcan a nuestra propia cuenta. Para usar esta opción, seguimos el procedimiento habitual pero también añadimos el sitio donde alojamos el sitemap. Google aceptará que contengan direcciones de cualquiera de nuestros sitios registrados.

¿Es confuso? Aquí hay más información.

73 comentarios:

La Blogueria

Muchas gracias, hacía tiempo que buscaba el cordón de Ariadna en los sitemaps.
¡Saludos!

Vistos Buenos

Hola, Buenos trucos has puesto, sobre el que me encanto fue el de LightWindow, es perfecto, he venido viendo los otros trucos como el VideoBox, E/O, pero este es perfecto es muy multifuncional.
Saludos!!!

JMiur

La Blogueria:
Uso sitemapas hace tiempo pero esto para mi fue una novedad y realmente se nota la diferencia.

Vistos Buenos:
Tiene razón, a mi también me parece que LightWindow, es perfecto y lo he adoptado definitivamente, me ha permitido simplificar muchas cosas y eliminar muchos otros scripts que usaba.

Alejandro

Genial.

Estoy probando lo de los 500, ya se verá que pasa en estos días... :-).

JMiur

Estaba a punto de mandarte un mail ara comentarte sobre esto porque es un tema que siempre te ha preocupado.

Parece funcionar bien pero sería bueno que lo evaluaras.

Alejandro

Gracias JMiur.

Lo voy a seguir de cerca, lo que se me ocurre es utilizar el site:urldelblog para ver si las paginas indexadas suben o bajan.

Pero por lo que tengo entendido, si esto no funciona... no ocasionaría mayores problemas. Además si la herramienta de Google da el OK con el sitemaps... quiere decir que está bien.

Hay que ver que pasa... le estamos enviando en vez de 25 post, 500 o más. Sólo eso.

La opción del sitempas en otro servidor tampoco es mala. Pero por ahora quería probar lo de los 500, para ver qué pasa.

:-)

JMiur

Tal como decís, mal no hace y lo de comparara con site:urldelblog me pareció una buena idea.

Por ejemplo, vi los archivos de todos los meses,cosa que antes no veía y todos los posts , incluyendo los primeros del 2006.

kyubiT

Muy bueno esto...

lo he realizado ayer y ya noto mucho la diferencia con y sin sitemaps...

salu2

JMiur

Sí, yo también, ahora que he mirado lo que dice Alejandro, me di cuenta de eso.

Alejandro

Ahora noto que agregaron una opción de ''detalles'' que te detalla el número de páginas indexadas del sitemaps. Por el momento el sitemaps de 500 parece estar en proceso de análisis (no aparecen errores de ningún tipo), parece ser algo normal.

Un sitemaps de los de antes (de 26), muestra en detalles 26 URL indexadas.

JMiur

Acabo de ver esa opción, en mi caso, para uno de los 3 sitemaps dice:

Enviado: 06-dic-2007
Última descarga en Google: 12-dic-2007
Total de URL en el Sitemap: 501
URL indexadas del Sitemap: 471
No se han encontrado errores ni advertencias.

Pepiche

Hola JMiur,

Una consulta,solamente hay que agregar esto para generar el sitemap?:

http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500

Solamente,o hace falta algo más??

Un saludo!

Pepiche.

JMiur

Exacto, Pepiche, sólo eso e indexa hasta 500 posts.

Pepiche

Gracias por el dato,JMiur,mañana meteré manos a la obra ;)

Un abrazo!

Carlos Soler

Genial JMiur, me rompia los sesos para crear el sitemap de blogger y no lo conseguia, escribire una referencia a este Post de como hacerlo, en un Post que escribi sobre Webmaster de Google. Saludos

JMiur

Gracias por el comentario, Carlos.

Alejandro

Con noticias sobre el tema: me demoró un poco pero los sitemps funcionaron. De 665 URL enviadas dice que indexo 629, así que no está nada mal (esos otros que al parecer no figurarn se perdieron en la matrixs) :-).

En vez de usar dos de 500, usé 4 de 200... sólo por probar, pero en definitiva es lo mismo. Los 4 con OK y URLs indexadas, aunque en ningún caso indexó el 100% de las URLs enviadas, por ejemplo de 201 enviadas indexaba 197, etc.

JMiur

Mi experiencia es similar, obviamente, parece que los sitemaps pueden tener cualquier número de URLs (hasta 500) así que la división no es importante.

Y, como en tu caso, nunca se indexaron todas, algunas, se pierden en el camino ¿por qué? no tengo idea, tal vez, si uno pudiera saber cuáles faltan podría llegarse a una conclusión pero no sé como averiguarlo fácilmente.

A su Imaginación

Todavia no logro entender a cabalidad este sistema, me es confuso =(

JMiur

Simplemente hará que Google indexe mejor tu sitio y, por lo tanto habrá más resultados en el buscador.

Francisco José

Soy un poco corto pero perdonemen, ¿que sitemaps es el que tengo que dejar para que encuentren mejor mi blog? Yo he agregado todo los sitemaps que había aquí escrito...

JMiur

En realidad, el sitemap sólo es uno pero, como Blogger no lista todos los post sino hasta 500, cuando se tienen más posts es necesario agregar otros.

En cualquier caso, la herramienta de Google te dirá si el sitemap ingresado es correcto y te dirá la cantidad de direcciones URL indexadas.

Carmen M

Tio, te amo, por fin la informacion de sitemaps que buscaba, todo funciona..., gracias. El cordon de Ariadna...precioso. Ahora seguire mi lucha con wordpress, para una amiga, que tiene el de gratis sin servidor y nos estamos volviendo locas para enviar un sitemap, algun truco tiene que haber;D, Gracias y creo que me hago devota de tu blog. Hasta pronto!

JMiur

Me alegro que te sirviera, Camen :)

En Wordpress.com el problema es similar, hay que usar los feeds. Puedes fijarte en estos dos posts a ver si ayudan: AQUÍ y AQUÍ

yeayu

Gracias tio, andaba dandole vueltas a l problema..

JMiur

Me alegro que te haya sido útil, yeayu :)

martinica

Hola,
al fin he conseguido que google indexe mis páginas.

He escrito un post en mi blog para que la información se difunda. Creo que en google no lo explican nada bien, y toda la ayuda a los demás será positiva.

He incluido un enlace a tu post.
Por si quieres verlo:
http://elblogdemartinica.blogspot.com/
2008/04/quiero-aparecer-en-google.html

Gracias por tu post

JMiur

Es verdad, Martinica, justamente por eso, es bueno difundir las cosas que vamos "descubriendo".

matius

Muchas gracias por el excelente post.

Otra cosa creo que el maximo resultado de los feeds no llega a 500, al menos a mi no me responde la consulta.

Yo lo he seteado a 400.

Y segun tengo entendido el máximo numero de entradas mostradas en el FEED estándar es de 26.

Muchas gracias.

JMiur

Es un tema confuso, hay versiones varias al respecto. La oficial dice que el límite es 100 pero, en la práctica 500 es aceptable. Nunca escuché sobre el número 26.

Joni B.

Una pregunta amigo, yo tengo mi blog en un dominio .com, el proceso es el mismo, me gustaria saber eso.

Saludos.

JMiur

Sí, Joni, si usas Blogger, es lo mismo, ya sea que tengas un dominio propio o no.

Joni B.

Ok, muchas gracias por el dato, me ha sido muy util.

Saludos.

Alan

A mí también el atom me daba un máximo de 26 (¿serán 25 posts ya la home?). De todos modos, ya lo cambién con esta información que diste. Muchas gracias.

JMiur

Número extraño el 26 así que suena lógico lo de 25 + el home. De cualquier forma, cambiándola como dice el post, anda perfecto; indudablemente, debe ser algún tipo de limitación del mismo Blogger.

Diego Arenas

Buena informacion yo tenia un problema con lo de las url no permitidas pero lo logre solucionar :D

Diego Arenas

[.S.a.i.D.]*

ola soy said tengo un problema aver si me pueden ayudar, yo hise eso de los sitemaps con feedburner y ammmmm pues de un mes paca estaba en el numero uno de mi propia buskeda "adiccion cerebral" osea mi blog , oy al checar ya no estaba y ammmmm entre a ver k onda a las herramientas webmaster de google y vi que mis site maps tenias advertencias "XML no válido: demasiados códigos
Hay demasiadas etiquetas para describir esta etiqueta. Soluciónelo y vuelva a enviar la información"

si me pueden decir como soluciono esto se los agradecere mucho =) gracias

JMiur

¿Cuál es la URL del sitemap?

pablo

la url es la de tu blog...
seria por ejemplo:
http://eurodipitybenidorm.blogspot.com/atom.xml
O tambien el rss.xml

jimpako

Funciona

http://www.escuchalibros.blogspot.com/

Calithos

Hola Javier ! tengo una preguntita para ti ..que todo lo sabes y lo que no lo encuentras :) . Mi Blog tiene 16,000 posts!! esta aun Blogger y ya lo migre a Wordpress todo salio excelente , ya probé por unos minutos la redirección 301 , solucione el problema de migrar el feedburner de blogger a Wordpress , tambien el levantar una BD de 140 mg cuando solo me permitian 25 en fin ....mi blog lo aloje en Hostgator , Ahora lo único que me falta es el Sitemaps ...tienes una idea que hago ahora con estos 16,ooo posts! Wordpress dicen que tiene plugin que hace ese trabajo superfacil ,pero si lo hago así en mi host es mas que posible que hostgator me cancele la cuenta por el exceso de los posts ...que me aconsejas? te dejo la dirección de mi nuevo blog : http://devocionalescristianos.org ... ah te recomiendo el vídeo que coloque en la pagina principal si te agradan los títeres!! Muchas gracias!

JMiur

Calithos:
No puedo darte ningun consejo porque no es un tema que maneje. Vas a tener que estudiar cómo se crean y editan los sitemaps.

elo-cocina

Interesadisimo en el tema pero a mi no me funciona tampoco

elo-cocina

Agradeceré tu respuesta por si actualmente hubiese problemas para indexar, con tu metodo, más de 26 url.
Gracias.

JMiur

elo-cocina:

La cantidad de páginas indexadas se muestran en las Herramientas de Webmasters de Blogger. No sé si allí te muestra algún tipo de error.

coc Misiones

Mil gracias, hace rato habia ingresado mi sitemap siguiendo los consejos de uno de tus post pero solo con la terminacion atom.xml y me daba error porque decia que URL no era valida. con esto lo solucione y hasta ahora no me da ningun error (espero que siga asi ja!).
gracias de nuevo.
saludos

JMiur

coc Misiones:
No debería dar errores, pero, uno nunca sabe :)

El Aventurero

Pues ya he añadido mi sitio a Sitemaps, espero que pronto me indexen las simpática arañitas y pueda aparecer en el Índice de google. :D

Saludos!!

JMiur

Suele tardar entre 24 y 48 horas. Cuando esté listo, lo verás allí, en el panel de las herramientas.

Anónimo

Muchas gracias, gracias a tu generosa información pude hacer mi sitemaps. Gracias mil!

Fernando D.

jhonAkw

Muy buen aporte, voy a probarlo

anita

Eres un genio, cada vez que busco algo siempre te encuentro con la solución, estoy llegando a la siguiente conclusión:
"Si JMiur no lo explica, es por que no existe" :D

Muchísimas gracias por todo, un abrazo.

JMiur

Saludos, Anita. Me alegra que te sirviera.

Quique

Hola:
Seguí tu consejo. Empecé por lo más fácil: le dije a Google que mi sitemap es: http://nombre.blogspot.com/atom.xml

El problema que tengo es que todas las páginas indexadas tienen el nombre de mi última entrada publicada. Puedes verlo aquí: site:www.alfilrojo.com
No sé que puede estar pasando.

JMiur

Por lo que veo, la indexación está bien, si te fijas, las URLs son diferentes pero, lo que parece estar ocurriendo es que lo que se muestra es sólo el título del blog cuando debería mostrarse además, el título del post.

Debe haber un error en la plantilla misma. Si te fijas en este post, allí está explicado como hacerlo.

Quique

Gracias JMiur, he leido el post que me recomendabas y en la plantilla de mi blog no encontré nada que se le parezca a este código que mencionas:

<*title><*data:blog.pageTitle/><*/title>

... así que lo he incluido, justamente después de <*/head>, y con las modificaciones que sugerías en el post. Espero haber hecho bien.

¡Ojalá funcione!

Gracias por tu ayuda.

JMiur

Hay que darle tiempo para que comience a cambiar la indexación. de cualquier forma, si hay problemas me envias un mail.

Anónimo

Jmiur no sabes q es lo q pasa con Google webmaster tools, ya q no permite por ningun motivo verificar mi blog, coloco el codigo como indicas debajo de (head) pero nada de nada.

No se si podras ayudarme te estaria muy agradecido.

JMiur

No sabría decirte cuál es el problema. Si el código que ellso te proveen está colocado correctametne, la verificación tarda 24 horas y no mucho más que eso.

Yo, intentaría eliminarla y empezar otra vez.

fyrwet

Gracias por comentar lo de los parámetros. Haré un tutorial similar a este en mi blog, es algo bastante útil.

Iradai

Hola JMIUR
Mi pregunta es si al hacer el sitemap, lo que introducimos como dice este post es la dirección del feed, influye en algo que el feed del blog lo tenga corto o es mejor poner completo?

Iradai

JMiur

Iradai:
Lo ideal es que esté marcado como COMPLETO. No influirá en el tiempo de carga del blog pero los lectores estarán agradecidos :) En lo particular, no me gusta leer feeds incompletos o que sólo tengan el título.

Iradai

Jmiur, la duda que tengo sobre poner el feed completo es por este articulo que lei http://cgnauta.blogspot.com/2008/04/cmo-ser-penalizado-por-contenido.html

En donde se habla de penalizaciones de google por malas interpretaciones

Que opinas

JMiur

Lo mejor para entender lo del contenido duplicado es leer lo que el mismo google dice al respecto: AQUÍ

Allí, termina dicendo algo que se podría aplicar a la nota a la que haces referencia:

Don't worry be happy: No se preocupe demasiado por los sitios de tipo scrape (los que republican contenidos). Aunque esto es molesto, es muy improbable que ese tipo de sitios puedan impactar negativamente en el buscador.

Winjaime

gracias, ya lo apliqué a mi blog y estoy esperando sus resultados

cualquier cosa la mencionaré

GOCASE

JMiur, cerre la ventana donde te comente antes y trataba de colocar una etiqueta para que indexara mejor google el blog, la coloque despues de head como lo dices y por casualidad veo que tengo una que es

meta content='iJKXcekJcawUWuflOmPFSn51M4YpvAgIfPHq/L1dobM=' name='verify-v1

De que se trata?? que es lo que hace???

Muchas gracias!!!

GOCASE

Mmm :O creo que fue la etiqueta que me dio google para verificar que el sitio era mio, que memoria la mia, sera que no has visto mis pastillas para la memoria por ahi??? es que se me olvido tomarmelas!!!

Ahh ya se;) las voy a buscar por Google!!! Que ideas las mias :D

JMiur

Sí, es la ID del Google Webmaster :D

Andromeda

:D

Muy bueno, lo queria utilizar sobre todo para el MSN Search (Ahora Bing)

Tenia puesto el como sitemaps "...blogspot.com/atom.xml" y el muy estupido solo me indexaba una 20 páginas de los 266 post.

Al final le puse un sitemaps generado online y empezo a indexar muchas más.

Espero que con tus parameros en el feed el MSN me indexe todas las páginas.

Un Saludo

JMiur

EN Google funciona bien pero en MSN Search no he probado los parámetros. Haré la prueba :D

Mangel

Hola JMiur, saludos ... si nos damos una vuelta por nuestro panel de google webmaster podemos ver que los sitemaps ya no funcionan como hasta hace poco, aunque se pueden seguir añadiendo diferentes sitemaps ... atom.xml?redirect=false&start-index=1&max-results=100, 200, 500 o 1000 ... solo se insertan las 25 últimas entradas ...
Alguien sabría como generar un sitemaps que indexe más paginas ...
Gracias y saludos ... que tengáis un buen día ...

JMiur

Diría que parece ser un error del feed o de Blogger. En este momento, estoy viendo lo que dice mi cuenta y de los cinco, hay dos que marcan una advertencia; el resto está bien. Marca los que tienen error y reenvíalos.

No es la primera vez que pasa.

¿Quiere dejar un comentario?

Hay varios métodos posibles.

Uno de ellos es el formulario de comentarios que tan generosamente nos ha regalado Blogger y que funciona sólo de tanto en tanto. Su uso es aconsejable sólo en caso de ser una de esas personas a las que les gustan los retos y los desafíos.
¿No quiere arriesgarse? Haga click para ocultarlo y utilice las otras opciones.

Si le gusta ir a lo seguro utilice este botón para abrir los comentarios en una ventana modal en esta misma pagina.

Si añora tiempos idos, use este enlace para agregar un comentario al viejo estilo ...

Los comentarios están siendo moderados y serán publicados a la brevedad.