Blogger: Sitemaps mejorados

En general, dice URL no permitida, por ejemplo:
http://feeds.feedburner.com/~r/Vagabundia/~3/195879678/blips.html
El proceso de añadir un sitemap es sencillo, en todo caso, aunque hay una referencia al tema en un viejo post, vale la pena repetirlo porque es algo que permitirá una mejor indexación. Así que vuelvo sobre esa entrada original de El Zulo:
Para crear uno en Blogger, lo primero que debemos hacer es ir al Centro para webmasters de Google y de allí vamos a la sección Herramientas para Webmasters (debemos acceder con nuestra cuenta de Google o de Gmail).
En la opción Añadir un Sitio, colocamos la dirección URL del nuestro blog y aceptamos.
Google exige que el sitio sea verificado (que seamos sus administradores) así que vamos a Verificar Sitio y en las opciones, elegimos Agregar una etiqueta META. Copiamos el código que nos da y lo pegamos en la plantilla, inmediatamente después de la etiqueta <HEAD>. Guardamos la plantilla y ahora sí, hacemos click en Verificar. Ahora, Google se tomará su tiempo y en unos días lo habrá agregado.
Una vez que esto ocurra, nuevamente vamos a Herramientas para Webmasters y allí, agregaremos el sitemap (Añadir un Sitemap Web General) de nuestro sitio pero, como no tenemos, le daremos la dirección de cualquiera de nuestros feeds, por ejemplo:
http://nombre.blogspot.com/atom.xml
Como no hay restricciones respecto a la cantidad de sitemaps usados, podemos agregar ambos:
http://nombre.blogspot.com/atom.xml
http://nombre.blogspot.com/rss.xml
Eso es todo, otra vez a esperar.
Hasta acá no hay problema pero, el redireccionamiento de Feedburner nos complica un poco. La solución es sencilla y nos la dan en Digital Expiration. Eliminamos el sitemap y cambiamos la dirección (o agregamos otro y cuando funcione, eliminamos el viejo) pero, esta vez lo hacemos añadiéndole un parámetro:
http://nombre.blogspot.com/atom.xml?redirect=false
El siguiente problema es más engorroso de resolver: los feeds de Blogger sólo admiten los últimos 25 posts.
Pero, ya que podemos agregar parámetros, los usamos. Por ejemplo:
http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=100
Enviará 100 posts y si tenemos más:
http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=100 http://nombre.blogspot.com/atom.xml?redirect=false&start-index=101&max-results=100
Es decir, agregamos tantos sidemaps como post querramos indexar. El valor de 100 es un valor tentativo ya que aparentemente, el valor máximo permitido es 500 así que, personalmente, he probado con:
http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
http://nombre.blogspot.com/atom.xml?redirect=false&start-index=501&max-results=500
http://vagabundia.blogspot.com/atom.xml?redirect=false&start-index=1001&max-results=500
Al principio, y hasta tanto Google las verifique, aparecerán como pendientes pero, los datos ingresados fueron aceptados lo que indica que la URL y los parámetros son correctos.


Esta, era una restricción importante que se implementaba por razones de seguridad. Cada sitemap (un archivo XML) debía estar alojado en el sitio al que hacía referencia. Esto era lo que nos impedía tener uno de estos archivos en Blogger, no hay manera de alojar el archivo.
Aparentemente, ahora, un sitemap puede tener referencias a URLs diferentes al sitio donde está alojado siempre que pertenezcan a nuestra propia cuenta. Para usar esta opción, seguimos el procedimiento habitual pero también añadimos el sitio donde alojamos el sitemap. Google aceptará que contengan direcciones de cualquiera de nuestros sitios registrados.
¿Es confuso? Aquí hay más información.

































73 comentarios:
Muchas gracias, hacía tiempo que buscaba el cordón de Ariadna en los sitemaps.
¡Saludos!
Hola, Buenos trucos has puesto, sobre el que me encanto fue el de LightWindow, es perfecto, he venido viendo los otros trucos como el VideoBox, E/O, pero este es perfecto es muy multifuncional.
Saludos!!!
La Blogueria:
Uso sitemapas hace tiempo pero esto para mi fue una novedad y realmente se nota la diferencia.
Vistos Buenos:
Tiene razón, a mi también me parece que LightWindow, es perfecto y lo he adoptado definitivamente, me ha permitido simplificar muchas cosas y eliminar muchos otros scripts que usaba.
Genial.
Estoy probando lo de los 500, ya se verá que pasa en estos días... :-).
Estaba a punto de mandarte un mail ara comentarte sobre esto porque es un tema que siempre te ha preocupado.
Parece funcionar bien pero sería bueno que lo evaluaras.
Gracias JMiur.
Lo voy a seguir de cerca, lo que se me ocurre es utilizar el site:urldelblog para ver si las paginas indexadas suben o bajan.
Pero por lo que tengo entendido, si esto no funciona... no ocasionaría mayores problemas. Además si la herramienta de Google da el OK con el sitemaps... quiere decir que está bien.
Hay que ver que pasa... le estamos enviando en vez de 25 post, 500 o más. Sólo eso.
La opción del sitempas en otro servidor tampoco es mala. Pero por ahora quería probar lo de los 500, para ver qué pasa.
:-)
Tal como decís, mal no hace y lo de comparara con site:urldelblog me pareció una buena idea.
Por ejemplo, vi los archivos de todos los meses,cosa que antes no veía y todos los posts , incluyendo los primeros del 2006.
Muy bueno esto...
lo he realizado ayer y ya noto mucho la diferencia con y sin sitemaps...
salu2
Sí, yo también, ahora que he mirado lo que dice Alejandro, me di cuenta de eso.
Ahora noto que agregaron una opción de ''detalles'' que te detalla el número de páginas indexadas del sitemaps. Por el momento el sitemaps de 500 parece estar en proceso de análisis (no aparecen errores de ningún tipo), parece ser algo normal.
Un sitemaps de los de antes (de 26), muestra en detalles 26 URL indexadas.
Acabo de ver esa opción, en mi caso, para uno de los 3 sitemaps dice:
Enviado: 06-dic-2007
Última descarga en Google: 12-dic-2007
Total de URL en el Sitemap: 501
URL indexadas del Sitemap: 471
No se han encontrado errores ni advertencias.
Hola JMiur,
Una consulta,solamente hay que agregar esto para generar el sitemap?:
http://nombre.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
Solamente,o hace falta algo más??
Un saludo!
Pepiche.
Exacto, Pepiche, sólo eso e indexa hasta 500 posts.
Gracias por el dato,JMiur,mañana meteré manos a la obra ;)
Un abrazo!
Genial JMiur, me rompia los sesos para crear el sitemap de blogger y no lo conseguia, escribire una referencia a este Post de como hacerlo, en un Post que escribi sobre Webmaster de Google. Saludos
Gracias por el comentario, Carlos.
Con noticias sobre el tema: me demoró un poco pero los sitemps funcionaron. De 665 URL enviadas dice que indexo 629, así que no está nada mal (esos otros que al parecer no figurarn se perdieron en la matrixs) :-).
En vez de usar dos de 500, usé 4 de 200... sólo por probar, pero en definitiva es lo mismo. Los 4 con OK y URLs indexadas, aunque en ningún caso indexó el 100% de las URLs enviadas, por ejemplo de 201 enviadas indexaba 197, etc.
Mi experiencia es similar, obviamente, parece que los sitemaps pueden tener cualquier número de URLs (hasta 500) así que la división no es importante.
Y, como en tu caso, nunca se indexaron todas, algunas, se pierden en el camino ¿por qué? no tengo idea, tal vez, si uno pudiera saber cuáles faltan podría llegarse a una conclusión pero no sé como averiguarlo fácilmente.
Todavia no logro entender a cabalidad este sistema, me es confuso =(
Simplemente hará que Google indexe mejor tu sitio y, por lo tanto habrá más resultados en el buscador.
Soy un poco corto pero perdonemen, ¿que sitemaps es el que tengo que dejar para que encuentren mejor mi blog? Yo he agregado todo los sitemaps que había aquí escrito...
En realidad, el sitemap sólo es uno pero, como Blogger no lista todos los post sino hasta 500, cuando se tienen más posts es necesario agregar otros.
En cualquier caso, la herramienta de Google te dirá si el sitemap ingresado es correcto y te dirá la cantidad de direcciones URL indexadas.
Tio, te amo, por fin la informacion de sitemaps que buscaba, todo funciona..., gracias. El cordon de Ariadna...precioso. Ahora seguire mi lucha con wordpress, para una amiga, que tiene el de gratis sin servidor y nos estamos volviendo locas para enviar un sitemap, algun truco tiene que haber;D, Gracias y creo que me hago devota de tu blog. Hasta pronto!
Me alegro que te sirviera, Camen :)
En Wordpress.com el problema es similar, hay que usar los feeds. Puedes fijarte en estos dos posts a ver si ayudan: AQUÍ y AQUÍ
Gracias tio, andaba dandole vueltas a l problema..
Me alegro que te haya sido útil, yeayu :)
Hola,
al fin he conseguido que google indexe mis páginas.
He escrito un post en mi blog para que la información se difunda. Creo que en google no lo explican nada bien, y toda la ayuda a los demás será positiva.
He incluido un enlace a tu post.
Por si quieres verlo:
http://elblogdemartinica.blogspot.com/
2008/04/quiero-aparecer-en-google.html
Gracias por tu post
Es verdad, Martinica, justamente por eso, es bueno difundir las cosas que vamos "descubriendo".
Muchas gracias por el excelente post.
Otra cosa creo que el maximo resultado de los feeds no llega a 500, al menos a mi no me responde la consulta.
Yo lo he seteado a 400.
Y segun tengo entendido el máximo numero de entradas mostradas en el FEED estándar es de 26.
Muchas gracias.
Es un tema confuso, hay versiones varias al respecto. La oficial dice que el límite es 100 pero, en la práctica 500 es aceptable. Nunca escuché sobre el número 26.
Una pregunta amigo, yo tengo mi blog en un dominio .com, el proceso es el mismo, me gustaria saber eso.
Saludos.
Sí, Joni, si usas Blogger, es lo mismo, ya sea que tengas un dominio propio o no.
Ok, muchas gracias por el dato, me ha sido muy util.
Saludos.
A mí también el atom me daba un máximo de 26 (¿serán 25 posts ya la home?). De todos modos, ya lo cambién con esta información que diste. Muchas gracias.
Número extraño el 26 así que suena lógico lo de 25 + el home. De cualquier forma, cambiándola como dice el post, anda perfecto; indudablemente, debe ser algún tipo de limitación del mismo Blogger.
Buena informacion yo tenia un problema con lo de las url no permitidas pero lo logre solucionar :D
Diego Arenas
ola soy said tengo un problema aver si me pueden ayudar, yo hise eso de los sitemaps con feedburner y ammmmm pues de un mes paca estaba en el numero uno de mi propia buskeda "adiccion cerebral" osea mi blog , oy al checar ya no estaba y ammmmm entre a ver k onda a las herramientas webmaster de google y vi que mis site maps tenias advertencias "XML no válido: demasiados códigos
Hay demasiadas etiquetas para describir esta etiqueta. Soluciónelo y vuelva a enviar la información"
si me pueden decir como soluciono esto se los agradecere mucho =) gracias
¿Cuál es la URL del sitemap?
la url es la de tu blog...
seria por ejemplo:
http://eurodipitybenidorm.blogspot.com/atom.xml
O tambien el rss.xml
Funciona
http://www.escuchalibros.blogspot.com/
yahooooo! gracias! :P
Hola Javier ! tengo una preguntita para ti ..que todo lo sabes y lo que no lo encuentras :) . Mi Blog tiene 16,000 posts!! esta aun Blogger y ya lo migre a Wordpress todo salio excelente , ya probé por unos minutos la redirección 301 , solucione el problema de migrar el feedburner de blogger a Wordpress , tambien el levantar una BD de 140 mg cuando solo me permitian 25 en fin ....mi blog lo aloje en Hostgator , Ahora lo único que me falta es el Sitemaps ...tienes una idea que hago ahora con estos 16,ooo posts! Wordpress dicen que tiene plugin que hace ese trabajo superfacil ,pero si lo hago así en mi host es mas que posible que hostgator me cancele la cuenta por el exceso de los posts ...que me aconsejas? te dejo la dirección de mi nuevo blog : http://devocionalescristianos.org ... ah te recomiendo el vídeo que coloque en la pagina principal si te agradan los títeres!! Muchas gracias!
Calithos:
No puedo darte ningun consejo porque no es un tema que maneje. Vas a tener que estudiar cómo se crean y editan los sitemaps.
Interesadisimo en el tema pero a mi no me funciona tampoco
Agradeceré tu respuesta por si actualmente hubiese problemas para indexar, con tu metodo, más de 26 url.
Gracias.
elo-cocina:
La cantidad de páginas indexadas se muestran en las Herramientas de Webmasters de Blogger. No sé si allí te muestra algún tipo de error.
Mil gracias, hace rato habia ingresado mi sitemap siguiendo los consejos de uno de tus post pero solo con la terminacion atom.xml y me daba error porque decia que URL no era valida. con esto lo solucione y hasta ahora no me da ningun error (espero que siga asi ja!).
gracias de nuevo.
saludos
coc Misiones:
No debería dar errores, pero, uno nunca sabe :)
Pues ya he añadido mi sitio a Sitemaps, espero que pronto me indexen las simpática arañitas y pueda aparecer en el Índice de google. :D
Saludos!!
Suele tardar entre 24 y 48 horas. Cuando esté listo, lo verás allí, en el panel de las herramientas.
Muchas gracias, gracias a tu generosa información pude hacer mi sitemaps. Gracias mil!
Fernando D.
Muy buen aporte, voy a probarlo
Eres un genio, cada vez que busco algo siempre te encuentro con la solución, estoy llegando a la siguiente conclusión:
"Si JMiur no lo explica, es por que no existe" :D
Muchísimas gracias por todo, un abrazo.
Saludos, Anita. Me alegra que te sirviera.
Hola:
Seguí tu consejo. Empecé por lo más fácil: le dije a Google que mi sitemap es: http://nombre.blogspot.com/atom.xml
El problema que tengo es que todas las páginas indexadas tienen el nombre de mi última entrada publicada. Puedes verlo aquí: site:www.alfilrojo.com
No sé que puede estar pasando.
Por lo que veo, la indexación está bien, si te fijas, las URLs son diferentes pero, lo que parece estar ocurriendo es que lo que se muestra es sólo el título del blog cuando debería mostrarse además, el título del post.
Debe haber un error en la plantilla misma. Si te fijas en este post, allí está explicado como hacerlo.
Gracias JMiur, he leido el post que me recomendabas y en la plantilla de mi blog no encontré nada que se le parezca a este código que mencionas:
<*title><*data:blog.pageTitle/><*/title>
... así que lo he incluido, justamente después de <*/head>, y con las modificaciones que sugerías en el post. Espero haber hecho bien.
¡Ojalá funcione!
Gracias por tu ayuda.
Hay que darle tiempo para que comience a cambiar la indexación. de cualquier forma, si hay problemas me envias un mail.
Jmiur no sabes q es lo q pasa con Google webmaster tools, ya q no permite por ningun motivo verificar mi blog, coloco el codigo como indicas debajo de (head) pero nada de nada.
No se si podras ayudarme te estaria muy agradecido.
No sabría decirte cuál es el problema. Si el código que ellso te proveen está colocado correctametne, la verificación tarda 24 horas y no mucho más que eso.
Yo, intentaría eliminarla y empezar otra vez.
Gracias por comentar lo de los parámetros. Haré un tutorial similar a este en mi blog, es algo bastante útil.
Hola JMIUR
Mi pregunta es si al hacer el sitemap, lo que introducimos como dice este post es la dirección del feed, influye en algo que el feed del blog lo tenga corto o es mejor poner completo?
Iradai
Iradai:
Lo ideal es que esté marcado como COMPLETO. No influirá en el tiempo de carga del blog pero los lectores estarán agradecidos :) En lo particular, no me gusta leer feeds incompletos o que sólo tengan el título.
Jmiur, la duda que tengo sobre poner el feed completo es por este articulo que lei http://cgnauta.blogspot.com/2008/04/cmo-ser-penalizado-por-contenido.html
En donde se habla de penalizaciones de google por malas interpretaciones
Que opinas
Lo mejor para entender lo del contenido duplicado es leer lo que el mismo google dice al respecto: AQUÍ
Allí, termina dicendo algo que se podría aplicar a la nota a la que haces referencia:
Don't worry be happy: No se preocupe demasiado por los sitios de tipo scrape (los que republican contenidos). Aunque esto es molesto, es muy improbable que ese tipo de sitios puedan impactar negativamente en el buscador.
gracias, ya lo apliqué a mi blog y estoy esperando sus resultados
cualquier cosa la mencionaré
JMiur, cerre la ventana donde te comente antes y trataba de colocar una etiqueta para que indexara mejor google el blog, la coloque despues de head como lo dices y por casualidad veo que tengo una que es
meta content='iJKXcekJcawUWuflOmPFSn51M4YpvAgIfPHq/L1dobM=' name='verify-v1
De que se trata?? que es lo que hace???
Muchas gracias!!!
Mmm :O creo que fue la etiqueta que me dio google para verificar que el sitio era mio, que memoria la mia, sera que no has visto mis pastillas para la memoria por ahi??? es que se me olvido tomarmelas!!!
Ahh ya se;) las voy a buscar por Google!!! Que ideas las mias :D
Sí, es la ID del Google Webmaster :D
:D
Muy bueno, lo queria utilizar sobre todo para el MSN Search (Ahora Bing)
Tenia puesto el como sitemaps "...blogspot.com/atom.xml" y el muy estupido solo me indexaba una 20 páginas de los 266 post.
Al final le puse un sitemaps generado online y empezo a indexar muchas más.
Espero que con tus parameros en el feed el MSN me indexe todas las páginas.
Un Saludo
EN Google funciona bien pero en MSN Search no he probado los parámetros. Haré la prueba :D
Hola JMiur, saludos ... si nos damos una vuelta por nuestro panel de google webmaster podemos ver que los sitemaps ya no funcionan como hasta hace poco, aunque se pueden seguir añadiendo diferentes sitemaps ... atom.xml?redirect=false&start-index=1&max-results=100, 200, 500 o 1000 ... solo se insertan las 25 últimas entradas ...
Alguien sabría como generar un sitemaps que indexe más paginas ...
Gracias y saludos ... que tengáis un buen día ...
Diría que parece ser un error del feed o de Blogger. En este momento, estoy viendo lo que dice mi cuenta y de los cinco, hay dos que marcan una advertencia; el resto está bien. Marca los que tienen error y reenvíalos.
No es la primera vez que pasa.
¿Quiere dejar un comentario?
Hay varios métodos posibles.
Uno de ellos es el formulario de comentarios que tan generosamente nos ha regalado Blogger y que funciona sólo de tanto en tanto. Su uso es aconsejable sólo en caso de ser una de esas personas a las que les gustan los retos y los desafíos.
¿No quiere arriesgarse? Haga click para ocultarlo y utilice las otras opciones.
Si le gusta ir a lo seguro utilice este botón para abrir los comentarios en una ventana modal en esta misma pagina.
Si añora tiempos idos, use este enlace para agregar un comentario al viejo estilo ...
Los comentarios están siendo moderados y serán publicados a la brevedad.