¿Cómo indexa Google las imágenes de las webs?

Taza de caféLas imágenes que aparecen en los resultados de búsqueda de Google provienen de multitud de webs de todos tipo que han insertado esas imágenes dentro de sus páginas. Google indexa imágenes en formato BMP, GIF, JPEG, PNG, WebP y SVG.

Pero ¿Cómo sabe Google que una imagen contiene por ejemplo una taza de té y no una taza de café? La respuesta es el contexto de la página en la cual se ha encontrado la imagen. Se analiza el título de la página y su contenido, el nombre del archivo, el texto de los enlaces que apunten a la imagen y su texto alternativo (atributo ALT); además de escanear el contenido de la imagen para intentar reconocer su contenido y finalmente el contenido de los «Image Sitemaps», si existen en la página.

Para ayudar a que Google indexe las imágenes de una web hay que asegurar:

  • Que se pueda acceder a la página HTML en la cual la imagen está insertada y también a la imagen.
  • Que la imagen esté en uno de los formatos soportados: BMP, GIF, JPEG, PNG, WebP y SVG.

Además se recomienda:

  • Que el nombre de la imagen esté relacionado con su contenido.
  • Que el atributo ALT describa el contenido de la imagen de una forma intendible por un humano.
  • Y que el texto que está alrededor de una imagen y en la página HTML esté relacionado con la imagen.

 

Unas cuantas respuestas a preguntas frecuentes que le hacen a Google con respecto a la indexación de las imágenes:

¿Existe un tamaño máximo para las imágenes que se pueden indexar?

  • No existe ninguna restricción de tamaño.

¿Que pasa con los datos EXIF, XMP u otros metadatos que tenga la imagen?

  • Esta información puede ser usada para la indexación de las imágenes. Por ejemplo la información EXIF puede mostrarse en la búsqueda de imágenes al hacer click sobre una imagen determinado.

¿Debería usar IMAGE SITEMAPS? ¿Cuáles son sus ventajas?

  • Si. IMAGE SITEMAPS ayudan a Google aprender sobre las imágenes y cual es su contenido.

Si uso un CDN para alojar mis imágenes, ¿puedo usar un IMAGE SITEMAP?

  • Se puede usar un IMAGE SITEMAP para apuntar a imágenes que están en otro dominio, pero hay que tener en cuenta las restricciones que aplican. También es recomendable dar de alta el dominio del CDN en Google Webmaster Tools para poder tener información sobre errores de indexado.

¿Es un problema de contenido duplicado si mis imágenes pueden accederse en varios dominios, subdominios o espacios en un CDN?

  • Generalmente la mejor opción es tener solo una copia del contenido. Si existen imágenes duplicadas en distintos dominios o subdominios, Google elegirá una copia como la «canónica» y esta no puede ser la que el webmaster quiera. Además las imágenes duplicadas pueden hacer que la indexación de las mismas sea más lenta.

¿Por qué a veces la imagen original está peor posicionada que la misma en otra fuente?

  • No hay que olvidar nunca que el contenido de la página es fundamental para determinar el contexto de una página. Si la imagen original está en una galería de imágenes con muy poco texto, puede ser que aparezca en los resultados de búsqueda la misma en otra web con mucho contenido de texto. Esto se puede reportar en el Webmaster Help Forum.

¿Cómo determina el filtro Safe Search que imágenes no mostrar en los resultados?

  • Los algoritmos de Google usan una variedad de señales para determinar si una imagen debería de ser filtrada de los resultados de búsqueda al tener activado el filtro Safe Search. La señal más fuerte para filtrar una determinada imagen de un resultado de búsqueda es el marcado del contenido como adulto mediante las siguientes meta-etiquetas:
    <meta name="rating" content="adult" />
    <meta name="rating" content="RTA-5042-1996-1400-1577-RTA" />

 

Hay más información sobre el tema en: Google Webmaster Central Blog. Esperamos os haya parecido interesante. ¡Buen fin de semana!

Descubre porqué somos Apasionados del Marketing

Mira también

Los errores AMP notificados en enero son un fallo de Google

Si en los últimos días os ha llegado una notificación de errores AMP no hace …