Desde hace algún tiempo cada vez aparece más spam de referencia dentro de los datos de Google Analytics y de otros programas de estadística web. Este tráfico produce incrementos en las visitas procedentes desde URLs para las que los propietarios quieren hacer publicidad.
El tráfico de referencia más habitual viene de los siguientes dominios:
- buttons-for-website.com
- darodar.com
- googlsucks.com
- hulfingtonpost.com
- ilovevitaly.com
- makemoneyonline.com
- semalt.com
- simple-share-buttons.com
- social-buttons.com
En agosto del año pasado empezó está forma de spam con semalt.com y ya publicamos en su día como se les podía bloquear: Bloquear semalt.com / semalt.semalt.com.
¿Qué es el spam de tráfico de referencia?
La idea detrás de esta forma de spam es realizar peticiones de páginas a una web que tenga seguimiento estadístico (por ejemplo de Google Analytics o Piwik) y aparecer dentro de las estadísticas de las páginas que mandan tráfico. Apareciendo en el tráfico de referencia se llama la atención del webmaster y es probable que acceda para ver de dónde procede el tráfico. Si el webmaster accede a la web de procedencia ya ya han conseguido su objetivo que normalmente incluye colocar cientos de cookies de programas de afiliación.
Este spam de referencia era muy efectivo hace algunos meses, cuando nadie era consciente de qué se trataba exactamente, pero hoy en día cada vez hay más información sobre el tema y los webmasters son más cuidadosos y acceden mucho menos (pero siguen teniendo miles de visitas por hacer este tipo de spam).
En Google Analytics el tráfico de referencia se puede ver en: Adquisición / Visión General / Todo el Tráfico / Referencias.
¿Por qué alguien usa el spam de referencia?
Existen unas cuantas razones para las cuales utilizar este tipo de spam:
- La forma más inofensiva es para conseguir dar a conocer los servicios de la empresa que lo hace. Así se consiguen visitas que pueden comprar el servicio.
- Incrementar el número de visitas para monetizar la web con banners, programas de afiliados, etc o para poder venderla con tráfico.
- Colar cookies de portales de comercio electrónico con afiliados para cobrar comisiones por posibles ventas (por ejemplo la cookie de afiliados de Amazon).
- Conseguir enlaces desde páginas web que escriben sobre este tema (por eso aquí no se enlaza a ninguno de ellos).
¿Cómo funciona el spam de referencia?
Hay dos formas de funcionamiento:
- La más habitual: Haciendo visitas a las páginas de la web con un robot que tiene como referencia la web que se quiere «publicitar».
- Menos habitual, pero también lo estamos viendo: A través de llamadas directas a Google Analytics. La pecularidad es que estas visitas siempre se producen en el primer perfil de Google Analytics (el que acaba en -1). Por ejemplo: UA-….-1.
¿Cómo bloquear el spam de referencia?
Con .htaccess (servidor web Apache)
Incluyendo el siguiente código en el archivo .htaccess de la web:
RewriteEngine On # Bloquear spam de referencia RewriteCond %{HTTP_REFERER} ^http://.*(buttons-for-website|darodar|econom|googlsucks|ilovevitaly|makemoneyonline|simple-share-buttons|social-buttons|semalt) [NC] RewriteRule .* %{HTTP_REFERER} [R,L]
Este código se puede ir ampliando con todos los dominios que vayamos detectando que hagan spam de referencia. Ahora mismo estamos utilizando el siguiente código en varios sitios:
RewriteEngine On # Bloquear spam de referencia RewriteCond %{HTTP_REFERER} ^http://.*backgroundpictures\.net/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*bestwebsitesawards\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*buttons\-for\-website\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*darodar\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*embedle\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*extener\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*fbfreegifts\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*feedouble\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*feedouble\.net/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*googlsucks\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*hulfingtonpost\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*joinandplay\.me/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*joingames\.org/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*kambasoft\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*makemoneyonline.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*musicprojectfoundation\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*myprintscreen\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*7makemoneyonline.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*o\-o\-6\-o\-o\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*openfrost\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*openmediasoft\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*savetubevideo\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*semalt\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*simple\-share\-buttons\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*social\-buttons\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*softomix\.ru/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*softomix\.net/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*softomix\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*soundfrost\.org/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*srecorder\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*vapmedia\.org/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*videofrost\.net/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*videofrost\.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*youtubedownload\.org/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*zazagames\.org/ [NC] RewriteRule ^(.*)$ – [F,L]
OJO: Esto no evita que en los logs del servidor aparezcan todos los accesos de estos bots. Para que no aparezcan en al log del servidor hay que modificar el archivo httpd.conf del servidor Apache: CustomLog logs/access.log common env=!nolog
Y cambiar la última línea del código de .htaccess por la siguiente: RewriteRule .* - [F,L,E=nolog:1]
Con Google Analytics
Esta forma que hemos explicado para evitar el spam de referencia solo funcionan cuando un bot accede a la web y hace la llamada a la misma, pero no cuando se llama directamente al código de Google Analytics.
La mejor solución en el segundo caso es utilizar una propiedad de Google Analytics que no acabe en -1 para hacer el seguimiento de las visitas. Lo malo es que esto es poco viable para páginas ya establecidas y con un histórico de datos, pero es un buen consejo a tener en cuenta al crear una nueva web: Siempre usar una propiedad de Google Analytics distinta a la primera; o sea que acabe en -2, -3, etc.
¿Cómo filtrar los datos en Google Analytics?
Activando el filtrado de los datos de los bots de Google Analytics en: Administrador / Configuración de vista de informes
- Filtrado de robots
- Excluye todas las visitas de robots y de arañas conocidos.
Y creando un filtro especial para el spam de referencia: Administración › Filtros de vista › Añadir filtro a la vista
- Filtro
- Nombre: Bloquear bots referencia
- Tipo: Personalizado
- Excluir: Referencia
- Patrón del filtro:
(?:([^. ]+)\.)?(?:([^.]+)\.)?(buttons-for-website|darodar|econom|googlsucks|ilovevitaly|makemoneyonline|simple-share-buttons|social-buttons|semalt)\.(com?|de|net)
Combinando el bloqueo por .htaccess con el filtrado por Google Analytics vamos a conseguir reducir en gran medida las visitas del spam de referencia en las estadísticas web.
Si tenéis problemas de este tipo o necesitáis alguna ayuda, dejarnos un comentario.
Imágenes: Shutterstock – Palto