Cómo identificar las Keywords Not Provided en Google Analytics

Llevamos ya unos meses viendo que entre las palabras clave que nos traen tráfico se está colando la columna (not provided) antes eran tan pocas visitas y no parecía preocupante, sin embargo, en los últimos 4 días esas palabras clave han aumentado considerablemente.

Evolución del tráfico (not provided) en los útimos días

¿Qué es Not Provided?

(Not provided) es la suma de palabras clave que un usuario busca en Google estando logado.

Google lo está vendiendo como un tema de privacidad pero no sabemos desde cuando Google se ha empezado a preocuparse por estos conceptos, sobre todo que en el interfaz de Adwords parece que las palabras se seguirán viendo normal.

Parece ser que el motivo de la subida repentina de este tráfico se debe a que hasta hace poco solo se aplicaba en Google.com y que hace unos 4 días ya está funcionando en otros países como Google.es.. a partir de ahora si estás logado a Gmail y accedes a www.google.es, automáticamente te redirigirá a https://www.google.es y a partir de entonces nadie puede saber con qué palabra has llegado a un sitio web determinado (Salvo Gran Hermano Google).

Este cambio implica además, que ninguna herramienta de medición de tráfico pueda saber la palabra clave de referencia, ni siquiera Google Analytics Premium que cuesta unos 150k$ al año.

¿Cual es la solución?

A pesar de que Google ha ocultado esas palabras clave, hay trucos que podemos utilizar y que nos pueden resolver este tema.

Primero, hay que ir en Google Analytics a Fuentes de tráfico > búsqueda > Orgánico.

Una vez estemos en el informe de palabras clave orgánicas, activamos un filtro avanzado donde incluimos solo palabras clave que tienen Not Provided, el resultado es algo así:

Vemos que todas las palabras han desaparecido salvo Not Provided, ahora tenemos que añadir una dimensión segundaria donde seleccionamos página de destino:

Con eso conseguimos clasificar las palabras Not Provided por páginas de aterrizaje.. En mi caso haciendo un análisis de http://regalador.com el resultado es el siguiente:

Con esa información, la situación es la siguiente: no sabemos qué palabras clave ha utilizado el usuario, pero sí sabemos donde ha aterrizado… a partir de aquí podemos hacer 2 tipos de análisis: uno con intuición y otro más matemático:

  1. Analizando con intuición:

 En nuestro caso, sabiendo que estamos primeros en “regalos para San Valentín” sé que las palabras clave que me han traído esas visitas y que Google me está ocultando corresponden a esta palabra clave que tengo bien posicionada.. por tanto es un juego fácil, sé para qué palabra clave tengo posicionada cada página, por tanto si me dices la página donde aterriza, te puedo decir más o menos con que palabra habría aterrizado.

Pero este análisis es limitado, porque puede haber varias variaciones de una misma temática (regalos para san Valentín, detalles para san Valentín etc..) por eso es probable que necesitemos profundizar con un método más “matemático”

2. Análisis por extrapolación matemático

Para los inconformistas que quieren ir más allá, se pueden hacer extrapolaciones matemáticas. Para ello vamos a hacerlo al revés, primero vamos a: Contenido > Contenido del sitio > Páginas de destino.

Una vez estamos en el informe de páginas de destino, elegimos la página que queremos analizar, en mi caso vamos a imaginar que Google me oculta 300 palabras que han aterrizado en la landing page de San Valentín y nuestra misión es descubrirlas, por tanto clicaré en la página “/es/ocasiones/san-valentin/ “.

Después, Seleccionamos dimensión segundaria y escribimos Palabras Clave, el resultado es algo así: (los números son falsos para que no me espíe mi amigo Miguelo de http://www.regaletes.com, mi competencia directa para  http://regalador.com :)

Ahora, tengo que descargar esta tabla en una tabla Excel, eliminando las columnas de (not set) y (not provided) y manteniendo las demás para sacar qué porcentaje supone cada una de las variaciones de palabras clave, el resultado me sale así:

Ahora bien, hemos dicho que estamos tratando de identificar unas 300 visitas de Google que no sabemos qué palabras clave han usado para aterrizar en la landing de Regalos para San Valentín (/es/ocasiones/san-valentin/), pues teniendo estos porcentajes de arriba, lo único que queda es extrapolar estas 300 visitas a esos porcentajes y listo, tenemos unos datos bastante más fiables que nuestra propia intuición:

Evidentemente hacer este trabajo de forma manual es costoso ya que hay que ir página por página, pero seguramente alguien (lo más seguro es que sea un americano) lanzará muy pronto una aplicación basada en esta “teoría” que usará el API de Google Anlytics y calculará las palabrasNot Provioded de forma mucho más sencilla y automática… ahí tenéis una idea :)

Conclusión y impresión,

Creo sinceramente que es importante saber todas las palabras clave, pero creo que aquí la capa de conocimiento que un SEO aporta al proyecto facilita la interpretación de las palabras Not Provided, ya que un SEO hace un seguimiento de las posiciones de palabras clave y le basta saber donde aterriza el tráfico para saber qué palabras clave pudo haber utilizado.

Para descargar la tabla de ejemplos en xls, por aquí.

Si te gusta este artículo, se agradecen Tweets y +1 :)

 

{lang: 'es'}

48 pensamientos en “Cómo identificar las Keywords Not Provided en Google Analytics

  1. Pingback: SEO, SEM, Social Media y Marketing 13 | SEOcretos

  2. Lakil, muy bien explicado el artículo pero una cosa. Realmente con esto es lo que se consigue es:
    - ver aquellas páginas a las que te está llegando tráfico de not provided
    - “estimar” las visitas que puede estar trayendo cada keyword (visible) a dichas páginas

    Pero lo que seguimos sin saber es cuáles son esas keywords de “not provided”, con lo cual pueden estar perdiéndose gran cantidad de keywords por longtail.

    Un abrazo Lakil y muchos regalos!

  3. Pingback: Google Analytics “Not provided”: implicaciones.

  4. Hola Sergio, está claro que nunca más volveremos a saber con exactitud esas palabras, pero si extrapolamos los datos podemos acercarnos mucho a este dato, mira la parte final de artículo que creo que te las has pasado por encima :) y a ver si me cuentas de una vez qué estas tramando con Elisa :)

  5. ¿Cómo que no he leído? Que si he decidido responder es porque me lo he leído tranquilamente! Lo que quiero decir es que al final lo que hacemos son “adivinaciones” para saber lo que nos ha llegado, pero no determinar cómo o qué nos ha llegado. Elisa y yo hemos decidido considerar el “not provided” como una nueva métrica y no distribuirlo o extrapolarlo por ejemplo entre tráfico de marca y/o no marca, como se está empezando a publicar en algunos medios. No obstante, felicidades por el artículo, que no era una crítica, sino simplemente una división de opiniones. Un abrazo!

  6. Algo a tener en cuenta al extrapolar los datos es que muchas de las palabras metidas en el saco del “not provided” (alrededor del 40% o 50%, pero puede ser muy variable) serán únicas, es decir que no estarán repetidas, nadie más las habrá usado para acceder a la web.
    Serán frases de cola larga imposibles de determinar.
    En resumen, la extrapolación no debería hacerse sobre el total de “not provided” sino sobre un cierto porcentaje de ese total.

  7. Gran error de Google. El análisis se hace casi imposible, a no ser que juguemos a adivinar o a suponer algunos datos…. Quizás sea muy crítico, pero esto afectará sin duda al SEO, con lo cual Google estará más que encantado.

  8. Yo creo que este análisis se hace partiendo de la base de que las búsquedas not provided son proporcionales a aquellas de las que sí tenemos información.

    Mi opinión es la siguiente. Si vas a hacer eso, mejor no perder el tiempo porque realmente no nos importa si por una palabra clave te entran 70 o 7.000 personas. Lo importante es la proporción con respeco al número de visitas totales de tu web. Y si consideras que las not provided vienen en la misma proporción que las demás, esto es trabajo en vano.

    La otra opición que nos queda es admitir que Google nos ha capado cierta información y que probablemente, lo seguirá haciendo. Y que debido a esto, vamos a perder algunas oportunidades pero… nuestra competencia también.

    • Hola Linkbuilding,

      El método de la extrapolación de datos no es una pérdida de tiempo, es un método habitual en cualquier cálculo o previsión, mira lo que dice Wikipedia:
      El método de extrapolación es un método científico lógico que consiste en suponer que el curso de los acontecimientos continuará en el futuro, convirtiéndose en las reglas que se utilizarán para llegar a una nueva conclusión. Es decir, se afirma a ciencia cierta que existen unos axiomas y éstos son extrapolables a la nueva situación.

      Admitir que Google nos ha capado los datos y quedarnos con los brazos cruzados no es una actitud SEO :)

      • No me referia a quedarnos de brazos cruzados. Solo pienso que extrapolar esos datos de esa manera es erronea porque se esta asumiendo que vienen en la misma proporcion que el resto de la palabras y no creo que sea asi. Lo que queria decir es que creo que ese metodo es como hacer una regla de 3 en una situacion en la que los factores no responden de la misma manera. No digo que la tecnica sea mala, es probable que sea la mejor solucion hasta ahora, solo digo que tiene fallos.

  9. ¡Qué bueno Lakil! Me parece un truco genial.
    Además en SEO no importa tanto la precisión del número como el saber qué obtienes de ello y cómo obtenerlo.
    Aplicado el truco, un abrazo,

    – iñaki

  10. Pingback: Tráfico "not provided" de Google Analytics | Blog de Soluciones C2

  11. Pingback: (Not provided): ¿supone realmente un problema para SEO?

  12. Somos una empresa de diseño Web en Barcelona, Madrid y queríamos decirles que estamos totalmente de acuerdo con el artículo ya que nosotros trabajamos con SEO y hemos podido comprobar que va en aumento.

    Muchas Gracias y Felicitaciones por el artículo

    Saludos,
    wbase

  13. Pingback: Obteniendo información del “not provided” en Google Analytics | Roberto Ballester

  14. Pingback: ¿Qué hacer con los datos not provided en Google Analytics? - 40 de Fiebre

  15. Muchas gracias, estoy empezando con esto del SEO y la verdad es que tengo la cabeza saturada de informacion y posibles combinaciones para sacar informacion, no se si sera la mejor, pero es una manera de obtener algo de informacion y clasificar esas visitas, gracias de nuevo.

  16. He encontrado este artículo porque también he notado que los “not provided” iban en aumento y quería saber por qué.
    De momento no tengo un elevado número de visitas por lo que no sé si la fórmula de extrapolación y % me será útil, pero me has resuelto muchas dudas y ahora voy a leerme los artículos que habéis puesto aquí que también hablan sobre el tema.
    Gracias por compartir esta información.

  17. Hola Lakil,
    a mi me gusta el método de extrapolación que usas, vamos, es el que usamos todos pero asumimos por intuición SEO, experiencia o lo que sea, algunos puntos que dan incertidumbre a los resultados. Por ejemplo:

    ¿Los usuarios logueados se comportan igual a los no logueados? ¿Podríamos decir que los logueados son un poco más heavy users que los no logueados y por lo tanto es mas probable que usen keywords longtail que quedarían fuera de la extrapolación?

    Solo digo que como tal, cualquier extrapolación de datos tiene un margen de incertidumbre que hay que tener en cuenta a la hora de interpretar los datos.

  18. yo creo que es un trabajo de más… te explico.
    Con la extrapolación estás diciendo que los datos not provide se comportan de igual forma que los demás, por lo tanto aplicas los porcentajes correspondientes… De ser así el resultado final será que mantedrás los mismos porcentajes (luego de sumar las keyword not provide correspondientes) por lo que al final tendrás información con la que ya contabas antes de hacer todo el cálculo. Me entiendes? Si no cuentas las not provide tendrás ciertos porcentajes de participación de keywords… luego si haces el cálculo y empiezas a sumar las keyword not provide de forma ponderada, los porcentajes finales serán los mismos… es decir LO QUE YA TENÍAS.
    Bueno, es mi opinión… de todas formas +1 ya que estos foros ayudan mucho y es un trabajo desinteresado de tu parte. Saludos cordiales.

  19. Buenas!
    Sólo quería agradecerte el artículo, me ha servido de mucha ayuda para complementar mi post sobre “Qué hacer con los datos not provided” en 40defiebre.com

    Creo que es un método ligeramente pesado para el día a día salvo que se trate de una cuenta muy importante con un volúmen de tráfico brutal, pero aun así me parece un post genial y tremendamente útil, llegado el caso.

    Un saludo.

  20. aaaa hhh disculpa !!
    entiendo que te refieres al introducir un sitio nuevo dividirlo en subcarpetas o subdirectorios… no ¿?

    Eso en caso de que se pueda.

    saludos !!

  21. Está bien obtener las páginas a las que referencia cada not provided, pero… Una misma página, está posicionada por dos palabras claves muy distintas, como ejemplo.. “Pepito Garcia – Recetas de empanadas caseras”. Habrá quien busque directamente a Pepito García, porque lo conozca.. y habrá quien busque directamente “recetas de empanadas caseras” y se encuentre con la web de Pepito.
    99 de las visitas, son por “Pepito García”
    10 por “recetas de empanadas caseras” y seguimos teniendo la incertidumbre de 90 visitas “not provided”… no hay manera de saber la evolución de nuestro trabajo en posicionamiento si nos basamos en las estadísticas pasadas con el not provided o en la densidad de palabras clave de la página.
    Según los datos de mi web, 1/3 de las visitas están logueadas y eso es mucho rango de incertidumbre.

  22. Pingback: Blog Hoswedaje » Blog Archive » Google Analytics “Not provided”: implicaciones

  23. Pues si que resulta una tocada de eggs esto del not provided.A la hora de pasar informes a clientes,ahora siempre te queda la duda.De todas manerss esta interesante tu truco,y habra que ponerlo en marcha.Gracias

  24. Pues tenéis razón esto del not provided es una tocada de narices, el artículo aunque lo he leído ya hace meses me parece muy correcto, no sabía del pique entre miguel de regaletes y tu aunque es lógico. Ambos hemos coincidido en persona, aunque últimamente no me prodigo mucho la verdad, en todo caso si alguien me puede recomendar más avances sobre el not provided encantado, lo digo por ir derecho a la fuente. Saludos.

  25. Pingback: Google Analytics para seguimiento de descargas | GRS

  26. Pingback: Google Analytics para seguimiento de descargas - Espectaculos Peru

  27. Muy bueno y claro, la verdad deja pensando y decir que estoy totalmente de acuerdo con el artículo ya que trabaja con SEO y he podido comprobar que va en aumento.

  28. Muy bueno y claro, la verdad deja pensando y decir que estoy totalmente de acuerdo con el artículo ya que trabaja con SEO y he podido comprobar que va en aumento.

  29. Hola Lakil,

    El artículo me ha parecido muy interesante, pero me ha dejado con una duda sobre el método matématico. ¿Porqué dices que piensas que google te oculta 300 palabras? ¿Que miras en el ejemplo (y donde en analytics) que sea 300? Yo llego hasta ese paso con mi web, pero no sé de donde sacar esa cifra para hacer la regla de tres.
    Gracias

    Saludos!

  30. Pingback: Google Analytics para seguimiento de descargas | Informacion Celulares [VC]

  31. If it’s a Canadian $100 gold coin, the face value of it is $100 CDN if you choose to spend it.What you’re loiokng for is it’s numismatic value, and that can vary based on the age, condition and rarity of the coin.What year was the coin minted? Has the coin ever been used? Was there any mistakes when the coin was minted that is, was it double-struck (struck twice)? Does Her Majesty face the wrong way compared to the regular issue? etcetera.Your best answers are not on the Web. A good coin dealer in your town can assay (figure out the value) of your coin and (probably) quote you a fair price.But if the Web way’s the only way for you, seek on Yahoo the following search terms 100 Canada gold coin Queen Elizabeth Silver Jubileeand ye shall find.Good luck, Cincypix.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

*

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>