Microsoft BrowseRank

Hace meses escribí un artículo en la interactiva cuestionando el uso por parte de google del comportamiento de los usuarios como un factor más de clasificación de resultados, el artículo tenía una sombre de originalidad que amenazaba su credibilidad pero en realidad jamás lo presenté como realidad absoluta sino cómo una serie de preguntas que casi terminaban formando una teoria: “Google debe tener algun filtro o algoritmo que puntua las webs según la experiencia del usuario, y si este algoritmo existe, quizá se llamase IndyRank” la verdad que sobre este último término no volví a escuchar nada y se quedó en un auténtico misterio, pero de lo demás estoy convencido de que sí, que Google está muy preocupado por medir las Webs según su calidad y la satisfacción de los usuarios, las herramientas de medición son múltiples: Analytics o sino GoogleBar, Feedberner, iGoogle, Google reader y otras herramientas que Google puede usar para saber si una web “mola” o no.

Hoy leo en searchengineland.com que Microsoft está trabajando sobre un algoritmo llamado BrowseRank que será parecido al Pagerank en lo que se refiere a la popularidad pero incorporará estos valiosos datos de la experiencia del usuario como medir el tiempo del usuario en una página y su interacción con la misma. el documento se llama “BrowseRank: Dejar que los usuarios de la web voten la importancia de una página (PDF)” y decribe cómo BrowseRank evitar los puntos débiles del PageRank, les dejo el PDF para saber más sobre el tema.

{lang: 'es'}

El PageRank: “Estoy vivo”

Nadar contra la corriente es a veces incómodo, como en la vida real, en la red tendemos a repetir aquello que otros dicen, lo otorgamos autoridad y lo convertimos en una verdad. “el PageRank ha muerto” una frase que me he cansado de escuchar de la boca de todo el mundo menos la de Google. desde el 2005 en todas las comunidades y en todos los idiomas. me pregunto: ¿Porque vuelve a estar en la portada de todos los blogs y webs sobre SEO cada 3 meses? ¿a caso nos gusta hablar de muertos? al mismo tiempo que me gusta imaginar a google gastando recursos en mantener un algoritmo que no usa…

La noticia hoy es que Google ha vuelto a actualizar su barra verde (el PageRank) algunos dominios verán subir su PageRank, otros lo verán bajar, pero pocos verán variar sus visitas. En ocasiones anteriores había defendido al pagerank y su uso por Google frente a teorias que afirmaban que estaba ya abandonado. y algunos posts y comentarios que he dejado en blog de compañeros había llamado la atención a qué quizá su funcionamiento haya sido modificado y que hayan entrado en juego nuevos factores pero el PageRank esa grán patente de Google está lejos de estar muerta sino que participa activamente en la clasificación de resultados.

Aclarado este punto, quiero referirme a la cuestión de “¿hasta qué punto afecta esto a mi tráfico y mis posiciones?” Bien, el día de la acualización de la barra verde seguramente no notes nada raro, tus visitas y posiciones seguirán siendo las mismas, ya que el PageRank aunque se publica cada 3 o 4 meses en realidad se actualiza diariamente, todos los días, el algoritmo es enriquecido por pequeñas aportaciones es por eso que tus posiciones podrán variar de un dia a otro sin que existe ningúna actualización visible. Google ya había anunciado que ahora tiene la capacidad de calcular este valor varias veces al día, por tanto el hecho de que el valor de la barra verde cambie, no es más que resultado de unos cambios que ya habían ocurrido con anterioridad.

{lang: 'es'}

La publicidad y ROI en los medios sociales (Social Media)

El escaso uso de los medios sociales en España

En realidad no quiero centrarme en redes sociales sino en Social Media en general, es decir centrarse en el usuario tanto internamente como externamente, tanto en nuestro Site como en las redes sociales de terceros. Ello implica un urgente cambio de chip… El giro al Marketing online no es sólo llevar los conceptos tradicionales de Marketing a Internet, y si antes los marketinianos todavía tenían alguna duda, con la Web 2.0 ya no cabe ninguna, la marca tiene que entrar en diálogo con los usuarios que al final son sus cliente finales, estamos ante una nueva filosofía y cambio sustancial de los conceptos de la publicad.

Ser amigo del usuario significa en primer lugar dejar de bombardearle con anuncios tradicionales y ofrecerle aquella publicidad que le aporta valor, la que necesita y en el tiempo que la necesita, ahora que lo escribo me viene a la cabeza la expresión del “punto de necesidad” que usa mi amigo y uno de los grandes consultores Pablo Melchor, es un modelo que puede significar un importante ahorro en los costes y un considerable ahorro en los porcentajes de conversiones.

Desgraciadamente las marcas españolas parecen ajenas a estas nuevas tendencias, visto el gráfico de la evolución de tráfico para Facebook.com Yahoo.es y Msn.es, creo que uno tiene que ser ciego para no verlo. En la mayoría de los últimos proyectos en los que he participado, las marcas están invirtiendo presupuestos en hacer campañas que solo toman en cuenta el capricho de las personas (generalmente con una clásica y poco innovadora ideología marketiniana) a los que cuesta explicarles aquello de 2.0 y que ellos mismos han repetido en más de una ocasión.

No merece la pena gastarse los recursos en hacer un minisite que sólo sirva de fachada a tu producto, esto ya no es el objetivo, deja de intentar vender tu producto como sea, tu público objetivo son usuarios no son telespectadores, (incluso en televisión han dejado de serlo con la introducción de la interactividad y TDT) piensa por tanto en acercarte a ellos y establecer con ellos un dialogo. A la hora de plantear un nuevo proyecto, haz una Web de usuarios, no una Web para los usuarios. Piensa que no vas a conseguir tus objetivos sin centrarte en ellos, que ellos son la herramienta y son el medio. Son los que van a dar vida a tu Web, y si tu Web les aporta valor, tendrán el nombre de tu marca omnipresente en su cabeza, si no les aportas nada, primero no te encontrarán.. y si te encuentran pasarán de ti, porque ahora, el poder lo tienen ellos.

Medición de Retorno de Inversión en Social Media y Web 2.0

Uno de los motivos del escaso uso del Social Media es la dificultad de medición ROI, la antigua generación de marketinianos sigue teniendo los mismos conceptos de medición de siempre, y desconfían en cualquier inversión cuyos beneficios son difíciles de calcular y por tanto difíciles de demostrar para sus respectivos departamentos.

En parte comparto esas preocupaciones porque la apuesta por el Social Media tiene que venir del más alto nivel, pero creo que se comete un gran error al intentar vincular el Social Media con otras acciones tangibles, ya que los resultados de este último son intangibles, por tanto en mi opinión Social Media hay entenderlo más como una acción para mejorar la notoriedad y percepción de la marca que como una acción publicitaria tradicional.

Para hacer publicidad en Medios Sociales entran en juego factores hasta poco inexistentes como la interacción con el usuario, la percepción de marca, el ROI se tiene que medir en su globalidad, el mejor retorno de inversión es conseguir que un usuario acepte tu amistad de forma voluntaria y se interese por tu producto.

No puede existir un ROI en los Medios Sociales, no es medible. Social Media es solo una de las acciones que se tienen que llevar a cabo, las mejores campañas publicitarias son las que combinan varias acciones, las que abren varios frentes, y Social Media es una frente más, pero que cada día es más importante, por tanto el ROI se tiene que medir en su globalidad, el valor de la publicidad en medios sociales sólo es percibido cuando se analizan los beneficios obtenidos totales y no solamente de esta acción.

Artículos relacionados:

El paradigma de la medición del engagement y de la influencia online

{lang: 'es'}

Google y la experiencia del usuario

Parece que estoy entrando otra vez en mi bucle de asociar estas dos cosas, lo cierto es que no lo puedo evitar, es más me niego a creer que google no está usando User Experience para mejorar su buscador, el año pasado mientras veía a Jeffry Veen (Ahora ex-director de Experiencia de Usuario de Google) hablando en Fundamentos Web del uso de esta disciplina, me venía a la cabeza lo tan obvio que es el caso Google, ¿y es que no lo vemos? el éxito de Google se debe a eso, a que las decisiones de mejora no son tomadas de forma unilateral sino basándose en el comportamiento de los usuarios. Sigue leyendo

{lang: 'es'}

La miserable vida de un SEOSMOSEMCSSUXAIROI

Quizás si Victor Hugo hubiera sido contemporáneo a nosotros, nos habría aludido en su novela “Los Miserables”. ¿Has pasado varias horas delante de google sin saber qué estás buscando? ¿Se ha convertido google en un blog para navegar en lugar de un buscador? Sí ese es tu caso, tienes las síntomas de ese raro síndrome bautizado SEOSMOSEMCSSUXAIROI…

Miserable, porque mientras un diseñador termina su tarea con la intrega de unos cuantos PSD´s (evidentement no se salva de tocamiento de los huevos) y un programador se preocupa por que un aplicación funcione. Un SEO ve confusos y conflectivos los límites de su área.

En principio había que preocuparse por las posiciones en buscadores, de ahí el uso, en mi opinión equivocado, de “posicionamiento” para referirse a “SEO” u optimización para buscadores. Para conseguir tales posicones había que optimizar internamente las páginas, sin darte cuenta ya estabas metido en el mundo de maquetación y de accesibilidad, y acariciendo la Web semántica y los microformatos.. en fin unas cuantas ramas por las que uno se puede desvíar fácilmente. Sigue leyendo

{lang: 'es'}

Latent semantic indexing (LSI)

Cuando efectuamos una búsqueda en buscadores, los primeros resultados que aparecen son páginas en cuyos títulos y contenido está presente el término que buscamos, después de varios años, los usuarios hemos aprendido y perfeccionado nuestras formas de búsqueda cambiando, especificando y a veces añadiendo términos para filtrar los resultados hacia un concepto u otro.

Mientras tanto, los buscadores siguen siendo lo que son, unas máquinas incapaces de entender más allá de lo que nosotros les suministramos, es decir, pueden asociar “televisión” a “tv” o “seguro médico” a “seguro de salud” cuando un humano ya se lo ha especificado con anterioridad, sino no son capaces de entenderlo.

Introducir la semántica a los buscadores es de lo más complejo que se puede imaginar dado como está montada hoy la Web, hoy para conseguir que una máquina entienda una familia de sinónimos tiene que haber una persona por detrás que se encargue de agregar y agrupar esos miles de sinónimos y metáforas, eso podría ser una locura, y más si pensamos que hay muchos un idioma en el mundo.

Pero Google parece más preocupado por la semántica, sus últimas actualizaciones, parecen ir en este sentido, de hecho se ha observado una mayor tolerancia a la presencia de resultados de temática cercana aunque no idéntica al término buscado, como por ejemplo buscar una receta y que te devuelve un resultado de tareas de hogar entre los 10 primeros… ¿Entiende  Google que cocinar forma parte de tareas de hogar? Y cómo lo sabe? tiene que ver con eso la metodología de Latent Semantique indexing LSI o Indexación Semántica Latente?

De LSA a LSI (indexación semántica latente)

LSI no es algo nuevo, viene del método del Análisis Semántico Latente (LSA), una teoría que pretendía representar el conocimiento humano mediante un modelo estadístico basado en las palabras, esa teoría permite comparar las similitudes semánticas entre piezas de información textual que pueden ser páginas, documentos, e incluso entre palabras y entre párrafos de un mismo documento, esa técnica lleva varios años circulando entre especialistas en la psicolingüística computacional desde que se publicó en “Journal of the Society for Information Science” 1990 por . Deerwester, G. W. Furnas, T. K. Landauer, et R. Harshman.

LSI es una nueva forma de indexación que pretende aproximar la forma de pensar de un buscador a la de un humano, cuando un humano busca una información en varios documentos, lo que hace es rastrear todos los documentos que hablarán más o menos del tema en cuestión, y en función de eso establecerá una clasificación de resultados ordenados por relevancia, de modo que el primer resultado sea el más exacto y satisfactorio, esto aplicándolo a miles de páginas es una tarea infinitamente complicada, de ahí la necesidad de un algoritmo, ahora bien, un humano también sabe dónde buscar para encontrar la información, su cerebro ya tiene agrupados miles de conceptos y familias de temáticas cercanas, por lo que para buscar una receta de cocina irá a buscar en los libros o documentos que hablen de tareas de hogar, y si viene algún amigo buscando información sobre tareas del hogar probablemente lo ofrecerá el documento de las recetas de cocina como uno de los resultados. Esa inteligencia es la que los buscadores quieren desarrollar, y LSI (indexación semántica latente) es de los pocos métodos que pueden dar una respuesta científica.

Este método parece que ha despertado el interés de los buscadores que desean ir más allá de la sintaxis y la gramática y analizar semánticamente el contenido, es decir analizar el significado y no solo el significante, el fondo y no solo la forma.

Oficialmente ningún buscador ha anunciado que está empleando estas teorías, pero el sentido común y la necesidad de una profunda comprensión, recopilación y luego clasificación de la información en Internet hace muy necesario trabajar sobre LSI o conceptos similares, para tomarlos como punto de partida hacia algoritmos más inteligentes.

Funcionamiento de LSI

La idea de este método al final es definir la temática de una página y la relación entre varios elementos (páginas, conceptos, párrafos etc.) basándose en familias de palabras semánticamente cercanas, es decir no contar exclusivamente la densidad de las palabras (frecuencia con que aparecen en el texto) sino también estudiar las correlaciones ocultas entre las palabras.

Por ejemplo, si en un texto se habla de ordenador, USB, cable, ratón etc. Google u otro algoritmo puede entender que esos términos pertenecen a una misma familia, y que por tanto es un texto que habla de accesorios de informática, de forma que si alguien busca “accesorios de ordenador” Google o otros buscadores deberían sacar esta página entre los resultados aunque no contenga el término “accesorios” si además de eso las páginas enlazadas a la misma también tratan esa temática o de temáticas parecidas (tecnología) Google la puede clasificar incluso para búsquedas de términos como “hardware” y “material informático”, de esta forma los buscadores pretenden llegar a ofrecer resultados inteligentes y relevantes sin basarse exclusivamente en la sintaxis.

¿Pero cómo puede una máquina definir familias de palabras sin saber el significado de cada término? Todo comienza con una hipótesis, cualquier texto está abierto a varios niveles de abstracción y organización. En el nivel más bajo de la abstracción, el contenido está estrictamente organizado por reglas de sintaxis y gramática, de modo que si hacemos un análisis estadístico de la frecuencia de aparición de términos obtendremos un resultado con alta influencia de la estructura sintáctica y gramatical de un idioma, por tanto este análisis no nos vale.

Las palabras no son cifras, las palabras tienen un sentido que varía en función del contexto, un término, una frase, un párrafo o un capítulo entero de un libro se puede entender de una forma u otra dependiendo de su contexto, por lo qué no existe un solo nivel de análisis sino son múltiples los niveles de segmentación y abstracción a los que se somete un texto. La metodología LSI tiene como objetivo la correlación entre palabras por métodos estadísticos pero intentando eliminar el ruido que hay en los niveles más bajos de abstracción que suele ser un ruido relacionado más con la gramática que con la semántica,

Con el objetivo de llegar a correlaciones a un nivel más alto y más relacionado con el significado del texto, y mientras que para analizar la correlación entre términos otros métodos estadísticos se basan en una teoría estadística propuesta a principios del siglo pasado por Karl Pearson llamada ACP (Análisis en Componentes Principales), LSI utiliza el método de Descomposición en valores singulares, entender ambos métodos requiere sólidos conocimientos en matemáticas y describir sus funcionamientos es algo que supera el alcance de este artículo. Sin embargo conviene señalar que la forma de análisis de LSI es global, es decir que no estudia las relaciones entre términos que forman una frase ni presta atención a su orden de aparición, sino lo analiza todo en conjunto, algo así como una caja de términos. Los cálculos se hacen sobre la suma de los términos obtenidos de un documento determinado y su frecuencia de aparición en el texto.

¿LSI es usado por los buscadores?

Con las ultimas actualizaciones de los SERP´s, se ha venido culpando a la introducción de LSI de forma sistemática, pero no hay nada que puede afirmar que Google utiliza esta metodología para segmentar los textos y entender los conceptos semánticos de un documento o grupo de documentos, sin embargo alguna metodología con objetivos parecidos seguro que usa, o por lo menos debería usar, llevamos años escuchando que Google solo toma en cuenta el anchor text de los enlaces procedentes de web de misma temática, me pregunto: si mi página no tiene titles ni encabezados se limitaría Google a los enlaces para asociar una temática a una web? O intentará averiguar el significado de mis párrafos usando LSI o algo parecido?

Siempre he pensado que eso tiene que ser muy relativo, porque los buscadores ni siquiera con la web 2.0 son capaces de entender más allá de las combinaciones sintácticas y vacías de concepto, LSI no es una solución perfecta, porque las lenguas son sistemas demasiado complicados como para segmentarlas por temática agrupando familias de términos. Estoy imaginando la metodología de LSI intentando entender un poema de Góngora o Quevedo que ni siquiera un estudiante de filología es capaz de hacerlo… las palabras por sí mismas no tienen mucho significado sino que somos los humanos los que las damos sentido.

Sinceramente después de investigar sobre LSI, como SEO me puedo dormir tranquilo porque Google, si bien puede incorporar un intento de ese estilo, es muy poco probable que le dé más peso que otros conceptos en su algoritmo. Y es que la única forma científica de determinar la temática de un documento es mediante lenguajes como RDF capaces de metaetiquetar y explicar cada término, frase, o contenido, y es lo que la Web Semántica pretende alcanzar.

{lang: 'es'}

Las marcas españolas no son concientes del SEO

Leo en el Blog de Ismael El-Qudsi un artículo sobre la importancia de SEO, y me viene a la cabeza lo lejos que están los clientes y sobre todo las agencias tradicionales de entenderlo, el gráfico de Eyetools viene a confirmar numerosos mapas de calor que en las que se reflejaba claramente que las primeras tres posiciones son los más vistos, estos son los porcentajes (no de clicks sino de vistas) que da el estudio:

Posición 1 – 100%
Posición 2 – 100%
Posición 3 – 100%
Posición 4 – 85%
Posición 5 – 60%
Posición 6 – 50%
Posición 7 – 50%
Posición 8 – 30%
Posición 9 – 30%
Posición 10 – 20%

En fin, ese era el dato, y ahora una reflexión: Son concientes las marcas españolas de que están perdiendo mucho dinero para crear una minisite que luego nadie lo visita?  abajo el mapa:

heatmap google

{lang: 'es'}

Mi resumen del SMX Madrid 2008

smx madrid 2008

Con barra libre de cerveza ha concluido hoy la primera edición de SMX Madrid, la edición ha contado con 3 intervenciones de Rand Fishkin de seomoz.org que han sido interesantísimas y aunque no ha soltado nada nuevo, ha ido confirmando punto por punto lo que todo profesional de SEO sabe o suspecha… Sigue leyendo

{lang: 'es'}

Optimizar la distribución interna de PageRank

Uno de los temas al que hay que prestar atención a la hora de optimizar una web es el tema del PageRank y su distribución interna, el eje principal sobre de todo trabajo de SEO, la arquitectura interna de una Web no siempre es fruto de un buen estudio de usabilidad y arquitectura, y muchas veces, el trabajo de SEO viene cuando el proyecto ya está finalizado y con pocos márgenes de maniobra.

El PageRank suele verse afectado por dos desafíos que se plantean a la hora de optimizar internamente una Web:

1. La duplicación de contenidos y su negativo impacto en el page rank.
2. La presencia de páginas poco relevantes para la actividad que desarrolla el cliente. Sigue leyendo

{lang: 'es'}

Funcionamiento del Pagerank

centro de atención de todos los que nos dedicamos a SEO, el PageRank parece la meta más importante a conseguir, y a pesar de que abundan el la web frases de tipo :”el pagerank no es el objetivo, es uno de los medios”, la gente lo sigue interpretando de la forma incorrecta, en un post que publiqué en octubre sobre google human rating, el PR no constituye por sí mismo la base para la clasificación de resultados, sino adquiere su importancia a la hora de contrastarlo con otos factores que hacen subir o bajar el índice de confianza que es la nueva tendencia de google.

las variaciones del PR no necesariamente pueden afectar a las posiciones en Google, más bien muchos han observado que tanto las visitas como las posiciones siguen igual después de las actualizaciones de PR. existe la posibiliad de que nisiquiera esté relacionado unicamente con los enlaces sino con otros aspectos como el contenido duplicado la originalidad de contenido, pero esta posibilidad creo que convierte el PR en el eje principal de un trabajo de SEO, un eje que lo engloba todo, lo cual ha dejado de serlo desde hace mucho tiempo con la incorporación de varios filtros y procesos de clasificación.

Os dejo sin embargo el video de la entrevista con Andy Steggles de SitePR Tracker que trata este tema:

</p>

Leer tambien:
Indyrank y los evaluadores humanos
La era de los algoritmos humanizados
Trustrank

{lang: 'es'}