<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>SEO 2.0 &#187; web semántica</title>
	<atom:link href="http://www.seo-20.com/tag/web-semantica/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.seo-20.com</link>
	<description>blog de lakil essady</description>
	<lastBuildDate>Tue, 07 Feb 2012 13:16:43 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Seo y Web Semántica, hablando de ontologías</title>
		<link>http://www.seo-20.com/seo-y-web-semantica-hablando-de-ontologias/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=seo-y-web-semantica-hablando-de-ontologias</link>
		<comments>http://www.seo-20.com/seo-y-web-semantica-hablando-de-ontologias/#comments</comments>
		<pubDate>Sat, 04 Jun 2011 19:22:02 +0000</pubDate>
		<dc:creator>Lakil Essady</dc:creator>
				<category><![CDATA[General]]></category>
		<category><![CDATA[congresos]]></category>
		<category><![CDATA[ontologías]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[web semántica]]></category>

		<guid isPermaLink="false">http://www.seo-20.com/?p=411</guid>
		<description><![CDATA[Cada a día la Red da pequeños pasos que la mayoría de las veces no tienen ningún impacto inmediato, pero quien iba a decir que esa Red creada hace un par de décadas llegaría a ser lo que es ahora: &#8230; <a href="http://www.seo-20.com/seo-y-web-semantica-hablando-de-ontologias/">Sigue leyendo <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Cada a día la Red da pequeños pasos que la mayoría de las veces no tienen ningún impacto inmediato, pero quien iba a decir que esa Red creada hace un par de décadas llegaría a ser lo que es ahora: Buscadores que te localizan cualquier documento, redes sociales que nos conocen más que nuestras madres, compra online, música y libros en formatos digitales etc.<span id="more-411"></span></p>
<p>En La primera Edición del <a href="http://congresoweb.es">Congreso Web de Zaragoza</a>, ha tocado hablar de algo que silenciosamente está cambiando la Red,  pero del que desgraciadamente sabemos solo el nombre, la Web Semántica o la Web 3.0, llevo tiempo siguiendo este tema, y tengo que reconocer que muchos vendedores de humo lo han sabido explotar muy bien para dar la sensación de controlar el tema cuando no tienen ni idea de lo que es.</p>
<p>Hoy después de pensarlo mucho tenía 2 opciones, la opción uno era hacer una presentación densa explicando lo que es y su posible impacto SEO, la otra opción es contar un par de chistes, enseñar un par de videos de Youtube y todos contentos, opté por la opción número 1, porque prefiero ser un coñazo y ofrecer un contenido interesante, a ser majo e inútil.</p>
<p>La presentación pretende explicar de forma muy visual las ontologías y su uso actual, las limitaciones de los buscadores sintácticos y los pequeñas y prometedoras salidas que se están encontrando para ofrecer resultados más relevantes.</p>
<p>Antes de dejaros con la presentación que he subido a SlideShare, tengo que agradecer a los asistentes por los más de 150 Tweets que me han dedicado. De verdad ¡muchas gracias!</p>
<div id="__ss_8208259" style="width: 425px;"><strong><a title="SEO y Web Semántica en Congreso Web" href="http://www.slideshare.net/lakil/seo-y-web-semntica-en-congreso-web">SEO y Web Semántica en Congreso Web</a></strong><object id="__sse8208259" width="425" height="355" classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowScriptAccess" value="always" /><param name="src" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=congresoweb-110604135809-phpapp01&amp;stripped_title=seo-y-web-semntica-en-congreso-web&amp;userName=lakil" /><param name="allowfullscreen" value="true" /><param name="allowscriptaccess" value="always" /><embed id="__sse8208259" width="425" height="355" type="application/x-shockwave-flash" src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=congresoweb-110604135809-phpapp01&amp;stripped_title=seo-y-web-semntica-en-congreso-web&amp;userName=lakil" allowFullScreen="true" allowScriptAccess="always" allowfullscreen="true" allowscriptaccess="always" /></object></div>
<div name="googleone_share_1" style="position:relative;z-index:5;float: left; margin-left: 10px; width:60px;"><g:plusone size="tall" count="1" href="http://www.seo-20.com/seo-y-web-semantica-hablando-de-ontologias/">{lang: 'es'}</g:plusone></div>]]></content:encoded>
			<wfw:commentRss>http://www.seo-20.com/seo-y-web-semantica-hablando-de-ontologias/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Latent semantic indexing (LSI)</title>
		<link>http://www.seo-20.com/lsi-latent-semantique-indexing/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=lsi-latent-semantique-indexing</link>
		<comments>http://www.seo-20.com/lsi-latent-semantique-indexing/#comments</comments>
		<pubDate>Fri, 13 Jun 2008 22:45:43 +0000</pubDate>
		<dc:creator>Lakil Essady</dc:creator>
				<category><![CDATA[General]]></category>
		<category><![CDATA[indexación semántica latente]]></category>
		<category><![CDATA[lsi]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[web semántica]]></category>

		<guid isPermaLink="false">http://www.seo-20.com/?p=56</guid>
		<description><![CDATA[Cuando efectuamos una búsqueda en buscadores, los primeros resultados que aparecen son páginas en cuyos títulos y contenido está presente el término que buscamos, después de varios años, los usuarios hemos aprendido y perfeccionado nuestras formas de búsqueda cambiando, especificando &#8230; <a href="http://www.seo-20.com/lsi-latent-semantique-indexing/">Sigue leyendo <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Cuando efectuamos una búsqueda en buscadores, los primeros resultados que aparecen son páginas en cuyos títulos y contenido está presente el término que buscamos, después de varios años, los usuarios hemos aprendido y perfeccionado nuestras formas de búsqueda cambiando, especificando y a veces añadiendo términos para filtrar los resultados hacia un concepto u otro.</p>
<p>Mientras tanto, los buscadores siguen siendo lo que son, unas máquinas incapaces de entender más allá de lo que nosotros les suministramos, es decir, pueden asociar “televisión” a “tv” o “seguro médico” a “seguro de salud” cuando un humano ya se lo ha especificado con anterioridad, sino no son capaces de entenderlo.</p>
<p>Introducir la semántica a los buscadores es de lo más complejo que se puede imaginar dado como está montada hoy la Web, hoy para conseguir que una máquina entienda una familia de sinónimos tiene que haber una persona por detrás que se encargue de agregar y agrupar esos miles de sinónimos y metáforas, eso podría ser una locura, y más si pensamos que hay muchos un idioma en el mundo.</p>
<p>Pero Google parece más preocupado por la semántica, sus últimas actualizaciones, parecen ir en este sentido, de hecho se ha observado una mayor tolerancia a la presencia de resultados de temática cercana aunque no idéntica al término buscado, como por ejemplo buscar una receta y que te devuelve un resultado de tareas de hogar entre los 10 primeros… ¿Entiende  Google que cocinar forma parte de tareas de hogar? Y cómo lo sabe? tiene que ver con eso la metodología de Latent Semantique indexing LSI o Indexación Semántica Latente?</p>
<p><strong>De LSA a LSI (indexación semántica latente)</strong></p>
<p>LSI no es algo nuevo, viene del método del Análisis Semántico Latente (LSA), una teoría que pretendía representar el conocimiento humano mediante un modelo estadístico basado en las palabras, esa teoría permite comparar las similitudes semánticas entre piezas de información textual que pueden ser páginas, documentos, e incluso entre palabras y entre párrafos de un mismo documento, esa técnica lleva varios años circulando entre especialistas en la psicolingüística computacional desde que se publicó en “Journal of the Society for Information Science” 1990 por . Deerwester, G. W. Furnas, T. K. Landauer, et R. Harshman.</p>
<p>LSI es una nueva forma de indexación que pretende aproximar la forma de pensar de un buscador a la de un humano, cuando un humano busca una información en varios documentos, lo que hace es rastrear todos los documentos que hablarán más o menos del tema en cuestión, y en función de eso establecerá una clasificación de resultados ordenados por relevancia, de modo que el primer resultado sea el más exacto y satisfactorio, esto aplicándolo a miles de páginas es una tarea infinitamente complicada, de ahí la necesidad de un algoritmo, ahora bien, un humano también sabe dónde buscar para encontrar la información, su cerebro ya tiene agrupados miles de conceptos y familias de temáticas cercanas, por lo que para buscar una receta de cocina irá a buscar en los libros o documentos que hablen de tareas de hogar, y si viene algún amigo buscando información sobre tareas del hogar probablemente lo ofrecerá el documento de las recetas de cocina como uno de los resultados. Esa inteligencia es la que los buscadores quieren desarrollar, y LSI (indexación semántica latente) es de los pocos métodos que pueden dar una respuesta científica.</p>
<p>Este método parece que ha despertado el interés de los buscadores que desean ir más allá de la sintaxis y la gramática y analizar semánticamente el contenido, es decir analizar el significado y no solo el significante, el fondo y no solo la forma.</p>
<p>Oficialmente ningún buscador ha anunciado que está empleando estas teorías, pero el sentido común y la necesidad de una profunda comprensión, recopilación y luego clasificación de la información en Internet hace muy necesario trabajar sobre LSI o conceptos similares, para tomarlos como punto de partida hacia algoritmos más inteligentes.</p>
<p><strong>Funcionamiento de LSI</strong></p>
<p>La idea de este método al final es definir la temática de una página y la relación entre varios elementos (páginas, conceptos, párrafos etc.) basándose en familias de palabras semánticamente cercanas, es decir no contar exclusivamente la densidad de las palabras (frecuencia con que aparecen en el texto) sino también estudiar las correlaciones ocultas entre las palabras.</p>
<p>Por ejemplo, si en un texto se habla de ordenador, USB, cable, ratón etc. Google u otro algoritmo puede entender que esos términos pertenecen a una misma familia, y que por tanto es un texto que habla de accesorios de informática, de forma que si alguien busca “accesorios de ordenador” Google o otros buscadores deberían sacar esta página entre los resultados aunque no contenga el término “accesorios” si además de eso las páginas enlazadas a la misma también tratan esa temática o de temáticas parecidas (tecnología) Google la puede clasificar incluso para búsquedas de términos como “hardware” y “material informático”, de esta forma los buscadores pretenden llegar a ofrecer resultados inteligentes y relevantes sin basarse exclusivamente en la sintaxis.</p>
<p>¿Pero cómo puede una máquina definir familias de palabras sin saber el significado de cada término? Todo comienza con una hipótesis, cualquier texto está abierto a varios niveles de abstracción y organización. En el nivel más bajo de la abstracción, el contenido está estrictamente organizado por reglas de sintaxis y gramática, de modo que si hacemos un análisis estadístico de la frecuencia de aparición de términos obtendremos un resultado con alta influencia de la estructura sintáctica y gramatical de un idioma, por tanto este análisis no nos vale.</p>
<p>Las palabras no son cifras, las palabras tienen un sentido que varía en función del contexto, un término, una frase, un párrafo o un capítulo entero de un libro se puede entender de una forma u otra dependiendo de su contexto, por lo qué no existe un solo nivel de análisis sino son múltiples los niveles de segmentación y abstracción a los que se somete un texto. La metodología LSI tiene como objetivo la correlación entre palabras por métodos estadísticos pero intentando eliminar el ruido que hay en los niveles más bajos de abstracción que suele ser un ruido relacionado más con la gramática que con la semántica,</p>
<p>Con el objetivo de llegar a correlaciones a un nivel más alto y más relacionado con el significado del texto, y mientras que para analizar la correlación entre términos otros métodos estadísticos se basan en una teoría estadística propuesta a principios del siglo pasado por Karl Pearson llamada ACP (<span style="text-decoration: underline;"><a href="http://www.monografias.com/trabajos15/analisis-acp/analisis-acp.shtml">Análisis en Componentes Principales</a></span>), LSI utiliza el método de <span style="text-decoration: underline;"><a href="http://divulgamat.ehu.es/weborriak/TestuakOnLine/05-06/PG-05-06-Zaballa.pdf">Descomposición en valores singulares</a></span>, entender ambos métodos requiere sólidos conocimientos en matemáticas y describir sus funcionamientos es algo que supera el alcance de este artículo. Sin embargo conviene señalar que la forma de análisis de LSI es global, es decir que no estudia las relaciones entre términos que forman una frase ni presta atención a su orden de aparición, sino lo analiza todo en conjunto, algo así como una caja de términos. Los cálculos se hacen sobre la suma de los términos obtenidos de un documento determinado y su frecuencia de aparición en el texto.</p>
<p><strong>¿LSI es usado por los buscadores?</strong></p>
<p>Con las ultimas actualizaciones de los SERP´s, se ha venido culpando a la introducción de LSI de forma sistemática, pero no hay nada que puede afirmar que Google utiliza esta metodología para segmentar los textos y entender los conceptos semánticos de un documento o grupo de documentos, sin embargo alguna metodología con objetivos parecidos seguro que usa, o por lo menos debería usar, llevamos años escuchando que Google solo toma en cuenta el anchor text de los enlaces procedentes de web de misma temática, me pregunto: si mi página no tiene titles ni encabezados se limitaría Google a los enlaces para asociar una temática a una web? O intentará averiguar el significado de mis párrafos usando LSI o algo parecido?</p>
<p>Siempre he pensado que eso tiene que ser muy relativo, porque los buscadores ni siquiera con la web 2.0 son capaces de entender más allá de las combinaciones sintácticas y vacías de concepto, LSI no es una solución perfecta, porque las lenguas son sistemas demasiado complicados como para segmentarlas por temática agrupando familias de términos. Estoy imaginando la metodología de LSI intentando entender un poema de Góngora o Quevedo que ni siquiera un estudiante de filología es capaz de hacerlo… las palabras por sí mismas no tienen mucho significado sino que somos los humanos los que las damos sentido.</p>
<p>Sinceramente después de investigar sobre LSI, como SEO me puedo dormir tranquilo porque Google, si bien puede incorporar un intento de ese estilo, es muy poco probable que le dé más peso que otros conceptos en su algoritmo. Y es que la única forma científica de determinar la temática de un documento es mediante lenguajes como RDF capaces de metaetiquetar y explicar cada término, frase, o contenido, y es lo que la Web Semántica pretende alcanzar.</p>
<div name="googleone_share_1" style="position:relative;z-index:5;float: left; margin-left: 10px; width:60px;"><g:plusone size="tall" count="1" href="http://www.seo-20.com/lsi-latent-semantique-indexing/">{lang: 'es'}</g:plusone></div>]]></content:encoded>
			<wfw:commentRss>http://www.seo-20.com/lsi-latent-semantique-indexing/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>La Web semántica es imprescindible</title>
		<link>http://www.seo-20.com/web-semantica-3/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=web-semantica-3</link>
		<comments>http://www.seo-20.com/web-semantica-3/#comments</comments>
		<pubDate>Wed, 18 Apr 2007 14:40:00 +0000</pubDate>
		<dc:creator>Lakil Essady</dc:creator>
				<category><![CDATA[accesibilidad]]></category>
		<category><![CDATA[buscadores]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[web semántica]]></category>

		<guid isPermaLink="false">http://www.accesibilidad-posicionamiento.com/web-semantica-3/</guid>
		<description><![CDATA[La asociación de la web 3.0 al concepto de la semántica puede que no sea mera imaginación, hoy en día la lucha entre las principales desarrolladoras de tecnologías (Microsoft, Adobe&#8230;) puede provocar una confusión acerca de hacía dónde se dirige &#8230; <a href="http://www.seo-20.com/web-semantica-3/">Sigue leyendo <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>La asociación de la web 3.0 al concepto de la semántica  puede que no sea mera imaginación, hoy en día la lucha entre las principales  desarrolladoras de tecnologías (Microsoft, Adobe&#8230;)  puede provocar una confusión acerca de hacía dónde  se dirige la web.</p>
<p>Muchos, siguen apostando por el código donde lo importante  es que sea vea “bien&#8221; y funcione, pero son los típicos trabajos que con el paso  del tiempo el mantenimiento cuesta más y la rentabilidad va bajando con la aparición  de nuevos conceptos cuyo punto de partida ha sido hacer las cosas realmente  bien.</p>
<p>Resulta que la “audiencia&#8221;,  como en la televisión, también manda y mandará en Internet, lo que en la red se llama  tráfico, y conseguir ese tráfico solo es posible siguiendo 3 vías:</p>
<ol type="1">
<li>Tener       un producto ya publicitado lo suficientemente en otros medios como puede       ser Coca Cola, Niké etc. Y ese tipo de Web no necesitan tener semántica       ninguna porque no dependen de las máquinas para auto publicitarse, sino son los propios humanos los que lo hacen.</li>
<li>Tener       un sitio Web con contenido rico e importante, e incluso polémico como para       traer un número tan alto de visitas. Aunque este tipo también se va a       pagando a medida que la noticia vaya perdiendo importancia.</li>
<li>Hacer       una Web lo más semánticamente posible. eso puede significar una interface       menos espectacular pero asegura un  rendimiento más duradero en el tiempo y más       amplio en los medios.</li>
</ol>
<p>El tercer punto es el más importante de todos, porque nos  puede asegurar una serie de ventajas.</p>
<ol type="1">
<li>Posibilidad       de buena visualización en los diferentes dispositivos (móviles, PDAs psp, etc), y una buena       indexabilidad por los buscadores, porque estos sólo son capaces de indexar       páginas, no aplicaciones completas como Ajax, o Flash / video.</li>
<li>la       separación de la forma y el contenido asegura que en el futuro otros       dispositivos que se irán incorporando a la red, pueden usar nuestra       información aunque sea con otro aspecto, al mismo tiempo que baja los costes de los futuros rediseños.</li>
</ol>
<p>Hay muchas otras ventajas para hacer una ruptura con la Web  no accesible. Pero volviendo al tema de la audiencia (el poder), cabe destacar  que Google está desarrollando nuevos algoritmos de búsqueda basadas en la semántica (leer  <a rel="bookmark" href="http://www.accesibilidad-posicionamiento.com/google-accessible-search/"> Google accessible search </a> ).  Hasta ahora las búsquedas están basadas en la sintaxis, es decir si buscas “playa  Cádiz&#8221; los resultados en que te saldrán son los que tienen está combinación de  palabras. Pero puede existir una página que trata el tema de la playa de Cádiz  y que no tenga esta combinación. Si se basara en algoritmos semánticos, un  buscador podría entender que ésta es la página buscada sin necesidad de tener  tal combinación de palabras.</p>
<p>Artículos relacionados:<br />
<a rel="bookmark" href="http://www.accesibilidad-posicionamiento.com/accesibilidad-usabilidad/"> La accesibilidad y el posicionamiento Web</a><br />
<a rel="bookmark" href="http://www.accesibilidad-posicionamiento.com/google-accessible-search/"> Google accessible search </a></p>
<div name="googleone_share_1" style="position:relative;z-index:5;float: left; margin-left: 10px; width:60px;"><g:plusone size="tall" count="1" href="http://www.seo-20.com/web-semantica-3/">{lang: 'es'}</g:plusone></div>]]></content:encoded>
			<wfw:commentRss>http://www.seo-20.com/web-semantica-3/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

