<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Ferticidio&#039;s &#187; Teoria</title>
	<atom:link href="http://ferticidio.com/tag/teoria/feed" rel="self" type="application/rss+xml" />
	<link>http://ferticidio.com</link>
	<description>El blog personal de Fernando Lescano donde escribe un monton de cosas que solo a el pueden interesarle</description>
	<lastBuildDate>Wed, 23 May 2012 12:22:47 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Como funciona Google, introduccion al indice</title>
		<link>http://ferticidio.com/como-funciona-google-introduccion-al-indice</link>
		<comments>http://ferticidio.com/como-funciona-google-introduccion-al-indice#comments</comments>
		<pubDate>Sat, 30 Jan 2010 22:51:36 +0000</pubDate>
		<dc:creator>ferticidio</dc:creator>
				<category><![CDATA[Google]]></category>
		<category><![CDATA[Buscadores]]></category>
		<category><![CDATA[Programacion]]></category>
		<category><![CDATA[Teoria]]></category>

		<guid isPermaLink="false">http://ferticidio.com/?p=2066</guid>
		<description><![CDATA[Esto pretende ser una introducción a como funcionan los buscadores modernos. Muchas veces me lo pregunte: ¿Como puede hacer una búsqueda entre tantos millones de paginas? ¿Como guarda esa información?. Empecemos: Primero dejemos en claro una cosa, cuando introducimos una &#8230; <a href="http://ferticidio.com/como-funciona-google-introduccion-al-indice">Sigue leyendo <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Esto pretende ser una introducción a <strong>como funcionan los buscadores modernos</strong>. Muchas veces me lo pregunte: ¿Como puede hacer una búsqueda entre tantos millones de paginas? ¿Como guarda esa información?. Empecemos:</p>
<p>Primero dejemos en claro una cosa, cuando introducimos una <strong>búsqueda en Google</strong> (O yahoo, o bing o quien sea) este no chequea en las paginas que tiene almacenadas, el chequea su indice.</p>
<p>¿Que es un indice?</p>
<p>No es un indice como al que estamos acostumbrados en el que se nombran los títulos de los capítulos de un libro, pero se acerca, es mas algunos libros tienen un indice que se acerca mucho mas todavía. Seguramente en algún libro de texto lo han visto, al final tienen toda una serie de términos y junto a cada uno de ellos las paginas donde podemos encontrarlo. <strong>El indice de Google funciona asi.</strong></p>
<p>Se crea un indice por palabras, eliminando las superfluas. Es decir tenemos todas las palabras y a cada una la asociamos con una serie de paginas. Mas facil con un ejemplo, supongamos que solo tenemos 3 paginas diminutas indexadas, sus textos son los siguientes:</p>
<p>a. &#8220;Juan lava el auto&#8221;</p>
<p>b. &#8220;Pedro anda en auto&#8221;</p>
<p>c. &#8220;Marta lava la ropa&#8221;</p>
<p>Nuestro indice seria:</p>
<ol>
<li>juan -&gt; a</li>
<li>pedro -&gt; b</li>
<li>marta -&gt; c</li>
<li>lava -&gt; a, c</li>
<li>auto -&gt; a,b</li>
<li>ropa -&gt; c</li>
</ol>
<p>Eliminamos &#8220;el&#8221;, &#8220;en&#8221; y &#8220;la&#8221; por ser considerados supefluos.</p>
<p>Ahora supongamos que viene alguien y busca en nuestro diminuto buscador. Si en el cuadro de busqueda introduce: &#8220;lava&#8221; le daremos como resultado links a &#8220;Juan lava el auto&#8221; y &#8220;marta lava la ropa&#8221; y si en vez de eso ingresa &#8220;anda&#8221; nuestro unico resultado seria un link a &#8220;Pedro anda en auto&#8221;. Y si introduce &#8220;comer&#8221; no podríamos darle ningún resultado.</p>
<p>También se podrían hacer búsquedas mas complicadas. Por ejemplo supongamos que alguien busca &#8220;lava auto&#8221;. Nuestro indice primero buscaría las paginas que tienen &#8220;lava&#8221; y luego las que tienen &#8220;auto&#8221; y nuestro resultado serian las paginas que estan presentes en las dos búsquedas.</p>
<p>Por ultimo, para que nuestro buscado pueda ser eficiente debe poder indexar frases y no solo palabras sueltas. Pero creo que esto ya es cosa de otro post.</p>
<p>Seguramente algun dia, ni se cuando, me ponga a escribir sobre como funcionan las arañas (el famoso Googlebot) y como es el proceso de indexado.</p>
]]></content:encoded>
			<wfw:commentRss>http://ferticidio.com/como-funciona-google-introduccion-al-indice/feed</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
	</channel>
</rss>

