<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>WebXall Seo Blog &#187; Crawler Robots &amp; Spider</title>
	<atom:link href="http://blog.webxall.net/category/crawler-robots-spider/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.webxall.net</link>
	<description>Una guida all&#039;ottimizzazione e al posizionamento nei motori di ricerca</description>
	<lastBuildDate>Tue, 13 Jul 2010 07:27:14 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>Lo spider di Google è passato dal mio sito?</title>
		<link>http://blog.webxall.net/come-tracciare-lo-spider-di-google</link>
		<comments>http://blog.webxall.net/come-tracciare-lo-spider-di-google#comments</comments>
		<pubDate>Tue, 27 Oct 2009 17:31:19 +0000</pubDate>
		<dc:creator>Angelo Palma</dc:creator>
				<category><![CDATA[Crawler Robots & Spider]]></category>

		<guid isPermaLink="false">http://blog.webxall.net/?p=466</guid>
		<description><![CDATA[Come faccio a sapere quando lo spider di Google &#232; passato dal mio sito? Una domanda questa che &#233; stata posta nel forum di assistenza per i webmaster di Google. Ho pensato di indicare qui uno script che aiuti a&#160;segnalare il passaggio&#160;degli&#160;spider dei motori di ricerca conosciuti, dandoci informazioni per esempio sulla data, l&#8217;orario e [...]]]></description>
			<content:encoded><![CDATA[<h1><span style="font-family: Times New Roman"><span style="font-size: medium">Come faccio a sapere quando lo spider di Google &egrave; passato dal mio sito?</span></span></h1>
<p>Una domanda questa che &eacute; stata posta nel <a href="http://www.google.com/support/forum/p/webmasters/thread?tid=46c3cb36015c79d1&amp;hl=it">forum di assistenza per i webmaster di Google</a>.</p>
<p>Ho pensato di indicare qui uno script che aiuti a&nbsp;segnalare il passaggio&nbsp;degli&nbsp;spider dei motori di ricerca conosciuti, dandoci informazioni per esempio sulla data, l&#8217;orario e la pagina dove &eacute; entrato.</p>
<h2><span style="color: #800000">Come tracciare il passaggio dello Spider?</span></h2>
<p>Lo script qui sotto aiuta a tenere traccia del passaggio di diversi robots conosciuti. Ci sono quindi il Crawler di Google, lo Spider di Yahoo, il robot di Bing, e altri <strong>ragnetti</strong> vari che possono essere anche tolti o aggiunti seguendo l&#8217;esempio.<span id="more-466"></span></p>
<p><strong><span style="color: #ff0000">&lt;?php<br />
</span></strong>if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;Yandex&#8217;)){ $bot=&#8217;Yandex&#8217;;}<br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;Googlebot&#8217;)){$bot=&#8217;Google&#8217;;}<br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;Mediapartners-Google&#8217;)){$bot=&#8217;Mediapartners-Google (Adsense)&#8217;;}<br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;Slurp&#8217;)){$bot=&#8217;Hot&amp;nbsp;Bot&amp;nbsp;search&#8217;;}<br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;WebCrawler&#8217;)){$bot=&#8217;WebCrawler&amp;nbsp;search&#8217;;}<br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;ZyBorg&#8217;)){$bot=&#8217;Wisenut&amp;nbsp;search&#8217;;}<br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;scooter&#8217;)){$bot=&#8217;AltaVista&#8217;;}&nbsp; <br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;StackRambler&#8217;)){$bot=&#8217;Rambler&#8217;;}&nbsp; <br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;Aport&#8217;)){$bot=&#8217;Aport&#8217;;}&nbsp; <br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;lycos&#8217;)){$bot=&#8217;Lycos&#8217;;}&nbsp; <br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;WebAlta&#8217;)){$bot=&#8217;WebAlta&#8217;;}<br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;yahoo&#8217;)){$bot=&#8217;Yahoo&#8217;;}<br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;msnbot&#8217;)){$bot=&#8217;msnbot/1.0&#8242;;}<br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;ia_archiver&#8217;)){$bot=&#8217;Alexa search engine&#8217;;}<br />
else if (strstr($_SERVER['HTTP_USER_AGENT'], &#8216;FAST&#8217;)){$bot=&#8217;AllTheWeb&#8217;;}<br />
&nbsp;<br />
if($bot !=&quot;&quot;){<br />
$b_data = &quot;<strong>Spider.txt</strong>&quot;;<br />
$inf = date(&quot;YmdHis&quot;,time());<br />
$day = date(&quot;d.m.Y&quot;,time());<br />
$time = date(&quot;H:i&quot;,time());<br />
$ip = $REMOTE_ADDR;<br />
$home = $_SERVER['HTTP_HOST'] . $_SERVER['REQUEST_URI'];<br />
$data = fopen($b_data, &quot;a&quot;);<br />
fwrite($data, &quot;$inf|$day|$time|$bot|$ip|$home|rn&quot;);<br />
fclose($data);<br />
}<br />
<span style="color: #ff0000"><strong>?&gt; </strong></span></p>
<p>&nbsp;</p>
<hr />
<p>Qui sopra vediamo che la ricerca degli Spider viene fatta per nome. Per esempio nella condizione alla riga 3,&nbsp;troviamo il nome del Crawler <strong>Mediapartners-Google</strong>, il robot che esegue la scansione delle pagine alla ricerca degli affiliati di <strong>Adsense</strong>, il quale quando passer&aacute; dalla pagina dove avremo inserito questo script (si consiglia di inserirlo nel Footer della pagina al meglio&nbsp;prima del tag &lt;/body&gt;), far&aacute; scattare il nostro script che andr&aacute; a scrivere la data, l&#8217;orario, l&#8217;indirizzo <strong>IP </strong>del Crawler, il suo nome e il nome della pagina in cui &eacute; entrato, nella pagina <span style="color: #ff0000"><strong>Spider.txt</strong></span>.</p>
<p>&nbsp;</p>
<h2><span style="color: #800000">Come installare questo script</span></h2>
<p>Innanzitutto le pagine dove esso risieder&aacute; dovranno essere delle pagine dinamiche di tipo PHP (pu&oacute; tuttavia facilmente essere convertito in altri formati dinamici), dopo averlo inserito cos&igrave; come lo vedete, creeremo una pagina che chiameremo <span style="color: #800000"><strong>Spider.txt</strong></span>, e che andremo ad Uplodare nella root del nostro dominio. La sua posizione&nbsp;cos&igrave; come l&#8217;estensione della pagina (htm, html, eccetera)&nbsp;pu&oacute; essere scelta a piacere, nel caso, ci si ricordi di modificare l&#8217;indirizzo anche qui nello script. La pagina<span style="color: #800000"><strong> Spider </strong></span>come si stava dicendo, pu&oacute; essere anche in formato HTML ed essere formattata con il CSS per adattarla al layout del nostro sito se lo vorremo. Cos&iacute; come la si vede adesso, scrive semplicemente in bianco e nero uno per riga i log dei Robots.</p>
<p>Buon divertimento !&nbsp; <img alt="" src="http://blog.webxall.net/wp-content/plugins/fckeditor-for-wordpress-plugin/smiles/msn/teeth_smile.gif" /></p>
<p>&nbsp;</p>
<blockquote><p><span style="font-size: small"><span style="background-color: #ffffcc"><span style="font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: DE; mso-fareast-language: DE; mso-bidi-language: AR-SA"><strong></p>
<p><span style="font-size: small"><span style="background-color: #ffffcc"><span style="font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: DE; mso-fareast-language: DE; mso-bidi-language: AR-SA"><em>Angelo Palma &eacute; consulente e web stratega su </em></span></span></span><span style="font-size: small"><span style="background-color: #ffff99"><span style="background-color: #ffffcc"><span style="font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: DE; mso-fareast-language: DE; mso-bidi-language: AR-SA"><a href="http://www.webxall.net/"><span style="text-decoration: none; text-underline: none"><font color="#105cb6"><em>www.webxall.net</em></font></span></a>.&nbsp;</span></span></span></span>&nbsp;WebXall</p>
<p></strong>si occupa dello studio per l&rsquo;ottimizzazione del codice HTML.<font face="Arial">&nbsp;</font></span></span></span></p></blockquote>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.webxall.net/come-tracciare-lo-spider-di-google/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
