<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blog WebXall &#187; Crawler Robots &amp; Spider</title>
	<atom:link href="http://blog.webxall.net/category/crawler-robots-spider/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.webxall.net</link>
	<description>WebXall Seo Blog</description>
	<lastBuildDate>Fri, 06 Jan 2012 09:01:25 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Lo spider di Google è passato dal mio sito?</title>
		<link>http://blog.webxall.net/come-tracciare-lo-spider-di-google</link>
		<comments>http://blog.webxall.net/come-tracciare-lo-spider-di-google#comments</comments>
		<pubDate>Tue, 27 Oct 2009 17:31:19 +0000</pubDate>
		<dc:creator>Angelo Palma</dc:creator>
				<category><![CDATA[Crawler Robots & Spider]]></category>

		<guid isPermaLink="false">http://blog.webxall.net/?p=466</guid>
		<description><![CDATA[Come faccio a sapere quando lo spider di Google &#232; passato dal mio sito? Una domanda questa che &#233;&#160; stata posta nel forum di assistenza per i webmaster di Google. Ho pensato di indicare qui uno script che aiuti a&#160;segnalare il passaggio&#160;degli&#160;spider dei motori di ricerca conosciuti,&#160; dandoci informazioni per esempio sulla data, &#160;l&#39;orario e [...]]]></description>
			<content:encoded><![CDATA[<h1><span style="font-family: times new roman"><span style="font-size: medium">Come faccio a sapere quando lo spider di Google &egrave; passato dal mio sito?</span></span></h1>
<p>Una domanda questa che &eacute;&nbsp; stata posta nel <a href="http://www.google.com/support/forum/p/webmasters/thread?tid=46c3cb36015c79d1&amp;hl=it">forum di assistenza per i webmaster di Google</a>.</p>
<p>Ho pensato di indicare qui uno script che aiuti a&nbsp;segnalare il passaggio&nbsp;degli&nbsp;spider dei motori di ricerca conosciuti,&nbsp; dandoci informazioni per esempio sulla data, &nbsp;l&#39;orario e la pagina dove &eacute;&nbsp; entrato.</p>
<h2><span style="color: #800000">Come tracciare il passaggio dello Spider?</span></h2>
<p>Lo script qui sotto aiuta a tenere traccia del passaggio di diversi robots conosciuti. Ci sono quindi il Crawler di Google, &nbsp;lo Spider di Yahoo,&nbsp; il robot di Bing,&nbsp; e altri <strong>ragnetti</strong> vari che possono essere anche tolti o aggiunti seguendo l&#39;esempio.<span id="more-466"></span></p>
<p><strong><span style="color: #ff0000">&lt;?php<br />
	</span></strong>if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;Yandex&#39;)){ $bot=&#39;Yandex&#39;;}<br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;Googlebot&#39;)){$bot=&#39;Google&#39;;}<br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;Mediapartners-Google&#39;)){$bot=&#39;Mediapartners-Google (Adsense)&#39;;}<br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;Slurp&#39;)){$bot=&#39;Hot&amp;nbsp;Bot&amp;nbsp;search&#39;;}<br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;WebCrawler&#39;)){$bot=&#39;WebCrawler&amp;nbsp;search&#39;;}<br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;ZyBorg&#39;)){$bot=&#39;Wisenut&amp;nbsp;search&#39;;}<br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;scooter&#39;)){$bot=&#39;AltaVista&#39;;}&nbsp; <br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;StackRambler&#39;)){$bot=&#39;Rambler&#39;;}&nbsp; <br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;Aport&#39;)){$bot=&#39;Aport&#39;;}&nbsp; <br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;lycos&#39;)){$bot=&#39;Lycos&#39;;}&nbsp; <br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;WebAlta&#39;)){$bot=&#39;WebAlta&#39;;}<br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;yahoo&#39;)){$bot=&#39;Yahoo&#39;;}<br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;msnbot&#39;)){$bot=&#39;msnbot/1.0&#39;;}<br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;ia_archiver&#39;)){$bot=&#39;Alexa search engine&#39;;}<br />
	else if (strstr($_SERVER[&#39;HTTP_USER_AGENT&#39;], &#39;FAST&#39;)){$bot=&#39;AllTheWeb&#39;;}<br />
	&nbsp;<br />
	if($bot !=&quot;&quot;){<br />
	$b_data = &quot;<strong>Spider.txt</strong>&quot;;<br />
	$inf = date(&quot;YmdHis&quot;,time());<br />
	$day = date(&quot;d.m.Y&quot;,time());<br />
	$time = date(&quot;H:i&quot;,time());<br />
	$ip = $REMOTE_ADDR;<br />
	$home = $_SERVER[&#39;HTTP_HOST&#39;] . $_SERVER[&#39;REQUEST_URI&#39;];<br />
	$data = fopen($b_data, &quot;a&quot;);<br />
	fwrite($data, &quot;$inf|$day|$time|$bot|$ip|$home|rn&quot;);<br />
	fclose($data);<br />
	}<br />
	<span style="color: #ff0000"><strong>?&gt; </strong></span></p>
<p>&nbsp;</p>
<hr />
<p>Qui sopra vediamo che la ricerca degli Spider viene fatta per nome. Per esempio nella condizione alla riga 3, &nbsp;troviamo il nome del Crawler <strong>Mediapartners-Google</strong>, il robot che esegue la scansione delle pagine alla ricerca degli affiliati di <strong>Adsense</strong>, il quale quando passer&aacute;&nbsp; dalla pagina dove avremo inserito questo script (si consiglia di inserirlo nel Footer della pagina al meglio&nbsp;prima del tag &lt;/body&gt;),&nbsp; far&aacute;&nbsp; scattare il nostro script che andr&aacute;&nbsp; a scrivere la data, &nbsp;l&#39;orario, l&#39;indirizzo <strong>IP </strong>del Crawler,&nbsp; il suo nome e il nome della pagina in cui &eacute;&nbsp; entrato,&nbsp; nella pagina <span style="color: #ff0000"><strong>Spider.txt</strong></span>.</p>
<p>&nbsp;</p>
<h2><span style="color: #800000">Come installare questo script</span></h2>
<p>Innanzitutto le pagine dove esso risieder&aacute;&nbsp; dovranno essere delle pagine dinamiche di tipo PHP (pu&oacute; &nbsp;tuttavia facilmente essere convertito in altri formati dinamici),&nbsp; dopo averlo inserito cos&igrave; come lo vedete,&nbsp; creeremo una pagina che chiameremo <span style="color: #800000"><strong>Spider.txt</strong></span>,&nbsp; e che andremo ad Uplodare nella root del nostro dominio. La sua posizione&nbsp;cos&igrave;&nbsp; come l&#39;estensione della pagina (htm, html, eccetera)&nbsp;pu&oacute; essere scelta a piacere, nel caso, ci si ricordi di modificare l&#39;indirizzo anche qui nello script. La pagina<span style="color: #800000"><strong> Spider </strong></span>come si stava dicendo,&nbsp; pu&oacute; essere anche in formato HTML ed essere formattata con il CSS per adattarla al layout del nostro sito se lo vorremo. Cos&iacute; come la si vede adesso,&nbsp; scrive semplicemente in bianco e nero uno per riga i log dei Robots.</p>
<p>Buon divertimento !&nbsp; <img alt="" src="http://blog.webxall.net/wp-content/plugins/fckeditor-for-wordpress-plugin/smiles/msn/teeth_smile.gif" /></p>
<p>&nbsp;</p>
<blockquote>
<p><span style="font-size: small"><span style="background-color: #ffffcc"><span style="font-family: 'times new roman'; mso-fareast-font-family: 'times new roman'; mso-ansi-language: de; mso-fareast-language: de; mso-bidi-language: ar-sa"><strong><span style="font-size: small"><span style="background-color: #ffffcc"><span style="font-family: 'times new roman'; mso-fareast-font-family: 'times new roman'; mso-ansi-language: de; mso-fareast-language: de; mso-bidi-language: ar-sa"><em>Angelo Palma </em></span></span></span></strong><span _fck_bookmark="1" style="display: none">&nbsp;</span><span style="font-size: small"><span style="background-color: #ffffcc"><span style="font-family: 'times new roman'; mso-fareast-font-family: 'times new roman'; mso-ansi-language: de; mso-fareast-language: de; mso-bidi-language: ar-sa"><em>&eacute;&nbsp; un consulente e web stratega su </em></span></span></span><span style="font-size: small"><span style="background-color: #ffff99"><span style="background-color: #ffffcc"><span style="font-family: 'times new roman'; mso-fareast-font-family: 'times new roman'; mso-ansi-language: de; mso-fareast-language: de; mso-bidi-language: ar-sa"><a href="http://www.webxall.net/"><span style="text-decoration: none; text-underline: none"><font color="#105cb6"><em>www.webxall.net</em></font></span></a></span></span></span></span><span _fck_bookmark="1" style="display: none">&nbsp;</span><strong><span style="font-size: small"><span style="background-color: #ffff99"><span style="background-color: #ffffcc"><span style="font-family: 'times new roman'; mso-fareast-font-family: 'times new roman'; mso-ansi-language: de; mso-fareast-language: de; mso-bidi-language: ar-sa">.&nbsp;</span></span></span></span>&nbsp;WebXall </strong></span></span></span><span style="font-size: small"><span style="background-color: #ffffcc"><span style="font-family: 'times new roman'; mso-fareast-font-family: 'times new roman'; mso-ansi-language: de; mso-fareast-language: de; mso-bidi-language: ar-sa">si occupa dello studio per l&rsquo;ottimizzazione del codice HTML.<font face="Arial">&nbsp;</font></span></span></span></p>
</blockquote>
]]></content:encoded>
			<wfw:commentRss>http://blog.webxall.net/come-tracciare-lo-spider-di-google/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

