搜索引擎研究

研究搜索引擎,优化网站,让网站在搜索引擎上取得好的名次
随笔 - 5, 评论 - 5, 跟踪 - 0

导航

<2012年1月>
25262728293031
1234567
891011121314
15161718192021
22232425262728
2930311234

文章分类

档案

搜索引擎研究

登录

    用户名

    密  码

    记住我
     

2005年9月22日

搜索引擎关键字调整和提高访问量的两个策略

前言:很多朋友做站宣传方法经常走老套路,效果不是很明显。为什么不明显呢?因为你是跟在别人的后面,而且离得很远。不过如果用恶意的套路,我绝对不会提倡。我的这两个方法可能不是最好,但是绝对能给你的网站提高一些访问量,或者你会得到更多的体会。

第一个方法:利用知名博客网站(站长站有个SB要人出1000块来买他的方法,结果被我研究出来了!)

很多的博客网站世界排名都很高,是因为大部分博客网站的页面都是静态,而且,页面很多,更重要的是PV很高。博客的申请是免费的,但是我们可以基于这么个访问量很大,PV很高,有很大个人自主权的免费的平台上做搜索关键字的优化。其实别人搜索关键字的时候,搜索引擎首先匹配这个关键字,然后在根据数据库里网页优化程度,再后来才是引居网页的访问量来给搜索结果排序的。其实说这个很抽象。

我举个例子:

大家在Google搜索“老鼠爱大米”看排在第二位,第四,五为的博客就是一个例子,这几个网站是同一个人的。这个关键字在百度今天就被搜索了近4万次。Google上的搜索量应该不会比这个数目少。也就说这个博客页每天的访问量最少有3万次。

心动了吧,我们来分析一下!

1.歪酷博客的访问量还算蛮高的,页面量很多,PV很高!
2.这个页面“老鼠爱大米”这个关键字出现量很高!
3.页面上有很多“老鼠爱大米”的连接,都是著名博客上的互相连接!PR值会高一些!
4.关键字怎么选择呢?看http://top.baidu.com/top_keyword.html,最新上榜的!!

大家知道怎么做了吗?不知道的话,请再反复阅读100遍!!

第二个方法:利用TOM(这个是我自创的方法!)

众所周知,TOM的搜索是用百度的,TOM首页有一些预设的关键字,在搜索框下面,我观察了一端时间,这些关键字总会保留两个周以上。我们就是要对这些关键字做手脚。再一两个月前,我曾经再落伍提起过,TOM首页有个“裸体播报”的关键字,我曾经利用这个关键字让我的网站每天的IP增加一万多,绝无虚假!

那么你一定想问:不会所有关键字都要做吧。

答案是否定的,那么怎么样来挑选关键字呢?这里有几个小技巧:

1.选择那些稍微带点XX意味的。
2.分别搜索一下,搜索到的相关网页量比较小的,几百或几千,这样很快就能排到前面。

我告诉大家这些方法,是因为很多朋友网站有很好的内容却无人访问,现在“酒向也怕巷子深”,访问量增大的同时应该努力做好网站,留住访问者才是最重要的!!
这些都是依赖搜索引擎的,请大家不要滥用,否则后果自负!

0:20 | 评论 (3)

百度pagerank揭密

百度的关键字排名主要分加种:
  收费的不用说是老大了,但网页上总要有特定关键字才好些
  第一是知名网站
  第二是联盟成员
  第三是非盈利网站
  如果这几类网站都有某个关键字
  刚按类别,相同类别的优先
  如果大家都是一样,则视网页更新先后,百度会把后更新的排在前面。
  此外,如果你被百度收录的所有页都在某个关键字,也会排得更前些。
  这是最基本的方面,总的来说,用适当的关键字就行了。
  这只是大体的情况,并不是什么绝对规则,还有一点最重要的是:标题完全匹配某个关键字或长标题靠前的的优先,这一点是最重要的。
  比如
  “Yes165激情笑话--偷拍美女走光图搞笑恐怖两性”
  这里“走光图”被重视,实际就是如此,至于按时间优先,我是在分析其它网站时得出的一般结论,当然这个关键字是有其它因素的,我这里讨论的是一般网页而言。
  解析两个观点:
  一、“长标题靠前”指定是,如果你的标题有很多关键字,则前面的关键字被重视,后面的忽略
  二、我这里说的规律并不是叫大家想法作弊,而是假如你做好了一个很好的主页,如何让用户更方便的找到你之意!

0:20 | 评论 (0)

2005年9月10日

百度排名

先不要说百度好不好~我给楼猪说个例子吧~~~
我们先说百度的搜索问题..他搜索内容非常之大大家如果常常关心自己的网站会发现百度比别的都会多收好多页.可是有一点你看清了??他只是收了一些无用的页你在一页一页的看的时候就发现他后面的又都没了...百度这么做无非是想用内容多来超过别的搜索在中国做出个样来,3721是百度在中国最难打倒的对手,3721有YAHOO做后台数据库和搜索代码程序都要比百度的好这个大家不用去强最少这个时代只有GOOGLE和YAHOO才能算是二个最棒的搜索。
还有就是楼猪做网站可能无非是做一些不相关的内容,一天没有几个人去搜,你试试做前面热门词你就知道百度厉害之处了。
这里没有几个做商业网站的吧,如果有他一定会说哎不在百度做推广人家百度根本不理你.
百度一半的工作人员认钱.我说个事你可能不信。百度以前卖过左侧排名现在还在卖,我做传奇私服这个词他第三要我一个月9000,我和你说搜索无非是认网站在网络中的重要度去排名,大家去做优化也没什么错.只有真正有能力的站才会到第一页,可是百度不一样了,他的热门一些词和每个搜索都差很多你知道原因吗??你可能没看过这些词天天的变化吧,每天都在变。你排在第一,一周最多你就会叫百度删了,你写信他们会说是不知道原因在看看,然后给你放回来,可是放回来以后在第几页我就不想和大家说了
我做传奇私服三个月内三次排到百度第一可是三次都叫删了,哎没有做弊,只是百度认连接的方法和别的搜索不一样,还有百度你做上去也会叫人为给你拿下来的原因大家那个做搜索优化的都不会去做百度的,
百度还有一个很怪的方法就是喜欢删一个服务器的全陪站.有的更厉害只要是和他有连接的站他都删,
百度好我没看出来在百度上做弊的人一样多只是大词没有几个小词你们看看吧乱的吓人那
百度收录快还好排不用那么高的PR就可以排个很好的名这样的好事谁不想去做,百度就明现代有中国那些**官员的样子,做的站只要交钱什么都行啊,就这点来说百度会慢慢的人会少的多的多,大家都说3721的网络实名没有人装你看是百度的那个装的人多还是3721的人多啊,百度的人认钱这是公认的他们的推广是3毛钱一个IP啊大家个位站长想想
我现在自己的站一天是一万多IP要是都是多百度来的那一天就是3000多,3毛钱只是一个底线要是做推广的人多你3毛钱可能会排到第三四页.你就是出更多的钱排更好的名次.哎百度这些事你能说他好也不是很容易,只能说百度不想去理你那些词,好词在百度一天排第一最少能有一万以上IP,高最的时候可能到二万左右,这么好的利意百度不会给别人的他知道怎么赚钱,现在做推广的网站没有几个是心甘情愿的去做,是没有办法百度你不交钱你就在后面,你在看看你下面那些站天天在变,你为认为在百度第一是什么好事,可能下一个倒霉的就会是你了~~~

楼猪时间会证明一切,这句话我想你也会相信以后看看时间 就知道百度以这样的方法发展下慢慢的不过2005年过了我想大家用的就会是一搜,GOOGLE这样的了,百度现在最厉害的就是很多门户站用他的搜索数据库,所以他还在那狂要是等以后都换了哎他也快走到头了~~~

13:09 | 评论 (1)

2005年9月9日

站页面标题与关键字定义拙见

需要先说明一下的就是,这些都是我的个人经验,如果不对的地方欢迎各位指正,也欢迎大家根据部分细节进行更具体化的分享。

鱼举到一个可以堆积关键字的网站,问其效果及后果。那我先从这个问题开始说,搜索引擎许多都会自动识别刻意堆积关键字的行为,比如“社区论坛网站免费激情QQ辣妹",这些都是高频关键字,而且前几个和后几个关系很小,我猜想可能会有一个容忍度,如果高频关键字堆积得过了一个限制,有可能会被baidu拔毛,Google降权。

当然,搜索引擎就算是Google这种依赖机器人的也应该是有人工审查的部分,不排除人工批量审查高频关键字Title的可能。

因为大部分搜索引擎的细节操作我们都不知道,只能根据自己的切身体验和感受去领会。个人到现在的一点体会就是在踏实做站和宣传的基础上合理地安排适量的关键字,一般2-3个即可。目前来讲,我这样做,baidu,google对俺都挺好的。

对于Title识别,我还有一点想法,就是我怀疑机器人搜查Title的时候是有字节限制的。像那种堆到变态的估计不会看到后面。如果Google和baidu还没有想到这点,那应该尝试一下,因为正常的网站Title,不会很长,超过30个汉字的Title很难没有问题。

Google机器人还有一个变态的地方,它蛮喜欢分析域名的,如果域名中含有某些关键字那就更容易被收录。但是有一个笨的地方就是如果该关键字在域名后部,排位会差很多。比如fayecn.com和cnfaye.com搜索Faye,同样的网站内容,那么前者肯定领先。好像baidu还没有这样。

Google百度都各有特点,技术特长也不同,比如学术性的东西,我觉得Google搜出来的要准确许多,baidu要差一些,可是关键字部分,个人觉得Baidu做得比较好,公正公平。在中文搜索方面,我还是喜欢baidu,更容易找到想要得东西。

至于3721这种垃圾,就不用理了,当它不存在。不过这里面夹杂了个人情感,真正做站的就不必像我这样意气用事了,访问量多一点是一点嘛。

各位站长在定义文章Title(标题)的时候应该遵循符合本页内容并尽量精简的原则,这样做好看,正规,而且方便用户收藏某页。相信大家访问到标题超常的网站第一反应就是作弊或是不规范,一定没什么好印象。

至于Keyword和Description,这两个量是完全写给搜索引擎看的,所以可以适当增加一些关键字,不一定最高频就最好,因为高频的关键字无数站在用,选择合适的关键字和介绍也是一门学问,可以多多尝试,如果在这方面有兴趣的话。

嗯,最后,对于Title,我有一个提醒,这些是我吃亏N次后发现的。就是标题中尽量不要用标点,空格使用虚假的空格,比如在code页面直接打一个空格,而不是html语言里的& n b s p ;,有些标点,尤其是句号之类的,尽量避免。

一般对页面进行改动后需要一段时间才会有效果。不可急躁,安心等待便是。对于Google,PR值也很重要,可以和PR高的站点进行文字链接。当然这是题外话。

个人愚见,希望各位指正。

11:27 | 评论 (0)

Google网页加速器的工作原理

最近一直忙着写论文,周末终于有空放松半天时间,到网络上看看,铺天盖地的关于google最新的消息,原来google又出了新玩艺,Google Web Accelerator。

听说很神,特地找了一台Windows电脑准备一试。可是我去google网站下载时却发现google 说用户太多,不提供了。

感谢Owen硬盘里还有保留,终于得到了珍贵的“绝版”Google网页加速器。

我尝试访问了6个网站,并且分析了日志,基本上明确了Google网页加速器的工作原理,其实很简单:Proxy + 缓存。

1. 本地化的Proxy + 缓存
当运行了 google 的网页加速器,本机会启动一个httpd的服务,端口是9100 :
http://127.0.0.1:9100
这个服务实际上是一个本地化的Proxy+缓存,就是所有的 http 的请求都是通过这里走的。那么为什么能够加速呢?

缓存。当你第一次访问一个网页的时候,相当多的图片,静态文字全部的存储下来,然后当你再次访问的时候,就直接从缓存里调出来,因此大大加快了访问速度。

我这里做了一个有趣的试验:

访问我自己的blog一个日志(http://blog.wespoke.com/archives/000907.html)的日志记录:

adsl-69-154-77-102.dsl.rcsntx.swbell.net - - [09/May/2005:12:34:38
+0800] "GET /archives/000907.html HTTP/1.1" 304 -

刷新这个网页,Apache的记录仍然是 304。表明没有传输内容,紧紧验证了
expired的信息。

touch archives/000907.html (改变这个文档的时间标记)
再次刷新,这次不一样了:
adsl-69-154-77-102.dsl.rcsntx.swbell.net - - [09/May/2005:12:35:28
+0800] "GET /archives/000907.html HTTP/1.1" 200 10319

这次是返回了200,并传输了10319个字节。

这个就是工作的原理,在第一种的情况下,节省了10319个字节的传输。

当然,这也是所有的缓存proxy的设计原则。

2. Google 的缓存+路由
当我发现我访问的日志上记录的IP和我本地的IP不一样的时候,看来Google 自己也还是有缓存服务器的,就是说当我们请求一个网页时,如果联接非常的慢,google会让这个请求通过google的缓存服务器,同时改变路由。这就是为什么看到的IP不是自己机器的IP了。

由此看来,Google的网络加速器实际上是一个个人的小型Proxy缓存服务器+Google帝国的一个格点状的Proxy缓存服务器系统构成并有效的来管理这些缓存,并非什么特别的技术,而是将大家忽视了多年的一些基本的概念从新应用了起来。

3. 看看这里就更加明白一些:http://race.google/http://www.wespoke.com,注意,必须启动了加速器后才能连接,因为google Web Accelerator讲这个域名解释为本机并采用Iframe显示。您可以将http://www.wespoke.com替换成您想要到达的网页,看看有没有加速?

关于加速的原理,你应该了解expired模块。

http://httpd.apache.org/docs/mod/mod_expires.html

11:20 | 评论 (1)