SEO的那些事儿

By Snger on

来自 前端开发
2011-02-15 10:08:07 2条评论»

去年Q4客串了点SEO的工作,简单总结下。当然SEO涉及内部优化和外部优化两个方面,内部优化主要是站点内链路结构的优化和关键词优化,外部优化则主要是外部链接优化。相对来说,内部优化更具可操作性,而且成本也较低,但是内部优化在整个SEO中只能占到30%~40%的比重,外部优化能带来实际效果的提升可能更显而易见,比如你在权重极高的站点获得了一个外部链接,那么你这个网站权重的提升将会比较明显,但我觉得外部优化不算个技术活儿,还存在很多“潜规则”,我表示兴趣不大。所以以下内容主要涉及的是SEO中内部优化的一点总结。

页面收录

SEO内部优化第一步当然不是关键词优化,第一步简单粗暴:让搜索引擎收录更多页面!抛开外链不谈,单从站点本身来说,让每一个页面都有链接(内部链接)链接进来,能被搜索引擎爬虫爬到即可。一般来说一个站点中首页具有权重是最高的,搜索引擎爬取的频率也非常高,所以内部链接结构优化也通常是从首页入手,如把最新更新的内容放到首页第一屏内。这样做一方面能提升用户体验,另一方面也是让搜索引擎能即时地抓取到新增加的页面。
但是首页能承载的内容总是有限的,为了增加站内页面的链接入口,通常站点也还会常用诸如“分类”、“存档”或是“推荐”这样的形式来增加内部链接的数量,在SEO中这些方法都是可行的。
除此之外你还可以通过“网站地图”来提交页面地供搜索引擎抓取。目前主流搜索引擎都支持通过站点地图提交网站链接,但是百度目前情况不明。每个sitemap.xml最多只能提交50000个链接,一个站点可以有多个sitemap文件,默认搜索引擎会试图抓取根目录下的sitemap.xml文件,你也可以将sitemap.xml添加到robots.txt文件(Sitemap: http://example.com/sitemap.xml)。多个sitemap的情况可以通过添加到robots.txt或是创建sitemap索引文件(其实我不知道这个东西咋用)来告诉搜索引擎sitemap的具体路径。一点建议:一个网站除了可以建立一个xml版的sitemap外,还可以考虑创建一个html的sitemap,除了能够增加搜索引擎爬取到站内链接的机会,而且对用户体验的提升也有大有益处的。
目前flash内的链接,JS产生的链接内容都是不能被抓取的。当你的网站必须要使用flash或是JS来创建内容时,最好是也能创建一个HTML版来共搜索引擎抓取页面上的链接。这个特性当然很多时候被用来控制页面权重的分配。

关键词优化

我们在搜索引擎中搜索关键词,搜索引擎将与这个关键词相匹配的网页检索出来,根据网页内容与这个关键词的相关性高低来返回给我们。那么搜索引擎是如何来确定一个网页与某个关键词的相关性的呢?
在确定关键词之前是提取关键词。搜索引擎爬取页面后,将页面内容通过分词技术等将页面文本内容提取出来。但是页面中的有些地方的词“先天性”的就具有一定的相关性。比如

  • 页面标题(title)中出现的词
  • hn标签中出现的词(通常是h1>h2>h3,其他h标签几乎没有任何权重了)
  • 页面代码中越靠前的内容
  • 黑体或斜体字体
  • ……
    所以技术手段的优化基本上就是将页面中的主要关键词分布到title,h1/h2/h3,页面内容靠前的部分来提高关键词的相关性。很多有分栏设计的页面,都可以通过技术实现将主要内容在代码中置前来排除其他辅助性内容的干扰。黑体和斜体字体较之于其他字体具有略高的相关性,当然这在用户看来也是具有强调提示作用的。关键词在上诉位置有所体现,同时在页面正文中也有一定的密度分布,那么这个关键词基本上在页面内容上的优化就OK了。但是这里注意一点:切忌堆砌大量关键词,有可能被视作作弊而受到惩罚。
    除了页面中本身内容提取出来的关键词,外部链接文字也会对页面关键词产生影响,有时候影响还非常大。举个极端一点的例子,比如说某几个大型网站,PR值极高,在他们的首页上都有链接“handsome man”链接到我们的博客域名omiga.org,那么“handsome man”就有可能成为我博客的关键词,而且相关性极高。
    在上面例子的过程中,一方面大型站点拥有极高的权重和信任度,那么搜索引擎会认为它的描述信息是准确可信的,同时也将它们的权重传递到了我的域名上。站点域名权重对关键词相关性的计算也有较大的影响。
    keyoworks和description这两个曾经名噪一时的属性如今在关键词相关性计算方面基本上已经没有任何作用,因为曾经的极度滥用,搜索引擎已将这两个属性打入冷宫。但是description对于搜索结果的调整还是有很大的用处,基本上各搜索引擎还是首先考虑将description中的内容显示成搜索结果的描述信息。

权重传递

上面提到了权重的传递,权重的传递都是通过链接来完成,而且同等条件下外部链接比内部链接能传递更多的权重,因为内部链接毕竟是网站管理员自己所能控制的,搜索引擎不会让你随意的操作权重的分配。尽管如此,不等于说在站点内部控制权重的分配没有一点作用,你在pr值极高的首页链接到一个内页,这个内页同样还是会获得比较高的权重的。权重传递会随着页面深度的增加会逐渐衰减,一般来说>4层的链接后的页面已经分配不到第一个页面的权重了。比如:A链向B、B链向C,C链向D(A-B-C-D),那么D基本上能分配得到A的权重就极少了,哪怕A是http://www.miibeian.gov.cn/。很多网站使用了分页功能,这样做前面的一两页内容上的链接或许还能分配到一点权重,而后面的页码上的链接由于深度的关系,可能就分配不到任何权重了。
页面权重的传递除了可以通过外部链接来进行,其实向外导出链接也有可能获得一些权重,或是信任度。比如在网站A首页上,添加各大门户的首页链接,那么也是有可能对A的权重产生影响的。同时还有可能增加用户信任度,对提高点击量具有一定的作用!
站点内部权重的分配,一方面可以通过链接深度来实现,另一方面有一个rel=”nofollow”属性,你在wordpress的评论发布者链接上可以看到这个属性,搜索引擎不会为具有rel=”nofollow”属性的链接分配权重,也不会爬取这个链接,目前主流浏览器都支持这个属性。当然也具有相同的作用,不同之处是meta方式将使页面上所有的链接不被爬取也不能分配权重,百度目前不支持noindex。

其他一些比较散的点:

URL静态化

现在的搜索引擎完全有能力分析复杂的URL,因此从搜索引擎收录来讲,没有必要非得做URL静态化或是伪静态化。但是从用户体验考虑,短网址更便于用户记忆和传播,同时在搜索引擎结果中短网址也会具有更高的点击率。当然了,如果在URL中还能出现关键词,搜索引擎是会将关键词高亮显示的,这也会增加用户对搜索结果的信任度,提升点击率。

Title

title中出现的词具有相对较高的关键词权重外,title还直接在搜索引擎结果中以及其醒目的方式显示。因此,title除了用于关键词优化,提高页面权重外,还可用于优化搜索引擎展示结果,吸引用户点击。即使不点击,也能取得一些如电视媒体广告,视频广告类似的展示营销效果。

图片优化

影响图片关键词相关性主要是以下几个方面:

  • alt属性 alt属性中的文本对图片关键词相关性计算具有比较大的影响
  • 图片前后的文字 即是img标签前后的文字信息,观察发现img后面的文字较img前面的文字的相关性更高一些
  • 整个页面的关键词 这一点无需多言,一个卖化妆品的页面上的一个alt为“java开发”的图片怎么也很难让人相信能给java扯上什么关系
  • 图片大小 一般来说600-1000左右宽高的图片可能更易被搜索引擎偏爱

视频优化

视频的这类多媒体内容和图片有类似的特征,即是搜索引擎都无法直接读取其内容。那么搜索引擎在计算其关键词相关性方面也会采取一些相同的算法,比如前后的文字信息、整个页面的关键字等。除此,各搜索引擎也支持站点视频地图(baidu、soso、youdao、sougou,国内这几个搜索引擎都是按照互联网视频开放协议来发布的视频站点地图标准,google采用了另外的视频地图,或是mRSS),你可以通过创建视频站点地图来向搜索引擎提交视频内容。

W3C验证对SEO无影响

至少从目前来看,页面代码是否能通过W3C校验对SEO不会产生任何影响。但是简洁,富含语义的代码确是能增加对搜索引擎友好度的。

纯属虚构

SEO可以说是一个体力活,传说目前google参与关键字相关性计算的因子就多达200多个,所以,你也很难做一两项优化就达到立竿见影的效果。但相对外部优化来说,内部优化似乎可操作性更强,而且内部优化在一定程度上也对提升用户体验有很大的益处。虽说这篇文章在谈论SEO要如何如何,其实抛开SEO来看,网站结构优化、标题优化、语义化标签这些工作大多也是本应该做好的,与SEO也扯不上多大关系。以上说的种种,或是其他SEO文章所言种种优化方式不一定准确,也不保证长期有效,因为目前还没有哪个搜索引擎公布其搜索算法,所有的一切都是不明真相的群众在经验+数据+小道消息的基础上总结归纳,所以请勿如岳不群邂逅葵花宝典那般走火入魔,专心做内容,先练好内功,有朝一日定能独步武林!
SEO的最终目的还是增加点击量、增加业绩,排名、PR值神马的都是浮云,所以你也可以为提高用户点击量不择手段,买也好、抢也罢,与SEO无关!

相关文章

标签详解
分类:前端开发 | 标签:robots,seo,sitemap,搜索引擎优化
trackback: http://omiga.org/blog/archives/1565/trackback

交流区