电子商务应用课程知识整理 第五章-搜索引擎优化(SEO)
一、认识SEO
SEO概述
SEO(Search Engine Optimization),译为搜索引擎优化,就是针对搜索引擎对网页的检索特点,网站建设的各项基本要素适合搜索引擎的检索原则,从而使得搜索引擎收录本网站尽可能多的网页,并且在搜索引擎自然检索结果中排名考前,最终达到网站推广的目的。
SEO相关术语
SEO黑帽
SEO黑帽是指采用了搜索引擎所禁止的方法,对网站在搜索引擎的排名进行优化,在短时间内排到搜索引擎前列。
SEO白帽
指采用合理的SEO行为优化网站,提高用户体验,合理和其他网站互联,从而达到网站在搜索引擎跑名的稳定提升。
PV(Page View)
指用户访问网站时所浏览的总网页数。
平均PV值侧面反映出一个网站的用户粘性。
跳出率
指来到网站只浏览了一个页面就离开的用户占网站总浏览用户的百分比。是搜索引擎在排名时考虑的一个因素。
沙盒效应
指一个新建立的网站在刚上线的一个或几个月内,在搜索引擎上很难有好的排名,甚至没有排名。
是搜索引擎对新建网站的一种考察,是搜索引擎对网站建立信任的过程。
SPAM
Specially Processed Assorted Meat 指专门针对欺骗搜索引擎的技术。
利用不道德的技巧去提高自己搜索引擎上的排名,这种做法会让网站在短期内排名得到提高,但是后果十分严重,可能导致搜索引擎把网站从数据库中永久删除。
目前大多数主流搜索引擎都具备完善的反SPAM机制。
快照
蜘蛛在爬取网页内容时,将网页文本内容独立创建一个文本文件,保存在数据库中的网页“照片”。
二、SEO常用技术
1. 网页title的优化
title标签具有不可替代性,是网页第一个重要标签,也是搜索引擎了解网页的入口,是对网页主题归属的最佳判断点。
要点:
- title要尽量简短,但是一定要把网页中的内容尽量表述出来。
- 创建符合网页内容、不重复的title
- 用简短但有描述性质的title
- 关键词由小到大,由细到粗
- 关键词分隔符
- 百度或其他国内搜索引擎:使用下划线“_”分隔title关键词
- Google或其他国外搜索引擎:使用横杠“-”
- 如果想要在Google和百度都表现良好,使用下划线“_”
- 不建议使用“|”
2. 关键词的选取
找到一个适合自己网站的关键词,是整个SEO中最为关键的一步。
注意的问题:
- 关键词不要太宽泛
- 考虑长尾关键词:长尾关键词指的是那些“不受欢迎的”(比如搜索量低)、但是又会被精准搜索同时能带来高转化的词。
- 多考虑用户会以什么关键词搜索
- 选择竞争较小、但实际关注度高的关键词
- 关键词和网站一定要有关系
需要避免的问题:
- 切记一个网站只选择一个关键词,而且所有页面都使用这个关键词。
- 每个页面的关键词只要确定两三个就可以了,过多关键词会导致分值被平分,在搜索引擎中每个关键词都不会有良好表现。如果网站确实有很多关键词,那么可以在keywords中只保留主关键词,在页面正文中体现其他关键词,或者在页面描述中写出其他关键词。
3. 元标签关键词的优化
元标签就是HTML中<head>
标签中的<meta>
标签。其作用是告诉一切支持网页运行的程序或者搜索引擎蜘蛛该网页的内容和基本信息,包括关键词、描述、版权等。
对于搜索引擎,蜘蛛爬取时首先要了解这个网页的内容是什么,属于什么类别,因此合理的meta标签非常重要。meta标签常用的方式是<meta name="keywords">
要点:
- keywords是一个关键词的集合,而不是句子的集合。
- 关键词之间以英文逗号“,”分隔
4. 关键词密度
指一个网页中某个词和所有文本之间的比例。
搜索引擎根据页面某个关键词出现的次数,以及导入链接指向该页面时所使用的锚文字等多方面判断该页面的关键词,meta中的keywords只是为蜘蛛提供一个参考。
在确定关键词后必须开始控制网页关键词密度。如果关键词密度过低,那么对优化起不到重要作用,如果密度过高,会被搜索引擎认为是作弊。
一般情况下,中文网页的关键词密度应控制在2%到8%之间。
5. robots属性和robots文件
让搜索引擎按照我们的意图来爬行的方式有两种:一种是设置meta标签,一种是编辑robots.txt文件。
元标签中的robots属性用于设置是否让机器人抓取。有如下取值:
- All:不拒绝任何蜘蛛的抓取行为
- Noindex:不索引当前页面
- Index:索引当前页面
- Nofollow:不追踪当前网页的链接
- Follow:追踪当前网页的链接
- Noarchive:在搜索结果中不保存当前网页的快照
- Archive:在搜索结果中保存当前网页的快照
- Nosnippet:在搜索结果中不采用当前页面的头部描述信息,且不保存快照
- None:不索引当前页面以及当前页面的所有链接
robots属性如果包含多个关键词,需要在中间以英文逗号”,"分隔。
robots.txt是一个纯文本文件,必须放置在站点根目录下,且文件名必须全部小写。
注意点:
- 让蜘蛛远离网站源程序文件和后台管理文件
- 不让蜘蛛访问数据库文件、模板文件、CSS文件、导航图片、背景图片等
- 拒绝垃圾搜索引擎。降低服务器负担。
- 合理使用robots.txt文件,避免用户未登录进入后台操作
- 如果网站使用Rewrite方式进行伪静态化,网站将有两个网站。可使用robots.txt文件防止蜘蛛抓取动态页面,只允许抓取伪静态页面。
6. description属性
使用长达255个字符来描述一个网页。如果一个网页description写法不规范或者没有description,搜索引擎索引并显示整个网页前面的一些字符。description在网页排序中有很重要的作用。
常见问题:
- 将description和keywords写得一模一样,或者直接从网页正文复制一部分作为description。这对网页排名很不利。
- 整个网站中所有网页使用相同description,将严重影响网站网页收录的数量,是SEO中的大忌。
要点:
- 用一句话来概括本网页的主题内容
- 不要超过255个字符,搜索引擎只索引前255个字符
- 使用英文格式的标点符号
7. 网站结构和URL优化
域名选择
- 尽量选择包含关键词的域名,必要时在中间加横杠。
- 在注册域名前,了解该域名是否曾被人使用过,有没有被搜索引擎惩罚过。
- 二级域名和主域名权重是一样的,将会分散SEO精力。
注意点:
- URL中带有关键词
- URL不宜过长,且避免”?“参数
- 采取伪静态或者直接生成静态网页(没有后缀参数(“?”)的文件也是静态文件,如uml.jsp)
- 减少自动生成的URL
- 使用于内容相符的目录名,三层目录最为合适
- 只使用一个URL访问网页
- 只用小写字母
8. 网页链接的优化
8.1 内部链接的优化
相关页面的链接优化(采用固定关键词的专题策略、文章内容的引用链接、“上一篇”“下一篇”链接)可以提高网站的PV,提高页面之间关键词的相关度。
- 网站导航尽量使用文本形式来作为链接的锚文字
- 尽量不适用js脚本、图片、Flash动画等作为网站导航
如果一定要使用,注意一下几点:- 在页面其他部位(如导航条下部、页面底部)放置与图片、js、Flash导航内容相同的文本文字的链接。
- 在页面底部或其他显著位置防止HTML格式或XML格式的网站地图sitemap,包含各个频道、栏目的链接
- 图片导航添加alt属性
8.2 外部链接的优化
外部链接时SEO的关键因素之一。高权重和同行业的网站给予的友情链接会使本网站分值提高。
- 慎重交换链接,仔细分析对方网站是否被搜索引擎惩罚过
- 尽量选择同行业的网站
- 高质量的网站(PR>=6)
- 定期检查连接到外部的友情链接,查看是否出现空连接,对方网站是否使用js脚本做友情连接等。
- 网站对外的连接越少,对网站自身的好处越大;链向本网站的链接越多,对网站自身的好处越大。
- 小技巧:通过whois信息确定网站的年龄。通过site:域名查看网站收录网页数量。
9. heading标签的优化
在seo中,heading标签有举足轻重的地位。从h1到h6,搜索引擎关注度逐渐降低。
蜘蛛爬取顺序:链接锚文字->title标签->h1标签
10. 图片优化
11. 网页减肥
让蜘蛛能够轻盈地抓取网页的核心内容。
- js脚本代码:使用js文件封装js代码;尽量将js代码放在html代码之后
- 网页文本:分页处理
- 网页图片:图片裁剪和压缩
- flash:避免使用flash
搜索引擎不友好网站的特征
- 大量采用图片、flash或Rich Media形式,没有可以检索的文本信息
- 没有标题,或标题中没有包含有效关键词
- 正文中有效关键词很少
- 网站导航系统让搜索引擎无法理解
- 动态网页让搜索引擎无法理解
- 没有被其他已经被搜索引擎收录的网站提供的链接
- 充斥大量欺骗搜索引擎的垃圾信息
- 含有许多错误链接
三、常见作弊方式
1. 桥页(Doorway Pages)
又称为过渡页,通常是用软件自动生成大量包含关键词的网页,然后从这些网页做自动转向主页。目的是希望这些以不同关键词为目标的桥页在搜索引擎中得到好的排名。
2. 关键词堆砌(Keyword Stuffing)
在网页中大量堆砌关键词。
3. 隐藏文字(Hidden Text)
在网页的HTML文件中放上含有关键词的文字,但这些文字不能被用户看到,只能被搜索引擎看到。比如说超小字号的文字、与背景颜色相同颜色的文字、放在评论标签中的文字、放在表格input标签中的文字、通过样式表把文字放在不可见的层上等等。
4. 隐藏链接(Hidden Link)
和隐藏文字相似,区别是把关键词放在链接里面。
5. 隐藏页面(Cloaked Page)
使用程序或脚本来检测访问的是搜索引擎还是普通用户。如果是搜索引擎,网页返回经过优化的版本,如果来访的是普通人,返回另一个版本。
6. 如何防止被搜索引擎认为是SPAM
- 注意网页上的链接数量,且不要给已经被处罚过的网站提供导出链接。
- 关键词密度控制在2%到8%
- 网站中的每个网页都要有独一无二的内容
- 一个页面只能通过一个地址能够访问
- 避免出现网友反感的关键词
- 注册域名前,查询该域名是否被注册过、惩罚过
- 如果网页有blog系统、留言本、论坛,需要经常注意检查内容。