知识点:Title和Meta标签
Title 可谓一个页面的核心。对 Title 的书写要注意以下问题:
1、title 简短精炼,高度概括,含有关键词,而不是只有一个网站名称。但关键词不宜过多,不要超过 3 个词组。
2、前7个字对搜索引擎最重要,因此关键词位置尽量靠前,总字数不超过30个汉字。
知识点:Meta属性关键词(Keywords):
Keywords提示搜索引擎:本网站内容围绕这些词汇展开。
因此keywords书写的关键是每个词都能在内容中找到相应的匹配才有利于排名。
描述(Description)
Description 一般被认为重要性在 title 和 keywords 之后。描述的书写要注意以下问题:
1. 描述中出现关键词,与正文内容相关,这部分内容是给人看的,所以要写的很详细,让人感兴趣,
吸引用户点击。
2. 同样遵循简短原则,字符数含空格在内不要超过 120 个汉字。
3. 补充在 title 和 keywords 中未能充分表述的说明 。
其它 Meta 标签:
为了限制搜索引擎对内容的抓取,可以采用以下几个 Robots Meta 标签:
<meta name=”Robots” content=”all|none|index|noindex|follow|nofollow|noarchive”>
其中:all:文件将被检索,且页面上的链接可以被查询;
none:文件将不被检索,且页面上的链接不可以被查询;
index:文件将被检索;
follow:页面上的链接可以被查询;
noindex:文件将不被检索,但页面上的链接可以被查询;
nofollow:文件被检索,页面上的链接不被查询。
noarchive:文件不被缓存
知识点:动态网页静态化
基于 Apache HTTP Server 静态化
Apache Web Server 的配置 (conf/httpd.conf )
1. 在 httpd.conf文件中查找 LoadModule rewrite_module modules/mod_rewrite.so
通常该行被注释,去掉“#” 。如果没有就增加该行。
2. 加入代码:
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteRule ^/([0-9]+).html$ /user.php?user=$1
</IfModule>
3. 如果网站使用通过虚拟主机来定义,请务必将代码加到虚拟主机配置文件.htccess 中去,否
则可能无法使用。
4. 重启 Apache,重新载入配置。
5. 在地址栏输入 http://localhost/1.html ,实际指向 http://localhost/user.php?user=1
知识点:Roboots.txt
Robots.txt 带来的好处:
1. 几乎所有的搜索引擎 Spider 都遵循 robots.txt 给出的爬行规则,协议规定搜索引擎 Spider 进入某个网站的入口即是该网站的 robots.txt,当然,前提是该网站存在此文件。对于没有配置robots.txt 的网站,Spider将会被重定向至 404 错误页面,相关研究表明,如果网站采用了自定义的 404错误页面, 那么 Spider将会把其视作 robots.txt——虽然其并非一个纯粹的文本文件——这将给 Spider索引网站带来很大的困扰,影响搜索引擎对网站页面的收录。
2. robots.txt 可以制止不必要的搜索引擎占用服务器的宝贵带宽,如 email retrievers,这类搜索引擎对大多数网站是没有意义的;再如 image strippers,对于大多数非图形类网站来说其也
没有太大意义,但却耗用大量带宽。
3. robots.txt 可以制止搜索引擎对非公开页面的爬行与索引,如网站的后台程序、管理程序,事实上,对于某些在运行中产生临时页面的网站来说,如果未配置 robots.txt,搜索引擎甚至会索引那些临时文件。
4. 对于内容丰富、存在很多页面的网站来说,配置 robots.txt 的意义更为重大,因为很多时候其会遭遇到搜索引擎 Spider给予网站的巨大压力:洪水般的 Spider访问,如果不加控制,甚至会影响网站的正常访问。
5. 同样地,如果网站内存在重复内容,使用 robots.txt 限制部分页面不被搜索引擎索引和收录,可以避免网站受到搜索引擎关于 duplicate content的惩罚,保证网站的排名不受影响。
知识点: HTTP状态码
成功2×× 成功处理了请求的状态码。
200 服务器已成功处理了请求并提供了请求的网页。
204 服务器成功处理了请求,但没有返回任何内容。
重定向3×× 每次请求中使用重定向不要超过 5 次。
301 请求的网页已永久移动到新位置。当URLs发生变化时,使用301代码。搜索引擎索引中保存新的URL。
302 请求的网页临时移动到新位置。搜索引擎索引中保存原来的URL。
304 如果网页自请求者上次请求后没有更新,则用304代码告诉搜索引擎机器人,可节省带宽和开销。
客户端错误4×× 表示请求可能出错,妨碍了服务器的处理。
400 服务器不理解请求的语法。
403 服务器拒绝请求。
404 服务器找不到请求的网页。服务器上不存在的网页经常会返回此代码。
410 请求的资源永久删除后,服务器返回此响应。该代码与 404(未找到)代码相似,但在资源以前存在而现在不存在的情况下,有时用来替代404 代码。如果资源已永久删除,应当使用 301 指定资源的新位置。
服务器错误5×× 表示服务器在处理请求时发生内部错误。这些错误可能是服务器本身的错误,而不是请求出错。
500 服务器遇到错误,无法完成请求。
503 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态。
知识点:内容优化
搜索结果内容优化
A. 好的搜索结果内容是简洁、连贯的一段话,能够吸引用户点击,在排名相对较低的时候(如第三、四名) ,能够获得超越排名位置的点击率。 (国外点击率参考:排名第一:点击率 51%;排名第二:点击率 16%;排名第三:点击率 6%;排名第四:点击率 6%。 )
B. 搜索结果的内容出现在 meta description 中,或者网页的正文中。
网页内容优化
A. 内容页最好图文并茂,分类明确,让用户可以全面的了解该页面要表达的意思。
B. 页面能够让用户感觉到你的技术水平、工作态度。
3. 软文优化
A. 软文的内容一定要对用户有用,用户感觉好,才能帮助你传播转载。
B. 在文章中出现关键词的时候要替换成你要排名的页面,这样别人转载的时候,就帮你做了大量的外链了。
C. 文章中不要出现很明显的联系方式等信息,否则会被当做广告贴而删除。
D. 不要在百度产品中发布,否则会导致网站遭屏蔽。