Web产品必读

佚名 2022-07-30 12:07

最近在看SEO这方面的知识非常有趣。学习一些新东西总是好的。随着经验的增加,情绪不那么冲动。现在的年龄也是学习一些有趣事物的好时机。这里有两本书SEO《百度基本入门书》SEO《一本通》《精通》SEO》希望本文与志同道合者共同进步!

尽管现在最火SEO书籍是Zac出的那本《SEO豆瓣密码,豆瓣评分也不错,但实际读起来逻辑比较分散,信息量太大,有点像历史博客文章的积累。SEO的人来说其实并不适合,

个人建议可以从入门书开始,形成自己的理解体系,然后用自己建立的系统加深阅读,这也是我常用的方法。其实我看书的量不多,更喜欢看适合自己这个阶段的,去书里学习。

首先,让我们来看看这两本书的逻辑系统,并朝着方向阅读:

《7天精通SEO》

这本书侧重于站内、站外和战略部分。这三个部分主要讲优化的实用方法论。基础文章是了解一般常识,快速浏览,可与案例篇专题篇相结合。

《百度SEO一本通》

本书主要关注关键词、链接优化技巧,了解和了解网络技术和百度竞价推广、网络联盟推广。

接下来,梳理一下SEO基本常识(后续补充不完整部分)

SEO定义:

Search Engine Optimization(全称)即搜索引擎优化,是从搜索引擎获取流量的技术。搜索引擎的主要工作包括:通过了解搜索引擎的工作原理,掌握如何爬网页,如何索引,如何确定关键词排名位置,科学优化网页内容,同时满足用户浏览习惯,提高排名和网站访问,最终获得商业技术的能力。

搜索引擎工作原理:

主要有爬行抓取、预处理、服务输出三个工作流程

2.1 爬行抓取

主要功能是抓取网页。目前有三种爬行方法

批量收集:只要互联网上有链接,收集网页需要很长时间,大约几周。缺点是增加了额外的带宽消耗,时效性不高。

增量收集:在原收集网页的基础上搜索新的网页,更改上次收集后更改的页面,删除收集重复和不存在的页面。

增量收集:在原收集网页的基础上搜索新的网页,更改上次收集后更改的页面,删除收集重复和不存在的页面。

网站管理员通过工具主动向搜索引擎提交网站,该方法响应速度相对较慢,主流擎蜘蛛主动爬行。

2.1.1 常见蜘蛛

搜索引擎蜘蛛是搜索引擎的自动程序,其功能是访问互联网上的网页、图片、视频等内容,建立索引库,一般用途是spider URL这里的URL它是搜索引擎的痕迹,可以通过检查服务器中的日志中是否有它URL,同时还能查看一些列属性。

百度蜘蛛:可以根据服务器的负载能力调整价格访问密度,降低服务器的压力,但百度蜘蛛通常会捕获相同的页面,导致其他页面无法捕获,一般通过robots协议来避免

Baiduspider ( http://www.baidu.com/search/spider.htm)

谷歌蜘蛛:属于更活跃的网站扫描工具,间隔约28天将派蜘蛛检索更新或修改的网页。谷歌蜘蛛的爬行深度大于百度。谷歌蜘蛛的爬行深度大于百度。

Mozilla/5.0(compatible;Googlebot/2.1;http://www.google.com/bot.html)

–中国蜘蛛雅虎 Mozilla/5.0(compatible;Yahoo!SLurp China;http://misc.yahoo.com.cn/help.html)**

–微软必应蜘蛛

msnbot/1.1( http://search.msn.com/msnbot.htm)

–搜索蜘蛛爬行抓取速度快,抓取的数量相对较少,且不抓取robot.text文件

Sogou web robot ( http://www.sogou.com/socs/help/webmasters.htm#07)

–搜搜蜘蛛

Sosospider ( http://help.soso.com/webspider.htm)

–有道蜘蛛

Mozilla/5.0(compatible;YodaoBot/1.0;http://www.yodao.com/help/webmaster/spider/

2.1.2 爬行策略

深度优先爬行:沿一条线抓取,知道最后,然后返回到另一条线

广度优先爬行:在一个页面上找到多个链接后,抓取所有第一层的链接,然后沿着第二层和第三层……

2.1.3 预处理

也就是说,索引捕获的数据,包括多个过程,提前在后台完成。

2.1.3.1 关键词提取

将HTML、JS、CSS等标签&去除程序,提取有效的排名文本。

2.1.3.2去除停用词

即反复出现的无用词,如:“地,啊,阿,然后”等

2.1.3.3分词技术

它是中文搜索引擎独特的技术支持,中文不同于英文单词和单词之间的空间分隔,所以搜索引擎必须将整个句子切割成小单元单词,分词有两种方法

根据不同的方向,基于字符串匹配的分词方法可分为正向匹配、反向匹配和最小切词。混合后,产生正向最大匹配、反向最大匹配、正向最小匹配和反向最小匹配。作者个人理解为根据中文习惯对整个句子的组词形式进行拆分。作者个人理解为根据中文习惯对整个句子的组词形式进行拆分。

基于统计分词法 直接调用分词词典中的几个单词进行匹配,同时使用统计技术识别一些新单词,匹配所有统计结果,发挥切词的最高效率。

2.1.3.4消除噪声

消除对搜索引擎无用的广告文本、图片、登录框、版权信息等。

2.1.3.5析网页建立倒排文件

积极索引:将页面转换为关键字组合,记录页面上每个关键字的频率、频率、格式和位置,使每个页面可以记录为一系列关键字组合,并记录每个关键字的频率、格式、位置等权重信息。

倒排索引:正向索引不能直接用于排名,倒排索引以关键词为索引

2.1.3.6 计算链接关系

计算页面上哪些链接指向其他页面,每个页面导入哪些链接,链接使用哪些锚文本等,Google推出的PR是代表之一。

2.1.3.7 处理特殊文件

对flash、视频、PPT、XLS、图片等非文字内容不能执行脚本和程序。标签通常用于图片

2.3 服务输出

显示输出结果的方式,如:与搜索关键字匹配的部分用红色字体标记

输出

网站分类目录

是人工编辑的搜索结果,收集整理互联网上的优秀网站,将不同的分类或主题放在相应的目录中,多依靠人工提交,如:hao123网址导航

关键词

一般指用户在搜索框中定制输入的信息,按概念可分为:目标关键词、长尾关键词、相关关键词;按页面划分,可分为主页、栏目页、内容页关键词;可分为直接、营销关键词

权重和PR值(PageRank)

PR价值是谷歌搜索引擎衡量网页重要性的一种方法,也是判断网站质量的重要标准之一。最大的影响因素是它是否有大量高质量的外部链。

网站权重是指网站和网站在搜索引擎眼中的分级系统“待遇”性能是搜索引擎中的一个综合性能指标。决定性因素包括:导入外部链接、稳定的高质量内容和结构清晰的网站结构。

区分这是两个不同的概念

6. 白帽SEO和黑帽SEO

7. 锚文本、外链、内链、单向链接、双向链接、导出链接、导入链接

8. 有机列表

是SERP通过制定中间的免费列表,即搜索结果页面的免费列表SEO优化策略。

9. robots.txt文件

Robots Exclusion Protocol,网站通过Robots该协议告诉搜索引擎哪些页面可以获,哪些页面不能捕获。

9. robots.txt文件

Robots Exclusion Protocol,网站通过Robots协议告诉搜索引擎哪些页面可以捕获,哪些页面不能捕获。多用于避免大量404页和死链接

如何查看?格式:输入浏览器URL/robots.txt即可,下面是www.taobao.com/robots.txt文件

User-agent: Baiduspider

Disallow: /

User-agent: baiduspider

Disallow: /

User agent 指浏览器

robots文件通常通过组合使用,主要有以下四种情况

User-agent: *Disallow:/ 禁止抓取所有页面

User-agent: *Disallow:/ 允许抓取所有页面

User-agent: BadBot Disallow:/ 禁止访问搜索引擎

User-agent: Baiduspider.Disallow:User-agent:Disallow 允许百度抓取,不允许其他抓取

10. nofollow

决定是否投票并传递网站的权重可以用来防止垃圾链接

它可以出现在网页级元标记中,用示搜索引擎不要在网页上抓取任何东西

链接前可以出现,指示蜘蛛不要抓特定链接 signin

黑链

超链接只存在于源代码中

动态网站和静态网站

搜索跳出率

用户查到一个网站并点击进入,且只浏览了一个页面就离开所占的比例

网页快照

搜索引擎在收录网页时,备份网页并存储在自己的服务器缓存中。当用户点击搜索引擎时“网页快照”搜索引擎将链接Spider当时系统抓取并保存的网页内容显示,称为“网页快照”。

了解网站的常见情况HTTP状态码

SEO常见指令

“site: URL” 用于查询特定网站的收录情况

“Link: URL” 查外链

“related: URL” 查询相关网页指令,找到与你的网站内容相关的网站

“info: URL” 查询特定网站的包含信息、最近的快照、类似的网页、网站链接、内部链接和包含域名的链接是一个只支持的综合指令Google。

“allintext/intext:”有效查询特定网页文档中的特定关键词,找到最相关的网页和潜在链接对象,只支持Google。

“allinurl/inurl:”找到特定的网页url中包含特定url关键词可以与其他指令结合使用 用,


下一篇: 建设智能城市的大数据+人工智能
上一篇: tag如何优化标签的聚合页面?
相关文章
返回顶部小火箭