百度是如何对一个页面,分析生成了哪个关键字的?
来源:
2021-04-12
百度是如何对一个页面,分析生成了哪个关键字的?
很多同伴在搜索外提问。 百度是如何分析判断一个页面与关键字的关联度的,或者是如何知道这个页面是哪个关键字的,这里就说明一下个人的观点。
百度如何判断页面和关键字的关联度
一个页面是否与关键词一致,首先SEO站长必须理解两个概念。 一个是词数,另一个是密度。 搜索引擎刚发展的时候,很多站长都知道可以通过积累关键词轻松获得排名。 这就是词数。 很明显,该算法存在弊端,因此衍生出了密度的说法,密度的出现对关键词的堆积行为产生了一定的抑制。
以上,关于词数这个概念,必须理解统计方法TF-IDF。 TF是词数(temfrequency ),IDF是逆文档频率(inverse document frequency )。 对于特定关键字,将包含该关键字的文档数除以数据库文档总数,得到该词的文档频率。 相反,如果将文件总数除以含有该词的文件数(通常在实际计算时取对数),则得到逆文件频率。 因此,语言中常见的词,包含该词的文档数量越多,文档频率也越高,逆向文档频率也越低。
逆文档频率表示这个词的语义重要性,或者区别文档的能力。 例如,“的”通常出现在所有文档中,文档的频率极高,反向文档的频率极低,也就是说“的”一词的语义重要性很低,几乎不能用于代表和区分文档的内容。 “搜索引擎”一词只出现在部分文件中,逆向文件的频率要高得多,对文件内容的重要性很高。
搜索引擎在判断页面与哪个关键字更相关时,不单纯考虑字数,而是计算将字数乘以倒文档频率,即TF-IDF。 即使文档频率低、词数高,页面和关键字的相关性也不高。 例如,要优化“新加坡旅行”这个短语,百度搜索“新加坡”返回27600000的结果,搜索“旅行”返回100000000的结果,包含“新加坡”的文件数为“新加坡”。 由于百度数据库的文件总数是固定的,“新加坡”的逆文件频率大于“旅行”,换言之“新加坡”一词比“旅行”一词具有更好的区别和识别文件的能力。 在优化文案的时候,增加“旅行”的出现次数就不用增加“新加坡”的次数了。
分析SEO站长如何写文章
说到写作,原创备受欢迎,强调内容差异化,符合用户需求,可以说是老生常谈。 在这里,博主只谈下一个关键字在网页上的布局,百度搜索引擎判断网页和关键字的关联度。1、优化网页标题
网页的三个基本元素是标题、关键字和说明。 这三个标签可以最直接地传达百度页面表达了什么。 赋予标题title的分数最高,写title时一定要包含优化的目标关键字,用户可以在搜索时直接匹配关键字。 当然,标题不能太长。 要是能总结文章的主旨就好了。
2、正文关键词匹配
正文内容输出自然,写SEO文章时要简要分析关键词。 自己是否完全理解关键词的意思,自己是否能组织语言写文章,能不能写是最好的,写不出来的时候可以先读别人的文章,然后用自己的语言来表达。 即使写得很自然,正文的第一段和最后一段也必须至少出现一次关键字。 如果是不熟悉的关键字,在正文中也可以进行释义,如果出现其他页面的关键字,可以在关键字中设置链接文本来指向该页面,可以提高网站整体的关键字的关联性。
3、相关文章的聚合
除了以上两点之外,添加相关文章的阅读和tag标签,有助于搜索引擎判断当前页面属于哪个类别。 关联度高的文章也起到辅助作用,有助于页面和关键字的关联度匹配。
结语:当然,以上只是简单的理论分析,写这篇文章只是启发。 实际上百度搜索引擎在计算关联性时比单纯的计算要复杂得多,但实际上文章关键字的密度保持了多少还不确定,SEO和编辑在写作时,不需要考虑这么多。 果然那个词,如果自然地写的话,关键词必然会自然地融入,所以就足够了。