可可网络
专注效果,用心服务
电话

免费服务热线

19925363846

二维码
分析站点日志的用途是什么?如何进行日志分析

来源: 2021-06-10

分析站点日志的用途是什么?如何进行日志分析?(SEO技术)
很多初学者SEO站长可能认为不分析网站日志也不重要。相信谷歌分析、双边统计、百度统计、cnzz、51.la等网站统计代码都设置在自己的网站上。这些工具可以统计网站的流量,但这些统计工具都不能统计主机资源的原始访问信息(例如下载图片的人)或没有添加统计代码的地方(例如后台操作页面)。
大部分付费主机提供原始访问日志,web服务器在每个访问者访问时自动记录部分信息,并将其存储在原始访问日志文件中,如果主机不提供日志功能,建议在过期后更改主机。日志记录网站上所有资源的访问信息,包括从所有网页打开过程(如照片、CSS、JS、FLASH、HTML、MP3)加载的资源,并记录访问这些资源的人、使用过的访问、访问结果等。原始访问日志可以说记录了主机上的所有资源使用情况。

分析网站日志有什么作用?
1.搜索引擎蜘蛛在我们网站上爬行的次数可以比较准确地找到。可以阻止伪蜘蛛。
2.通过分析网站日志,可以准确地找到搜索引擎蜘蛛爬行的页面和持续时间。我们可以依次微调我们的网站。
3、http返回状态代码、搜索引擎蜘蛛和用户每次访问我们的网站时,服务器端能否产生301,404,200这样的状态?我们可以参考这些信息。对出现问题的网站进行简单诊断,及时处理问题。
如何分析网站日志的内容?
第一,注意经常访问的资源。
如果在日志中发现某些资源(网页、照片、MP3等)经常被访问,要注意该资源被使用在哪里。如果这些请求的来源(Referer)不是您的站点,或者为空,状态代码(Http  Code)为200,则这些资源很有可能被盗。通过Referer可以确认被盗链的网址。这可能是您网站流量猛增的原因。要做好防盗链。
第二,请注意您的网站没有资源的请求。
如果部分请求信息不是本网站的资源,则HTTP代码不是403或404,但可能是名称分析中存储数据库信息的文件。如果让别人拿走这个信息,攻击网站就容易多了。发起这些请求的目的只是扫描网站的漏洞。如果漫无目的地扫描和下载这些已知漏洞文件,就会发现网站的漏洞!从观察来看,用于这些请求的代理几乎都是异常的浏览器类型,如Mozilla/4.0、Mozilla/5.0或Libww-Agent/,上面提供的日志格式化工具集成了对这些请求的警报功能。可以禁止对这些代理的访问,以达到防止扫描的目的。具体方法如下所述。第三,观察搜索引擎蜘蛛的访问。
查看日志上的信息可以知道你的网站被蜘蛛访问的频率,还可以知道你的网站是否被搜索引擎首选。这些都是SEO关心的问题。日志格式化工具集成了对搜索引擎蜘蛛的提示功能。典型的搜索引擎蜘蛛使用的代理列表如下。
谷歌蜘蛛:Mozilla/5.0 Google  boot/2.1;http://www.google.com/bot.html)
百度蜘蛛:Baiduspider(http://www  . Baidu.com/search/spider  . htm)
雅虎!蜘蛛:莫拉/5.0(compatible;雅虎!SLURP/3.0;http://help  . Yahoo.com/help/us/y  search/slurp)
雅虎!中国蜘蛛:Mozilla/5.0雅虎!Slurp中国;http://misc  . Yahoo.com.cn/help  . html)
微软Bing蜘蛛:msnbot/2.0b(http://search  . MSN.com/msnbot  . htm)
谷歌Adsense蜘蛛:Mediapartners-Google
有蜘蛛:Mozilla/5.0(compartible;YouDaobot/1.0;http://www  . Youdao.com/help/web  master/spider/)
Soso搜索博客蜘蛛:SOSOBLOGSPider(3358 Help  . SOSO.com/SOSO-Blog-Spider  . htm)
sogo  Sogou蜘蛛:sogo  web蜘蛛/4.0(3358 www  . Sogou.com/docs/help/web  masters  . htm  # 07)
Twiceler爬行动物计划:Mozilla/5.0(twiceler-0.9 http://www  . cuil.com/twiceler/robot  . html)
谷歌图像搜索蜘蛛:谷歌启动-图像/1.0俄罗斯Yandex搜索引擎蜘蛛:Yandex/1 . 01 . 001(compatible;Win16I)。
Alexa蜘蛛:IA  _ Archiver(http://www  . Alexa.com/site/help/web  masters)
pedeski蜘蛛:Mozilla  5.0(compartible;Feedsky  crawler  /1.0)
韩国Yeti蜘蛛:Yeti/1.0(NHN  Corp;http://help.naver.com/robots/)
四、观察访客的行为
查看格式化的日志可以查看一段时间内跟踪IP的一系列访问行为。对单个IP的访问记录越多,网站PV越高,用户粘度越高。如果单个IP的访问记录是姬姬,你应该考虑如何使你的网站内容更有吸引力。可以分析访客的行为,为网站建设提供强有力的参考。哪些内容好,哪些内容不好,可以决定网站的发展方向。分析访客的行为,看看他们做了什么,就能推测访客的意图,及时抓住恶意用户。
摘要:还有一点需要介绍的是,当网站搜索引擎K掉的时候,网站日志会提供K掉的原因(我为驿军朋友考虑),通过网站日志相关的数据可以知道网站什么时候搜索引擎恢复正常访问,因此我们可以继续或放弃。没办法,但这是不得已而明智的选择。