有哪些的数据获取方式

有哪些的数据获取方式,第1张

1、网站日志文件:是做原始的数据获取方式,主要在服务端完成,在网站的应用服务器配置相应的写日志的功能就能实现。
优势:完整的服务端请求记录,包括爬虫等的请求;
缺陷:(1)、日志的获取和清洗过滤成本较高;(2)、无用日志对统计干扰造成数据不准确;(3)灵活性有限(页面端很多 *** 作无法记录)。
2、Web Beacons:实现方式是在需要统计的网站页面或者模块上嵌入一个11像素的透明,用户完全察觉不到,当用户访问该网友的同时会请求透明,并完成页面访问的记录工作,就像是在纸上画一个不易察觉的小点来标记那张纸。它实现了日志记录服务器与网站应用服务器的分离。
优势:(1)、日志服务器与应用服务器分离;(2)、数据获取的可控性使日志处理成本降低。
缺陷:(1)、需要在页面植入小;(2)、获取信息比较有限;(3)、无法获取蜘蛛等不请求的访问记录。
3、JS页面标记:是Web Beacons的改进,是在页面端嵌入JS标记代码,当用户访问网页时同时执行JS代码,JS代码会将一些统计需要的信息以URL参数的形式附带在请求地址的后面,然后再向服务器请求,这样日志服务器就可以获取比较完整的访问数据啦。
优势:(1)、数据获取的可控性和灵活性较高;(2)、可以对页面端 *** 作进行记录;(3)、获取的数据比较完整丰富。
缺陷:(1)、需要在页面植入JS标记代码;(2)、当用户禁用JS功能时无法获取数据;(3)、无法获取蜘蛛等不请求JS的访问记录。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://www.outofmemory.cn/zz/13437891.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-08-06
下一篇 2023-08-06

发表评论

登录后才能评论

评论列表(0条)

保存