用shell分析nginx日志百度网页蜘蛛列表页来访情况-白红宇

用shell分析nginx日志百度网页蜘蛛列表页来访情况

阅读量：6983 次

发布时间：2019-06-27

本文共 725 字，大约阅读时间需要 2 分钟。

#!/bin/bash#desc: this scripts for baidunews-spider#date:2014.02.25#testd in CentOS 5.9 x86_64#saved in /usr/local/bin/baidu-web.sh#written by coralzd@gmail.com www.zjyxh.comdt=`date -d "yesterday" +%m%d`if [ $1x != x ] ;then  if [ -e $1 ] ;then     grep -i "Baiduspider/2.0" $1 > baiduspider-${dt}.txt     num=`cat baiduspider-${dt}.txt|wc -l`     echo "baiduspider number is ${num},file is baidu-${dt}.txt"     cat baiduspider-${dt}.txt|awk '{print $7}'|sort |uniq -c|sort -r >`ls ${1}|cut -c 1-10`-${dt}.txt     echo "$1 was done"    else       echo "$1 not exsist!"  fielse     echo "usage: $0 file_path"fi

本次用shell分析百度网页蜘蛛跟百度新闻蜘蛛一个方法，无非就是把关键词由baiduspider-news换为baiduspider/2.0。

转载于:https://blog.51cto.com/coralzd/1590956

你可能感兴趣的文章

Redis安装及主从配置

查看>>

jvm Classload method介绍