成都網站建設

擁有10年以上經驗豐富的網站制作團隊,具備科學的建站流程和快速的客戶服務體系

成都網站建設專家

整合營銷專家

短時間、快速度、操作簡單、低投入品牌展示率

成都整合營銷專家

網站優化推廣

包年網站優化,百度自然排名首頁,真正實現點擊不收費!

成都網站優化推廣

主機域名

集群式CDN加速,打開速度快速,利于優化排名

獨立IP主機
您當前位置:成都網站建設 >> 新聞頻道 >> 常見問題FAQ >> 瀏覽文章

關于shell命令的問題


時間:2014年07月02日 點擊量:

想從網站日志中提取出,用戶的訪問記錄,不要搜索引擎的,命令怎么寫呢。

 

使用python即可完美提取
這是一般Apache的 Log 內容:
192.168.1.1 - - [20/Nov/2011:01:10:35 +0100] "GET /feed.atom HTTP/1.0" 200 259653
192.168.1.2 - - [20/Nov/2011:01:10:49 +0100] "GET /feed.atom HTTP/1.1" 304 153
192.168.1.3 - - [20/Nov/2011:01:10:50 +0100] "GET /2008/1/23/no HTTP/1.0" 404 472
192.168.1.4 - - [20/Nov/2011:01:10:50 +0100] "GET /feed.atom?_qt=data HTTP/1.1"
先調出Log文件

with open('/var/log/apache2/access.log') as f:
for line in f:


然后提取用戶訪問記錄

import re
from collections import defaultdict
from heapq import nlargest

with open('log.txt') as f:
count = defaultdict(int)
for line in f:
    match = re.search(r' "\w+ (.*?) HTTP/', line)
    if match is None:
        continue
    uri = match.group(1).split('?')[0]
    count[uri] = count[uri] + 1

most_common = nlargest(5, count.items(), key=lambda x: x[1])
print most_common

文章由四川冠辰成都網站建設http://www.29241838.com/9741.html編輯整理,轉載請注明出處
相關閱讀:
簽約動態成都網站建設成都建站動態成都網站推廣成都企業名錄常見問題FAQ冠辰公告
聯系我們
  • 業務咨詢:18782121200
  • 業務咨詢:18080432432
  • 服務熱線:028-86088588
  • 服務熱線:028-62322623-0
  • 免費熱線:400-000-2367
  • 傳 真:028-62322623-823
網站首頁| 關于我們| 熱門關鍵詞| 付款方式| 資質證書| 聯系我們
版權所有 Copyright © 2002-2013 四川冠辰科技開發有限公司www.29241838.com 保留所有權利 蜀ICP備11012605號
地址:四川省成都市金牛區五塊石路1號龍湖北城天街28棟903室 冠辰科技資質證書
服務熱線:400-000-2367 028-86088588 總機:028-62322623-0 傳真:028-62322623-823
新加坡彩蛋 北京彩蛋