Como determinar quais endereços ip são bater seu site o mais

Esta é uma breve um. Graças a The How-To Geek por trazer este comando em meu repertório solução de problemas.

Um pouco de fundo em primeiro lugar. Este comando é útil para determinar quem está causando a maioria dos acessos ao seu site. No meu blog música, eu postar um bom número de MP3s (totalmente legal). Alguns menos do que as pessoas éticas muitas vezes usam esses MP3s para transmitir via seu site, fazendo com que a minha para ser mais lento (e uma nota de maior largura de banda). Ao descobrir o endereço IP do site / pessoa “roubar” a minha largura de banda I pode então bloquear seu IP de acessar qualquer um dos meu conteúdo.

Nota: você vai precisar de acesso shell a seus arquivos de log do servidor web

  1. SSH (ou telnet) para o seu host. Mude para o diretório que armazena os arquivos de log do servidor web.
  2. Executar este comando:

    cauda -100000 access.log | awk `{print $ 1}` | tipo | uniq -c | tipo -n

    Onde 100000 é o número de linhas (a partir do final do arquivo de log) que pretende procurar, e access.log é o nome do seu log de acesso do servidor web.



  3. terminal com resultados de ordenação cauda awk uniq

  4. O resultado será uma (provavelmente) bastante longa lista de IPs, ordenadas por menor número de acessos a mais. O primeiro valor em cada linha é o número de vezes que o endereço de IP (o segundo número) acessado seu site (no número de linhas do arquivo de log especificado).

    Use o hospedeiro comando para determinar o nome completo do domínio de qualquer endereço IP que aparece (você provavelmente vai querer saber que os que atingiu o seu site o mais são). No exemplo imagem abaixo, dois dos IPs que atingiu simplehelp.net mais foram Googlebot eo Yahoo Site Crawler.

  5. terminal com cauda awk uniq tipo

  6. Se há um domínio / IP que pareça suspeito, você pode verificar para ver quais arquivos foram bater usando o comando:

    cauda -1000 access.log | xx.xx.xx.xx grep

    Nesse comando, 1000 é o número de linhas de verificar, access.log é o nome do seu log de acesso do servidor web, e xx.xx.xx.xx é o IP que você deseja classificar. Eu sugiro usar um número menor (1000 vs. 100000, usado no primeiro comando), como você provavelmente não precisa / quer ver cada arquivo que eles acessado. Se fizer isso, aumentar o número 1000. Ou, se não muitos resultados mostram-se, o que significa que eles foram bater seu site “mais cedo”, e você vai querer aumentar a 1000 para um número maior.


Artigos relacionados