3 Maneiras que você pode remover páginas de blog indesejados de google
Você é um crente na idéia de que uma vez que algo é publicado na Internet, ele é publicado para sempre? Bem, hoje nós estamos indo para dissipar esse mito.
Conteúdo
A verdade é que em muitos casos é bem possível para erradicar a informação a partir da Internet. Claro, há um registro de páginas da web que foram apagados se você procurar o Wayback Machine, certo? Sim, absolutamente. Na máquina Wayback há registros de páginas da web que vão para trás muitos anos - páginas que você não vai encontrar com uma pesquisa do Google porque a página web não existe mais. Alguém apagou-lo, ou o site foi fechado.
Assim, não há como fugir disto, certo? Informação será para sempre gravado na pedra da Internet, há gerações que ver? Bem, não exatamente.
A verdade é que, embora possa ser difícil ou impossível para acabar com notícias mais importantes que proliferaram a partir de um site de notícias ou blog para outro, como um vírus, é realmente muito fácil de erradicar completamente uma página web ou várias páginas da web de todos os registros da existência - para remover essa página para ambos os motores de busca, bem como a Wayback Machine. Mas há um problema, é claro, mas nós vamos chegar a isso.The Machine New Wayback permite que você visualmente viajar no tempo InternetThe Machine New Wayback permite que você visualmente viajar no tempo InternetParece que desde o lançamento Wayback Machine em 2001, os proprietários do site decidiram jogar fora o back-end baseado em Alexa e redesenhá-lo com o seu próprio código-fonte aberto. Após a realização de testes com o ...consulte Mais informação
3 maneiras para remover blog páginas da Net
O primeiro método é o que a maioria dos proprietários de sites usar, porque eles não conhecem nada melhor - páginas web simplesmente apagar. Isso pode acontecer porque você percebeu que você tem conteúdo duplicado em seu site, ou porque você tem uma página que você não quer aparecer nos resultados de busca.
Simplesmente eliminar a página
O problema com páginas inteiramente apagar a partir do seu site é que desde que você já estabeleceu a página na net, não são susceptíveis de ser links do seu próprio site, bem como links externos de outros sites para que determinada página. Quando você apagá-lo, o Google reconhece imediatamente que a página de vocês como uma página perdida.
Então, na exclusão de sua página, você não só criou um problema com “Not Found” erros de rastreamento para si mesmo, mas você também criou um problema para qualquer um que já vinculado à página. Normalmente, os usuários que chegam ao seu site a partir de um desses links externos verá sua página 404, o que não é um grande problema, se você usar algo como um código personalizado 404 do Google para dar aos usuários sugestões ou alternativas. Mas, você acha que poderia haver formas mais graciosas de exclusão de páginas de resultados de pesquisa sem dar início a todas essas 404 da para ligações recebidas existente, certo?
Bem, existem.
Remover uma página dos resultados de pesquisa do Google
Primeiro de tudo, você deve compreender que se a página web que deseja remover dos resultados de pesquisa do Google não é uma página do seu próprio site, então você está fora de sorte a menos que existam razões legais ou se o site publicou o seu pessoal informações on-line sem a sua permissão. Se for esse o caso, em seguida, usar solução de problemas de remoção do Google para enviar uma solicitação para que a página removido dos resultados de pesquisa. Se você tem um caso válido, o seu pode encontrar algum sucesso com a página removido - é claro que você pode ter um sucesso ainda maior apenas entrar em contato com o dono do site como eu descrevi como fazer volta em 2009.Como remover informações falsas sobre si mesmo na InternetComo remover informações falsas sobre si mesmo na Internetconsulte Mais informação
Agora, se a página que você deseja remover dos resultados de pesquisa é em seu próprio site, você está na sorte. Tudo que você precisa fazer é criar um robots.txt arquivo e certifique-se que você não permitido ou a página específica que você não quer nos resultados da pesquisa, ou em todo o diretório com o conteúdo que você não quer indexada. Aqui está o que bloqueando uma única página se parece.
User-agent: * Disallow: /my-deleted-article-that-i-want-removed.html
Você pode bloquear bots de rastejar diretórios inteiros do seu site como segue.
User-agent: * Disallow: / content-sobre-personal-stuff /
Google tem uma excelente página de suporte que podem ajudá-lo a criar um arquivo robots.txt se você nunca criou um antes. Isso funciona muito bem, como expliquei recentemente em um artigo sobre ofertas de estruturação de sindicação para que eles não te machucar (pedindo parceiros de distribuição para não permitir a indexação de suas páginas onde são distribuídos). Uma vez que o meu próprio parceiro syndication concordou em fazer isso, as páginas que foram duplicados conteúdo do meu blog desapareceu completamente de pesquisa listagens.Como negociar acordos de distribuição e proteger a sua pesquisa rankingsComo negociar acordos de distribuição e proteger a sua pesquisa rankingsSyndicating é toda a raiva estes dias. Mas, de repente você pode achar que o parceiro syndication está listado mais elevado do que nos resultados da pesquisa para uma história que você escreveu originalmente! Proteja seus rankings de busca.consulte Mais informação
Apenas o site principal surge em terceiro lugar para a página onde lista nosso título, mas o meu blog está agora listado em ambos o primeiro e segundo algo spots- que teria sido quase impossível ter um site de autoridade superior esquerda da página duplicada indexado .
O que muitas pessoas não percebem é que isso também é possível realizar com o Internet Archive (o Wayback Machine) também. Aqui estão as linhas que você precisa adicionar ao seu arquivo robots.txt para que isso aconteça.
User-agent: ia_archiverDisallow: / sample-category /
Neste exemplo, eu estou dizendo a Internet Archive para remover qualquer coisa no subdiretório amostra-categoria no meu site a partir do Wayback Machine. O arquivo Internet explica como fazer isso em sua página Exclusão ajuda. Esta é também onde eles explicam que “O Internet Archive não está interessado em oferecer acesso a sites ou outros documentos de Internet cujos autores não querem que seus materiais na coleção.”
Esta voa ao contrário da crença geral de que qualquer coisa publicado na internet fica arrastada para o arquivo para toda a eternidade. Nope - webmasters que possuem o conteúdo pode especificamente ter o conteúdo removido do arquivo usando a abordagem robots.txt.
Remover uma página individual Com Meta Tags
Se você tiver apenas algumas páginas individuais que você deseja remover resultados da Pesquisa Google, você realmente não tem que usar a abordagem robots.txt em tudo, você pode simplesmente adicionar a “robôs” corretas tag meta para as páginas individuais, e dizer aos robôs para não indexar ou seguir links em toda a página.
Você pode usar a “robôs” meta acima de parar robôs de indexar a página, ou você poderia dizer especificamente o robô do Google não para o índice assim que a página só é removido dos resultados de pesquisa do Google, e outros robôs de busca ainda pode acessar o conteúdo da página.
É completamente até você como você gostaria de gerenciar o que os robôs fazem com a página e se ou não a página é listada. Por apenas alguns páginas individuais, esta pode ser a melhor abordagem. Para remover um diretório inteiro de conteúdo, ir com o método robots.txt.
A idéia de “Remover” Conteúdo
Este tipo de transforma toda a noção de “conteúdo apagar a partir da Internet” em sua cabeça. Tecnicamente, se você remover todos os seus próprios links para uma página em seu site, e removê-lo do Google Search eo Arquivo Internet usando a técnica de robots.txt, a página é para todos os efeitos “excluído” da Internet. O legal é que embora se houver links existentes para a página, os links ainda funcionará e você não vai provocar erros 404 para os visitantes.
É uma abordagem mais “suave” para a remoção de conteúdo da Internet sem inteiramente bagunçar existente popularidade da ligação do seu site durante todo o Internet. No final, como você vai administrar o conteúdo é coletado pelos motores de busca eo Internet Archive é com você, mas lembre-se sempre que, apesar do que as pessoas dizem sobre a vida útil das coisas que são publicadas on-line, é realmente completamente dentro de seu controle .