Feedly estava roubando o seu conteúdo - aqui vai a história, e seu código

Na semana passada, Feedly lançou um novo e controverso “recurso” - links de feed seqüestro de roubar o tráfego de milhões de blogueiros

Conteúdo

Primeiro, a boa notícia
Video: roubei a jÓia do banco - minecraft
Eles estão decapagem anúncios
Eles estão hijacking ligações
Video: roubei uma moto !!! veja o porque !
Video: fui assaltado pelo galeroso ��
Sua primeira fix: uma lista de exclusão hardcoded
Seu segundo fix: um corte rápido para ignorar todo o código

Redirecionando links compartilhados com Feedly a própria visão do Feedly do artigo, em vez do próprio artigo sobre o site original é uma preocupação para os criadores de conteúdo original em muitos blogs. Ele não só resulta em perda de tráfego, mas também é enganador para aqueles que seguem um blog particular.

Aqui está a história completa do porquê as pessoas estão com raiva, e como um blogueiro ajudou a corrigir a situação. Eu também mergulhar em seu código fonte para mostrar o quão sujo seus pequenos truques são.

Crédito devido: The Reader Digital foi a fonte original para esta notícia - eu apenas decidi investigar um pouco mais e ver exatamente o que eles estavam fazendo.

Primeiro, a boa notícia

No momento da escrita, o comportamento tem sido um pouco corrigido para que as ligações feedly encurtados estão de fato sendo enviados para o site autores, mas um rápido exame do código de status HTTP revelou que o redirecionamento não estava sendo feito da maneira típica nível do servidor com um 301 ou redirecionamento 302 (200, que Feedly está enviando, significa “sim, nós temos essa página, segurar” - 404 significa “não encontrado” - 301 significa “redirecionando permanentemente para outro URL-enquanto 302 significa‘redirecionamento temporário’).Top 10 sites para códigos de erro & Solução de problemasTop 10 sites para códigos de erro & Solução de problemasconsulte Mais informação

Isto significou o redirecionamento estava sendo realizado em javascript, então eu queria saber mais. Usando uma página de linha de comando ferramenta chamada onda buscar, eu era capaz de pegar o código fonte de uma amostra ligação Feedly para Techmeme.com antes do redirecionamento ocorreu (desde CURL não irá executar javascript) - e revelou alguns petiscos surpreendentes. Aqui está o que eu encontrei.

Video: ROUBEI A JÓIA DO BANCO - MINECRAFT

(I`ve`ve carregado a fonte completo aqui se você gostaria de dar uma olhada - Eu só estou com alguns trechos interessantes abaixo)

Algumas pessoas estavam preocupados com as implicações de SEO, basicamente, ter seu conteúdo roubado e re-publicado elsewhere- a boa notícia é que Feedly definir corretamente o rel = “canonical” tag meta para instruir Google que todos os valores da ligação deve ser passado para o site original. No entanto, é impossível determinar se este foi adicionado após queixas começaram ou esteve presente desde o início.

lt;rel ligação="canônico" href="http://techmeme.com/131202/p30#a131202p30" /gt;

Eles estão decapagem anúncios

No que foi provavelmente uma tentativa equivocada de duplicação de um funcionalidade tipo legibilidade, que tira uma página para baixo para seu núcleo essencial, Feedly foi tirando toda a publicidade, rastreamento e compartilhar sociais botões que podem ter sido incorporados no item alimentação de originais. Aqui está a lista completa de coisas que estão sendo retirados:6 Bookmarklets que irá impulsionar seu Web Surfing velocidade & Produtividade6 Bookmarklets que irá impulsionar seu Web Surfing velocidade & ProdutividadeBookmarklets são ajudantes pequenos insuspeitos que se sentam na barra de favoritos do seu navegador. Ao contrário de seus favoritos regulares, eles não arquivar um URL, em vez bookmarklets são pequenos applets Java com uma funcionalidade de um clique. Há centenas de ...consulte Mais informação

var visualExcludePatterns = [ "feedproxy","FeedBurner","/ ~","feeds.wordpress.com","stats.wordpress.com","googleadservices.com","feedads","Piu-presente", "fmpub","-Publicidades","_Publicidades","Pheedo","Zemanta","u.npr.org/iserver","openx.org","slashdot-it","smilies","/ ico-","commindo-media.de","creatives.commindo-media","doubleclick.net","i.techcrunch","AdView","/feed.gif",".Publicidades.","/avw.php”,"wp-digg-esta","alimentação-injetor","/plugins/","TweetMeme.com","_ícone_","/de Anúncios-","compartilhar-botões","feedsportal.com","BuySellAds","holstee","MusicTapp","/de Anúncios_","/botão/","donate.png","/ patrocinadores /","googlesyndication.com","/ pagead","/ adx","activos / feed-fb","activos / feed-tw","feedburner.com/~ff","gstatic.com","feedsportal.com"]-

Tomar um botão “doar” parece particularmente irritante, por algum motivo.

Eles estão Hijacking Ligações

Aqui chegamos ao ponto mais grave, pois não só foram Feedly raspando o conteúdo do seu site, eles foram então despindo quaisquer botões sociais originais e reescrevendo os meta-dados. Isto significa que quando alguém posteriormente dividiu o item, que seria de fato compartilhando o link Feedly e não o post original. Quem clicar no link que iria direto para Feedly.

Captura de tela de conteúdo raspado TheDigitalReader

Então, o que, você pode perguntar? Quando um post vai viral, pode ser de grande benefício para o site em questão - levantando page views e receita de anúncios, e expandir seu público. Feedly foi outright roubar esse benefício específico para longe do local para expandir a sua própria base de usuários. O código Feedly incluído cheques para dispositivos móveis que direcionam os usuários para a página appstore relevante.

Video: Roubei uma MOTO !!! VEJA O PORQUE !

função açao( Onde ){var actionName = "Segue"-var url = "http://feedly.com/#" + encodeURIComponent( "inscrição/" + feedInfo.identidade )-E se( / IPhone | iPad / i.teste( navegador.agente de usuário ) ){actionName = "instalar"-url = "http://itunes.apple.com/us/app/feedly/id396069556"-}outro E se( / Android / i.teste( navegador.agente de usuário ) ){actionName = "instalar"-url = "Mercado: // details? id = com.devhd.feedly"-}_gaq.empurrar( [ `_trackEvent`, balde(), actionName + "." + Onde, feedInfo.identidade ] )-janela.setTimeout( função() { documento.localização.href = url-}, 20 )-janela.evento.cancelBubble = verdadejanela.evento.stopPropagation()-janela.evento.preventDefault()-}

Não foi “apenas fazendo o artigo mais fácil de visualizar” - ele estava roubando tráfego, pura e simples. Isso não é muito legal.

Video: FUI ASSALTADO PELO GALEROSO ��

Sua Primeira Fix: uma lista de exclusão Hardcoded

Quando The Reader Digital reclamou primeiro a Feedly, sua resposta foi a re-código do javascript para incluir uma lista de exclusão. Eles literalmente adicionado um cheque para cada link Feedly para ver se ele era um item do The Reader Digital, e se assim para ignorar o seqüestro página.

var siteExcludePatterns = [ "/ TheDigitalReader /" ] -função shouldExcludeSite (URL)

Este é, naturalmente, uma forma absolutamente ridícula de fazer isso - eles estavam pensando em adicionar a essa lista o passar do tempo e mais blogueiros reclamou?

Nate, de The Reader Digital respondeu:

onde você sai exigindo que eu optar por sair de seu seqüestro? É como dizer que eu deveria ter que pedir a alguém para parar de me bater na carteira face. E ainda assim você acha que é razoável?

Seu segundo Fix: um corte rápido para ignorar todo o código

Depois do que eu só posso supor que era esmagador número de queixas que se seguiram, eles ajustado o filtro seqüestro da seguinte forma:

E se( tipo == "parcial" || shouldExcludeSite( "http://techmeme.com/131202/p30#a131202p30" ) || verdade ){documento.corpo.innerHTML = ""-documento.localização.href = "http://techmeme.com/131202/p30#a131202p30"-}

“Parcial” refere-se ao conteúdo raspadas ser um inteiro ou uma alimentação parcial - não há nenhum ponto no sequestro alimenta que publicam apenas um trecho afinal. Presumivelmente, esta função começou como a única seleção que ocorreu quando escolher se deseja enviar o usuário para o site original ou não. Você pode ver a primeira correção depois disso, o que chama a função de verificar se este site está na lista de sites que optaram out- mas depois vemos a sua correção final no lugar -

|| verdade.

Se você tem alguma experiência em programação, você vai reconhecer o rápido hack que diz “o seguinte código será sempre executado”, e é normalmente usado apenas na depuração. Se qualquer um desses 3 condições (os dois primeiros não importa), Feedly redireciona os usuários instantaneamente para o site original.

E é aí que está agora. Então, o que aprendemos?

Basicamente, Feedly foi sobre a criação de uma espécie de emagreceu experiência de leitura, mas a forma como eles foram sobre isso - reescrever links para propagar seu próprio serviço através de ações sociais subseqüentes era muito danado nojento. Esta não é a única má jogada Feedly recentemente fez tanto - no mês passado, que começou a exigir que ingresse em contas Google+ (tendo visto quão bem Google+ login é trabalhar para YouTube, Eu acho), mas que também foi rapidamente revertida. A lição é - você pode querer começar a encontrar uma feedreader alternativa, a menos que já foram suckered em pagar US $ 99 para uma conta Pro.do YouTube Comentários Seção Agora limpados, cortesia do Google+do YouTube Comentários Seção Agora limpados, cortesia do Google+Google limpou YouTube com um sistema comentando novo Google+ alimentado. Você vai ver agora os comentários mais upvoted, os de pessoas em seus círculos do Google+ e do proprietário do vídeo.consulte Mais informação