Feedly estaba robando su contenido - aquí está la historia, y su código

La semana pasada, Feedly puso en marcha un nuevo y controvertido “característica” - enlaces de alimentación secuestro para robar el tráfico de millones de bloggers.

Vídeo: UN YOUTUBER FAMOSO RUSO ME ESTÁ ROBANDO VÍDEOS

La reorientación de los enlaces compartidos con Feedly a la propia opinión de Feedly del artículo en lugar del propio artículo en el sitio original es una preocupación para los creadores de contenidos originales en muchos blogs. No sólo resulta en la pérdida de tráfico, pero también es engañoso para los que siguen un blog en particular.

Aquí está la historia completa de por qué la gente está enfadada, y cómo un blogger ayudó a enderezar la situación. También profundizar en su código fuente donde se muestra el grado de suciedad de sus pequeños trucos son.

Crédito debido: El lector digital fue la fuente original de esta noticia - que decidí investigar un poco más y ver exactamente lo que estaban haciendo.

En primer lugar, la buena noticia

En el momento de la escritura, el comportamiento ha sido un tanto corregida de modo que los enlaces acortados Feedly de hecho están siendo enviados al sitio originadores, pero un rápido examen de la código de estado HTTP reveló que la redirección no se está haciendo en la forma típica de nivel de servidor con una redirección 301 o 302 (200, que es el envío de Feedly, significa “sí, tenemos esa página, espera” - 404 significa “no encontrado” - 301 significa “redirigir de forma permanente a otra URL-302, mientras que significa‘cambio de dirección temporal’).Top 10 de los sitios web para los códigos de error & Solución de problemasTop 10 de los sitios web para los códigos de error & Solución de problemasLee mas

Vídeo: Atención esta es la nueva modalidad de robar en la República Dominicana usando Grúa

Esto significaba que la redirección se estaba realizando en javascript, por lo que quería saber más. El uso de una página web de línea de comandos herramienta llamada rizo ir a buscar, yo era capaz de agarrar el código fuente de una muestra de enlace Feedly a Techmeme.com antes de producirse el cambio de dirección (desde CURL no ejecutará javascript) - y reveló algunos datos sorprendentes. Esto es lo que encontré.

(I`ve`ve subido su fuente completo aquí si desea echar un vistazo - Sólo estoy ofreciendo algunos fragmentos interesantes más adelante)

Algunas personas estaban preocupados por las implicaciones de SEO, básicamente, que su contenido robado y publicado de nuevo en otro lugar- la buena noticia es que Feedly ajustado correctamente el rel = “canonical” etiqueta meta para instruir a Google de que todos los valores de vínculo deben ser pasados ​​al sitio original. Sin embargo, es imposible determinar si esto se añadió después de las quejas comenzaron o estuvo presente desde el principio.

lt;rel enlace="canónico" href="https://techmeme.com/131202/p30#a131202p30" /gt;

Están Decapado Anuncios

En lo que probablemente fue un intento equivocado al duplicar una funcionalidad tipo legibilidad, que excluye una página a fin de cuentas es esencial de la base, Feedly estaba despojando toda la publicidad, seguimiento y botones de acción social que haya sido incrustados en el elemento de alimentación de originales. Aquí está la lista completa de las cosas se rompan:6 Bookmarklets que impulsará su velocidad de navegación web & Productividad6 Bookmarklets que impulsará su velocidad de navegación web & ProductividadBookmarklets son pequeños ayudantes insospechadas que se sientan en la barra de marcadores del navegador. A diferencia de sus marcadores normales, no archivar una URL, en lugar bookmarklets son pequeños applets de Java con una funcionalidad de un solo clic. Hay cientos de ...Lee mas

var visualExcludePatterns = [ "feedproxy","FeedBurner","/ ~","feeds.wordpress.com","stats.wordpress.com","googleadservices.com","feedads","tuitea esto", "fmpub","-ads","_ads","Pheedo","Zemanta","u.npr.org/iserver","openx.org","slashdot-it","emoticones","/ ICO","commindo-media.de","creatives.commindo-media","doubleclick.net","i.techcrunch","AdView","/feed.gif",".ads.","/avw.php”,"wp-digg-esta","alimentar-inyector","/plugins/","tweetmeme.com","_icono_","/anuncio-","compartir-botones","feedsportal.com","BuySellAds","Holstee","musictapp","/anuncio_","/botón/","donate.png","/ patrocinadores /","googlesyndication.com","/ pagead","/ ADX","activos / feed-fb","activos / feed-tw","feedburner.com/~ff","gstatic.com","feedsportal.com"]-

Sacar un botón “donar” parece particularmente irritante, por alguna razón.

Están Secuestro de Enlaces

Aquí llegamos al punto más grave, porque no sólo se Feedly raspando el contenido de su sitio, se les rompía los botones sociales originales y reescribir los meta-datos. Esto significa que cuando alguien compartió posteriormente el artículo, que sería de hecho compartir el enlace Feedly y no el post original. Cualquier persona al hacer clic en ese enlace iría directamente a Feedly.

Captura de contenido extraído de TheDigitalReader
Captura de contenido extraído de TheDigitalReader

Entonces, ¿qué, usted puede pedir? Cuando un post va viral, que puede ser de gran beneficio para el sitio en cuestión - el aumento de páginas vistas y los ingresos por publicidad, y ampliar su audiencia. Feedly estaba robando abiertamente que beneficio específico de distancia del sitio de ampliar su propia base de usuarios. El código Feedly incluye controles para los dispositivos móviles que dirigir a los usuarios a la página de appstore relevante.

función acción( dónde ){var actionName = "seguir"-var url = "https://feedly.com/#" + encodeURIComponent( "suscripción/" + feedInfo.carné de identidad )-Si( / IPhone | iPad / i.prueba( navegador.agente de usuario ) ){actionName = "instalar"-url = "https://itunes.apple.com/us/app/feedly/id396069556"-}más Si( / Android / i.prueba( navegador.agente de usuario ) ){actionName = "instalar"-url = "mercado: // details? id = com.devhd.feedly"-}_gaq.empujar( [ `_evento de pista`, cangilón(), actionName + "." + dónde, feedInfo.carné de identidad ] )-ventana.setTimeout( función() { documento.ubicación.href = url-}, 20 )-ventana.evento.cancelBubble = ciertoventana.evento.stopPropagation()-ventana.evento.preventDefault()-}

No era “sólo hacer el artículo más fácil de ver” - que estaba robando el tráfico, así de simple. Eso no es muy bueno.

Su primer arreglo: Una lista de exclusión Hardcoded

Cuando el lector digital primero se quejó a Feedly, su respuesta fue que recodificar el javascript para incluir una Lista de exclusion. Literalmente añaden un cheque a cada eslabón Feedly para ver si se trataba de un elemento del lector digital, y si es así para evitar el secuestro de la página.

siteExcludePatterns var = [ "/ TheDigitalReader /" ] -Función shouldExcludeSite (url)

Esto es por supuesto una forma absolutamente ridícula de hacer esto - Estaban planeando añadir a esa lista el paso del tiempo y más bloggers se quejó?

Vídeo: Top 10 Maneras Estúpidas de Robar un Cajero Automatico

Nate, desde el lector digital respondió:

¿de dónde sacas fuera exigiendo que opto fuera de su secuestro? Es como decir que yo debería tener que pedir a alguien que deje de pegarme en la billetera cara. Y sin embargo, usted piensa que es razonable?

Su segundo Fix: Un Hack rápida para omitir todo el código

Después de lo que sólo puedo asumir que era abrumador número de quejas que siguieron, ajustaron el filtro de secuestro de la siguiente manera:

Si( tipo == "parcial" || shouldExcludeSite( "https://techmeme.com/131202/p30#a131202p30" ) || cierto ){documento.cuerpo.innerHtml = ""-documento.ubicación.href = "https://techmeme.com/131202/p30#a131202p30"-}

“Parcial” se refiere al contenido fragmentado ser un completo o una alimentación parcial - no hay ningún punto en el secuestro alimenta que sólo publicar un extracto después de todo. Presumiblemente, esta función comenzó como el único control que se produjo la hora de elegir si desea enviar al usuario al sitio original o no. Se puede ver el primer punto de referencia después de eso, que llama a la función para comprobar si este sitio está en la lista de sitios que han optado OUT- pero luego vemos su dosis final en lugar -

|| cierto.

Si usted tiene alguna experiencia en programación, podrás reconocer el truco rápido que dice “el siguiente código siempre se llevará a cabo”, y por lo general es utilizado sólo en la depuración. Si cualquiera de esas 3 condiciones son verdaderas (los dos primeros ya no importa), Feedly redirige los usuarios al instante al sitio original.

Y ahí es donde está ahora. Entonces, ¿qué hemos aprendido?

Básicamente, Feedly se trata de crear una especie de adelgazado experiencia de lectura, pero la forma en que fue sobre él - reescritura de enlaces para propagar su propio servicio a través de acciones sociales posteriores fue condenadamente desagradable. Este no es el único mal movimiento Feedly ha hecho recientemente, ya sea - el mes pasado, que comenzaron a requerir iniciar sesión con cuentas de Google+ (habiendo visto qué tan bien está funcionando Google+ inicio de sesión para YouTube, Supongo), pero eso también se revirtió rápidamente. La lección es - es posible que desee iniciar la búsqueda de una feedreader alternativa, salvo que usted haya suckered a pagar $ 99 para una cuenta Pro.Comentarios Sección de YouTube Ahora limpiado, cortesía de GoogleComentarios Sección de YouTube Ahora limpiado, cortesía de GoogleGoogle ha limpiado YouTube con un sistema de comentarios de Google+ nueva potencia. Ahora vamos a ver los comentarios más upvoted, los de las personas en tus círculos de Google+, y desde el propietario del vídeo.Lee mas

Artículos Relacionados