Claves

NYT construye un mejor sistema de recomendación de noticias

Por @cdperiodismo

Publicado el 15 de agosto del 2015

El equipo de tecnología del New York Times también está comprometido en la difusión de la información de la organización, que publica más de 300 artículos, posts e historias interactivas al día.

Es en ese sentido que está buscando perfeccionar la forma en que los lectores navegan a través de todo ese contenido. De esta forma se puede ayudar a los lectores a encontrar información relevante para ellos, lo adecuado en un ideal formato multimedia.

En un post, el equipo explica cómo están innovando en el algoritmo que sirve para recomendar artículos dentro de la web del NYT.

Primero debemos conocer cómo trabajó la organización con la vieja tecnología:

  • Las noticias recomendadas deben funcionar bien con un nuevo contenido: noticias de última hora que no han sido vistas por muchos lectores. Es por eso que los datos de los artículos disponibles en el momento de la publicación son útiles: el tema, autor, escritor y etiquetas asociadas a las palabras claves de cada artículo.
  • El motor de recomendación utiliza las etiquetas de palabras clave para hacer recomendaciones. El uso de etiquetas para los artículos permite al algoritmo recomendar artículos similares a los que ya se han leído.
  • El enfoque tiene un atractivo intuitivo: Si un usuario lee diez artículos etiquetados con la palabra “Clinton”,  probablemente se le mostrará pronto artículos etiquetados con esa palabra.
  • Se está probando el filtro colaborativo, el cual se basa en lo que los lectores leen en común. El enfoque es atractivo cuando un lector tiene preferencias similares al de otro lector. Este método falla cuando se trata de recomendar algo recién publicado.

La nueva tecnología funciona así:

  • Se ha combinado las anteriores técnicas para construimos un algoritmo inspirado la Collaborative Topic Modeling (CTM), los modelos de contenidos, el ajuste de este modelo mediante la visualización de las señales de los lectores,  la preferencia de los modelos de los lectores y las recomendaciones por similitud entre preferencias y contenidos.
  • El algoritmo comienza mediante el modelado de cada artículo como una mezcla de los temas que aborda.
  • Se presenta la información a cada lector basado en sus preferencias temáticas.

El reto tiene tres partes más para el equipo:

Parte 1: Cómo modelar un artículo basado en su texto.
Parte 2: Cómo actualizar el modelo basado en los patrones de lectura del público.
Parte 3: Cómo describir a los lectores basados en su historial de lectura.

En conclusión, al modelar el contenido del artículo y las preferencias del lector con temas y realizar ajustes sobre la base de patrones de lectura, se ha reconceptualizado el motor de recomendaciones del NYT.

“Nuestro sistema es ahora una exitosa implementación a gran escala de investigación de vanguardia en el modelado de temas colaborativos, y proporciona incrementos en el rendimiento a comparación con los anteriores algoritmos utilizados para hacer recomendaciones”, escribe el grupo.

Vía NYT.

Publicado por:

Sígueme

COMPATIR EN REDES

NOTICIAS RELACIONADAS

Diario vende las fotos de los reporteros gráficos que despidió

El Chicago Sun-Times, diario estadounidense que despidió a todo sus reporteros gráficos en mayo pasado, sigue siendo cuestionado, pero esta vez enfrenta duras críticas por poner todo su archivo fotográfico en venta.

16-10-13

Vox experimenta republicando artículos antiguos que son actualizados

Vox quiere ser un mejor lugar para realizar coberturas, escribir y usar código. Por eso lanzó un pequeño experimento por una semana con sus editores y redactores.

16-01-15

Google tiene 8 cursos online gratuitos que debes aprovechar

Google presentó ocho cursos virtuales desarrollados por prestigiosas universidades de España y que están al alcance de los usuarios de todo el mundo.

24-10-15

COMENTARIOS