La API de Topics según las pruebas de Criteo

Google anunció a finales de julio que tiene la intención de comenzar a eliminar gradualmente las Third-Party Cookies para su navegador Chrome en la segunda mitad de 2024. Como sabrás, la solución que Google lanzó en 2019 es Privacy Sandbox. Desde el principio de esta iniciativa, Criteo ha participado activamente en varias fases de prueba de su Privacy Sandbox, incluyendo la primera "Prueba de Origen" en 2021. Durante esta primera prueba, compartieron sus comentarios sobre la FloC API, que finalmente fue descartada por Google, el 13 de julio de 2021.

En 2022, Google lanzó una nueva serie de "Origin Trials" en varias propuestas de Privacy Sandbox. Como proveedor líder de soluciones tecnológicas publicitarias basadas en el rendimiento para propietarios de medios y comercializadores, Criteo se comprometió a probar las propuestas que podrían respaldar las funciones básicas de la publicidad en la open web, entre ellas:

  • La creación de audiencias y la segmentación, con las APIs FLEDGE y Topics.

  • Atribución y medición, con la Attribution Reporting API.

El objetivo de Criteo era probar el Privacy Sandbox de Google para medir y maximizar el valor entregado a los anunciantes y publishers. Para ello, se quería cuantificar la utilidad de las API en comparación con las soluciones de statu quo impulsadas por Third-Party Cookies. Para cada API Criteo ha estudiado rigurosamente las repercusiones previsibles en publishers y anunciantes, para compartir los resultados objetivos y ofrecer recomendaciones para ayudar a mejorar las propuestas y dar forma al éxito del Privacy Sandbox.

Una de las principales soluciones propuestas por Google es Topics API, que pretende permitir la segmentación por intereses de los anuncios en la open web una vez que Google deje de admitir las Third-Party Cookies. La documentación de Topics define la publicidad basada en intereses de la siguiente manera:

"La publicidad basada en intereses (IBA) es una forma de publicidad personalizada en la que se selecciona un anuncio para el usuario en función de los intereses derivados de los sitios que ha visitado en el pasado. Es diferente de la publicidad contextual, que se basa únicamente en los intereses derivados del sitio que se está viendo (y en el que se anuncia). Una de las ventajas de la IBA es que permite que los sitios que son útiles para el usuario, pero que quizá no podrían monetizarse fácilmente mediante la publicidad contextual, muestren anuncios más relevantes para el usuario de lo que podrían hacerlo de otro modo, ayudando a financiar los sitios que el usuario visita".

En este artículo se describe el proceso de pruebas de Criteo en torno a la relevancia de Topics. En concreto, les interesaba evaluar cómo Topics puede permitir a los anunciantes crear audiencias basadas en intereses, tal y como se hace actualmente con las Third-Party Cookies. Es importante mencionar que esta es la primera versión de la API de Topics y que habrá espacio para muchas iteraciones y mejoras. El objetivo es compartir las primeras conclusiones de Criteo sobre la primera iteración de temas para ayudar a mejorar la propuesta.

Resumen

Criteo ha implementado la API de temas de Google para la publicidad basada en intereses en la open web sin Third-Party Cookies. Comenzaron las pruebas en junio y Google abrió el tráfico al 1% de la versión estable de Chrome en los ordenadores de sobremesa en agosto, y en los móviles Android en septiembre. Ahora están observando cerca de un millón de usuarios diarios con etiquetas temáticas y pueden ofrecer su primera evaluación del valor de esta señal en el presente artículo.

Tras unos meses de recopilación de datos en relación con Topics API, identificaron algunas limitaciones en la capacidad de la solución para emular audiencias basadas en intereses sin el uso de Third-Party Cookies. En general, observaron que las audiencias basadas en intereses de Criteo son cinco veces más relevantes que las generadas por esta primera iteración de la Topics API. Aunque Criteo continuará realizando experimentos para evaluar el impacto de esto en los vendedores (ROI) y en los publishers (ingresos), se puede anticipar un impacto negativo para ambos considerando la caída en la relevancia de la audiencia.

Por ello creen que las siguientes mejoras, si se ponen en práctica, podrían aumentar la relevancia y la utilidad de los temas para la publicidad basada en intereses:

  • Utilizar una taxonomía más detallada y completa, con especial atención a los temas comercialmente relevantes.

  • Identificar los temas más frecuentes por usuario en comparación con la población general

  • Clasificar la web de forma más granular teniendo en cuenta la URL y el contenido de la página

  • Acortar la duración de las épocas para destacar los temas vistos recientemente

También son conscientes de que las señales que proporciona Topics API podrían tener una mayor utilidad si se combinan con otras señales, como los First-Party Data y la información contextual, y esto será objeto de su futura experimentación.

El compromiso de Criteo ha sido y seguirá siendo el de realizar pruebas y proporcionar comentarios constructivos para que Google, el sector, los profesionales del marketing y los propietarios de los medios puedan actuar y adaptarse positivamente a este próximo cambio.

Topics API

Topics API está pensada para potenciar la publicidad basada en intereses en la open web, deduciendo los principales intereses (o temas) de un usuario y poniendo esos temas a disposición de cualquier comercializador. Para ello, Google clasifica los sitios web en uno o varios temas de esta taxonomía mediante una combinación de clasificación manual y automatizada. A continuación, cada semana (época), y durante un total de tres semanas, Google recupera los cinco temas más frecuentes de un usuario basándose en su historial de navegación. Por último, la comunidad publicitaria de players (publishers, anunciantes, DSPs, SSPs, etc.) que llamen a Topics API en un determinado sitio web podrán recuperar, como máximo, uno de los temas por época, hasta un máximo de tres temas. Estos temas recuperados pueden utilizarse para la publicidad basada en intereses.

Figura 1: Flujo de Topics API (Fuente Elias Selman, Criteo)

Lo que Criteo observó en las pruebas iniciales

Poco después de que Google anunciara el despliegue de la prueba del origen de Topics, Criteo reaccionó con un enfoque práctico para implementar y empezar a probar. Comenzaron a registrar los primeros eventos que contenían temas de los usuarios en junio y vieron volúmenes significativos cuando Google abrió el tráfico al 1% de la versión estable de Chrome en agosto.

La figura 2 ilustra la evolución del número de usuarios con Topics en el último mes. Vemos que el tráfico se disparó a principios de septiembre y, a día de hoy, observamos más de un millón de usuarios diarios distintos por sitio que contienen al menos una etiqueta de Topics, lo que ha sido suficiente para redactar las primeras conclusiones.

Figura 2: Evolución de los usuarios etiquetados por Topics (Fuente Elias Selman, Criteo)

Tras el aumento del volumen de Topics, ya pudieron visualizar los Topics más comunes observados por los anunciantes y publishers con los que están integrados. Su primera observación, ilustrada en la figura 3, muestra que más del 60% de los Topics observados pertenecen al nivel 1, la categoría más general dentro de la taxonomía, que contiene sólo 24 Topics en total.

FIGURA 3: Distribución de Topics por nivel de taxonomía (Fuente Elias Selman, Criteo)

Además, los tres principales Topics de nivel 1 observados son "Arte y entretenimiento", "Noticias" y "Compras". Si incluimos "Comunidades online", que es el noveno Topic de nivel 1 más observado, observamos que casi la mitad de todos los Topics observados no están relacionados con información comercialmente valiosa sobre lo que podría interesar al comportamiento de compra de un usuario.

Figura 4: Proporción de Topics observados (Fuente Elias Selman, Criteo)

Este fenómeno es una consecuencia directa de tres importantes características de Topics API:

En primer lugar, la taxonomía actual, que contiene 349 Topics, carece de algunos Topics muy relevantes relacionados con el comercio, como los zapatos y los vestidos. Afortunadamente, Google ya ha compartido con Criteo que se trata sólo de una taxonomía de prueba y que tiene previsto mejorarla y enriquecerla en los próximos meses, algo que seguiremos de cerca. A medida que Google ponga a disposición una taxonomía más granular, Criteo volverá a probar la solución para comprender el impacto.

En segundo lugar, el mecanismo de asignación de Topics a los usuarios rara vez selecciona temas de nicho. Como se ha mencionado anteriormente, Google asigna los 5 temas principales por los que ha navegado un usuario durante los últimos 7 días utilizando la frecuencia absoluta. Descubrimos que este enfoque tiende a favorecer las categorías de interés más populares y amplias, como "Compras", "Comunidades online" (medios sociales) o "Noticias". Por el contrario, rara vez se observan temas más especializados, como "Alquiler de coches", que son señales más definitivas que suelen asociarse con intenciones de comercio inmediato y, por tanto, son más valiosas desde el punto de vista comercial.

Por último, la tercera razón es el propio clasificador de Topics. A continuación se analiza con más detalle.

Modelo del clasificador de Topics

La importancia de las señales de la URL y del contenido de la página

Para evaluar el clasificador de Topics, lo comparamos con el clasificador de Criteo, que se utiliza principalmente para predecir el tema y el sentimiento de los contenidos de las páginas web de los publishers. Su clasificador utiliza técnicas de procesamiento del lenguaje natural para interpretar una URL y, cuando se permite, un rastreador extrae el contenido principal de la página.

TABLA 1: Clasificador de temas frente al clasificador de Criteo (Fuente Elias Selman, Criteo)

Una de las limitaciones del clasificador de Topics de Google es que sólo tiene en cuenta el nombre de host (incluyendo el dominio y el subdominio) del sitio web para su clasificación. Esto significa que, incluso si el usuario está navegando por una sección de deportes dentro de una tienda de venta masiva, el clasificador sólo tendrá en cuenta el nombre de host y, por tanto, dará como resultado "Compras" como tema principal para esa interacción. El cuadro 1 ilustra esta situación con ejemplos concretos de sitios web de anunciantes y publishers. Este es un punto relevante para la publicidad basada en intereses, ya que gran parte de la actividad en línea de un usuario se produce en subcategorías dentro de los sitios web de grandes retailers, publishers o redes sociales en general. En consecuencia, hay muchas señales sobre los intereses del usuario que temas no está captando.

Clasificación de los anunciantes

Para evaluar la calidad del clasificador de Topics, lo comparamos con la vertical de anunciantes de Criteo, una categoría asignada para cada anunciante. Para no tener en cuenta la limitación generada por la taxonomía de pruebas, sólo consideramos los verticales de anunciantes que tienen uno o más temas equivalentes (o similares) de nivel 1. La figura 5 muestra un mapa de calor que contiene la clasificación de temas correspondiente a cada vertical para los 1000 principales anunciantes de Criteo.

Figura 5: Distribución de los verticales de los anunciantes en los temas de Topics API (Fuente Elias Selman, Criteo)

Con la excepción de los verticales "B2B / Oficina", "CPG (Alimentación y Bebidas)" y "Juegos de Azar", observamos que los temas dominantes para cada vertical tienen sentido. Sin embargo, llama la atención que muchos verticales de anunciantes tienden a clasificarse significativamente dentro de los temas "Arte y entretenimiento" y "Noticias". Evidentemente, el predominio de estos temas, tal y como se muestra en la figura 4, podría explicarse en parte por el hecho de que estos temas son ampliamente navegados por los usuarios, y en parte por los falsos positivos mostrados en la figura 5.

Clasificación de los publishers

A continuación, comparamos el clasificador de publishers de Criteo y el clasificador de Topics en un conjunto de publishers conocidos.

TABLA 2: Clasificador de Topics frente al clasificador de Criteo en sitios de publishers (Fuente Elias Selman, Criteo)

Observamos que el rendimiento de Topics es relativamente similar al del clasificador de Criteo en sitios de publishers, a pesar de tener una taxonomía menos sofisticada.

Recomendación de Criteo para la siguiente fase del clasificador de Topics

Según el análisis, el clasificador de Topics asigna sistemáticamente el mismo tema a cada nombre de host. Sin embargo, el hecho de que el clasificador de temas sólo tenga en cuenta el nombre de host del sitio web supone una desventaja para la utilidad del modelo. La inclusión de ambos, la URL completa y el contenido de la página, generaría una mejora significativa en este sentido.

Evaluación de la relevancia de los temas de audiencia

Ahora entramos en materia. Aquí exploramos la relevancia de las audiencias basadas en temas para generar resultados efectivos para los profesionales del marketing en comparación con las soluciones existentes para la publicidad basada en intereses. Vale la pena señalar que la eliminación de las Third-Party Cookies tendrá sin duda un impacto en los modelos de puja predictiva utilizados en la publicidad programática. En esta sección, se centran exclusivamente en cómo la Topics API afecta a las capacidades de creación de audiencia del embudo superior del sector.

Actualmente, Criteo, al igual que muchos otros DSP’s, crea audiencias basadas en intereses y alimentadas por Third-Party Cookies, a las que llamamos audiencias de mercado. Su plataforma de compra para anunciantes se basa en múltiples funciones para calcular el interés comercial del usuario. Esto permite a los anunciantes elegir entre diferentes configuraciones de intereses y perfiles para construir una audiencia precisa basada en intereses. Por ejemplo, un anunciante puede decidir dirigirse a la audiencia "en el mercado para una marca de zapatos específica". Además, los anunciantes pueden mejorar estas audiencias utilizando modelos de aprendizaje automático que deduzcan el género o el poder adquisitivo del usuario. En general, existen las siguientes opciones de configuración, que pueden mezclarse y combinarse:

  • Categoría de comercio

  • Marca

  • Poder adquisitivo

  • Género

La eliminación de las Third-Party Cookies dificultará (si no imposibilitará) la creación de la mayoría de estas configuraciones de audiencia, ya que los temas sólo pueden replicar, hasta cierto punto, las audiencias In-Market que se basan exclusivamente en la categoría de comercio. Por lo tanto, como vemos en la Tabla 3, alrededor del 51% de los ingresos de los publishers son generados por audiencias que no son reproducibles con la versión actual de temas.

CUADRO 3: Parte de los ingresos de los publishers por tipo de audiencia en el mercado (Fuente Elias Selman, Criteo)

Es justo decir que la categoría es la más relevante de estas configuraciones. De hecho, las audiencias In-Market con al menos un filtro de categoría representan cerca del 92% de los ingresos de los publishers de audiencias In-Market. Lo que esto significa es que, aunque no podamos replicar la mayoría de las configuraciones, seguirá siendo muy beneficioso tener la capacidad de reproducir audiencias In-Market basadas en categorías utilizando audiencias basadas en temas. Y eso es exactamente lo que intentamos hacer en Criteo.

Audiencias In-Market de Criteo vs. Audiencias Basadas en Topics

Configuración del experimento

Dado el número limitado y la falta de granularidad de los temas relacionados con el comercio en la taxonomía actual de Topics, seleccionan sólo las categorías de comercio de Nivel 1 (aunque las más generales) dentro de sus configuraciones de audiencias In-Market que tienen un tema coincidente o similar. Éstas se detallan en la siguiente lista junto con su cuota de ingresos de los publishers.

TABLA 4: Equivalencia entre las audiencias basadas en temas y las audiencias In-Market de Criteo (Fuente Elias Selman, Criteo)

Su siguiente paso fue construir las audiencias adecuadas. En el caso de los temas, recuperaron todos los usuarios que tenían la etiqueta del tema respectivo en los últimos 7 días, mientras que para la audiencia In-Market consideraron la configuración más básica, una que sólo considera a los usuarios que navegaron por la categoría dada en los últimos 7 días. En su audiencia de referencia no se utilizaron técnicas de predicción ni de aprendizaje automático. Para que estas audiencias sean comparables, tomaron una muestra aleatoria de la audiencia In-Market para que coincidiera con el número de usuarios de la audiencia equivalente basada en temas.

Figura 7: Explicación de la relevancia de la audiencia (Fuente Elias Selman, Criteo)

Relevancia de la audiencia

Cuando un anunciante configura una campaña para entregarla a una audiencia interesada en una categoría determinada, busca captar a personas que probablemente seguirán navegando, interesándose o comprando dentro de esta categoría en los días siguientes.

Por lo tanto, definieron la relevancia de una audiencia como el número de eventos relevantes observados con posterioridad a la creación de la audiencia. Los eventos relevantes son las visitas orgánicas, las cestas y los eventos de compra asociados a los productos de la categoría seleccionada en la configuración de la audiencia. La figura 7 explica el cálculo de la relevancia para una audiencia de "Videojuegos".

FIGURA 6: Configuración del experimento de relevancia de la audiencia (Fuente Elias Selman, Criteo)

Resultados

En el siguiente figura, presentan el número de eventos relevantes en el periodo posterior de 3 días realizados por los usuarios dentro de las audiencias In-Market y temas de Criteo.

FIGURA 8: Relevancia de las audiencias In-Market de Criteo y las basadas en temas de Google (Fuente Elias Selman, Criteo)

Observamos que la solución actual de Criteo para la publicidad basada en intereses genera audiencias que son de media 5 veces más relevantes que las habilitadas por la versión actual de Topics API. Por ejemplo, en Electrónica, una categoría popular de In-Market: observamos 270 eventos posteriores relevantes por cada 1000 usuarios con la audiencia de temas, mientras que para la de In-Market registraron 830. Esto se traduce en un aumento de la relevancia de x3.

En este momento, no pueden cuantificar en qué se traduciría esta diferencia en la relevancia de la audiencia para los profesionales del marketing y los publishers, pero sin duda es algo a lo que les gustaría llegar en futuros experimentos. Su experiencia en la creación de audiencias les indica que es probable que los profesionales del marketing experimenten una considerable disminución de los resultados comerciales deseados en relación con las soluciones actuales basadas en Third-Party Cookies. Esto podría poner en riesgo a los publishers, ya que los comercializadores podrían desplazar el gasto a entornos no afectados por la depreciación de la señal.

Cansancio del usuario: "¡Deja de enseñarme los zapatos!"

Tener temas asignados sólo después de una semana, y con una duración de tres semanas, no es adecuado para captar las intenciones de compra de interés oportunas. Los estudios sobre la materia han demostrado ampliamente que la recencia de los eventos es muy importante en la capacidad de predicción de una audiencia. Con la excepción de los bienes duraderos caros (por ejemplo, los frigoríficos), las personas que compran por Internet suelen tener un recorrido de consumo corto: no es habitual que alguien pase 3 semanas buscando zapatos, por ejemplo. Esto obliga a los responsables de marketing a actuar con rapidez si quieren atraer a este comprador. Incluso si los tópicos captan perfectamente las intenciones del comercio, una muestra de publicidad motivada por un evento de navegación de hace 3 semanas probablemente será cualquier cosa menos ruido para el usuario.

Conclusión

Tras unos meses de recopilación de datos sobre la API de Topics, se han identificado algunas limitaciones en la capacidad de la solución para emular audiencias basadas en intereses sin el uso de Third-Party Cookies. Dado que éste es sólo el punto de partida de la propuesta de Topics, esperan y desean que se produzcan muchas mejoras gracias a las pruebas de utilidad y a los comentarios de todos los probadores. Hasta entonces, desde Criteo ofrecen una serie de mejoras que creen que tendrán un impacto positivo en la próxima iteración de esta utilidad API:

  • Utilizar una taxonomía más detallada y completa, con especial atención a los temas comercialmente relevantes: Los temas genéricos como "Compras" o "Noticias" carecen de valor comercial para fines publicitarios. La primera taxonomía de prueba es limitada y excluye muchas categorías comerciales relevantes que son esenciales para el negocio de la publicidad. Sugerimos una taxonomía de comercio más granular, como la taxonomía de productos de Google.

  • Identificar los temas más frecuentes por usuario en comparación con la población general: El proceso que define cómo se asignan los 5 temas principales a los usuarios tiende a favorecer los mismos temas genéricos y populares para la mayoría de los usuarios. Proponen implementar una frecuencia relativa que se ajuste a la popularidad general del tema dentro del país o región del usuario.

  • Incluir la URL y el contenido de la página en las características del clasificador de temas: El clasificador asigna categorías descriptivas a los nombres de host de anunciantes y publishers. Según la experiencia de Criteo en la creación de audiencias, están seguros de que tener en cuenta la URL y el contenido del sitio web como características en el clasificador permitirá una clasificación mucho más precisa de las páginas de los sitios web y, por tanto, mejorará la señalización dentro de los temas

  • Mejorar la puntualidad en la selección de temas. Como se ha demostrado, un comportamiento de hace una semana tiene una utilidad limitada para un anuncio online. Por lo tanto, propone que los temas se asignen al usuario después de los últimos 2 días de historial de navegación.

Confían en que, de aplicarse estas cuatro sugerencias, la relevancia de las audiencias basadas en temas mejoraría considerablemente.

Próximos pasos

Como hemos visto en este artículo, es probable que Topics API, por sí sola y en su forma actual, no responda adecuadamente a las necesidades de los profesionales del marketing en materia de publicidad basada en intereses. Pero es posible que esta solución, en combinación con otras señales, como las características contextuales, los First-Party Data y los proporcionados por FLEDGE y las API de medición, pueda ofrecer una alternativa valiosa.

El compromiso de Criteo es añadir continuamente complejidad a sus experimentos y analizar el rendimiento de las soluciones combinadas tan pronto como sea técnicamente posible. Agradecen la apertura de Google a los comentarios constructivos que hemos proporcionado sobre esta primera versión de Topics API. Seguirán realizando pruebas y proporcionando recomendaciones para que Google, el sector, los profesionales del marketing y los propietarios de los medios puedan actuar y adaptarse positivamente a este próximo cambio.

Fuente: Elias Selman, Product Data Scientist, en Criteo

Anterior
Anterior

El cofundador de Dmexco explica la idea que hay detrás de "Possible", la nueva conferencia sobre marketing, publicidad, tecnología y cultura

Siguiente
Siguiente

GroupM dice a los anunciantes que Twitter es una compra de medios de "alto riesgo”