No te pierdas las noticias de la industria de las redes sociales de mañana
Publicado: 2023-04-01Tal como lo prometió el jefe de Twitter, Elon Musk, a principios de este mes, hoy, Twitter publicó su código de algoritmo de recomendación en GitHub para que todos lo vean, mientras que también publicó una nueva descripción general de cómo funciona su algoritmo de recomendación de tweets, brindando nuevos conocimientos sobre lo que dicta el orden. en el que se muestran los tweets.

Como explica Twitter:
“ En GitHub , encontrará dos repositorios nuevos ( repositorio principal , repositorio ml ) que contienen el código fuente de muchas partes de Twitter, incluido nuestro algoritmo de recomendaciones, que controla los Tweets que ve en la línea de tiempo Para usted. Para este lanzamiento, buscamos el mayor grado posible de transparencia, al tiempo que excluimos cualquier código que pudiera comprometer la seguridad y privacidad del usuario o la capacidad de proteger nuestra plataforma de los malos actores, lo que incluye socavar nuestros esfuerzos para combatir la explotación y manipulación sexual infantil”.
También es importante tener en cuenta que Twitter no tiene la información de ponderación conectada a cada elemento, es decir, cuánto énfasis recibe cada factor para impulsar los resultados de salida finales.
Así que no son todos los detalles, pero proporciona información de alto nivel sobre cómo funcionan los algoritmos de Twitter, mientras que Twitter también proporciona una explicación más sencilla del sistema, para ayudar a las personas a comprender cómo decide lo que verá en su línea de tiempo cada momento de abrir la aplicación.
Según Twitter:
“ La base de las recomendaciones de Twitter es un conjunto de modelos y funciones centrales que extraen información latente de los datos de Tweet, usuario y participación. Estos modelos tienen como objetivo responder preguntas importantes sobre la red de Twitter, como "¿Cuál es la probabilidad de que interactúes con otro usuario en el futuro?" o “¿Cuáles son las comunidades en Twitter y cuáles son los Tweets de moda dentro de ellas?”Responder estas preguntas con precisión permite a Twitter ofrecer recomendaciones más relevantes.”
Ese último elemento es importante y se alinea con lo que Ryan Broderick de Garbage Day había encontrado en sus experimentos para probar lo que ahora gana tracción a través de tweets.
Como lo resume Broderick:
“Twitter está utilizando subreddits invisibles a través de Temas para organizar algorítmicamente los tweets. Debido a que la página Para ti ya no es cronológica, los tuits virales ya no pueden ser tan oportunos como solían ser. Tienen que ser una especie de hoja perenne. Ayuda si están comentando algo que ya se está volviendo viral. Y realmente ayuda si publica un hilo, se responde a sí mismo o crea algún tipo de discusión en las respuestas. También parece haber un mayor énfasis en el video ahora. ”
Resulta que Ryan tenía razón: Twitter ahora busca promover más tweets en el feed 'Para ti' según el compromiso temático, que Twitter define a nivel de cuenta, al filtrar ciertas cuentas en categorías de temas y luego usar eso como una guía para categorizar. el tema probable de cada uno de sus tweets.

Según Twitter:
“ Uno de los espacios de integración más útiles de Twitter es SimClusters . SimClusters descubre comunidades ancladas por un grupo de usuarios influyentes utilizando un algoritmo de factorización de matriz personalizado . Hay 145k comunidades, que se actualizan cada tres semanas. Las comunidades varían en tamaño desde unos pocos miles de usuarios para grupos de amigos individuales hasta cientos de millones de usuarios para noticias o cultura pop. Cuanto más les guste un Tweet a los usuarios de una comunidad, más se asociará ese Tweet con esa comunidad”.

La imagen de arriba muestra algunas de las 'comunidades' de Twitter más grandes, o colecciones temáticas basadas en el filtrado algorítmico de Twitter.
Twitter dice que este enfoque se ha convertido en un factor clave para decidir qué tweets 'fuera de la red' insertar en su feed 'Para usted', o qué tweets mostrarle de cuentas que no sigue. Y con más y más de estas recomendaciones que se insertan en los feeds de los usuarios, se ha convertido en un mayor impulsor de la exposición de los tweets, aunque eso volverá a cambiar pronto, cuando Twitter restrinja aún más las recomendaciones 'Para ti' a solo tweets de cuentas de suscriptores de pago.
En este momento, nadie sabe cómo impacta eso en la experiencia de Twitter, pero transformará fundamentalmente el feed 'Para ti', al menos, al limitar el grupo de tweets fuente de los que Twitter puede extraer.
Y si las celebridades, en particular, no pagan o dejan de twittear como resultado, ese impacto podría ser significativo.
Esta es la revelación más significativa de la descripción algorítmica de Twitter, aunque hay varias otras notas y puntos interesantes incluidos en la documentación:
- Por cada sesión de usuario, Twitter extrae alrededor de 1500 tuits que cree que pueden ser de interés para cada persona, antes de clasificarlos en el feed 'Para ti'.
- La línea de tiempo Para ti actualmente consiste en un 50 % de Tweets dentro de la red (personas a las que sigues) y un 50 % de Tweets fuera de la red, en promedio.
- Twitter también predice la probabilidad de compromiso entre dos usuarios. 'Cuanto mayor sea la puntuación de Real Graph entre usted y el autor del tuit, más tuits suyos incluiremos'
- Otro factor son los tweets con los que interactúan las personas a las que sigues, lo cual no es una revelación, solo un punto a tener en cuenta.
- La clasificación de los tuits se lleva a cabo a través de una 'red neuronal de parámetros de ~48 millones que se entrena continuamente en las interacciones de los tuits para optimizar la participación positiva (por ejemplo, me gusta, retuits y respuestas)'. Sin embargo, no hay ninguna nota sobre cómo Twitter determina la interacción positiva frente a la negativa en este contexto.
Eso proporciona un contexto interesante sobre cómo Twitter busca clasificar los tweets y maximizar la exposición dentro de la fuente principal 'Para ti', aunque nuevamente, esto cambiará el 15 de abril, cuando Twitter cambiará para mostrar solo tweets de usuarios que pagan en sus recomendaciones 'Para ti'.
Lo que, de alguna manera, hace que gran parte de esta idea sea redundante, aunque supongo que si la teoría de trabajo es que, eventualmente, la mayoría de los usuarios pagarán, entonces podría seguir siendo indicativo durante algún tiempo.
Excepto que no lo harán.
Menos del 1 % de los usuarios de Twitter están pagando actualmente por Twitter Blue, y aunque la decisión de eliminar las marcas azules 'heredadas' y revertir el proceso de clasificación 'Para ti' impulsará una aceptación adicional, parece poco probable que haga que Twitter Blue una consideración importante para la gran mayoría de los usuarios de Twitter.
Supongo que el otro elemento a tener en cuenta a este respecto es que la gran mayoría de los tweets provienen de muy pocos usuarios, y la mayoría de los perfiles de Twitter rara vez tuitean ellos mismos. Tal vez, entonces, Twitter solo necesita una colección más pequeña de usuarios para registrarse en Blue para que sea un elemento más significativo en la clasificación de tweets. Pero todavía parece poco probable que produzca mejores resultados al resaltar el contenido más relevante de toda la aplicación.
Independientemente, parece que Twitter está avanzando, y ahora, los desarrolladores externos tienen más información sobre cómo funciona el algoritmo de Twitter, lo que conducirá a una nueva avalancha de ideas y sugerencias sobre cómo jugar con el sistema.
La esperanza de Twitter es que también lo ayude a mejorar sus algoritmos rápidamente. Tal vez eso suceda también. Tendremos que esperar y ver.