Pular para o conteúdo

Saiba como funciona o algoritmo de recomendação do Twitter

Rede social usa seu like para recomendar conteúdo de perfis que você não segue

Saiba como funciona o algoritmo de recomendação do Twitter

Elon Musk pode ter feito um monte de patacoadas no Twitter – como encerrar o acesso gratuito à sua API e forçar o encerramento de muitos aplicativos e monitoramentos – mas sobre uma coisa ele merece o crédito: ele entrega o que promete.

A mais recente entrega foi a abertura dos códigos e fórmulas do algoritmo de recomendação da plataforma na aba For You, divulgados no GitHub nesta sexta-feira.

EXPLICA MAIS. É muito complexo fazer uma análise precisa desse código de forma independente em pouco tempo, então vamos ao que a empresa falou no post em seu blog de engenharia.

O algoritmo utiliza uma base de 500 milhões de tweets publicados diariamente para montar a página For You, aplicando um funil com três elementos principais:

SELEÇÃO DE CANDIDATOS

O processo de candidate sourcing tenta retornar os principais 1.500 tweets dentre milhões de postagens, valendo-se da rede quem você segue, mas também de perfis que você não segue, em uma proporção de 50% para cada lado.

RECOMENDAÇÕES DENTRO DA REDE. Um componente importante é a análise da probabilidade de interação entre dois usuários, a partir de um modelo chamado Real Graph, desenvolvido pelo próprio Twitter. A empresa publicou um estudo em 2014 sobre isso.

A grosso modo, a funcionalidade desse modelo é baseada em três elementos principais:

RECOMENDAÇÕES FORA DA REDE. Para achar recomendações de tweets e perfis que um usuário não segue, são utilizadas duas abordagens:

A resposta a essas duas perguntas gera tweets que podem abastencer sua timeline e, ocasionalmente, lhe fazer questionar porque diabos você está vendo aquilo.

Há também um grupo de usuários influentes, espalhados em 145 mil comunidades (cada um pode estar em mais de uma), cujos tweets também são servidos no seu feed. "Quanto mais usuários de uma comunidade curtirem um tweet, mais aquele tweet será associado àquela comunidade", diz o post.

Maiores comunidades do Twitter. Divulgação/Twitter

Rankeamento

Após esse processo, sobram cerca de 1.500 tweets que podem aparecer no seu feed, e o algoritmo vai pra fase de rankeamento, que vai definir a prioridade em que esses posts vão ser mostrados.

"Neste estágio, todos os (tweets) candidatos são tratados igualmente, sem levar em conta a fonte originária", diz o post.

Esse rankeamento é baseado em um rede neural de 48 milhões de parâmetros, à qual é otimizada para atrair engajamento positivo (tipo likes, retweets e respostas), e aplicar uma "nota" para cada tweet a partir da probabilidade de engajamento entre o usuário e aquele conteúdo.

Filtros

Por fim, o algoritmo aplica uma série de filtros, entre eles:

Resultado

A partir dessas etapas, os tweets selecionados podem ser mostrados na linha do tempo de um usuário, com a inclusão de anúncios e outras recomendações.

Via Twitter (no Github e no blog)

Sérgio Spagnuolo

Sérgio Spagnuolo

Jornalista e diretor do Núcleo. Em 2014, criou a agência de newstech Volt Data Lab. Foi Knight Fellow no ICFJ e diretor na Abraji, além de ter colaborado com vários veículos nacionais e internacionais

Todos os artigos

Mais em Jogo Rápido

Ver tudo

Mais de Sérgio Spagnuolo

Ver tudo