O controlador de tráfego desenvolvido pela Tencent Cloud reduz a latência pela metade
Sigcomm 2024 A gigante chinesa da web Tencent revelou o MegaTE, um sistema de engenharia de tráfego que ela usa em sua própria nuvem e que, segundo ela, supera os rivais ao adaptar o desempenho da rede às necessidades dos fluxos individuais.
A papel detalhando o MegaTE foi apresentado hoje na conferência SIGCOMM da Association for Computing Machinery em Sydney, Austrália, pelo pesquisador sênior da Tencent Congcong Miao. Ele explicou que máquinas virtuais em ambientes de nuvem normalmente interagem com um corretor de largura de banda que encontra um caminho ótimo e tenta atribuir os recursos mais apropriados para fazer o tráfego se mover.
Isso não é eficiente em uma nuvem de hiperescala, ele afirmou, porque os aplicativos precisam de redes para atender às suas necessidades específicas – seja devido à natureza da carga de trabalho ou aos níveis de serviço prometidos por uma operadora de nuvem.
As ferramentas de engenharia de tráfego (TE) atuais – Miao chamou de scFLOW e TEAL (Engenharia de Tráfego Acelerada pelo Aprendizado) – não foram projetadas para atender às necessidades de cada fluxo.
O MegaTE, por outro lado, pode “satisfazer as necessidades de cada fluxo de tráfego granular no nível da instância virtual”.
Miao explicou que a ferramenta não assume que é possível decidir arbitrariamente qual fluxo de tráfego entre dois endpoints precisará. Em vez disso, os endpoints executam um agente que aproveita o Berkeley Packet Filter (eBPF) – tecnologia que permite que o código seja executado em sandboxes dentro do kernel Linux. Esse agente coleta tráfego para criar dados de fluxo que são eventualmente compartilhados com um controlador que calcula um caminho de rede ideal. Esse cálculo é enviado de volta ao agente, que o armazena em um “mapa eBPF” para que as necessidades do aplicativo possam ser anunciadas e atendidas.
O MegaTE também está ciente das topologias de rede.
Os pacotes que saem de um ponto de extremidade nublado incluem informações de roteamento, o que significa que sua passagem pela rede já foi planejada e deve ser mais tranquila.
O resultado, Miao disse na conferência, é que aplicativos de alta prioridade podem atender aos acordos de nível de serviço. A Tencent o usa em produção e aparentemente reduziu a latência de pacotes na WAN em 51%. Miao afirmou que a ferramenta conseguiu isso ao lidar com mais de 20.000 fluxos por vez — muito mais do que é possível com scFLOW ou TEAL.
Miao observou que as métricas que ele mencionou refletem o desempenho das cargas de trabalho da própria Tencent, e não os resultados para os locatários do Tencent Cloud.
Mas a economia que ele mencionou provavelmente será muito significativa para a Tencent. Seus serviços WeChat e Weixin têm mais de 1,5 bilhão de usuários e seus serviços de streaming de vídeo e música ostentam mais de 100 milhões de assinantes cada. A empresa também administra a segunda maior loja de aplicativos da China e é uma editora e operadora de jogos colossal. A Nuvem da Tencent abrange sete regiões e 31 zonas de disponibilidade na China e Hong Kong, além de outras onze regiões e 22 zonas de disponibilidade em outros países.
A gigante provavelmente opera milhões de servidores e uma WAN substancial para conectá-los todos – tornando o impacto potencial do MegaTE enorme. ®