Logo do repositório
 
A carregar...
Miniatura
Publicação

Monitoring in Cloud and Edge Systems

Utilize este identificador para referenciar este registo.
Nome:Descrição:Tamanho:Formato: 
Capitao_2024.pdf2.77 MBAdobe PDF Ver/Abrir

Orientador(es)

Resumo(s)

Distributed systems monitoring is critical to ensuring the reliability, availability, and performance of complex systems; some of the main features are the early identification and resolution of issues before they turn critical, pinpointing possible bottlenecks, and possible optimizations in terms of performance and scalability. These aspects are especially prominent in Cloud infrastructures or Edge-based systems. Due to the growth in the number of edge devices, new problems are emerging. The number of monitored targets has increased exponentially across different regions of the globe, creating an overload of data sent to a central node, thus, leading to bandwidth bottlenecking and an increase in latency. There is also an excess of information and metadata in the collected monitored data, which leads to issues when browsing through said data. The main goal is to reduce the amount of data traffic and bandwidth usage when monitoring those systems while not only having information in the metrics collected about where said metrics are coming from and what services they are associated with but also allowing for low-latency alerts to be sent from an edge level. With this solution, it is expected that the collected metrics will be more eco- nomical, organized in terms of size, and provide additional critical information, thus reducing bandwidth usage and better analysis of said metrics.
A monitorização de sistemas distribuídos é crítica para garantir confiabilidade, disponibilidade e performance em sistemas complexos; algumas das principais características são a identificação e resolução atempada de erros antes que escalem negativamente, apontando possíveis bottlenecks, otimizações de performance e escalabilidade. Estes aspectos são especialmente relevantes em infraestruturas Cloud ou sistemas baseados em Edge. Devido ao crescimento de dispositivos Edge, novos problemas emergem. O número de dispositivos monitorizados aumentou exponencialmente nas várias regiões do mundo, criando uma sobrecarga de dados enviados para um nó central, o que provoca bottlenecks de bandwidth e aumento da latência. Existe também um excesso de metadados e informação nos dados coletados, o que causa problemas ao navegar pelos mesmos. O objetivo principal é reduzir a quantidade de tráfego e uso de bandwidth ao monitorizar esses sistemas, ao mesmo tempo em que se tem informações nas métricas coletadas sobre a origem das mesmas e a quais serviços ou aplicações a que estão associadas, além de permitir que alertas sejam enviados com baixa latência a partir de um nível de Edge ao invés de ter de chegar ao nó central. Com esta solução, espera-se que as métricas coletadas sejam mais económicas e organizadas em termos de quantidade e que as mesmas forneçam informações adicionais, reduzindo o uso de bandwidth, levando uma melhor análise das mesmas.

Descrição

Palavras-chave

Monitoring Cloud Edge Fog Prometheus VictoriaMetrics

Contexto Educativo

Citação

Projetos de investigação

Unidades organizacionais

Fascículo

Editora

Licença CC