Logo do repositório
 
A carregar...
Miniatura
Publicação

Mining Software Model Repositories

Utilize este identificador para referenciar este registo.
Nome:Descrição:Tamanho:Formato: 
Lacao_2023.pdf4.33 MBAdobe PDF Ver/Abrir

Orientador(es)

Resumo(s)

Modelling languages in software development are crucial for capturing requirements and representing software designs, architectures, and implementations. This dissertation focuses on UML class diagrams, a modelling language widely adopted in object-oriented software development. The quality of UML class diagram models can significantly impact the quality of the system they represent. Defects present in these models can hinder stakeholder understanding, introduce unnecessary complexity, and propagate to the developed system, leading to increased costs. Therefore, understanding the most common defects present in these diagrams is crucial. Further, with the growth of publicly available repositories, a wealth of valuable in- formation, including UML class diagrams, is accessible. This presents an opportunity to study a large number of models extracted from these repositories. In this dissertation, we present an automated evaluation tool to assess a dataset consisting of 103,103 UML class diagrams to identify the defects present in these diagrams. The creation of this dataset involved the development of a web scraping tool designed to extract UML class diagrams from public repository projects. The principles of the Physics of Notations proposed by Moody and the principles of diagram size and diagram flaws proposed by Störrle are incorporated into the automated evaluation tool to identify defects. This allowed us to analyse how UML class diagrams available in public repositories are built "in the wild", and to detect which are the most frequent violations of the modelling principles proposed by Moody and Störrle.
As linguagens de modelação no desenvolvimento de software são cruciais para capturar requisitos e na representação de designs, arquiteturas e implementações de software. A presente dissertação foca-se nos diagramas de classes UML, uma linguagem de modelação amplamente adotada no desenvolvimento de software orientado a objetos. A qualidade dos modelos de diagrama de classes UML pode impactar significamente a qualidade do sistema que estes representam. Defeitos presentes nestes modelos po- dem dificultar a compreensão dos stakeholders, introduzir complexidade desnecessária e propagar-se para o sistema desenvolvido, levando ao aumento de custos. Portanto, compreender os defeitos mais comuns presentes nestes diagramas é crucial. Além disso, com o crescimento de repositórios publicamente disponíveis, uma vasta quantidade de informações valiosas, incluindo diagramas de classes UML, está acessível. Oferecendo, deste modo, a oportunidade de estudar um grande número de modelos extraídos destes repositórios. Nesta dissertação, é apresentada uma ferramenta de avaliação automatizada para avaliar um dataset composto por 103,103 diagramas de classes UML, a fim de identificar defeitos presentes nestes diagramas. A criação deste dataset envolveu o desenvolvimento de uma ferramenta de web scraping projetada para extrair diagramas de classes UML de projetos de repositórios públicos. Os princípios da Physics of Notations propostos por Moody e os princípios de diagram size e diagram flaws propostos por Störrle são incorporados na ferramenta de avaliação automatizada para identificar defeitos. Isto permitiu-nos analisar como os diagramas de classes UML disponíveis em repositórios públicos são construídos “in the wild”, e detetar quais são as violações mais frequentes dos princípios de modelação propostos por Moody e Störrle.

Descrição

Palavras-chave

UML Class Diagram Model Quality Factors Physics of Notations Mining Repositories Web Scraping Modelling

Contexto Educativo

Citação

Projetos de investigação

Unidades organizacionais

Fascículo

Editora

Licença CC