Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10362/163569| Título: | Mining Software Model Repositories |
| Autor: | Lacão, Guilherme Ferreira |
| Orientador: | Goulão, Miguel |
| Palavras-chave: | UML Class Diagram Model Quality Factors Physics of Notations Mining Repositories Web Scraping Modelling |
| Data de Defesa: | Dez-2023 |
| Resumo: | Modelling languages in software development are crucial for capturing requirements
and representing software designs, architectures, and implementations. This dissertation
focuses on UML class diagrams, a modelling language widely adopted in object-oriented
software development.
The quality of UML class diagram models can significantly impact the quality of
the system they represent. Defects present in these models can hinder stakeholder
understanding, introduce unnecessarycomplexity, and propagate to the developed system,
leading to increased costs. Therefore, understanding the most common defects present in
these diagrams is crucial.
Further, with the growth of publicly available repositories, a wealth of valuable information,
including UML class diagrams, is accessible. This presents an opportunity to
study a large number of models extracted from these repositories.
In this dissertation, we present an automated evaluation tool to assess a dataset
consisting of 103,103 UML class diagrams to identify the defects present in these diagrams.
The creation of this dataset involved the development of a web scraping tool designed to
extract UML class diagrams from public repository projects. The principles of the Physics
of Notations proposed by Moody and the principles of diagram size and diagram flaws
proposed by Störrle are incorporated into the automated evaluation tool to identify defects.
This allowed us to analyse how UML class diagrams available in public repositories are
built "in the wild", and to detect which are the most frequent violations of the modelling
principles proposed by Moody and Störrle. As linguagens de modelação no desenvolvimento de software são cruciais para capturar requisitos e na representação de designs, arquiteturas e implementações de software. A presente dissertação foca-se nos diagramas de classes UML,uma linguagem de modelação amplamente adotada no desenvolvimento de software orientado a objetos. A qualidade dos modelos de diagrama de classes UML pode impactar significamente a qualidade do sistema que estes representam. Defeitos presentes nestes modelos podem dificultar a compreensão dos stakeholders, introduzir complexidade desnecessária e propagar-se para o sistema desenvolvido, levando ao aumento de custos. Portanto, compreender os defeitos mais comuns presentes nestes diagramas é crucial. Além disso, com o crescimento de repositórios publicamente disponíveis, uma vasta quantidade de informações valiosas, incluindo diagramas de classes UML, está acessível. Oferecendo, deste modo, a oportunidade de estudar um grande número de modelos extraídos destes repositórios. Nesta dissertação, é apresentada uma ferramenta de avaliação automatizada para avaliar um dataset composto por 103,103 diagramas de classes UML, a fim de identificar defeitos presentes nestes diagramas. A criação deste dataset envolveu o desenvolvimento de uma ferramenta de web scraping projetada para extrair diagramas de classes UML de projetos de repositórios públicos. Os princípios da Physics ofNotations propostos porMoody e os princípios de diagram size e diagram flaws propostos por Störrle são incorporados na ferramenta de avaliação automatizada para identificar defeitos. Isto permitiu-nos analisar como os diagramas de classes UML disponíveis em repositórios públicos são construídos “in the wild”, e detetar quais são as violações mais frequentes dos princípios de modelação propostos por Moody e Störrle. |
| URI: | http://hdl.handle.net/10362/163569 |
| Designação: | MASTER IN COMPUTER SCIENCE |
| Aparece nas colecções: | FCT: DI - Dissertações de Mestrado |
Ficheiros deste registo:
| Ficheiro | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Lacao_2023.pdf | 4,44 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.











