Utilize este identificador para referenciar este registo: http://hdl.handle.net/10362/163569
Título: Mining Software Model Repositories
Autor: Lacão, Guilherme Ferreira
Orientador: Goulão, Miguel
Palavras-chave: UML Class Diagram
Model Quality Factors
Physics of Notations
Mining Repositories
Web Scraping
Modelling
Data de Defesa: Dez-2023
Resumo: Modelling languages in software development are crucial for capturing requirements and representing software designs, architectures, and implementations. This dissertation focuses on UML class diagrams, a modelling language widely adopted in object-oriented software development. The quality of UML class diagram models can significantly impact the quality of the system they represent. Defects present in these models can hinder stakeholder understanding, introduce unnecessarycomplexity, and propagate to the developed system, leading to increased costs. Therefore, understanding the most common defects present in these diagrams is crucial. Further, with the growth of publicly available repositories, a wealth of valuable information, including UML class diagrams, is accessible. This presents an opportunity to study a large number of models extracted from these repositories. In this dissertation, we present an automated evaluation tool to assess a dataset consisting of 103,103 UML class diagrams to identify the defects present in these diagrams. The creation of this dataset involved the development of a web scraping tool designed to extract UML class diagrams from public repository projects. The principles of the Physics of Notations proposed by Moody and the principles of diagram size and diagram flaws proposed by Störrle are incorporated into the automated evaluation tool to identify defects. This allowed us to analyse how UML class diagrams available in public repositories are built "in the wild", and to detect which are the most frequent violations of the modelling principles proposed by Moody and Störrle.
As linguagens de modelação no desenvolvimento de software são cruciais para capturar requisitos e na representação de designs, arquiteturas e implementações de software. A presente dissertação foca-se nos diagramas de classes UML,uma linguagem de modelação amplamente adotada no desenvolvimento de software orientado a objetos. A qualidade dos modelos de diagrama de classes UML pode impactar significamente a qualidade do sistema que estes representam. Defeitos presentes nestes modelos podem dificultar a compreensão dos stakeholders, introduzir complexidade desnecessária e propagar-se para o sistema desenvolvido, levando ao aumento de custos. Portanto, compreender os defeitos mais comuns presentes nestes diagramas é crucial. Além disso, com o crescimento de repositórios publicamente disponíveis, uma vasta quantidade de informações valiosas, incluindo diagramas de classes UML, está acessível. Oferecendo, deste modo, a oportunidade de estudar um grande número de modelos extraídos destes repositórios. Nesta dissertação, é apresentada uma ferramenta de avaliação automatizada para avaliar um dataset composto por 103,103 diagramas de classes UML, a fim de identificar defeitos presentes nestes diagramas. A criação deste dataset envolveu o desenvolvimento de uma ferramenta de web scraping projetada para extrair diagramas de classes UML de projetos de repositórios públicos. Os princípios da Physics ofNotations propostos porMoody e os princípios de diagram size e diagram flaws propostos por Störrle são incorporados na ferramenta de avaliação automatizada para identificar defeitos. Isto permitiu-nos analisar como os diagramas de classes UML disponíveis em repositórios públicos são construídos “in the wild”, e detetar quais são as violações mais frequentes dos princípios de modelação propostos por Moody e Störrle.
URI: http://hdl.handle.net/10362/163569
Designação: MASTER IN COMPUTER SCIENCE
Aparece nas colecções:FCT: DI - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Lacao_2023.pdf4,44 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.