| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 2.67 MB | Adobe PDF |
Autores
Orientador(es)
Resumo(s)
Na última década, diferentes países têm desenvolvido iniciativas relacionadas à divulgação de dados governamentais de forma aberta. Apesar da existência e disponibilização das bases de dados, a tarefa de utilização e extração de conhecimento dessas bases ainda apresenta alguns desafios, relacionados a à integração e à compatibilização das informações. Isso ocorre devido à baixa estruturação e a grande heterogeneidade das fontes, que faz com que as abordagens tradicionais de extração transformação e carga (ETL) tornem-se menos eficientes.
Esse trabalho busca analisar uma abordagem de construção de um repositório de dados abertos baseada na estrutura dos arquivos unidimensionais (flat files), que possibilite a construção dos modelos dimensionais de forma mais eficiente.
In the last decade, different countries have developed initiatives related to the dissemination of open data. Despite the existence and availability of databases, the task of using this data and knowledge extraction still presents some challenges related to the integration and compatibility of information. This occurs due to both poor-structure and a great heterogeneity of sources, which make traditional extraction, transformation, and loading (ETL) approach less efficient. This manuscript analyzes an approach for the construction of open data repository based on a flat files structure that enables a more efficient dimensional model building.
In the last decade, different countries have developed initiatives related to the dissemination of open data. Despite the existence and availability of databases, the task of using this data and knowledge extraction still presents some challenges related to the integration and compatibility of information. This occurs due to both poor-structure and a great heterogeneity of sources, which make traditional extraction, transformation, and loading (ETL) approach less efficient. This manuscript analyzes an approach for the construction of open data repository based on a flat files structure that enables a more efficient dimensional model building.
Descrição
Project Work presented as the partial requirement for obtaining a Master's degree in Information Management, specialization in Knowledge Management and Business Intelligence
Palavras-chave
Dados Públicos Abertos Ciências Sociais Data Warehouse Design ETL Open Public Data Social Science
