Barbero, ChiaraAmaro, Raquel2020-07-082020-07-0820202236-4242PURE: 16312361PURE UUID: d55e9398-b492-42fd-b11b-b51401a0b838WOS: 000522748100005ORCID: /0000-0001-8120-1784/work/76959670ORCID: /0000-0002-4923-7186/work/86214906http://hdl.handle.net/10362/100548UIDB/03213/2020 UIDP/03213/2020A exploração de corpora para a extração de léxico de especialidade é um método consensual e comum na construção de recursos lexicais. No entanto, as metodologias empregadas não são explicitamente discutidas, dificultando a comparação e a determinação de abordagens robustas. Para preencher essa lacuna, neste artigo apresentamos e discutimos uma metodologia detalhada para extração de léxico de especialidade a partir de corpora, conjugando abordagens linguísticas e estatísticas. O método proposto prevê tanto o uso de corpora de especialidade como de corpora monitores e inclui: i) análise de dados de frequência; ii) extração de concordâncias e colocações; iii) extração de informação de ordem textual, permitindo a extração de unidades lexicais atómicas e multipalavra e de relações semânticas relevantes. Desse modo, o objetivo da metodologia é a determinação de listas de potenciais unidades lexicais de especialidade e de informações relevantes para a sua descrição que permitam uma validação final rápida e eficiente, maximizando o valor informacional da interação com os especialistas.20890289porSpecialized Lexicon ExtractionMethodologyCorporaConcordancesCollocationsExploração de corpora para extração e descrição de léxico de especialidadeExploiting corpora for extracting and describing specialized lexiconTowards a solid and sustained methodologyjournal article10.11606/issn.2236-4242.v33i1p69-104Para uma metodologia sólida e sustentadahttp://www.revistas.usp.br/linhadagua/article/view/165214