Artigo de Periódico
Seleção de atributos na previsão de insolvência: aplicação e avaliação usando dados brasileiros recentes
Attribute selection in bankruptcy prediction: application and evaluation using recent brazilian data
Autor
Horta, Rui Américo Mathiasi
Alves, Francisco José dos Santos
Carvalho, Frederico Antônio Azevedo de
Institución
Resumen
Bankruptcy prediction may have great utility to financial and nonfinancial institutions with regard to take in advance the best possible decisions regarding loans or investments. In specific literature, many bankruptcy prediction models have made use of data mining. The preprocessing step is important to select good quality data for use in mining operations. Still, although the selection of attributes can be very beneficial to pre-select representative data to improve the forecast performance end, it is not known which method is the best selection. This work has as main objective to compare two approaches for evalua–ting subsets of attributes: Filter and Wrapper. Despite being based on data mining techniques and widely used in the step of feature selection in bankruptcy prediction models, these techniques are rarely used to treat data from financial statements of Brazilian companies. Therefore the empirical basis of this study consists of a sample of Brazi–lian industrial and commercial enterprises, collecting data for the period 2004 to 2011. The results indicated that, in this sample, the filter approach was more effi–cient, providing better classification results both for logistic regression (91,80%) and for neural networks (93,98%). It was shown also the importance of making explicit the evaluation stage of the selection of attributes for achieving better results in applications of data mining techniques to predict insolvency. A specific conclusion about the advantages of the filter approach shows that it may be preferred to assess the attributes that will make predictive models. Previsão de falências pode ter grande utilidade para instituições financeiras e não financeiras no que se refere a tomar, antecipadamente, as melhores decisões possíveis quanto a empréstimos ou investimentos. Na literatura específica, muitos modelos de previsão de falência têm feito uso de técnicas de data mining (mineração de dados). O pré-processamento é passo importante para selecionar dados de boa qualidade para utilização em operações de mineração. Mesmo assim, apesar de a seleção de atributos poder ser muito benéfica para pré-selecionar dados representativos visando melhorar o desempenho da previsão final, não se sabe que método de seleção é o melhor. Este trabalho tem como objetivo principal comparar as duas abordagens mais utilizadas de avaliação de subconjuntos de atributos: Filtro e Wrapper. Apesar de serem fundamentadas em técnicas de mineração de dados e muito utilizadas na etapa de seleção de atributos em modelos de previsão de insolvência, essas técnicas são muito pouco utilizadas para tratar dados obtidos em demonstrativos contábeis de empresas brasileiras. Por isso, a base empírica deste estudo consiste em uma amostra de empresas comerciais e industriais brasileiras, coletando-se dados relativos ao período 2004-2011. Os resultados indicaram que, na amostra estudada, a abordagem Filtro foi a mais eficiente, fornecendo melhores resultados de classificação tanto para a técnica de regressão logística (91,80%), quanto para redes neurais (93,98%). Foi demonstrada, ainda, a importância da explicitação da etapa de avaliação da seleção de atributos para a obtenção de melhores resultados em aplicações de técnicas de mineração de dados na previsão de insolvência. Uma conclusão específica a respeito das vantagens da abordagem Filtro aponta que ela pode ser a preferida para avaliar os atributos que irão compor os modelos preditivos.