Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7340
Full metadata record
DC FieldValueLanguage
dc.creator.Latteshttp://lattes.cnpq.br/9747902267969441pt_BR
dc.contributor.advisor1BAPTISTA, Cláudio de Souza.-
dc.contributor.advisor1IDBAPTISTA, C. S.pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0104124422364023pt_BR
dc.contributor.referee1GOMES , Herman Martins.-
dc.contributor.referee2BRAZ JUNIOR, Geraldo.-
dc.description.resumoSoluções para identificação dos fatores que influenciam o acontecimento de acidentes em rodovias e a identificação de trechos de risco estão sendo estudados e aplicados por pesquisadores e governos de todo o mundo, a fim de encontrar uma solução que possa diminuir o número de tais acidentes. No entanto, o estudo de acidentes em rodovias depende do local onde o mesmo acontece. Destarte, esta pesquisa faz uso de técnicas de aprendizado de máquina supervisionado e aprendizado de máquina automatizado com o uso de diferentes características para analisar seu impacto na tarefa de predição do risco de acidentes graves ou não-graves em trechos de rodovias brasileiras, a fim de otimizar o desempenho e a performance dos classificadores. Os dados de acidentes foram pré-processados, analisados e técnicas de seleção de atributos foram empregadas, resultando em uma base com informações sobre o dia da semana, o turno do dia em que o acidente aconteceu, o tipo da pista, o traçado da via, o sentido da rodovia, a condição meteorológica no momento do acidente e o tipo do acidente. Diferentes modelos de aprendizado de máquina foram treinados e avaliados em quatro cenários diferentes: o cenário A utiliza uma base de dados desbalanceada com o atributo “Frequência de Acidentes”, enquanto o cenário B consiste na base de dados desbalanceada sem tal atributo; o cenário C faz uso da base de dados balanceada com o atributo “Frequência de Acidentes” e o cenário D utiliza a base de dados balanceada sem este atributo. A avaliação experimental ocorreu com o emprego das métricas acurácia, precisão, revocação e medida F. Os resultados dos cenários A e B não foram relevantes ao estudo, uma vez que os classificadores não convergiram, classificando os dados em apenas uma classe: não-grave. O melhor resultado para o cenário C foi a Rede Neural MLP, que obteve 85% de acurácia, 87% de precisão, 85% de revocação e 84% de medida F. Já para o cenário D, os melhores resultados foram combinações de dois modelos diferentes: Random Forest+BernoulliNB e Logistic Regression+ExtraTreesClassifier, ambos com 84,58% de acurácia, 88,14% de precisão, 84,58% de revocação e 84,06% medida F.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCentro de Engenharia Elétrica e Informática - CEEIpt_BR
dc.publisher.programPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOpt_BR
dc.publisher.initialsUFCGpt_BR
dc.subject.cnpqCiência da Computaçãopt_BR
dc.titleUso de aprendizado de máquina para classificação de risco de acidentes em rodovias.pt_BR
dc.date.issued2019-08-21-
dc.description.abstractIn order to decrease the number of road accidents, solutions to identify influencing factors of road accidents and its risk areas are being researched throughout the world. However, road accident studies depend upon its location, hence this study uses supervised machine learning techniques and automated machine learning to classify accident risk sections of brazilian federal road s in severe or not-severe, using several features. The accident data was analized, pre-processed and its features were selected using different techniques, resulting in a set of information containing the week day and time the accident happened, the road type, the road route, the road orientation, the weather condition when the accident happened and the accident type. Machine learning models were trained and evaluated in four different scenarios: scenario A used a imbalanced database with the "accident frequency" feature, while scenario B used a imbalanced database without the "accident frequency" feature; scenario C used a balanced database with the "accident frequency" feature and scenario D used a balanced database without the "accident frequency" feature. To validate the model, the accuracy, precision, recall and F-measure metrics were used. Scenarios A and B results were disregarded since all models preticted only one class: not-severe. Scenario C best result was a MLP neural network model with 85% of accuracy, 87% of precision, 85% of recall and 84% of F-measure. The best results to scenario D were two combinations of classifiers: first, the combination of Random Forest and BernoulliNB; second, the combination of Logistic Regression and ExtraTreesClassifier, both resulting in 84,58% of accuracy, 88,14% of precision, 84,58% of recall and 84,06% of F-measure.pt_BR
dc.identifier.urihttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7340-
dc.date.accessioned2019-09-26T11:30:54Z-
dc.date.available2019-09-26-
dc.date.available2019-09-26T11:30:54Z-
dc.typeDissertaçãopt_BR
dc.subjectAprendizado de Máquinapt_BR
dc.subjectAprendizado de Máquina Automatizadopt_BR
dc.subjectSeleção de Característicaspt_BR
dc.subjectRedução de Dimensionalidadept_BR
dc.subjectRisco de Acidente em Rodoviaspt_BR
dc.subjectClassificação de Riscopt_BR
dc.subjectMachine Learningpt_BR
dc.subjectAutomated Machine Learningpt_BR
dc.subjectFeature Selectionpt_BR
dc.subjectDimensionality Reductionpt_BR
dc.subjectRoad Accident Riskpt_BR
dc.subjectRisk Ratingpt_BR
dc.rightsAcesso Abertopt_BR
dc.creatorAMORIM, Brunna de Sousa Pereira.-
dc.publisherUniversidade Federal de Campina Grandept_BR
dc.languageporpt_BR
dc.title.alternativeUse of machine learning for classification risk of road accidents.pt_BR
dc.description.sponsorshipCNPqpt_BR
dc.relationCapespt_BR
dc.identifier.citationAMORIM, B. de S. P. Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias. 2019. 93 f. Dissertação (Mestrado em Ciência da Computação) – Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2019. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7340pt_BR
Appears in Collections:Mestrado em Ciência da Computação.

Files in This Item:
File Description SizeFormat 
BRUNNA DE SOUSA PEREIRA AMORIM - DISSERTAÇÃO (PPGCC) 2019.pdfBrunna de Sousa Pereira Amorim - Dissertação PPGCC 2019764.84 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.