Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/31011
Title: | Validação de um modelo linear com resíduos não normais pelo método de Box-Cox. |
Other Titles: | Validation of a linear model with non-normal residuals by Box-Cox method. Validación de un modelo lineal con residuos no normales por Método Box-Cox. |
???metadata.dc.creator???: | SOUZA, José Joedson Lima de. |
???metadata.dc.contributor.advisor1???: | SOUSA, Jorge Alves de. |
???metadata.dc.contributor.referee1???: | LOPES, Anselmo Ribeiro. |
???metadata.dc.contributor.referee2???: | VIEIRA, Alecxandro Alves. |
Keywords: | Não normalidade;Resíduos;Transformação de dados;Modelo ajustado;Non-normality;Waste;Data Transformation;Adjusted model;No normalidad;Residuos;Transformación de datos |
Issue Date: | 13-Jun-2023 |
Publisher: | Universidade Federal de Campina Grande |
Citation: | Souza, José Joedson Lima de. Validação de um modelo linear com resíduos não normais pelo método de Box-Cox. 2023. 58 fl. (Trabalho de Conclusão de Curso – Monografia), Curso de Licenciatura em Matemática, Centro de Educação e Saúde, Universidade Federal de Campina Grande, Cuité – Paraíba – Brasil, 2023. |
???metadata.dc.description.resumo???: | Quando nos deparamos com a não normalidade de dados, para que possamos fazer algumas análises estatísticas de forma mais confiáveis, como por exemplo, a análise de regressão, se faz necessário que encontremos alguma forma de transformar esses dados, visando atender em especial, a suposição de normalidade. Para nos auxiliar na transformação de dados reais extraídos do portal (MINISTÉRIO DA SAÚDE, 2022) do Departamento de Informática do Sistema Único de Saúde (DATASUS) e posterior ajuste de um modelo linear realizado no R Core Team (2023), optamos por utilizar a técnica de transformação Box-Cox. Além de análises gráficas visuais, para avaliar o atendimento a esta pressuposição para os resíduos do modelo ajustado, é de extrema importância a realização de testes. Para tanto, nessa pesquisa procedemos com um dos testes mais utilizados para análises de normalidade, o teste de Shapiro-Wilk. O objetivo deste trabalho foi a validação das pressuposições para ajuste de um modelo linear às variáveis idade e tempo de tratamento de pacientes diagnosticados com neoplasia maligna. Nesse cenário, após aplicação do teste de Shapiro-Wilk, verificamos que os resíduos do modelo ajustado (p-valor = 1.107e − 08) levavam à rejeição da hipótese de nulidade (H0), ou seja, os resíduos não seguem a distribuição normal. Dessa maneira, foi aplicado a transformação de Box-Cox nesses resíduos, porém, após feito a transformação foi aplicado novamente o teste nos novos dados, e foi encontrado que os dados permaneciam rejeitando o (H0), pois o p-valor foi igual a 0.001, sendo menor que o nível de significância sugerido por Fisher, assim, pode-se concluir que essa transformação não a ideal para esses dados em questão. Para próximos trabalhos em que variáveis ajustadas a modelos de regressão linear possuam resíduos que não sigam distribuição normal, sugerimos a aplicação de “Modelos Lineares Generalizados” (MLGs); cuja ideia básica consiste em abrir um leque de opções para variável resposta, permitindo que a mesma pertença à família exponencial uniparamétrica de distribuições. |
Abstract: | When we are faced with the non-normality of data, so that we can perform some statistical analyzes more reliably, such as regression analysis, it is necessary that we find some way to transform these data, aiming to meet, in particular, the assumption of normality. To assist us in transforming real data extracted from the portal (MINISTÉRIO DA SAÚDE, 2022) of the Department of Informatics of the Unified Health System (DATASUS) and later adjust a linear model performed in the R Core Team (2023), we chose to use the Box-Cox transformation technique. In addition to visual graphic analyses, to assess compliance with this assumption for the residuals of the adjusted model, it is extremely important to carry out tests. Therefore, in this research we proceeded with one of the most used tests for analysis of normality, the Shapiro-Wilk test. The objective of this study was to validate the assumptions for adjusting a linear model to the variables age and time of treatment of patients diagnosed with malignant neoplasia. In this scenario, after applying the Shapiro-Wilk test, we verified that the residuals of the adjusted model (p − valor = 1.107e − 08) led to the rejection of the null hypothesis (H0), that is, the residuals did not follow a normal distribution. In this way, the Box-Cox transformation was applied to these residues, however, after the transformation was carried out, the test was applied again to the new data, and it was found that the data remained rejecting (H0), since the p-value was equal to 0.001, being less than the significance level suggested by Fisher, thus, it can be concluded that this transformation is not ideal for these data in question. For future works in which variables adjusted to linear regression models have residuals that do not follow a normal distribution, we suggest the application of “Generalized Linear Models” (GLMs); whose basic idea is to open a range of options for the response variable, allowing it to belong to the uniparametric exponential family of distributions. |
???metadata.dc.description.resumen???: | Cuando nos enfrentamos a la no normalidad de los datos, para que podamos hacer algo análisis estadísticos de forma más fiable, como el análisis de regresión, si hace necesario que encontremos alguna manera de transformar estos datos, con el objetivo de encontrarnos en particular, el supuesto de normalidad. Para ayudarnos a transformar los datos reales extraídos del portal (MINISTERIO DE SALUD, 2022) del Departamento Informático del Sistema Único de Saúde (DATASUS) y posterior ajuste de un modelo lineal realizado en el R Core Team (2023), optamos por utilizar la técnica de transformación de Box-Cox. Además del análisis gráfico visual, para evaluar el cumplimiento de este supuesto para los residuales del modelo ajustado es de suma importancia. importancia de las pruebas. Por lo tanto, en esta investigación se procedió con una de las pruebas más utilizado para el análisis de normalidad, la prueba de Shapiro-Wilk. El objetivo de este trabajo fue la validación de los supuestos para ajustar un modelo lineal a las variables edad y tiempo de tratamiento de pacientes diagnosticados de malignidad. En este escenario, después de aplicar el prueba de Shapiro-Wilk, verificamos que los residuos del modelo ajustado (p-value = 1.107e − 08) llevó al rechazo de la hipótesis nula (H0), es decir, los residuos no siguen la distribución normal. De esta forma, se aplicó la transformación de Box-Cox a estos residuos, sin embargo, después Después de la transformación, se aplicó nuevamente la prueba sobre los nuevos datos, y se encontró que los datos siguieron rechazando (H0), ya que el p-valor fue igual a 0.001, siendo menor que el nivel de significación sugerido por Fisher, por lo que se puede concluir que esta transformación no ideal para este dato en cuestión. Para trabajos futuros en los que las variables ajustadas a modelos de regresión lineal tienen residuos que no siguen una distribución normal, sugerimos aplicación de “Modelos Lineales Generalizados” (GMLs); cuya idea básica es abrir un rango de opciones para la variable de respuesta, lo que le permite pertenecer a la familia exponencial distribuciones uniparamétricas. |
Keywords: | Não normalidade Resíduos Transformação de dados Modelo ajustado Non-normality Waste Data Transformation Adjusted model No normalidad Residuos Transformación de datos |
???metadata.dc.subject.cnpq???: | Matemática |
URI: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/31011 |
Appears in Collections: | Curso de Licenciatura em Matemática - CES - Monografias |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
JOSÉ JOEDSON LIMA DE SOUSA - TCC LICENCIATURA EM MATEMÁTICA CES 2023.pdf | José Joedson Lima de Sousa - TCC Licenciatura em Matemática CES 2023 | 6.6 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.