Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/41298
Title: | Leveraging LLMs for explainable recommender systems : exploring user perceptions and faithfulness in generated explanations |
Other Titles: | Aproveitando LLMs para sistemas de recomendação explicáveis: explorando Percepções do usuário e fidelidade nas explicações geradas |
???metadata.dc.creator???: | SILVA, Ítallo de Sousa. |
???metadata.dc.contributor.advisor1???: | MARINHO, Leandro Balby. |
???metadata.dc.contributor.referee1???: | CAMPELO, Cláudio Elízio Calazans. |
???metadata.dc.contributor.referee2???: | VELOSO, Adriano Alonso. |
Keywords: | Recuperação de Informação;Estudo de Usuário;Sistemas de Recomendação (RSs);Grandes Modelos de Linguagem (LLMs);Large Language Models (LLMs);Recommendation Systems (SRs);User Study;Information Retrieval |
Issue Date: | 13-Feb-2025 |
Publisher: | Universidade Federal de Campina Grande |
Citation: | SILVA, Ítallo de Sousa. Leveraging LLMs for explainable recommender systems : exploring user perceptions and faithfulness in generated explanations. 2025. 85 f. Dissertação (Mestrando em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2025. |
???metadata.dc.description.resumo???: | Sistemas derecomendação(RSs)tornaram-secomunsnodiaadiadeboapartedapop- ulação, auxiliandousuáriosnadescobertadeitensrelevantesemdiversosdomínios.No entanto, acrescentecomplexidadedosRSslevantapreocupaçõessobresuatransparênciae interpretabilidade, especialmenteemaplicaçõesdealtoimpacto.Estadissertaçãoinvestigao potencial dosGrandesModelosdeLinguagem(LLMs)paragerarexplicaçõesautomatizadas e centradasnoserhumanoparaRSseavaliasuafidelidadeemrefletiroraciocíniointerno dos modelos.Avaliamosrecomendaçõespersonalizadasdefilmeseexplicaçõesgeradas pelo GPT-3.5Turbopormeiodeumestudocomusuários,medindoeficácia,personaliza- ção epoderdepersuasão.Umestudocomplementar,abrangendorecomendaçõesdefilmes, músicas elivrosgeradasporquatroLLMs(asaber,GPT-4o,Llama3,Gemma2eMixtral 8x7B), avaliouafidelidadedessasexplicaçõesusandoumaavaliaçãoaxiomáticabaseada no AcordodeImportânciadeCaracterísticas.Nossosresultadosrevelaramque,emboraas recomendações geradaspelosLLMstenhammelhoradoasatisfaçãodousuárioemcom- paração comseleçõesaleatórias,asexplicaçõesfrequentementenãoatendiamaoscritérios de fidelidade.Surpreendentemente,explicaçõesbaseadasempreferênciasdousuárionão foram consistentementepercebidascomomaispersonalizadas,eficazesoupersuasivasdo que explicaçõesgenéricas.Asprincipaiscontribuiçõesincluíramumaavaliaçãocentrada no usuáriodaqualidadedasexplicações,ummétodoaxiomáticoparaavaliarafidelidade, percepções sobrepreferênciasdosusuáriosetiposdeexplicações,alémdeumaanáliseda interação entreosobjetivosdasexplicações.Desafiosnotáveisidentificadosincluemasca- pacidades limitadasdepersonalizaçãodosLLMs,avariabilidadenosresultadosdevidoao comportamento nãodeterminísticoeanaturezainerentementedecaixa-pretadessesmode- los. EstetrabalhodestacaaspromessaselimitaçõesdosLLMsemRSsExplicáveisefornece uma baseparafuturaspesquisasquebusquemmelhoraroalinhamentoentreapercepçãodo usuário eafidelidadedasexplicações. |
Abstract: | Recommender systems(RSs)havebecomeubiquitous,assistingusersindiscoveringrele- vantitemsacrossvariousdomains.However,theincreasingcomplexityofRSsraisescon- cerns abouttheirtransparencyandinterpretability,particularlyinhigh-stakesapplications. This thesisinvestigatesthepotentialofLargeLanguageModels(LLMs)togenerateau- tomated, human-centeredexplanationsforRSsandassessestheirfaithfulnessinreflecting the models’internalreasoning.Weevaluatedpersonalizedmovierecommendationsand explanationsgeneratedbyGPT-3.5Turbothroughauserstudy,measuringeffectiveness, personalization, andpersuasiveness.Afollow-upstudyacrossmovie,song,andbookrec- ommendations generatedbyfourLLMs(namely,GPT-4o,Llama3,Gemma2,andMixtral 8x7B) assessedthefaithfulnessoftheseexplanationsusinganaxiomaticevaluationbased on theFeatureImportanceAgreement.OurfindingsrevealedthatwhileLLM-generatedrec- ommendations improvedusersatisfactioncomparedtorandomselections,theexplanations often failedtomeetfaithfulnesscriteria.Surprisingly,explanationsbasedonuserpreferences were notconsistentlyperceivedasmorepersonalized,effective,orpersuasivethangeneric explanations.Keycontributionsincludedauser-centricevaluationofexplanationquality, an axiomaticmethodforassessingfaithfulness,insightsintouserpreferencesandexplana- tion types,andananalysisoftheinterplaybetweenexplanationgoals.Notablechallenges identified includeLLMs’limitedpersonalizationcapabilities,variabilityinoutputsdueto non-deterministic behavior,andtheinherentblack-boxnatureofthesemodels.Thiswork highlights thepromiseandlimitationsofLLMsinExplainableRSsandprovidesafounda- tion forfutureresearchtoenhancethealignmentbetweenuserperceptionandexplanation faithfulness. |
Keywords: | Recuperação de Informação Estudo de Usuário Sistemas de Recomendação (RSs) Grandes Modelos de Linguagem (LLMs) Large Language Models (LLMs) Recommendation Systems (SRs) User Study Information Retrieval |
???metadata.dc.subject.cnpq???: | Ciência da Computação |
URI: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/41298 |
Appears in Collections: | Mestrado em Ciência da Computação. |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ÍTALLO DE SOUSA SILVA - DISSERTAÇÃO - (PPGCC) 2025.pdf | 3.89 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.