Leveraging LLMs for explainable recommender systems : exploring user perceptions and faithfulness in generated explanations

Please use this identifier to cite or link to this item: https://dspace.sti.ufcg.edu.br/jspui/handle/riufcg/41298

Title:	Leveraging LLMs for explainable recommender systems : exploring user perceptions and faithfulness in generated explanations
Other Titles:	Aproveitando LLMs para sistemas de recomendação explicáveis: explorando Percepções do usuário e fidelidade nas explicações geradas
???metadata.dc.creator???:	SILVA, Ítallo de Sousa.
???metadata.dc.contributor.advisor1???:	MARINHO, Leandro Balby.
???metadata.dc.contributor.referee1???:	CAMPELO, Cláudio Elízio Calazans.
???metadata.dc.contributor.referee2???:	VELOSO, Adriano Alonso.
Keywords:	Recuperação de Informação;Estudo de Usuário;Sistemas de Recomendação (RSs);Grandes Modelos de Linguagem (LLMs);Large Language Models (LLMs);Recommendation Systems (SRs);User Study;Information Retrieval
Issue Date:	13-Feb-2025
Publisher:	Universidade Federal de Campina Grande
Citation:	SILVA, Ítallo de Sousa. Leveraging LLMs for explainable recommender systems : exploring user perceptions and faithfulness in generated explanations. 2025. 85 f. Dissertação (Mestrando em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2025.
???metadata.dc.description.resumo???:	Sistemas derecomendação(RSs)tornaram-secomunsnodiaadiadeboapartedapop- ulação, auxiliandousuáriosnadescobertadeitensrelevantesemdiversosdomínios.No entanto, acrescentecomplexidadedosRSslevantapreocupaçõessobresuatransparênciae interpretabilidade, especialmenteemaplicaçõesdealtoimpacto.Estadissertaçãoinvestigao potencial dosGrandesModelosdeLinguagem(LLMs)paragerarexplicaçõesautomatizadas e centradasnoserhumanoparaRSseavaliasuafidelidadeemrefletiroraciocíniointerno dos modelos.Avaliamosrecomendaçõespersonalizadasdefilmeseexplicaçõesgeradas pelo GPT-3.5Turbopormeiodeumestudocomusuários,medindoeficácia,personaliza- ção epoderdepersuasão.Umestudocomplementar,abrangendorecomendaçõesdefilmes, músicas elivrosgeradasporquatroLLMs(asaber,GPT-4o,Llama3,Gemma2eMixtral 8x7B), avaliouafidelidadedessasexplicaçõesusandoumaavaliaçãoaxiomáticabaseada no AcordodeImportânciadeCaracterísticas.Nossosresultadosrevelaramque,emboraas recomendações geradaspelosLLMstenhammelhoradoasatisfaçãodousuárioemcom- paração comseleçõesaleatórias,asexplicaçõesfrequentementenãoatendiamaoscritérios de fidelidade.Surpreendentemente,explicaçõesbaseadasempreferênciasdousuárionão foram consistentementepercebidascomomaispersonalizadas,eficazesoupersuasivasdo que explicaçõesgenéricas.Asprincipaiscontribuiçõesincluíramumaavaliaçãocentrada no usuáriodaqualidadedasexplicações,ummétodoaxiomáticoparaavaliarafidelidade, percepções sobrepreferênciasdosusuáriosetiposdeexplicações,alémdeumaanáliseda interação entreosobjetivosdasexplicações.Desafiosnotáveisidentificadosincluemasca- pacidades limitadasdepersonalizaçãodosLLMs,avariabilidadenosresultadosdevidoao comportamento nãodeterminísticoeanaturezainerentementedecaixa-pretadessesmode- los. EstetrabalhodestacaaspromessaselimitaçõesdosLLMsemRSsExplicáveisefornece uma baseparafuturaspesquisasquebusquemmelhoraroalinhamentoentreapercepçãodo usuário eafidelidadedasexplicações.
Abstract:	Recommender systems(RSs)havebecomeubiquitous,assistingusersindiscoveringrele- vantitemsacrossvariousdomains.However,theincreasingcomplexityofRSsraisescon- cerns abouttheirtransparencyandinterpretability,particularlyinhigh-stakesapplications. This thesisinvestigatesthepotentialofLargeLanguageModels(LLMs)togenerateau- tomated, human-centeredexplanationsforRSsandassessestheirfaithfulnessinreflecting the models’internalreasoning.Weevaluatedpersonalizedmovierecommendationsand explanationsgeneratedbyGPT-3.5Turbothroughauserstudy,measuringeffectiveness, personalization, andpersuasiveness.Afollow-upstudyacrossmovie,song,andbookrec- ommendations generatedbyfourLLMs(namely,GPT-4o,Llama3,Gemma2,andMixtral 8x7B) assessedthefaithfulnessoftheseexplanationsusinganaxiomaticevaluationbased on theFeatureImportanceAgreement.OurfindingsrevealedthatwhileLLM-generatedrec- ommendations improvedusersatisfactioncomparedtorandomselections,theexplanations often failedtomeetfaithfulnesscriteria.Surprisingly,explanationsbasedonuserpreferences were notconsistentlyperceivedasmorepersonalized,effective,orpersuasivethangeneric explanations.Keycontributionsincludedauser-centricevaluationofexplanationquality, an axiomaticmethodforassessingfaithfulness,insightsintouserpreferencesandexplana- tion types,andananalysisoftheinterplaybetweenexplanationgoals.Notablechallenges identified includeLLMs’limitedpersonalizationcapabilities,variabilityinoutputsdueto non-deterministic behavior,andtheinherentblack-boxnatureofthesemodels.Thiswork highlights thepromiseandlimitationsofLLMsinExplainableRSsandprovidesafounda- tion forfutureresearchtoenhancethealignmentbetweenuserperceptionandexplanation faithfulness.
Keywords:	Recuperação de Informação Estudo de Usuário Sistemas de Recomendação (RSs) Grandes Modelos de Linguagem (LLMs) Large Language Models (LLMs) Recommendation Systems (SRs) User Study Information Retrieval
???metadata.dc.subject.cnpq???:	Ciência da Computação
URI:	https://dspace.sti.ufcg.edu.br/jspui/handle/riufcg/41298
Appears in Collections:	Mestrado em Ciência da Computação.

Files in This Item:

File	Description	Size	Format
ÍTALLO DE SOUSA SILVA - DISSERTAÇÃO - (PPGCC) 2025.pdf		3.89 MB	Adobe PDF	View/Open

Show full item record