Analysis of security and privacy risks in large language models

dc.description.abstract The thesis consists of an introduction, three chapters, a conclusion, a list of references, and a list of appendices. The research begins with an introduction into the domain of artificial intelligence (AI) systems followed by domain analysis of large language models (LLMs). The first chapter examines both the positive and negative impacts of this technology. Through the examination of over 74 scientific articles, and books, the literature review emphasized the lack of structure related to problems that appear during the utilization of LLMs. This section also explores existing data protection techniques, identifies key challenges, and proposes solutions to ensure the safe development and use of LLM systems. The second chapter presents the initial deliverables of the research. It introduces the theoretical research framework, followed by detailed explanation of the 3-dimensional taxonomy, extended glossary, and decision tree. The chapter concludes with a discussion of the taxonomy's validation, conducted by three domain experts. Their analysis, based on specific criteria, offers constructive feedback and recommendations for future work. The final chapter focuses on the design and implementation of an expert system which has the purpose of demonstrating the practical application of the taxonomy. This system’s design is outlined through the definition of functional and non-functional requirements, along with the development of its architecture and components. Additionally, the chapter describes the implementation of the expert system, achieving the second objective, and discusses project results and observations. en_US
dc.description.abstract Cercetarea începe cu o introducere în domeniul sistemelor de inteligență artificială (AI), urmată de o analiză a domeniului modelelor lingvistice mari (LLM). Primul capitol examinează atât impacturile pozitive, cât și cele negative ale acestei tehnologii. Prin examinarea a peste 74 de articole științifice și cărți, analiza literaturii de specialitate a evidențiat lipsa unei structuri organizate privind problemele care apar în timpul utilizării LLM-urilor. Această secțiune explorează, de asemenea, tehnicile existente de protecție a datelor, identifică principalele provocări și propune soluții pentru a asigura dezvoltarea și utilizarea în siguranță a sistemelor LLM. Capitolul al doilea prezintă primele livrabile ale cercetării. Acesta introduce cadrul teoretic al cercetării, urmat de o explicație detaliată a taxonomiei tridimensionale, a glosarului extins și a arborelui decizional. Capitolul se încheie cu o discuție privind validarea taxonomiei, realizată de trei experți din domeniu. Analiza lor, bazată pe criterii specifice, oferă feedback constructiv și recomandări pentru lucrări viitoare. Capitolul final se concentrează pe proiectarea și implementarea unui sistem expert care are scopul de a demonstra aplicarea practică a taxonomiei. Proiectarea acestui sistem este detaliată prin definirea cerințelor funcționale și nefuncționale, împreună cu dezvoltarea arhitecturii și a componentelor sale. În plus, capitolul descrie procesul de implementare a sistemului expert, realizând al doilea obiectiv al cercetării, și analizează rezultatele proiectului și observațiile obținute. en_US
Analysis of security and privacy risks in large language models
Analiza riscurilor de securitate și confidențialitate în modelele lingvistice mari
