Această lucrare are drept scop este aplicarea algoritmului Mașini cu Suport Vectorial din învățarea automată pentru a clasifica în baza caracteristicilor vitale și comportamentale în două clase – predispus, nepredispus.
Întru realizarea scopului a fost stabilit un set de obiective generale. A fost analizată literatura de specialitate privind învățarea automată și în special algoritmul Mașini cu Suport Vectorial. De asemenea s-a efectuat analiza domeniului problematic - accidentul cerebral vascular. La rândul său, analiza domeniului inteligenței artificiale creează o imagine mai clară asupra universului de posibilități care oferă această disciplină și contribuie la
identificarea modelelor care ar rezolva numeroase probleme identificate, inclusiv din
medicină și, în cazul lucrării date, ale accidentului vascular cerebral. Aceste două obiective au fost atinse în cadrul Capitolului I ce poartă denumirea de „Analiza domeniului”.
Următoarele obiective vizează nemijlocit crearea modelului de clasificare a datelor ce țin de accidentului vascular cerebral. În această ordine de idei, a fost cercetată literatura de specialitate pentru familiarizarea cu acest algoritm și principiul acestuia de lucru. Luând în considerare importanța datelor la antrenarea modelului, au fost cercetate diverse surse de
date. S-a optat pentru setul cel mai relevant identificat pe platforma Kaggle. Având la
dispoziție o colecție de date curățite a fost posibilă aplicare a patru algoritmi pentru
compararea rezultatelor de clasificare – doi algoritmi creați în cadrul lucrării și doi existenți în librăria ScikitLearn. Compararea modelelor a fost făcută în baza metricilor precum
acuratețea, precizia, rata de detecție și scorul F1. Capitolul II cu denumirea „Fundamentare teoretică și implementare” cuprinde obiectivele care se referă la crearea SVM-ului.
În cele din urmă, în Capitolul III, „Realizarea aplicației web”, a fost atins obiectivul care constă în integrarea modelului de clasificare în cadrul unei aplicații web pentru a oferi o aplicație simplă, atractivă și user-friendly. Aplicația obținută nu constituie un produs final destinat utilizării pe larg, ce doar o mostră care permite testarea modelului de clasificare.
The purpose of this work is to apply the Support Vector Machines algorithm from machine learning to classify based on vital and behavioural characteristics into two classes – predisposed and non-predisposed.
In order to achieve the goal, a set of general objectives was established. The specialised machine learning literature, especially the Support Vector Machines algorithm, was analysed. Also, the analysis of the problematic area – stroke was carried out. Along with this, the analysis of the field of artificial intelligence creates a clearer picture of the possibilities offered by this discipline. It contributes to identifying models that would solve numerous identified problems, including in medicine and, in the case of the given work, stroke. In Chapter I, "Domain Analysis", these two objectives were achieved.
The following objectives aim to create the classification model for stroke data. Following, the specialised literature was researched for familiarisation with this algorithm and its principle. Various data sources were investigated, considering the importance of data in model training. The most relevant set identified on the Kaggle platform was chosen. It was possible to apply four algorithms, having a collection of cleaned data available, to compare the classification results – two algorithms created within the works and two existing in the ScikitLearn library. The models were compared based on metrics such as accuracy, precision, recall and F1 score. Chapter II, entitled "Theoretical Foundation and Implementation", includes the objectives that refer to the creation of the SVM.
Finally, in Chapter III, "Web application development", the goal of integrating the classification model within a web application to provide a simple, attractive and user-friendly application was achieved. The obtained application is not a final product intended for broad use. It only has one that allows the testing of the classification model.