Scopul lucrării: Proiectarea și implementarea unui cluster GPU capabil să ofere performanțe
înalte pentru sarcini de calcul intensive, utilizând Chroma Vector DB pentru crearea embeddingurilor.
Obiectivele lucrării:
Proiectarea infrastructurii hardware a clusterului GPU.
Configurarea și optimizarea rețelei de interconectare a serverelor.
Implementarea și configurarea Chroma Vector DB.
Automatizarea gestionării resurselor utilizând Kubernetes și Docker.
Evaluarea economică a investiției și analizarea beneficiilor pe termen lung.
Metodele aplicate la elaborarea lucrării: Utilizarea tehnologiilor de top în calculul distribuit, precum Kubernetes și Docker pentru orchestrarea containerelor, NVSwitch pentru interconectarea GPU-urilor și Chroma Vector DB pentru gestionarea bazelor de date vectoriale.
Rezultatele obținute: Drept urmare a implementării clusterului GPU, s-a demonstrat o creștere semnificativă a performanței în sarcinile de calcul intensive. Arhitectura propusă a permis o scalabilitate și flexibilitate sporită, asigurând în același timp o gestionare eficientă a resurselor și o securitate robustă. Analiza economică a relevat o perioadă de recuperare a investiției de aproximativ 6.88 ani, confirmând viabilitatea financiară a proiectului. Aceste rezultate subliniază importanța utilizării tehnologiilor moderne pentru optimizarea infrastructurii de calcul și pentru maximizarea randamentului investițiilor în domeniul
IT.
Purpose of the Work: The design and implementation of a high-performance GPU cluster capable of providing intensive computational performance, using Chroma Vector DB for creating embeddings.
Objectives of the Work:
Design of the hardware infrastructure of the GPU cluster.
Configuration and optimization of the network interconnection of servers.
Implementation and configuration of Chroma Vector DB.
Automation of resource management using Kubernetes and Docker.
Economic evaluation of the investment and analysis of long-term benefits.
Methods Applied in the Work: Utilization of top-tier technologies in distributed computing, such as Kubernetes and Docker for container orchestration, NVSwitch for GPU interconnection, and Chroma Vector DB for managing vector databases.
Results Obtained: As a result of the GPU cluster implementation, a significant increase in performance for intensive computational tasks was demonstrated. The proposed architecture allowed for enhanced scalability and flexibility, ensuring efficient resource management and robust security. The economic analysis revealed a payback period of approximately 6.88 years, confirming the financial viability of the project. These results highlight the importance of using modern technologies to optimize computing infrastructure and maximize the return on IT investments.