Design and Optimization of Machine Learning Models

Dátum
2025
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

Ez a disszertáció gépi és mélytanulásos optimalizálási technikákat vizsgál, a modellek teljesítményének és alkalmazkodóképességének javítására összpontosítva különböző területeken. A kutatás kiemeli az algoritmikus szintű optimalizálás jelentőségét, mint például a gradiens alapú optimalizálók és a hiperparaméter hangolás, valamint a stratégiai módszertanok, beleértve az átviteli tanulást, a finomhangolást és az előtanítást, különösen a nagy nyelvi modelleken (LLM) belül.

A III. fejezet egy új együttes keretrendszert mutat be, amely integrálja az LLM-eket a rekurens neurális hálózatokkal az olajárak előrejelzéséhez. Ez a fejezet bemutatja a hibrid architektúrák hatékonyságát a gazdasági előrejelzésben az érzelem-tudatos szövegelemzés és az idősoros modellek kombinálásával.

A IV. fejezet egy együttes folyamatláncot mutat be, amely értelmes információk kinyerésére szolgál az ügyfélvéleményekből. A javasolt rendszer felülmúlja az általánosan használt módszereket, a releváns állítások koherensebb és következetesebb kinyerését kínálva klasszikus és gépi tanulási technikák segítségével.

Az V. fejezet a multimodális tanulást vizsgálja a dohányzási viselkedés szöveges és képi adatokból történő detektálásán keresztül. A korlátozott adatkészlet ellenére a javasolt architektúra erős teljesítményt ér el, ami illusztrálja a multimodális fúzió lehetőségeit a viselkedéselemzési feladatokban.

A VI. fejezet összehasonlítja a visszakereséssel kiterjesztett generálást (RAG) a tudásalapú rendszerek építésében alkalmazott területspecifikus finomhangolással. Az eredmények azt mutatják, hogy a RAG kiváló rugalmasságot és teljesítményt nyújt az általánosításban és a tudásvisszakeresésben.

Végül a VII. fejezet az elméleti modellezést optimalizálási algoritmusokkal köti össze a legkisebb négyzetek görbeillesztésének alkalmazásával, hogy finomítsa az olyan epidemiológiai modelleket, mint a SIR, hozzájárulva a neurális hálózatok előtanításának javításához.

Ezek a tanulmányok bemutatják, hogy a testreszabott optimalizálási stratégiák hogyan segíthetik elő a gépi tanulási alkalmazások fejlesztését a változatos és összetett problématerületeken.


This dissertation explores machine and deep learning optimization techniques, enhancing model performance and adaptability across various domains. The research highlights the significance of optimization at the algorithmic level, such as gradient-based optimizers and hyperparameter tuning, and strategic methodologies, including transfer learning, fine-tuning, and pre-training, especially within large language models (LLMs).

Chapter III presents a novel ensemble framework that integrates LLMs with recurrent neural networks to forecast oil prices. This chapter demonstrates the effectiveness of hybrid architectures for economic forecasting by combining sentiment-aware textual analysis with time series models.

Chapter IV introduces an ensemble pipeline to extract meaningful insights from customer reviews. The proposed system outperforms commonly used methods, offering a more coherent and consistent extraction of relevant statements using classical and machine learning techniques.

Chapter V investigates multimodal learning through the detection of smoking behavior from both text and image data. Despite the limited dataset, the proposed architecture achieves strong performance, illustrating the potential of multimodal fusion in behavioral analysis tasks.

Chapter VI compares Retrieval-Augmented Generation (RAG) with domain-specific fine-tuning in constructing knowledge-based systems. The results indicate that RAG provides superior flexibility and performance in generalization and knowledge retrieval.

Finally, Chapter VII connects theoretical modeling with optimization algorithms by applying least squares curve fitting to refine epidemiological models like SIR, contributing to improved neural network pre-training.

These studies demonstrate how tailored optimization strategies can advance machine learning applications across diverse and complex problem domains.

Leírás
Kulcsszavak
Informatikai tudományok, Műszaki tudományok
Jogtulajdonos
URL
Jelzet
Egyéb azonosító
Forrás
Támogatás