Multimodális gépi tanulás

dc.contributor.advisorLakatos, Róbert
dc.contributor.authorKálucz, Miklós
dc.contributor.authorKiss, Roland
dc.contributor.authorOrosz, Erik
dc.contributor.departmentDE--Informatikai Kar
dc.date.accessioned2022-11-29T20:19:52Z
dc.date.available2022-11-29T20:19:52Z
dc.date.created2022-11-29
dc.description.abstractDolgozatunkban a mesterséges intelligencia egy feltörekvő ágát mutatjuk be, a többféle modalitáson történő gépi tanulást. Alapjául szolgál a Transformer architektúra, ilyen modellekből kellett választanunk egy képi, valamint egy magyar nyelven minél jobban teljesítő szövegmodellt. Döntésünket kifejtjük, valamint az alapul szolgáló, és híresebb modelleket ismertetjük. Ezek alapján egy CLIP (kép-szöveg társító) modellt hoztunk létre, melyet különböző, általunk feldolgozott adathalmazokon tanítottunk. Ennek felépítését és eredményeit tárgyaljuk továbbiakban.
dc.description.correctorN.I.
dc.description.courseMérnökinformatikus
dc.description.degreeBSc/BA
dc.format.extent116
dc.identifier.urihttps://hdl.handle.net/2437/341536
dc.language.isohu
dc.rights.accessHozzáférhető a 2022 decemberi felsőoktatási törvénymódosítás értelmében.
dc.subjectmachine learning
dc.subjectartificial intelligence
dc.subjectneural networks
dc.subject.dspaceDEENK Témalista::Informatika::Számítógéptudomány
dc.titleMultimodális gépi tanulás
Fájlok