MRI- és UH-felvételek geometriai elemzése a beszédszintézisben

dc.contributor.authorTrencsényi, Réka
dc.date.accessioned2021-06-28T11:10:39Z
dc.date.available2021-06-28T11:10:39Z
dc.date.issued2020-11-29
dc.description.abstractThe articulatory speech synthesis is a new trend in producing machine speech which is based on processing visual information related to voice formation. The profound knowledge of static and dynamic geometrical parameters of speech organs plays a fundamental role in the realization of speech synthesis. To visualize these data MRI and ultrasound scans, which have different geometry, could serve as appropriate sources. The pixels of ultrasound frames can conveniently be managed by setting a polar coordinate system, while for the description of MRI frames a Desceartes coordinate system can serve as a start. Since the ultrasound scans, as opposed to MRI, do not show the back part and the apex of the tongue, only partial information is gained on the movement of the tongue. Consequently, it is important and not trivial at all to concert the geometry of MRI and Ultrasound resources. This writing presents a possible way of geometrical transformation.en
dc.description.abstractA gépi beszéd előállításának egyik új vonulata az artikulációs beszédszintézis, ami a hangképzéshez kapcsolódó vizuális információk feldolgozásán alapszik. A hangképző szervek statikus és dinamikus geometriai paramétereinek pontos ismerete alapvető szerepet játszik a beszédszintézis megvalósításában. Ezen adatok vizuális kinyerésének alkalmas forrásai lehetnek a beszéd közben készült MRI- és UH-felvételek, melyek különböző geometriával jellemezhetők. Az UH-keretek képpontjai egy polárkoordináta-rendszer kijelölésével kezelhetők a legkényelmesebben, míg az MRIkeretek képpontjainak leírásához egy descartes-i koordináta-rendszer adhat megfelelő kiindulópontot. Mivel az UH-felvételeken nem látható a nyelv hátsó része és a nyelvhegy, így az MRI-hez képest csak részleges információt kaphatunk a nyelv mozgásáról. Ennélfogva fontos és egyben nem triviális feladat az MRI- és UH-források geometriájának összehangolása. A publikációban bemutatom a geometriai transzformációk egy lehetséges módját.hu
dc.formatapplication/pdf
dc.identifier.citationActa Medicinae et Sociologica, Évf. 11 szám 31 (2020) , 55-65
dc.identifier.doihttps://doi.org/10.19055/ams.2020.11/31/5
dc.identifier.eissn2559-866X
dc.identifier.issn2062-0284
dc.identifier.issue31
dc.identifier.jtitleActa Medicinae et Sociologica
dc.identifier.urihttps://hdl.handle.net/2437/317521en
dc.identifier.volume11
dc.languagehu
dc.relationhttps://ojs.lib.unideb.hu/ams/article/view/8513
dc.rights.accessOpen Access
dc.rights.ownerActa Medicinae et Sociologica
dc.subjectMRIen
dc.subjectultrasounden
dc.subjectspeech synthesisen
dc.subjectmechanical speechen
dc.subjectMRIhu
dc.subjectUHhu
dc.subjectbeszédszintézishu
dc.subjectgépi beszédhu
dc.titleMRI- és UH-felvételek geometriai elemzése a beszédszintézisbenhu
dc.typefolyóiratcikkhu
dc.typearticleen
dc.type.detailedmagyar nyelvű folyóiratközlemény hazai lapbanhu
Fájlok
Eredeti köteg (ORIGINAL bundle)
Megjelenítve 1 - 1 (Összesen 1)
Nincs kép
Név:
PDF
Méret:
3.38 MB
Formátum:
Adobe Portable Document Format