Analysing MRI and ultrasound scans in speech synthesis

dc.creatorTrencsényi, Réka
dc.date2020-11-29
dc.date.accessioned2021-06-28T11:10:39Z
dc.date.available2021-06-28T11:10:39Z
dc.descriptionThe articulatory speech synthesis is a new trend in producing machine speech which is based on processing visual information related to voice formation. The profound knowledge of static and dynamic geometrical parameters of speech organs plays a fundamental role in the realization of speech synthesis. To visualize these data MRI and ultrasound scans, which have different geometry, could serve as appropriate sources. The pixels of ultrasound frames can conveniently be managed by setting a polar coordinate system, while for the description of MRI frames a Desceartes coordinate system can serve as a start. Since the ultrasound scans, as opposed to MRI, do not show the back part and the apex of the tongue, only partial information is gained on the movement of the tongue. Consequently, it is important and not trivial at all to concert the geometry of MRI and Ultrasound resources. This writing presents a possible way of geometrical transformation.
dc.descriptionA gépi beszéd előállításának egyik új vonulata az artikulációs beszédszintézis, ami a hangképzéshez kapcsolódó vizuális információk feldolgozásán alapszik. A hangképző szervek statikus és dinamikus geometriai paramétereinek pontos ismerete alapvető szerepet játszik a beszédszintézis megvalósításában. Ezen adatok vizuális kinyerésének alkalmas forrásai lehetnek a beszéd közben készült MRI- és UH-felvételek, melyek különböző geometriával jellemezhetők. Az UH-keretek képpontjai egy polárkoordináta-rendszer kijelölésével kezelhetők a legkényelmesebben, míg az MRIkeretek képpontjainak leírásához egy descartes-i koordináta-rendszer adhat megfelelő kiindulópontot. Mivel az UH-felvételeken nem látható a nyelv hátsó része és a nyelvhegy, így az MRI-hez képest csak részleges információt kaphatunk a nyelv mozgásáról. Ennélfogva fontos és egyben nem triviális feladat az MRI- és UH-források geometriájának összehangolása. A publikációban bemutatom a geometriai transzformációk egy lehetséges módját.
dc.formatapplication/pdf
dc.identifierhttps://ojs.lib.unideb.hu/ams/article/view/8513
dc.identifier10.19055/ams.2020.11/31/5
dc.identifier.urihttp://hdl.handle.net/2437/317521
dc.languagehun
dc.publisherDebreceni Egyetem Egészségügyi Kar
dc.relationhttps://ojs.lib.unideb.hu/ams/article/view/8513/7745
dc.rightsCopyright (c) 2020 Acta Medicinae et Sociologica
dc.rightshttps://creativecommons.org/licenses/by-nc-nd/4.0
dc.sourceActa Medicinae et Sociologica; Vol. 11 No. 31 (2020); 55-65
dc.sourceActa Medicinae et Sociologica; Évf. 11 szám 31 (2020); 55-65
dc.source2559-866X
dc.source2062-0284
dc.subjectMRI
dc.subjectultrasound
dc.subjectspeech synthesis
dc.subjectmechanical speech
dc.subjectMRI
dc.subjectUH
dc.subjectbeszédszintézis
dc.subjectgépi beszéd
dc.titleAnalysing MRI and ultrasound scans in speech synthesis
dc.titleMRI- és UH-felvételek geometriai elemzése a beszédszintézisben
dc.typeinfo:eu-repo/semantics/article
dc.typeinfo:eu-repo/semantics/publishedVersion
Fájlok
Eredeti köteg (ORIGINAL bundle)
Megjelenítve 1 - 1 (Összesen 1)
Nem elérhető
Név:
PDF.pdf
Méret:
3.38 MB
Formátum:
Adobe Portable Document Format