Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Synteza mowy" wg kryterium: Temat


Tytuł:
Syntetyzer mowy uwzględniający prozodię wypowiedzi
Text-to-speech synthesizer employing automatic prosodic modification
Autorzy:
Łopatka, K.
Czyżewski, A.
Tematy:
synteza mowy
prozodia
PSOLA
speech synthesis
prosody
Pokaż więcej
Wydawca:
Politechnika Gdańska. Wydział Elektrotechniki i Automatyki
Powiązania:
https://bibliotekanauki.pl/articles/266714.pdf  Link otwiera się w nowym oknie
Opis:
Przedstawiono system syntezy mowy polskiej uwzględniający w sposób automatyczny prozodię, tj. profil intonacyjny, tempo i akcenty wypowiedzi. Zastosowano syntezę konkatenacyjną z wykorzystaniem jednostek mowy zawierających przejścia między dwoma głoskami – difonów. Opisano poszczególne moduły wchodzące w skład syntetyzera: przetwarzanie tekstu, bazę jednostek mowy oraz algorytmy związane z tworzeniem syntetyzowanego sygnału. Przeprowadzono testy subiektywne potwierdzające wysoką zrozumiałość generowanej mowy i skuteczność modyfikacji prozodycznych. Przedstawiono możliwość zastosowania opisanego systemu w aplikacjach edukacyjnych lub terapeutycznych oraz interfejsach multimodalnych przeznaczonych dla osób niepełnosprawnych.
The paper presents a Text-To-Speech synthesizer of Polish language employing automatic prosodic modification. The method used for synthesizing the speech signal is concatenative synthesis using constant-length segments – diphones. The subsequent modules of the synthesizer are introduced. Employed language analysis and signal processing techniques are described. The synthesized speech yields high intelligibility and naturalness, which is proved by auditory tests. The proposed system can be used in educational and therapeutic applications or multimodal interfaces for disabled people.
Dostawca treści:
Biblioteka Nauki
Artykuł
Tytuł:
Prace IPPT IFTR Reports ; 7/1984
Sterowana z minikomputera MERA 303 synterza wybranych diad polskich i ich percepcja
Autorzy:
Ciarkowski, Ryszard
Wydawca:
Instytut Podstawowych Problemów Techniki PAN
Powiązania:
Prace IPPT IFTR REPORTS
Opis:
Bibliogr. s. 22
42 s. : il. ; 21 cm
Dostawca treści:
RCIN - Repozytorium Cyfrowe Instytutów Naukowych
Książka
Tytuł:
Prace IPPT IFTR Reports ; 6/1987
Syntetyzator mowy MEA 8000 - układ i oprogramowanie dla eksperymentów z mową syntetyczną
Autorzy:
Ciarkowski, Ryszard
Wydawca:
Instytut Podstawowych Problemów Techniki Polskiej Akademii Nauk PAN
Powiązania:
Prace IPPT IFTR REPORTS
Opis:
Bibliogr. s. 33
36 s. : il. ; 21 cm
Dostawca treści:
RCIN - Repozytorium Cyfrowe Instytutów Naukowych
Książka
Tytuł:
Harry Potter i Kamień Filozoficzny słowem malowany - czyli badanie odbioru filmu z audiodeskrypcją z syntezą mowy.
Harry Potter and the Philosophers Stone painted with words: research into reception of the film with text-to-speech audio description
Autorzy:
Drożdż-Kubik, Justyna
Opis:
Tematem niniejszej pracy jest niekonwencjonalna audiodeskrypcja, od tradycyjnej audiodeskrypcji różniąca się zastąpieniem lektora syntezatorem mowy. Zbadanie odbioru dubbingowanej zagranicznej produkcji audiowizualnej pt. „Harry Potter i Kamień Filozoficzny” z audiodeskrypcją czytaną głosem syntetycznym jest natomiast głównym celem pracy. Taka audiodeskrypcja została odczytana młodzieży z Ośrodka dla Dzieci Niewidomych i Słabowidzących w Krakowie w styczniu 2010 roku. W pracy przedstawione są wyniki badania sprawdzające opinię wychowanków dotyczącą wprowadzenia rozwiązania polegającego na odczytywaniu audiodeskrypcji przez syntezator mowy na stałe lub tylko na pewien czas, do momentu rozpowszechnienia się usługi audiodeskrypcji i zastąpienia syntezatora mowy lektorem. Osoby przeprowadzające badanie zainteresowane były również sprawdzeniem wpływu zredukowanej treści skryptu audiodeskrypcji, dokonanej w wyniku ograniczeń technicznych syntezatora mowy, na odbiór szczegółowości audiodeskrypcji.
An unconventional audio description that is audio description read out by a speech synthesis software, is a core topic of this master dissertation. The main aim of the dissertation is to study the perception of the text-to-speech audio description among visually impaired teenagers. In a study conducted in January 2010, blind and partially sighted teenagers from the education centre in Kraków listened to the audio described dubbed version of the Harry Potter and the Philosopher’s Stone. In the dissertation their opinion on the changed audio description script, which was altered in order to be read out by a speech synthesizer is presented together with their view on the possible acceptance of introducing text-to-speech audio description as a temporary and permanent option.
Dostawca treści:
Repozytorium Uniwersytetu Jagiellońskiego
Inne
Tytuł:
Extending Visual Speech Synthesis for Polish with basic emotion model
Autorzy:
Bloch, J.
Tematy:
Visual Speech Synthesis
emotion
Xface
Ekman
wizualna synteza mowy
emocje
Pokaż więcej
Wydawca:
Fundacja na Rzecz Młodych Naukowców
Powiązania:
https://bibliotekanauki.pl/articles/115798.pdf  Link otwiera się w nowym oknie
Opis:
Expressing emotions is a very important feature of Visual Speech Synthesis systems. In 1972 the first “basic emotions” list was introduced, by Paul Ekman. Since then few different classifications were published. Most famous “basic emotion” models are briefly described in this paper. In previous publication new Visual Speech Synthesis system for Polish was presented. The system was based on Xface toolkit and “Karol” face model. The aim of this paper is to add “basic emotion” model, according to Paul Ekman’s classification, into “Karol” face model. To achieve this goal new emotional keyframes were proposed. This new functionality of “Karol” face model, allows to generate talking human face animations, which express emotions. The subjective test of new functionality are also included in the paper. The results showed that more information about speakers emotions is read from human face expression than form human speech signal. People can more easily recognize speakers emotion when they see his face expression.
Dostawca treści:
Biblioteka Nauki
Artykuł

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies