- Tytuł:
-
Metody deep-learning w rozpoznawaniu mowy
Melody deep-learning w rozpoznawaniu mowy - Autorzy:
- Kowenzowski, Piotr
- Opis:
-
In the last five years “Machine Learning”, “Big Data”, “Neural Nets”, etc. become buzz wordsand hot topics in science and industry. Business often doesn’t understand them. Nevertheless,a great amount of money is put in the area of “Big Data”. Development of the new algorithms andtechniques is highly desirable, because some problems (e.g. NP problems) are far too complex forprogrammers to calculate all possible combinations (like k-means clustering published by Lloydin 1957) or simple direct method does not exist (part-of-speech tagging).Machine learning (ML) scientific term was coined by Samuel (1959) as “Programmingcomputers to learn from experience should eventually eliminate the need for much of this detailedprogramming effort”. Deep learning (DL) one of the most prominent and recent ML techniqueshas brought the improvement of results and it is widely used by the industry.In this work we will adopt DL to Automatic speech recognition (ASR) in thiswork and show its advantageous over most common technique which is the Gaussianmixture models (GMM).This work is divided into three parts:Automatic speech recognition defines basic concepts and is briefly describes historyof a speech recognition. One can find the idea which will be proved later. Also it contains asummary of approaches which has been used so far but on the smaller scale.Models and features extraction shall give definitions of all algorithms. This is thebiggest part of this thesis.Experiment, data and results that gives origin of the data, descriptions of all allmetrics used in experiments, summary of our experiments and final discussion which will allowto confirm or reject our thesis.
W ciągu ostatnich lat "Uczenie Maszynowe", "Big Data", "Sieci Neuronowe" itd. stały się modnymi tematami w nauce i biznesie. Nie mniej jednak, dużo pieniędzy jest wkładanych w "Big Data", mimo że ten temat nie jest do końca rozumiany przez ludzi nie rozumiejących tego tematu. Rozwój nowych algorytmów i technik jest wysoce porządany, ponieważ niektóre problemy (np. problemy przetwarzanie języka naturalnego) są zbyt skomplikowane dla programisty, żeby policzyć wszystkie możliwe kombinacje.Głębokie uczenie (ang. Deep Learning - DL) stało się obiecującą techniką, która przyniosła przełom w rozpoznawaniu mowy. W tej pracy użyjemy technik głębokiego uczenia do rozpoznawania mowy i pokażemy jego przewagę nad dotychczas stowanymi technikami.Ta praca jest podzielona na trzy częsci:Automatyczne rozpoznawanie mowy definiuje podstawowe idee i krótko opisuje historię rozpoznawania mowy.Modele i ekstracja cech wprowadza podstawowe definicje wszystkich użytych algorytmów.Eksperymenty, dane i rezultaty opowiada o pochodzeniu danych, opisuje wszystkie metryki użyte w eksperymentach, podsumowuje eksperymenty i obala lub potwierdza tezę. - Dostawca treści:
- Repozytorium Uniwersytetu Jagiellońskiego
Inne