Negativna klasifikacija digitalne informacije boje glasa

  • Tomislav Jarmić
Ključne riječi: digitalna informacija boje glasa, karakteristična značajka boje glasa, WalshHadamard-ovi koeficijenti

Sažetak

U tehničkom smislu ne postoji prepoznavanje osobe po boji glasa na razini čovjeka. Prepoznavanje glasa i prepoznavanje govora su pojmovi koji su sadržajno potpuno različiti. Svrha prepoznavanja govora je prepoznavanje riječi govornika, dok se prepoznavanjem glasa identificirao poznatu ili nepoznatu osobu. Boja glasa osobe [1] ključan je uzorak u glasu govornika. Može se promatrati kao subjektivni osjet glasnoće, visine i boje zvuka te njegove percepcije u prostoru. Cilj istraživanja je pronaći u zvučnom zapisu govornika karakteristične značajke kojima se može odrediti digitalna informacija boja glasa. Digitalnom informacijom boje glasa uz upotrebu informacijskokomunikacijske tehnologije[2] prepoznajemo spol osobe, ciljanog govornika ili skupnu govornika. Namjera je do sada neiskorištene Walsh-Hadamardove koeficijente upotrijebiti za određivanje karakterističnih značajke. U procesu predprocesiranja izlučujemo karakteristične značajke za digitalnu informaciju boje glasa i to tako da se postupkom Kepstralne analize određuje osnovna frekvenciju F0 za svaki zvučni zapis, temeljem koje se izračunavaju pripadajući harmonici. Dobivene uzorci klasificiraju se po spolu. U slijedećem koraku iz zvučnih zapisa izlučuju se Walsh-Hadamardovi koeficijenti, klasificiramo ih po spolu, te se uspoređuju rezultati klasifikacija. U praksi model se može koristiti za prepoznavanje unaprijed preddefinirane klasu govornika, odnosno za brzu eliminaciju ciljane skupine podataka.

Objavljeno
2019-05-30
Rubrika
Članci