Sovellus datan luomiseen ja hallintaan neuroverkkopohjaista puhesynteesiä varten
Järvinen, Otto (2019)
Järvinen, Otto
2019
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-201905067735
https://urn.fi/URN:NBN:fi:amk-201905067735
Tiivistelmä
Insinöörityön tarkoituksena oli toteuttaa tietotekniikka-alan yritykselle web-pohjainen sovellus, jolla luodaan puheesta ja tekstistä koostuvaa aineistoa yrityksen oman neuroverkkopohjaisen puhesynteesimallin harjoittamista varten. Lisäksi tavoitteena oli kehittää sovellukseen työkalu aineiston ja puhesynteesimallin harjoittamisen hallintaan, jotta harjoittamista voidaan ohjata suoraan selaimessa.
Sovellus toteutettiin käyttäen Vue-ohjelmistokehystä käyttöliittymässä ja Node.js:ää palvelimena. Suuressa osassa sovelluksen kehitystä olivat myös Vuex-tilanhallintajärjestelmä, Vuetify-käyttöliittymäkirjasto sekä tietokantana käytetty MongoDB. Aineiston luomista varten sovellukseen kehitettiin äänitystyökalu, jolla voidaan äänittää puhetta lausekohtaisesti ja tallentaa äänite sekä äänitteessä puhuttu teksti käytettäväksi myöhemmin harjoittamiseen. Sovellukseen kehitettiin myös aineistonhallintajärjestelmä, jotta harjoittamisessa käytettävää aineistoa on mahdollista vaihdella halutulla tavalla. Lisäksi sovellukseen toteutettiin paneeli, josta harjoittamisen voi käynnistää ja pysäyttää.
Sovelluksen testausvaiheessa havaittiin, että äänityksen tuottama äänenlaatu ei ole riittävän hyvä laadukkaan puhesynteesimallin tuottamiseksi. Äänenlaadun heikon tason syyksi selvisi useimmissa selaimissa oletuksena päällä oleva automaattinen äänenmuokkaus, joka muun muassa tasaa äänenvoimakkuuksia ja poistaa taustahälinää. Kun äänenmuokkaus poistettiin ohjelmakoodissa käytöstä, äänenlaatu parani selvästi.
Lopputuloksena saatiin toivotut ominaisuudet sisältävä sovellus, jolla voidaan äänittää, hallita ja käyttää aineistoa puhesynteesimallin harjoittamisessa. Sovellus kuitenkin vaatii lisää testausta äänenlaadun osalta, ennen kuin sitä voidaan käyttää täysipainoisesti puheen äänittämisessä. Jos äänenlaadun katsotaan olevan tarpeeksi hyvä, aineiston kerääminen nopeutuu huomattavasti. Tällöin sovellus tarjoaa yritykselle tehokkaan tavan kerätä ja hallita puhesynteesin kehittämisen kannalta arvokasta aineistoa.
Sovellus toteutettiin käyttäen Vue-ohjelmistokehystä käyttöliittymässä ja Node.js:ää palvelimena. Suuressa osassa sovelluksen kehitystä olivat myös Vuex-tilanhallintajärjestelmä, Vuetify-käyttöliittymäkirjasto sekä tietokantana käytetty MongoDB. Aineiston luomista varten sovellukseen kehitettiin äänitystyökalu, jolla voidaan äänittää puhetta lausekohtaisesti ja tallentaa äänite sekä äänitteessä puhuttu teksti käytettäväksi myöhemmin harjoittamiseen. Sovellukseen kehitettiin myös aineistonhallintajärjestelmä, jotta harjoittamisessa käytettävää aineistoa on mahdollista vaihdella halutulla tavalla. Lisäksi sovellukseen toteutettiin paneeli, josta harjoittamisen voi käynnistää ja pysäyttää.
Sovelluksen testausvaiheessa havaittiin, että äänityksen tuottama äänenlaatu ei ole riittävän hyvä laadukkaan puhesynteesimallin tuottamiseksi. Äänenlaadun heikon tason syyksi selvisi useimmissa selaimissa oletuksena päällä oleva automaattinen äänenmuokkaus, joka muun muassa tasaa äänenvoimakkuuksia ja poistaa taustahälinää. Kun äänenmuokkaus poistettiin ohjelmakoodissa käytöstä, äänenlaatu parani selvästi.
Lopputuloksena saatiin toivotut ominaisuudet sisältävä sovellus, jolla voidaan äänittää, hallita ja käyttää aineistoa puhesynteesimallin harjoittamisessa. Sovellus kuitenkin vaatii lisää testausta äänenlaadun osalta, ennen kuin sitä voidaan käyttää täysipainoisesti puheen äänittämisessä. Jos äänenlaadun katsotaan olevan tarpeeksi hyvä, aineiston kerääminen nopeutuu huomattavasti. Tällöin sovellus tarjoaa yritykselle tehokkaan tavan kerätä ja hallita puhesynteesin kehittämisen kannalta arvokasta aineistoa.