Synteettinen data
Stenius, Iida (2023)
Stenius, Iida
2023
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2023121838096
https://urn.fi/URN:NBN:fi:amk-2023121838096
Tiivistelmä
Opinnäytetyön projektin tavoitteena oli luoda menetelmä, jonka avulla voidaan siirtää mahdollisimman ketterästi staattista, keinotekoista dataa järjestelmän tietokannasta toiseen. Datan tulisi olla yhteensopivaa ja yleispätevää järjestelmän testaamista varten.
Jotta voidaan taata käyttäjien yksityisyys ja noudattaa tietosuoja-asetuksia, testitarkoituksiin ei voida käyttää olemassa olevaa asiakasdataa. Tämän vuoksi tarvitaan mahdollisimman kattava paketti testidataa, joka on helppo ladata esimerkiksi järjestelmän päivityksen jälkeen.
Opinnäytetyön teoriaosuus kattaa synteettisen datan ominaisuudet, kuten sen hyödyt ja heikkoudet sekä sen yleisimmät käyttökohteet. Painotetaan erityisesti sitä, minkälaista synteettinen data on tietosuojan kannalta ja mitä pitää ottaa tietoturvan näkökulmasta huomioon. Tutkitaan esimerkkien valossa, minkälaisissa tapauksissa synteettistä dataa voidaan hyödyntää ja mitä sen käyttöönotto mahdollistaa yritykselle. Lopuksi esitellään opinnäytetyön projekti, joka tehty toimeksiantajalle, johon viitataan nimellä Yritys Y.
Toteutusosiossa käydään tarkemmin läpi projektin vaiheet. Tähän sisältyy muun muassa vaatimusmäärittely, joka on räätälöity sopimaan yrityksen tarpeisiin. Käydään läpi toteutusmenetelmä, jossa perehdytään tarkemmin tietokantoihin ja PL/SQL-kyselykieleen, jolla projektin skriptit on toteutettu. Näiden skriptien avulla mahdollistetaan keinotekoisen, staattisen datan ketterä siirto tietokannasta toiseen. Osiossa käsitellään myös testaamista.
Opinnäytetyön lopussa reflektoidaan, kuinka menetelmää voisi vielä parantaa ja miten sitä voisi soveltaa muihin käyttötarkoituksiin. Samalla pohditaan myös synteettisen datan tulevaisuutta ja miltä sen kehitys näyttää.
Jotta voidaan taata käyttäjien yksityisyys ja noudattaa tietosuoja-asetuksia, testitarkoituksiin ei voida käyttää olemassa olevaa asiakasdataa. Tämän vuoksi tarvitaan mahdollisimman kattava paketti testidataa, joka on helppo ladata esimerkiksi järjestelmän päivityksen jälkeen.
Opinnäytetyön teoriaosuus kattaa synteettisen datan ominaisuudet, kuten sen hyödyt ja heikkoudet sekä sen yleisimmät käyttökohteet. Painotetaan erityisesti sitä, minkälaista synteettinen data on tietosuojan kannalta ja mitä pitää ottaa tietoturvan näkökulmasta huomioon. Tutkitaan esimerkkien valossa, minkälaisissa tapauksissa synteettistä dataa voidaan hyödyntää ja mitä sen käyttöönotto mahdollistaa yritykselle. Lopuksi esitellään opinnäytetyön projekti, joka tehty toimeksiantajalle, johon viitataan nimellä Yritys Y.
Toteutusosiossa käydään tarkemmin läpi projektin vaiheet. Tähän sisältyy muun muassa vaatimusmäärittely, joka on räätälöity sopimaan yrityksen tarpeisiin. Käydään läpi toteutusmenetelmä, jossa perehdytään tarkemmin tietokantoihin ja PL/SQL-kyselykieleen, jolla projektin skriptit on toteutettu. Näiden skriptien avulla mahdollistetaan keinotekoisen, staattisen datan ketterä siirto tietokannasta toiseen. Osiossa käsitellään myös testaamista.
Opinnäytetyön lopussa reflektoidaan, kuinka menetelmää voisi vielä parantaa ja miten sitä voisi soveltaa muihin käyttötarkoituksiin. Samalla pohditaan myös synteettisen datan tulevaisuutta ja miltä sen kehitys näyttää.