A jövő zenéje: mire képes a ChatGPT és mire nem?
Ahogyan arról már bizonyára te is hallottál és ahogyan mi is megírtunk korábban, a (Chat)GPT egy, a mesterséges intelligencia technológia által vezérelt természetes nyelvfeldolgozó eszköz. A nyelvi modell, melyben óriási potenciál van, különböző inputok alapján válaszol felvetéseinkre, és segíthet olyan feladatokban, mint például a szövegírás, különféle kódok összeállítása vagy zenealkotás. Oké, de hogyan?
A téma, ami lázban tartja a zeneipart (is)
Manapság sokakban felmerül a kérdés, hogy hogyan is működik a ChatGPT-vel végzett zenealkotás. Olyannyira, hogy ma már ez az egyik legforróbb topik a technológia és a zene relációjában...
Ebben a témában nem mehetünk el szó nélkül az UberDuck modell mellett. Ez egy olyan platform, amely mesterséges intelligenciát használ fel ahhoz, hogy fejlett eszközöket biztosítson a felhasználóknak a szövegfelolvasáshoz, a hangautomatizáláshoz és szintetikus média (olyan tartalmak összessége, amelyekben ránézésre emberek szerepelnek, de algoritmusok generálták őket) létrehozásához.
E modell ereje abban rejlik, hogy használata egyáltalán nem bonyolult. Ahhoz, hogy működésbe hozzuk, első körben meg kell adnunk bizonyos kritériumokat, melyek alapján adott rendszer előállítja a kért tartalmat. Ilyen kritérium például az is, hogy írjon egy dalszöveget egy bizonyos előadó stílusában, egy adott témában, adott elemek beépítésével. Ha szövegalkotási inputot adtunk meg és a modell megalkotta azt, már csak annyi a dolgunk, hogy kiválasztjuk az általunk leginkább kedvelt részt belőle, csatlakoztatjuk az UberDuckhoz, majd onnan exportáljuk a DAW-ba. Ezt követően a dallam hozzáadása következik, ami egy autotone beépülő modulal lehetséges, ebből ingyenes és fizetős verziókkal is találkozhatunk.
Ez az egyik legnépszerűbb mesterséges intelligenciát igénylő zenei munkafolyamat. Ugyanakkor a kutatók és a lelkes felhasználók nap mint nap keresik a mesterséges intelligencia zenealkotási határait.
Olvastad már? Beköszöntött a „robotzene” kora, avagy egyre inkább teret hódít a mesterséges intelligenciával történő zenekészítés
Támogat, de nem végzi el helyetted a munkát
A zenészek és zenei szakemberek között parázs vita alakult ki azzal kapcsolatban, hogy a mesterséges intelligencia által generált zenét vagy a munkafolyamat lépéseit lehet-e értékelni, komolyan lehet-e venni. Az elmúlt évszázadok tapasztalatainak tükrében elmondható, hogy noha van, amit fenntartásokkal kell kezelni az innovatív eszközökkel kapcsolatban, mindenképpen egy kreatív társ lehet az alkotói folyamatban, kiegészítheti a munkádat, plusz ötletekkel lephet meg.
A rendszert nem konkrétan zenealkotásra képezték ki, de figyelemreméltó, hogy mikre képes.
Például egy amatőr kísérletben azt próbálták kideríteni, hogy a ChatGPT tud-e folytatni egy adott gitármintát, amit olyan megjegyzésekkel láttak el pluszban, melyeket minden gitáros ismer. Az eredmény szerint a ChatGPT az ellentétes irányba mutató perjeleket azonosként értelmezte, ez tehát inkább csak a tabulatúra utánzása, nem pedig egy tényleges zenei gondolat. Ettől függetlenül nagyon érdekes, hogy hogyan lehet használni a ChatGPT-t meglévő zenék iterálására.
A kísérlet a ChatGPT segítségével létrehozott akkorddiagramok és dalszövegek kombinálását is górcső alá vette. Bár az output meggyőző volt, többen nehezményezték, hogy a generált dallam és szöveg nem hangzik jól együtt, valahogy nem az igazi. Ebben az esetben érdemes szem előtt tartani, hogy a gép által generált szöveget nem egy az egyben, szóról szóra kell felhasználni, hanem azon még dolgozni kell saját stílusod, igényeid alapján.
Az elődök: MuseNet és Jukebox (GPT-2 és GPT-3)
A ChatGPT-ről szóló előző cikkünkben a ChatGPT-4 volt terítéken, de vessünk egy pillantást a korábbi verziókra is.
A MuseNet (GPT-2) 2019 áprilisában jelent meg. Egy neurális hálózat által működtetett rendszerről van szó, amely 4 perces zenei kompozíciókat tud generálni 10 különböző hangszerrel, és ötvözi a stílusokat Mozarton át a Beatlesig. A MuseNet nem kifejezetten a zenei ismeretek szerint lett programozva, hanem a harmónia, a ritmus és a stílus mintáit tárja fel azáltal, hogy megtanulta megjósolni a soron következő tokent több százezer MIDI-fájlban.
A Jukebox (GPT-3) indulása 2020 áprilisára datálható. Az alkalmazás egy újszerű kódolási, beágyazási, majd egy dekóder futtatási folyamaton keresztül generál zenét, hogy még jobb hangminőséget produkáljon. A Jukebox audioexportja jelentős fejlődést jelentett a MuseNethez képest, de még így is csak az olyan, durvának mondható zenei műfajok, mint például a death metal, pontos mintáját alkotta meg.
A GPT-4 zeneszerzési képességei kérdésesek, de a 2023-as fejlesztés megjelenése áttörést hoz a szövegalkotásban. A ChatGPT-4 nagyobb memóriája megfelel a hosszabb formájú narratívák vagy háttértörténetek készítésére a zenészek számára, továbbá több forrásból származó információk beépítésével lebilincselő történetek kreálhatók. Hosszabb tartalmak is generálhatók a ChatGPT-4 által, például cikkeket vagy előadói biográfiákat is készíthetünk, amelyek részletesebben feltárják a zene mögött rejlő kreatív folyamatokat.
Sokak számára meglepő lehet, de az elsősorban zeneszámok hallgatására szolgáló Spotify rendelkezik egy Basic Pitch nevű funkcióval, ami lehetővé teszi bárki számára, hogy dalt töltsön fel, melyet az alkalmazás átír MIDI-be, ami aztán ingyenesen exportálható. A Spotify szinte korlátlan GPU-teljesítménnyel, hatalmas hangadatbázissal és komoly közönségmutatókkal rendelkezik, ami a mesterséges intelligencia terén az egyik legversenyképesebb játékossá teszi.
Gépek lázadása?
Attól még, hogy tartasz tőle vagy ignorálod, a ChatGPT nem fog eltűnni, sőt, egyre inkább fejlődni, terjeszkedni fog. Zenészként, ha nem elutasítóan tekintesz az innovációra, a változásra, hanem megpróbálod beépteni a saját tempódban a saját munkafolyamataidba, csak nyerhetsz, ha mást nem, akkor tapasztalatot, de inkább kreatív ötleteket és a kísérletezés izgalmát!
Tedd próbára az új technológiát, mint anno a mára nélkülözhetetlenné vált szoftvereket, alkalmazásokat, és alkossatok együtt! A stúdióba zárkózás helyett/mellett pedig a partnerekkel és a közönséggel való kapcsolatéptítésre is érdemes koncentrálnod, hiszen ez az egyik olyan kvalitás, amellyel a mesterséges intelligencia (jelenleg) nem rendelkezik.
A kérdés már csak az, hogy, ha mostani még nem is, de a ChatGPT később változatai rendelkeznek-e majd efféle tulajdonságokkal, illetve képesek lesznek-e a nyers, őszinte, ösztönös zenealkotásra?
Szeretnél előadóként még több koncertet adni és így még több emberrel kapcsolódni a zenéd segítségével 2023-ban? Regisztrálj platformunkra!
Kiemelt kép: Canva, források: zdnet.com, audiocipher.com