„Nová umělá inteligence dokáže psát hudbu stejně dobře jako lidský skladatel.“ „Umělé inteligence se rychle stávají lepšími umělci.“ Tak zní nadpisy populárních článků věnujících se tématu umělé inteligence v automatizované kompozici. Od vydání však uběhlo pět let a nám nezbývá než se ptát: Kde se ta opěvovaná AI hudba nachází?
Podstatnou část svého života jsem se živil hudební kompozicí, ať už skládáním jinglů pro reklamní účely či tvorbou podkresů pro zpěváky, zpěvačky neb to kapely. Nepřísluší mi zde obhajovat kvalitu současné hudby; domnívám se, že o tom už bylo řečeno i napsáno mnohé. Musím však dodat, že to byly obdobné projekty, jež ve mně vzbudily širší zájem o automatizaci a algoritmickou kompozici.
Rok 2017 se nesl ve znamení velkolepých prohlášení. Technologický rozmach opravdu robustních rekurentních neuronových sítí, které umožnily reprezentovat hudbu jako sled navazujících událostí a modelovat ji jako podmíněnou pravděpodobnost mezi jednotlivými hudebními událostmi, byl takřka všudypřítomný (nehledě na to, že tato technologie byla dostupná již od přelomu tisíciletí). Naše antropomorfní tendence nahlížet na strojové učení nikoliv jako na proces matematického modelování a statistickou analýzu, nýbrž jako na rovnocenného konkurenta v závodu o zakázky na filmovou hudbu, mnohé z nás alespoň na chvíli zaslepila.
Hudební kompozice mě již neživí, mým každodenním chlebem však zůstala umělá inteligence a možnost jejího klinického nasazení ve zdravotnickém segmentu, především pak jako asistenční metody pro popis radiologických snímků. Domníváte se, že situace je zde jiná? Nikoliv. Andrew Ng, spoluzakladatel divize Google Brain a jeden z předních expertů na umělou inteligenci, se nechal (shodou okolností taktéž v roce 2017) slyšet, že již nyní je zbytečné trénovat radiologické experty ke čtení snímků, protože jejich expertíza brzy nebude potřeba. A zdaleka není jediným odborníkem, který toto tvrdí.
Avšak vraťme se k autonomní kompozici. Jak bylo zmíněno, potřebnou technologií disponujeme již od počátku nového milénia. Funkční metodologický postup pro počítačem generovanou tvorbu známe nejpozději od roku 1956, kdy dali Lejaren Hiller a Leonard Isaacson vzniknout projektu The Illiac Suite for String Quartet. A když se nad tím zamyslíme, přijdeme na to, že současné projekty se od takřka sedmdesát let starých nahrávek příliš neliší.
Dobře, pojďme zkusit nalézt nuance. Lepší architektura. Vyšší výpočetní výkon. Dostupnější trénovací data. Něco jsem opomenul?
Snažíme se sami sebe přesvědčit, že jsme schopni vytvořit digitální dvojče, avatara, který přesně imituje vzory a zvyklosti původních či současných autorů. Avšak namísto toho spíše hledáme sebenaplňující proroctví, takové fake it till you make it, které nepřichází. Za existujícími projekty stojí investoři, nadšenci a grantové projekty, všichni plni očekávání, že hodina pravdy nastala. Odpovědí jim je pečlivě vyselektované, vyprázdněné simulakrum, jež je zkomponováno týmem zkušených skladatelů a předneseno špičkovým symfonickým orchestrem. V čem je to vůbec jiné oproti Illiac Suite?
Kanadský profesor Philippe Pasquier se věnuje teorii a praxi umělé inteligence se zaměřením na kreativní a umělecké aplikace. Mimo jiné vědecké práce je autorem článku An Introduction to Musical Metacreation, kterému jsem se věnoval v předchozím textu. Mezi nejzajímavější kapitoly se řadí ta, jež vypovídá možnostech evaluace aplikací pro algoritmickou kompozici. A obsah? Kompozici, přeci tak silně podléhající subjektivním preferencím, bychom měli posuzovat podle reakcí publika, případně kritiků a tisku. Jak v knize AI Art píše Joanna Zylinska: my přeci víme, jaké umění se nám líbí a přesně takové umění my chceme…
Jestli se vám zdá text příliš pesimistický, jste na omylu. Hlavní rozdíl totiž spočívá mezi humbukem, chcete-li nafouknutou bublinou, a soustavnou činností s přesahem do skutečného světa, kterou však do dnešního dne příliš nevídáme. Každý chce být průkopníkem, ale jen málokdo si uvědomuje, že tam práce nekončí, nýbrž naopak začíná. Cesta k rozsáhlejší aplikaci umělé inteligence do skutečné; komerční, akademické i umělé praxe je dlážděna sotva pozorovatelnou mravenčí práci. Třeba takovou, kterou dělá Spotify Creator Technology Research Lab, přestože bychom s jejich cíli nejspíše nemohli souhlasit: společnost byla v minulosti již několikrát nařknuta z vytváření tzv. fake artists, neexistujících producentů nenáročných muzak skladeb. To by firmě potenciálně umožnilo licencovat takové skladby za výrazně nižší cenu než obvykle, čímž by se snížila obrovská částka, kterou ročně vyplácí držitelům hudebních práv.
I od obdobných nařknutí, kdy se jinak nedohledatelní umělci opakovaně objevovali v oficiálních playlistech společnosti, již uběhlo několik let, přesto se dá mluvit spíš o bouři ve sklenici vody. Jestli velkolepá vyjádření zainteresovaných projektů či firem ublížila vnímání umělé inteligence v kreativních průmyslech, to nehodlám hodnotit. Praxe však naznačuje, že naše očekávání možná přeci jen byla nerealistická.