Trendy |

Arthur I. Miller | Artysta drzemiący w maszynie28.10.2019

ilustracja: Patryk Sroczyński, animacja: Paweł Szarzyński

Komputery tworzą dziś nowy, wspaniały świat obrazów, dźwięków i historii na skalę wcześniej niespotykaną. Gerfried Stocker, znany ze swoich prowokacyjnych wypowiedzi dyrektor artystyczny Ars Electronica w Linz, mówi: „Zamiast zastanawiać się, czy maszyny mogą być innowacyjne i twórcze, powinniśmy zadać sobie pytanie: «Czy jesteśmy w ogóle w stanie docenić sztukę stworzoną przez maszynę?»

Poniższy fragment pochodzi z książki „The Artist in the Machine: The World of AI-Powered Creativity” autorstwa Arthura I. Millera  (The MIT Press, 2019). Został zaadaptowany na potrzeby Papaya.Rocks.

Dostrzegając rzeczy, których my nie widzimy, DeepDream od Alexandra Mordvintseva łączy ze sobą obrazy w sposób niezwykle innowacyjny i tym samym nierzadko dla ludzkiego odbiorcy niepokojący. Za pomocą generatywnych sieci przeciwstawnych (GAN), Ian Goodfellow daje komputerom możliwość oceny własnych dzieł bez asysty człowieka. Jak przyznaje, GAN jest dla AI tym, czym dla człowieka jego wyobraźnia. Ahmed Elgammal wykorzystał tę technologię do rozwinięcia swojej własnej sieci, CAN (Creative Adversarial Network), poszukując sztuki nie tylko zdecydowanie nowatorskiej, ale też przyjaznej dla ludzkiego oka. Programy takie jak Pix2Pix płodzący kompletne dzieła na podstawie samego ich konturu, czy CycleGan działający na zasadzie łączenia ze sobą dwóch różnych fotografii, stworzyły obrazy nie tylko wcześniej niewidziane, ale też dotychczas niewyobrażalne.

Na przestrzeni dziejów, za każdym razem, kiedy pojawiał się artysta, który łamiąc schematy tworzył sztukę niemożliwą do sklasyfikowana według istniejących kategorii, powstawał całkiem nowy nurt – tak stało się chociażby z Picassem i jego kubizmem. Sztuka w wykonaniu komputerów również często nie mieści się w tradycyjnym pojmowaniu tego terminu. Zamiast tego, przesuwa ona jego granice. „Komputery zmieniają sposób, w jaki malują ludzie,” mówi Alberto Barqué-Dura, artysta i performer stosujący w swojej pracy sztuczne sieci nieuronowe. I faktycznie, od tego roku laureatem stworzonej przez Gerfrieda Stockera nagrody Prix Ars Electronica, zostać można w zupełnie nowej kategorii: Sztucznej Inteligencji i Sztuki Życia.

Głównym celem wszystkich zajmujących się generowaną komputerowo sztuką, literaturą i muzyką jest stworzenie dzieła wybiegającego ponad pojmowanie danego gatunku.

Jeśli chodzi o muzykę, Project Magenta jest pierwszym komputerem, który skomponował własną melodię pomimo, że nie był wcześniej do tego celu zaprogramowany. Sztuczne sieci neuronowe, takie jak NSynth od Magenty, eksplorują nowe obszary muzyki produkując niesłyszane nigdy wcześniej przez człowieka dźwięki. Między muzyką napisaną przez maszynę z jej własnej inicjatywy (end to end) oraz skomponowaną przez komputer specjalnie w tym celu zaprogramowany (rule-based) jest ogromna różnica. Na ten moment podejście rule-based daje rezultat muzyki melodyjnej i o złożonej strukturze, będąc rozwiązaniem wykorzystywanym najczęściej do pomocy w kompozycji i odpowiednim opracowaniu utworu muzykom. Przynajmniej na razie takie oprogramowanie produkuje utwory na podobieństwo tych, których się już nauczyło. Sam poziom ich złożoności może jednak wyznaczać nowe trendy w komponowaniu, być może nawet prowadząc nas w kierunku muzyki, której nikomu wcześniej nie udało się wyśnić. Wszak głównym celem wszystkich zajmujących się generowaną komputerowo sztuką, literaturą i muzyką jest stworzenie dzieła wybiegającego ponad pojmowanie danego gatunku.

Generowana przez komputer literatura jest jeszcze gorzej zbadanym przez nas gruntem. Najlepszym na to dowodem jest pojawiające się pytanie o to czy, i w jaki sposób, maszyny mogą posiadać i wyrażać emocje. Jeszcze więcej pytań przysparzają próby zrozumienia ludzkiego poczucia humoru. Nawet w przypadku tych najbardziej prymitywnych dowcipów maszyny nie zdają sobie sprawy z tego, że żartują. Nie posiadają świadomości, co nie oznacza, że nie robią czasem czegoś ujmującego i zaskakującego. Takie zachowanie może wydawać się w oczach człowieka tożsame ze świadomością, tak jak stało się to gdy odpowiedzialne za scenariusz filmu Sunspring AI niespodziewanie zadeklarowało: „Na imię mam Benjamin.” 

Dzięki swojej złożoności i ogromnemu zasobowi słów, algorytm Tony’ego Veala, Scéalextric, potrafi pisać stosunkowo wyrafinowane historie. Raz udało mu się nawet skorzystać z własnej twórczej inwencji, łącząc ze sobą postacie Franka Underwooda i Keysera Söze.

Na razie zaprogramowane maszyny zazwyczaj generują historie bardziej wysublimowane niż te autorstwa niezależnych sztucznych sieci neuronowych. Dzięki swojej złożoności i ogromnemu zasobowi słów, algorytm Tony’ego Veala, Scéalextric, potrafi pisać stosunkowo wyrafinowane historie. Raz udało mu się nawet skorzystać z własnej twórczej inwencji, łącząc ze sobą postacie Franka Underwooda i Keysera Söze, obydwie grane przez tego samego aktora, Kevina Spacey. Tym samym komputer obszedł własny system.

Większość zaprogramowanych (rule-based) systemów posiada wewnętrzne ograniczenia, które mają na celu zapobiec tworzeniu nonsensu. Sztuczne sieci neuronowe produkują natomiast poezję i prozę przekraczającą często nawet i tę granicę, tak jak stało się to w przypadku scenariusza Sunspring, czy zainspirowanej obrazami poezji autorstwa „kamery słów” (ang. word camera) zaprogramowanej przez twórcę Sunspring, Rossa Goodwina. 

Poeci tacy jak Nick Montford czy Allison Parrish korzystają z algorytmów, aby móc w badaniu przestrzeni semantycznej stąpać po tej cienkiej linii między sensem i nonsensem. Parrish skupia się na pytaniu, czym nonsens w zasadzie jest. Czy słowo jest bez sensu po prostu dlatego, że nigdy go wcześniej nie słyszeliśmy? Z pomocą komputerów badacze są dziś w stanie poszerzać nasze horyzonty i pogłębiać rozumienie tego, co jest dla nas akceptowalne, a co w ogóle interesujące.

Na razie największą przeszkodą jest fakt, że maszyny nie potrafią docenić sztuki i muzyki, którą same produkują.

To, jak próbujemy interpretować prozę maszyn, może rzucić światło na to, jak przyjmiemy generowaną komputerowo prozę w przyszłości, prozę pisaną już przez obcą nam formę życia. Możemy być pewni, że w przyszłości komputery będą produkować literaturę inną niż cokolwiek, co potrafimy sobie wyobrazić. Naszym instynktem jest próba znalezienia we wszystkim sensu. Lecz jeśli nowa, pisana przez prawdziwie wysublimowane maszyny forma literatury się pojawi, możemy nie być już w stanie. Być może, kiedy nauczymy się w końcu ją doceniać, zaczniemy sięgać po nią nawet częściej niż po książki pisane przez człowieka.

Na razie jednak największą przeszkodą jest fakt, że maszyny nie potrafią docenić sztuki i muzyki, którą same produkują, że pozostają niewzruszone geniuszem swoich ruchów w szachach i grze Go. Że zwyczajnie brakuje im świadomości.

Kreatywność u Ludzi i Maszyn

W jaki sposób będziemy potrafili rozpoznać, że maszyną kieruje kreatywność? Większość zgodziłaby się, że dowiedzieć możemy się jedynie przyrównując ją do naszej własnej. Programować komputery możemy wyłącznie wedle własnego sposobu myślenia i swojej własnej inwencji. Więc kiedy maszyny osiągną już nasz poziom inwencji, one też będą w stanie wyprodukować swoją własną reatywność – kreatywność, której obecnie nie potrafimy sobie nawet wyobrazić.

Kierujący w Google Project Magenta Douglas Eck ostrzega, że błędem byłoby dzielenie świata na ludzki i ten zagospodarowany przez AI, próbując uzasadnić konieczność zrozumienia ludzkiej kreatywności przed przystąpieniem do studiowania jej w maszynach. Takie zachowanie, argumentuje Eck, przypomina działania kompozytora i teoretyka muzyki Freda Lerdahla i lingwisty Raya Jackendofa, którzy próbowali stworzyć generatywną teorię muzyki tonalnej w oparciu o generatywną teorię gramatyki Chomsky’ego, zbiór pustych formularzy gromadzących treści poprzez słuchanie mowy.

Propozycja Lerdahla i Jackendoffa z 1983 r. zakładała zaprogramowanie zestawu struktur opisujących sposób, w jaki nuty są pogrupowane, rodzaje możliwych przejść między nimi, a także ich tempo, czas trwania itd. Badacze stwierdzili, że struktury te tworzą w naszej podświadomości swego rodzaju muzyczną gramatykę, z której korzystamy potem do odczytania struktury konkretnego utworu, dodając przy tym, że zdolność do identyfikowania i demaskowania tych nieuświadomionych struktur jest konieczna do dokładnego odsłuchiwania i wykonywania muzyki.

Eck natomiast całkowicie odrzuca to podejście. Badacz spiera się, że „koncepcja priorytetyzacji zrozumienia struktury muzyki, po to, żeby dopiero później pojąć jej dynamikę czy wykonanie, jest niedorzeczna – wszystkie te aspekty są bardzo blisko ze sobą związane”. Podobnie, pytany o to, czy powinniśmy najpierw spróbować zrozumieć ludzką kreatywność, zanim w ogóle zabierzemy się za szukanie jej w maszynach, odpowiada: „Kreatywność od zawsze zakorzeniona jest w naszej kulturze i nie inaczej sprawa ma się z technologią. Naciskanie na rozkład problemu na osobne czynniki – analiza ludzkiej kreatywności w odłączeniu od reszty naszej rzeczywistości tylko po to, by potem zrozumieć, jak wszystko wzajemnie na siebie wpływa, pokazuje fundamentalne braki w rozumieniu specyfiki fenomenu.” Dla Ecka „technologia dała nam sztuczną inteligencję, która tworzy rzeczy dla nas piękne; nic dziwnego więc, że zaczynamy o nich myśleć w innych kategoriach. Nie powinniśmy natomiast reagować na to krzycząc: «ale zaraz, spróbujmy pojąć najpierw kreatywność człowieka!»”.  

Co dzieje się w mózgu maszyny? Co zachodzi w warstwach ukrytych, w centrum mocy przerobowych komputera?

Margaret Boden, profesor i badaczka kognitywistyki na Uniwersytecie w Sussex była jedną z pierwszych osób, które zasugerowały, że programy komputerowe mogą mieć sporo wspólnego ze sposobem działania ludzkiego umysłu. W skrócie Boden proponuje trzy kryteria oceny, czy pomysł lub artefakt są wynikiem kreatywności: nowatorskość, jakość i zdolność do zaskoczenia odbiorcy. Wedle tych kryteriów można powiedzieć, że 90-sekundową melodię Project Magenty charakteryzuje kreatywność. 

Ale czy naprawdę kryteria Boden wystarczają do opisania kreatywności, zarówno naszej i maszyn? Skupiają się one w końcu bardziej na produkcie niż procesie. Szczególnie w przypadku komputerów proces kreatywności jest niezwykle ważny. Pytaniem jest, co dzieje się w mózgu maszyny? Co zachodzi w warstwach ukrytych, w centrum mocy przerobowych komputera? Możemy dostrzec rezultaty ich pracy, ale wciąż nie potrafimy pojąć, jak działają. To właśnie zagadka warstw ukrytych była dla Alexandra Mordvintseva impulsem do stworzenia DeepDream, który ostatecznie sam stał się kolejnym krokiem w kierunku ich zrozumienia.

000 Reakcji

Profesor emeritus na wydziale Historii i Filozofii Nauki na University College London. Autor „Colliding Worlds: How Cutting-Edge Science is Redefining Contemporary Art” i innych książek, takich jak m.in. „Einstein, Picasso: Space, Time, and the Beauty That Causes Havoc”.

zobacz także

zobacz playlisty