Katarzyna Górska – Kulturomiczny cul de sac? O nowym podejściu w naukach o kulturze.

Streszczenie:

Kulturomika jest nowym tworem w obrębie studiów kulturowych. Jest swoistą próbą włączenia technologii informatycznych w dotychczasowy obszar humanistyki. Polega na przeprowadzeniu ilościowych i statystycznych analiz na olbrzymich zbiorach danych. Badania kulturomiczne pozwalają zaobserwować zmienność czestotliwości występowania danego wyrazu lub wyrażenia na przestrzeni czasu. Metoda ta prowadzi często do ciekawych wniosków, jednak istotnym ograniczeniem jest tutaj brak interpretacji. Zgodnie z założeniami twórców kulturomika służyć miała odkrywaniu i poznawaniu kultury człowieka. Ale to oryginalne zjawisko cyfrowej humanistyki budzi pewne wątpliwości i zastrzeżenia.

Abstract:

Culturomics is a brand new creation in the area of culture studies. It is an attempt to introduce IT into traditional humanities. This approach is based on quantitative and statistical analysis of high-throughput data. Culturomic research let us observe changes in the usage frequency of given word or phrase over the time. This method often leads to curious results, though lack of interpretation is a certain obstacle here. According to assumptions of its creators, culturomics was meant to discover human culture. However this original phenomenon of digital humanities drives to several doubts and questions.

Dzisiejsza humanistyka podlega rewolucyjnym zmianom, można powiedzieć, iż nigdy dotąd nie była nauką tak interdyscyplinarną i nigdy dotąd nie była związana w takim stopniu z naukami ścisłymi. Technologia cyfrowa wprzęgnięta w nauki humanistyczne umożliwiła wiele zmian, które niewątpliwie są korzystne, jeśli przyczyniają się do upowszechniania wiedzy. Trzeba przyznać, że humanistyka cyfrowa dzisiaj jest już faktem i nie sposób zignorować jej metod i narzędzi. Współczesna nauka o kulturze była ostatnimi czasy świadkiem narodzin fenomenu nazwanego kulturomiką (z ang. culturomics). Twór ów jest równie ciekawy, co i niepokjący, jeśli rzecz się tyczy ewolucji tej dziedziny naukii. Dyscyplina wedle słów jej propagatorów służyć ma poznaniu „genomu ludzkiej kultury”. Ale czy obrana technika metodologiczna rzeczywiście czyni przedsięwzięcie wykonalnym?

Nauka ta, a stosując bardziej precyzyjną nomenklaturę należałoby rzec metoda, polega na ilościowej analizie zawartości tekstualnych zgrupowanych w określonej bazie danych. Nazwa wywodzi się od terminu genomika, czyli dziedziny biologii, która zajmuje się analizą genomów – podstawowych jednostek zawierających materiał genetyczny. W nowopowstałej dziedzinie wiedzy analogiczną jednostką, stanowiącą kod genetyczny kultury człowieka, byłby kulturom (z ang. culturome). Aczkolwiek termin ten ma charakter wyłącznie teoretyczny i jest wybitnie abstrakcyjny, żeby nie powiedzieć fantastyczny. Zgodnie z Macmillan Dictionary definicja słowa culturomics wyjaśnia, iż jest to pole badań, w którym kulturowe trendy powiązane są z ilościową analizą użycia słowa w konkretnym okresie czasu. Przyrostek –omics jest popularny i typowy dla nauk biologicznych, a sama nazwa culturomics jest pierwszym przykładem jej użycia całkowicie poza dyscypliną biologii i poza naukami ścisłymi. Interesującym jest fakt, że American Dialect Society na początku 2011 roku ogłosiło nazwę kulturomika „neologizmem roku 2010”, który ma najmniejsze szanse na przyjęcie się w języku (Maxwell, 2011). Kulturomika jednak jako termin zyskała dość dużo sławy, nawet w przestrzeni naukowej, choć przez humanistykę generalnie jest krytykowana jako dość ograniczone narzędzie.

Rewolucja kulturomiczna, można uznać, że na dobre rozpoczęła się w 2011 r., jest owocem współpracy ekspertów z Harvard University i firmy Google. W wirtualnej przestrzeni kulturomika objawiła się głównie poprzez serwis www.culturomics.org prowadzony właśnie przez The Cultural Observatory (Harvard University), a także bezpośrednio przez narzędzie The Google Labs – Books Ngram Viewer http://ngrams.googlelabs.com/. To właśnie ów instrument pozwala na błyskawiczne przefiltrowanie pod względem konkretnego terminu lub kilku terminów zawartości cyfrowo utrwalonej i zgromadzonej w bazie Google. A baza ta zawiera przeszło 5 milionów pozycji z lat 1800 do 2000, co stanowi blisko 4% wszystkich opublikowanych książek świata i tworzy korpus 500 miliardów wyrazów. W tej chwili możliwe jest przeszukiwanie bazy w paru językach, oczywiście najbardziej rozbudowane zasoby są w języku angielskim, ale Ngram Viewer przeszukuje też terminy w językach francuskim, hiszpańskim, niemieckim, rosyjskim, hebrajskim czy też chińskim. Błyskawiczna analiza przeprowadzana przez narzędzie Google zostaje zobrazowana przy pomocy n-gramu, wykresu graficznie przedstawiającego zmiany częstotliwości występowania danego terminu lub terminów. Przeszukiwanie bazy dla jednego wyrazu zostanie zwizualizowane poprzez tzw. 1-gram, natomiast dla 5-cio wyrazowego wyrażenia będzie to odpowiednio 5-gram. Prócz tego pod każdym wykresem znajdują się pogrupowane latami zbiory hiperłączy odsyłających do konkretnych pozycji zawierających wyszukiwany termin. Rysunek 1 prezentuje taki porównawczy wykres dla terminów kultura i natura.

<Rys.1>

W przestrzeni naukowej zapowiedzią kulturomiki był artykuł, który ukazał się na łamach czasopisma Nature w 2007 r., dwaj główni propagatorzy nowego podejścia z The Cultural Observatory Erez Lieberman Aiden i Jean-Baptiste Michel opublikowali tekst zatytułowany Quantifying the Evolutionary Dynamics of Language, dotyczący badań ewolucji i dynamikii zmian językowych. Na początku roku 2011 w magazynie Science (w wirtualnym wydaniu czasopisma artykuł był dostępny już w grudniu 2010) pojawia się artykuł także autorstwa wyżej wspomnianych naukowców pt.: Quantitative Analysis of Culture Using Millions of Digitized Books. To właśnie w nim po raz pierwszy wprowadzono i wyjaśniono termin kulturomika (Michel, 2011, 176-182). Rysunek 2 przedstawia okładkę czasopisma Science (Vol.331, Issue 6014) poświęconego kulturomice, zdjęcie przedstawia wnętrze wieży zbudowanej z tysięcy książek, czyli rzeźby Idiom Mateja Kréna. Należy wyjaśnić, iż obydwa artykuły mają tak naprawdę wielu autorów, w sumie jest ich trzynastu oraz The Google Books Team. Poza reprezentantami internetowego giganta, są też naukowcy z Uniwersytetu Harvarda i Massachusetts Institute of Technology. Zatem kulturomika zaczęła rozpościerać swe skrzydła i rzeczywiście zdołała przez chwilę zdobyć zainteresowanie. Magazyn Science do dzisiejszego dnia opublikował co najmniej pięć artykułów bezpośrednio odwołujących się do kulturomiki, nie wliczając w to publikacji Michela i Aidena. Aktywnie więc uczestniczy w rozwoju nowego podejścia z The Cultural Observatory i stara się propagować je w naukowym środowisku. Warto też zauważyć, ze w kulturomicznej drużynie są głównie matematycy, inżynierowie i inni reprezentanci nauk ścisłych, Erez Lieberman Aiden jest matematykiem i biologiem molekularnym, Jean-Baptiste Michel również jest absolwentem matematyki stosowanej, doktoryzował się natomiast w dziedzinie biologii systemowej. Meteoda przez nich wykorzystywana również odwołuje się do technologii cyfrowej i systemów komputerowych, jedynie przedmiot ich zainteresowań jest już wybitnie humanistyczny. Być może tu należy dopatrywać się największego osiągnięcia kulturomiki, która wprowadziła nauki ścisłe i najnowsze technologie do zupełnie obcej im dyscypliny. Ale czy humanistyka cyfrowa jest zdolna udzielić odpowiedzi na pytania tradycyjnej humanistyki?

<Rys.2>

<Rys.3>

Kulturomika mianowana została nowym podejściem w poznaniu kulturowego dorobku ludzkości, warto jednak zastanowić się, co tak naprawdę wnosi do dzisiejszej nauki. Najistotniejszym osiągnięciem tej metody miała być analiza zmian trendów kulturowych i ludzkich zachowań (warto podkreślić, że autorzy nie odwoływali się wyłącznie do trendów językowych) na podstawie ilościowych danych na temat występowania konkretnego terminu w określonym momencie historycznego rozwoju. Przykładem wykorzystania rzeczonej techniki jest film Science Hall of Fame (http://fame.gonzolabs.org/video), który przedstawia panteon najbardziej znanych naukowców dwóch poprzednich stuleci. Rysunek 3 przedstawia kadr z filmu. Wykorzystując narzędzie Ngram Viewer John Bohannon, Adrian Veres i Jonathan Feinberg stworzyli muzyczny klip przedstawiający nazwiska naukowców, których popularność wyznaczono właśnie metodą kulturomiczną. Taka konceptualizacja i operacjonalizacja pojęcia sławy może budzić pewne zastrzeżenia, ale nie można jej zarzucić bezpodstawności. Dzięki narzędziu do ilościowej analizy zawartości tekstu eksperymenty takie jak ten stają się niebywale proste i nie wymagają ogromych pokładów czasu i pracy. Ale czy eksperymentowi temu nie bliżej do interesującej zabawy, niż do rzetelnej metody naukowej? Nauka, a nauka o człowieku i kulturze w szczególności, powinna opierać się na fundamentach zbudowanych z problemów badawczych i u swych podstaw wypływać z konkretnego procesu kognitywnego, a nie być próbą sklasyfikowania świata i ujęcia go w ramy statystyk i wykresów. Być może Pitagorejczycy mylili się w swym stwierdzeniu, iż „wszystko jest liczbą” i świata nie da się zamknąć w cyfrach. Wydaje się bowiem, że umyka nam wtedy jakaś część otaczającej rzeczywistości, ta niesamowitość świata, która odkrywa się dopiero wtedy, gdy zadamy pytanie jak, a nie ile. Metodologia ilościowa w naukach o kulturze jest o tyle przedsięwzięciem jałowym, że bez interpretacji dostarcza nam wiedzy jedynie o skali zjawiska. Podejście kulturonomiczne ogranicza się do ilościowej analizy danych, a brak interpretacji istotnie zawęża rezultaty badawcze. Animację The Science Hall of Fame można potraktować jako formę zabawy narzędziem NgramViewer i niewątpliwie metoda ta służyć będzie mogła takiej chwilowej rozrywce pod postacią pseudonauki. Być może będzie również wstępem do przyszłych badań opartych już na głębszych i istotnych problemach badawczych. Zmiany zachodzące w humanistyce nie muszą być pojmowane jako przeszkody, znacznie korzystniejsze będzie traktowanie ich jako nowe możliwości lub wyzwania współczesnej nauki. Naukowcy związani z kulturomiką zdają się mieć świadomość ograniczeń metody, sam Erez Lieberman Aiden mówi, iż narzędzie to służy raczej stawianiu pytań, niż zyskiwaniu odpowiedzi: „Pomyślcie o tym, jako o generującym hipotezy narzędziu” (Keim, 2010). Rzeczywiście wykorzystując narzędzie Ngram Viewer właściwie nie uzyskujemy żadnych odpowiedzi, choć wyniki graficzne są niezwykle intrygujące, to nie sposób powiedzieć, co tak naprawdę oznaczają.

Kultura i jej język to nie inżynieria, dlatego szczegółowej analizy jakościowej nie sposób pominąć, bo algorytm nigdy nie doprowadzi nas do znaczenia. Zrozumienie w naukach o kulturze i człowieku rzadko kiedy jest kwestią liczby, która zdaje się podawać nam jedynie informację-detal. Zatem czy kultura rzeczywiście może być badana tak jak ludzki genom? Porównanie zdaje się być zbyt daleko posunięte. Sam korpus danych zgromadzonych przez Google Books nie odzwierciedla mnogości sensów i znaczeń ustalonych w toku rozwoju ludzkiej kultury. A nawet jeżeli tak by było, to ilościowa analiza da nam wiedzę jedynie o kulturowej mozaice, w najmniejszym stopniu nie pomoże nam jej jednak zrozumieć. Czytanie i wnikliwa, kontekstualna analiza tekstu w dalszym ciągu pozostaną niezastąpione. Sami naukowcy z The Cultural Observatory mają zresztą tego świadomość, co potwierdzają na stronach swego serwisu, a także w artykule pt.: Quantitative Analysis of Culture Using Millions of Digitized Books. Przepaść między podejściem ilościowym a jakościowym nie jest dystansem nie do pokonania, ale trzeba pamiętać, że dopiero rozsądne połączenie obu metodologii służyć będzie nauce. Poza tym pojawia się jeszcze jedno zastrzeżenie, czyli badanie kultury wyłącznie na podstawie analizy tekstów pisanych. Niewątpliwie język dostarcza ogromnej wiedzy na temat człowieka i konstruowanego przez niego świata, ale jest poniekąd autonomicznym dyskursem, którego nie sposób zrównać z terminem kultura. Język jest jedną z form symbolicznej komunikacji, ale trzeba mieć świadomość ograniczoności tez wysuwanych na podstawie badań lingwistycznych. Zdaje się, że nie wyczerpują one swej prawomocności dla całości fenomenu kulturowego człowieka. Lingwistyka komputerowa czy też jej gałąź leksykologia, do której właściwie należy dziedzina zwana kulturomiką, jest interdyscyplinarnym działem wiedzy, który zaczął na dobre rozwijać się w drugiej połowie XX wieku. Zadaniem tego działu językoznawstwa było odkrycie reguł rządzących językiem i mową przy pomocy technologii komputerowych. Kulturomika zajmuje się właściwie tylko badaniami nad ewolucją języka, chociaż ze względu na rozpiętość czasową korpusu (okres 200 lat od 1800 do 2000 r.) przenosi wnioski leksykalne na całość zwaną kulturą. Ale to wydaje się już być pewnym nadużyciem.

Warto przy tym zwrócić uwagę, że taka ilościowa analiza zawartości była już w naukach humanistycznych obecna, metody kwantytatywne polegające na badaniu korpusów językowych wykorzystywane są m.in. w lingwistyce. I nagle kulturomika traci urok rewolucyjnego wynalazku. Jednak kolejny raz należy jej oddać pochwałę za usprawnienie i upowszechnienie metody. Trzeba zauważyć, że samo narzędzie Ngram Viewer mogłoby posiadać więcej możliwości przeszukiwania korpusu tekstowego, choć wkrótce pewnie analiza będzie możliwa przy bardziej zaawansowanych ustawieniach przeszukiwania (np. z wyłączeniem konkretnego przypadku występowania terminu, który nie będzie badacza interesował). Poza tym naukowwcy z The Cultural Observatory posiadając dostęp do całego korpusu, mają znacznie więcej możliwości przeprowadzania badań ilościowych. Owocem ich pracy są m.in. wspomniane artykuły, w których byli wstanie wnikliwie przestudiować zmiany lingwistyczne zachodzące na przestrzeni czasu. Jednak korzystając z samego narzędzia internetowego, możliwości są skrajnie ograniczone i właściwie zawężają się do stwierdzenia częstotliwości, czyli ilościowego występowania danego terminu w konkretnym okresie czasu.

We wrześniu tego roku mogliśmy również obserwować ciekawą ewolucję, jaka dokonała się w obrębie kulturomiki. A mianowicie powstanie kulturomiki 2.0 (z ang. Culturomics 2.0). Kalev H. Leetaru w swoim artykule zatytułowanym Culturomics 2.0: Forecasting Large-Scale Human Behavior Using Global News Media Tone in Time and Space ogłosił powstanie tego nowego podejścia. Wychodząc od szeroko zakrojonych badań nad literaturą, Leetaru stwierdził, że może w ten sam sposób analizować aktualne wiadomości medialne, uwzględniając przy tym elementy kontekstu, takie jak ton wiadomości (pozytywny lub negatywny) i lokalizacja geograficzna. Wykorzystując bazy danych gromadzące materiał informacyjny z prawie wszystkich państw świata z okresu 30 lat, doszedł do wniosku, że zarówno wydarzenia tegorocznej arabskiej wiosny, jak i miejsce kryjówki Osamy Bin Ladena czy też konflikty i przyjaźnie pomiędzy poszczególnymi państwami mogłyby być przepowiedziane przez kulturomiczną metodę. W podejściu kulturomicznym słowa lub wyrażenia traktowane były jako wyizolowane ze znaczenia przedmioty analiz częstotliwości, tymczasem kulturomika 2.0 „koncentruje się na rozszerzeniu tego modelu przez wprowadzenie do systemu informacji wyższego poziomu o każdym ze słów, przede wszystkim skupiając się na tonie wiadomości (news tone) i geograficznej lokalizacji, zważywszy na ich znaczenie w zrozumieniu relacji.” (Leetaru, 2011). Największym zarzutem, jaki można postawić kulturomice 2.0, jest właśnie to, że mogła przepowiedzieć owe wydarzenia, ale nigdy tak się nie stało. Jednak wprowadziła nową jakość do dotychczasowych badań kulturomicznych, przesuwając punkt ciężkości na kontekst informacji. Jeśli tylko metoda ta będzie ewoluować w tym kierunku, to rzeczywiście można się spodziewać interesujących badań i ich jeszcze ciekawszych wyników.

<Rys.4>

Informatyka i technologia mogą być innowacją w służbie studiom kulturowym, ale warto mieć świadomość ograniczeń i wad tegoż mariażu. O ile inne twory powstałe na płaszczyźnie Nauki 2.0 mogą spowodować prekursorskie zmiany w obrębie klasycznej koncepcji nauki, o tyle kulturomika nie budzi większych oczekiwań. Jako narzędzie w metodologii triangulacyjnej  z pewnością może być wykorzystywana, ale wypada wątpić, że stanie się niezależną metodą badawczą. Mimo to, tradycyjna edukacja właściwie nie pozostaje w sprzeczności z wykorzystaniem technologii internetowej, odpowiednie połączenie obu metod jest krokiem naprzód. Niewątpliwym potencjałem technologicznych rozwiązań w nauce jest jej upowszechnienie i rozszerzenie kontekstu społecznego, nigdy wcześniej wiedza nie była dostępna na taką skalę. Zatem abstrahując od pozostałych motywów, przystoi oddać szacunek, jeśli szczere są słowa firmy Google, iż jej misją „jest uporządkowanie światowych zasobów informacji, tak aby stały się powszechnie dostępne i użyteczne.” (Google) W związku z tym nasuwa się pytanie czy technologia będzie zbawieniem czy przekleństwem współczesnej nauki? Z pewnością jest jeszcze zbyt wcześnie, aby oceniać zjawisko przy pomocy kategorii ostatecznych. Wszystko, co przyczynia się do upowszechniania wiedzy, a technologie cyfrowe i informatyczne umożliwiły to na niestpotykaną dotąd skalę, powinno być korzystne dla rozwoju nauki. Jednak niektóre z przedsięwzięć i kierunków dzisiejszego rozwoju mogą budzić konkretne wątpliwości. Kulturomika zatem generuje jedno ważne pytanie, czy humanistyka rzeczywiście może być cyfrowa, czy też granice dyscyplin naukowych są na tyle trwałe, że nie jest to możliwe? Jedynym, na co można sobie obecnie pozwolić jest stwierdzenie, że transcendentalne podejście, nieuznające nieprzekraczalności barier dziedzinowych, przyniesie zaskakujące rezultaty.

Źródła ilustracji (na dzień: 13.09.2011):

Rys.1 http://ngrams.googlelabs.com

Rys.2 http://www.sciencemag.org

Rys.3 http://fame.gonzolabs.org/video

Rys.4 http://www.johnbohannon.org

Bibliografia:

Bénel, Aurélien, Lejeune, Christophe; 2009, Humanities 2.0: documents, interpretation and intersubjectivity in the digital age, w: International Journal of Web Based Communities, Vol.5, No.4

Bohannon, John; 2011, The Science Hall of Fame, w: Science, Vol.331, Issue 6014 (2011), s.143

Google; Strona Główna> Wszystko o Google> Firma,  z: http://www.google.com/intl/pl/about/corporate/company/ (na dzień 13.09.2011)

Frow, John; 2005, The Public Humanities; w: The Modern Language Review, Vol. 100, Supplement: One Hundred Years of “MLR” General and Comparative Studies

Keim, Brandon; 2010, Cultural Evolution Could Be Studied in Google Books Database, z: WiredScience http://www.wired.com/wiredscience/2010/12/cultural-evolution-google/ (na dzień 13.09.2011)

Leetaru, Kalev H.; 2011, Culturomics 2.0: Forecasting Large-Scale Human Behavior Using Global News Media Tone in Time and Space, w: First Monday, Vol.16 Number 9 – 5 September 2011

Maxwell, Kery; 2011, Definition of Culturomics. BuzzWord from Macmillan Dictionary,  http://www.macmillandictionary.com/buzzword/entries/culturomics/ (na dzień 13.09.2011)

Michel, Jean-Baptiste et al.; Quantitative Analysis of Culture Using Millions of Digitized Books, w: Science, Vol.331, Issue 6014 (2011), ss. 176-182. [Published online ahead of print: 12/16/2010]

Nunberg, Geoffrey; 2011, Counting on Google Books; w: Chronicle of Higher Education, Vol. 57, Issue 18

Biogram:

Mgr Katarzyna Górska – doktorantka w Instytucie Amerykanistyki i Studiów Polonijnych UJ, absolwentka kulturoznawstwa międzynarodowego i studiów latynoamerykańskich.