Percepcja kolorów

Gdyby ktoś się mnie zapytał, jaki element grafiki statystycznej ma największy wpływ na jej odbiór, bez zastanowienia odpowiedziałbym, że wybór palety kolorów. Jednak w znakomitej większości grafik statystycznych kolor używany jest niewłaściwie, przez co zamiast pomagać w zrozumieniu, utrudnia, wprowadza szum, przytłacza lub wypacza informację płynącą z danych.

Jak więc używać koloru poprawnie? Jak dobierać kolory do wykresu? Temu zagadnieniu poświęcony jest poniższy esej. Nie ograniczymy się jednak do zarekomendowania kilku wzorników kolorów, ale prześledzimy dualną naturę barwy, przyjrzymy się historii badań nad kolorami, anatomii oka, licznym próbom liczbowego opisu kolorów. Czy musimy to wszystko wiedzieć by sprawnie dobierać kolory do wykresu? Za odpowiedź pozwolę sobie użyć cytatu z Salvadora Dali Jeżeli nie macie zamiaru studiować anatomii, sztuki rysunku i perspektywy, matematyki i estetyki oraz nauki o barwach, pozwólcie, że powiem wam, iż jest to bardziej objaw lenistwa niż geniuszu

Na sawannie umiejętność zauważenia drapieżnika skrywającego się w gąszczu wysokich traw była umiejętnością na wagę życia. Uwzględnienie informacji o kolorach w obrazie rejestrowanym przez oko pozwala łatwiej i szybciej wypatrzeć drapieżnika czy rozróżnić jadalne jagody od trujących. Ewolucja zatroszczyła się o to, by nasze oko i mózg potrafiły szybko zarejestrować i wykorzystać informacje o kolorze.

Dziś większość ludzkości żyje już poza sawanną, drapieżników też się nie obawiamy, ale w wyszukiwaniu informacji na obrazie kolor wciąż pełni bardzo istotną rolę. Tworząc ilustracje danych, musimy uwzględnić sposób, w jaki wybór kolorów wpływa na odczytywanie i interpretację całości.

Pamiętajmy, że natychmiastowo i podświadomie przypisujemy barwom znaczenia, często różniące się w zależności od warunków życia czy kultury. Przykładowo biel w starożytnym Egipcie była utożsamiana z nieurodzajem i śmiercią, ponieważ kojarzyła się z pustynią oraz białymi kośćmi. Z kolei w Chinach biel jest uznawana za kolor nieszczęścia, żałoby, przywdziewany na pogrzebach. W kulturze chrześcijańskiej kojarzy się z czystością, światłem oraz dobrem. Eskimosi używają kilkunastu różnych określeń na różne odcienie bieli.

W przypadku grafiki statystycznej siła oddziaływania koloru może stać się problemem, gdy tylko część informacji zakodowanej za pomocą składowej koloru zdominuje cały wykres lub gdy kolor nie niesie żadnej informacji i pełni tylko rolę szumu. Mając na uwadze, że kolor jest najsilniejszą przyprawą, należy dawkować go z umiarem.

Gdyby ktoś zapytał mnie, jaką charakterystykę wykresu najtrudniej kontrolować, odpowiedziałbym, również bez namysłu, że jest to kolor. Postrzegana barwa różni się w zależności od oświetlenia, jakości wydruku, charakterystyki barwnej ekranu lub projektora, zależy od barwy obiektów sąsiadujących a nawet odczuwanych emocji. To bardzo komplikuje przedstawianie informacji z użyciem koloru. Linia o długości 5 cm ma tę długość bez względu na oświetlenie, fakturę papieru czy techniki nadruku. Ale już fotografia wygląda zupełnie inaczej na ekranie komputera, inaczej na wydruku i to różnie w zależności od użytego papieru czy drukarki.

Mając na uwadze problemy zarówno z kontrolą barw, które zobaczy odbiorca wykresu, jak i z tendencją koloru do dominowania całego wykresu, często można spotkać apele o nieużywanie kolorów na wykresach. Zdarzają się opinie, że dobra grafika statystyczna powinna być czytelna nawet po usunięciu kolorów i sprowadzeniu do skali szarości.

Rysunek 1: Znajdź chłopca ukrytego wśród wrzosów. Źródło: fotografia własna Rysunek 2: Przy dodanym kolorze łatwiej jest zauważyć chłopca. Źródło: fotografia własna

To nie są jednak rady dla nas. Kolory bywają zdradliwe i z pewnością można znaleźć wykresy, dla których lepiej by było, aby pozostałe czarno-białe, ponieważ utrudniają lub przekłamują obraz danych. Mając jednak aspiracje do bycia profesjonalistami w zakresie wizualizacji danych, pamiętajmy, że profesjonaliści nie boją się używać kolorów. Profesjonaliści wiedzą, kiedy, dlaczego i jakich kolorów warto użyć.

Na stronie otwierającej ten esej znajdują się miniaturki sześciu z dwudziestu obrazów katedry w Rouen namalowanych w latach 1893–1894 przez Claude'a Moneta. Ten sam budynek na każdym z tych obrazów wygląda zupełnie inaczej. Obrazy były malowane o różnych porach dnia i roku, a w różnym oświetleniu ten sam budynek wygląda inaczej i wywołuje w nas różne odczucia. Trudno o silniejszy dowód na wpływ kolorów na odbiór obrazu.

Podobnie jest z wykresami, ten sam wykres w zależności od doboru barw może być łatwy lub trudny do odczytania, może wyglądać nowocześnie i profesjonalnie lub wywoływać znudzenie i sprawiać wrażenie niechlujnego.

Zanim jednak przejdziemy do rekomendacji palet kolorów, musimy zrozumieć, jak te palety są budowane. Zaczniemy więc od opisu, czym jest kolor i jaka jest różnica pomiędzy kolorem a barwą.

Rysunek 3: Młode dziewczyny przy pianinie, Pierre-Auguste Renoir, 1892, Musée de l'Orangerie. Domena publiczna, źródło http://www.wikipaintings.org/

Pomiędzy Isaakiem Newtonem a Johannem Wolfgangiem von Goethe

Pisząc o kolorach, należy wziąć poprawkę na dwoistą naturę tego pojęcia. Z jednej strony możemy opisywać fizyczne właściwości koloru, pisać o falach, promieniowaniu i o receptorach, z drugiej strony możemy pisać o subiektywnym odbiorze barw, o wrażeniach barwnych wywoływanych przez nagłe rozbłyski światła lub pojawiających się na granicy dwóch obszarów o różnych kolorach.

Poniżej przyjrzymy się bliżej obu perspektywom. Rozpoczniemy od opisu fizycznej natury światła, zaczynając od wyników Isaaca Newtona dotyczących zjawiska rozszczepiania światła. Następnie powiemy o eksperymentach ze światłem prowadzonych przez artystę o duszy uczonego, Johanna Wolfganga von Goethego. Obie te perspektywy pozwolą nam lepiej zrozumieć, jak działa nasz aparat postrzegania kolorów i pomogą nam lepiej te kolory dobierać.

To, co nazywamy światłem białym, jest mieszaniną fal o różnej długości. Oko ludzkie jest w stanie zarejestrować fale o długościach z zakresu 380–780 nanometrów (nanometr to miliardowa część metra, $1$ nm = $10^{-9}$ m).

Na potrzeby poniższego opisu nie będziemy zagłębiać się w dwoistą naturę światła, ani w zjawisko dualizmu korpuskularno-falowego, będziemy opisywać światło zgodnie z jego naturą falową

Dlaczego fotoreceptory w naszym oku reagują akurat na fale z tego zakresu? Jest to silnie związane z widmem promieniowania słonecznego docierającego na poziom morza. Nasze słońce emituje co prawda fale z szerszego zakresu, jednak te, które przedostają się przez atmosferę i docierają do poziomu morza, to głównie fale z zakresu widzianego przez człowieka. Krótsze fale światła ultrafioletowego, o długościach poniżej 380 nm, są w dużej części absorbowane przez atmosferę i na Ziemię trafia niewielka część tego promieniowania. Jedynie pszczoły, motyle i niektóre ptaki widzą w ultrafiolecie i tylko dlatego, że pomaga im to znaleźć nektar określonych kwiatów. Fale długie, o długości większej niż 780 nm, czyli światło podczerwone, są emitowane przez słońce w znacznie mniejszym stopniu. Takie fale są jednak emitowane przez organizmy żywe i inne ciepłe obiekty, przez co niektóre zwierzęta, takie jak węże czy nietoperze, są w stanie postrzegać również te długości fal. Jednak nie dlatego, że emituje je słońce, tylko dlatego, że emitują je ciepłokrwiste ofiary tych stworzeń.

Ludzie nie żywią się nektarem, zwykle nie polują w nocy na ciepłokrwiste istoty, do przeżycia wystarcza nam widzenie światła w zakres fal od 380 do 780 nm, przez co gołym okiem nie widzimy w podczerwieni ani w ultrafiolecie.

Każde źródło światła emituje pewną mieszaninę fal. Dla słońca w uproszczeniu przyjmuje się często, że jest to widmo ciągłe, tzn. obserwujemy wszystkie fale z zakresu 380–780 nm. Nie jest to w pełni prawda, ponieważ część długości fal jest absorbowana jeszcze w górnych warstwach słońca i atmosfery ziemskiej, ale na potrzeby naszego opisu takie uproszczenie jest do przyjęcia

Rysunek 4: Widmo światła widzialnego. Źródło: opracowanie na bazie wikipedii

Isaac Newton (1642–1726) w serii eksperymentów opublikowanych w 1672 roku rozszczepił za pomocą pryzmatu białe światło na ciągłe spektrum kolorowych prążków. Fale o różnych długościach są załamywane przez pryzmat pod różnymi kątami, stąd zjawisko rozszczepienia. Tak rozszczepione światło można kolejnym pryzmatem ponownie szczepić i otrzymać wyjściową białą barwę. Prace nad rozszczepianiem światła prowadzone były już wcześniej, pisał o nich już w 150 r. Klaudiusz Ptolemeusz. Newton jednak dowodził, że wszystkie kolory można otrzymać przez mieszanie kolorów pierwotnych. Spektrum kolorów podzielił na siedem przedziałów, a za kolory pierwotne, dzięki którym można odtworzyć pozostałe, wybrał czerwony, zielony i niebieski. Zgodnie z modelem Newtonowskim kolory można tworzyć przez składanie tych barw. Znaczenie nazw kolorów zmieniało się w czasie, dziś zamiast niebieski/indygo powiedzielibyśmy, cyjanowy/niebieski

Brakujące prążki w widmie światła są nazywane liniami Fraunhofera, na cześć Josepha von Fraunhofera (1787–1826), który je zaobserwował z użyciem pryzmatu

Ponad 100 lat później nad teorią kolorów pracował Johann Wolfgang von Goethe (1749–1832). Zauważył on pewne rozbieżności pomiędzy Newtonowskim fizycznym opisem światła a postrzeganiem kolorów przez człowieka. Zaobserwował on, że kolor pojawia się nie tylko tam, gdzie jest światło, ale też tam, gdzie nie ma światła. Jeżeli patrzymy na silne źródło światła, takie jak słońce lub biały śnieg w słoneczny dzień, a następnie wejdziemy do zupełnie zacienionego pokoju, to zaobserwujemy wrażenie wirujących czerwonych kręgów. Z obserwacji Goethego wynikało, że miejsca ocienione wydają się mieć kolory, choć cień to przecież, zgodnie z teorią Newtonowską, miejsce, gdzie nie ma światła, nie ma więc kolorów. Zacienione miejsce sąsiadujące z silnie odbijającym światło śniegiem będzie zdawało się mieć własną barwę właśnie z uwagi na sąsiedztwo jaskrawej bieli. Tak więc wrażenia barwne zależą zarówno od tego, co widzieliśmy wcześniej, jak i tego, co jeszcze znajduje się w naszym polu widzenia.

Kolejnym odkryciem Goethego była zmiana postrzegania kolorów rozszczepionych przez pryzmat, jeżeli odległość pomiędzy pryzmatem a ścianą lub kartką, na którą pada rozszczepione światło, jest zmienna. W serii eksperymentów dotyczących światła zaobserwował on kolory, których brakowało w widmie otrzymanym przez Newtona. Jednym z takich kolorów był kolor karmazynowy (purpurowy). Jeżeli na pryzmat pada szeroka struga światła, to rozszczepione spektra kolorów generowane przez odległe brzegi strugi białego światła zaczną się na siebie nakładać. Dobierając odpowiednio szerokość strugi światła oraz odległość pryzmatu od kartki, na którą pada światło, można doprowadzić do nałożenia się koloru czerwonego i cyjanowego (niebieskiego), co skutkuje pojawieniem się koloru karmazynowego. Goethe w swojej teorii kolor karmazynowy uznał za przeciwstawny do zielonego, ponieważ otrzymuje się go w sytuacji, gdy z białego światła usuwa się kolor zielony.

Rysunek 5: Koło kolorów przedstawione przez Isaaka Newtona w jego książce Opticks z roku 1704. Spektrum kolorów Newton podzielił na siedem przedziałów, na wzór siedmiostopniowej doryckiej skali muzycznej. Środki tych przedziałów odpowiadają kolorom podstawowym, a oznaczenia kolorów odpowiadają oznaczeniom muzycznym. W średniowieczu skala dorycka zaczynała się od D, więc przedział DE to kolor czerwony, EF pomarańczowy, FG żółty, kolejne przedziały odpowiadają kolorowi zielonemu, niebieskiemu, indygo i fioletowemu. Źródło: Wikipedia, domena publiczna

Swoje wyniki Goethe opublikował w 1810 roku w dziele Teoria Kolorów, które ponoć cenił bardziej niż swoją twórczość poetycką. W swojej teorii Goethe dużą uwagę przywiązywał wrażeniom kolorów, ich percepcji w zależności od różnych czynników, również emocji obserwatora. Goethe uważał, że jego teoria jest przeciwstawna teorii Newtona. Być może było to powodem, dla którego współcześni mu fizycy odrzucili jego rozważania, nie traktując ich nawet jako teorii naukowej, ale jako zbiór luźnych obserwacji. Teoria ta była jednak dalej rozwijana przez filozofów. Z czasem zwiększyło się nasze rozumienie tego, jak fizyczny opis światła i kolorów pogodzić z percepcją barw wywoływaną w ludzkim mózgu, obie teorie pozwoliły na lepsze zrozumienie tego, jak postrzegamy kolory.

W dalszej części tego eseju będziemy używać słowa kolor, odnosząc się do fizycznych właściwości, takich jak długość fali, natężenie promieniowania, a słowa barwa, odnosząc się do subiektywnej percepcji koloru przez mózg.

Rysunek 6: Koło kolorów Goethego. Sześć wyróżnionych kolorów to trzy kolory podstawowe (żółty, czerwony i niebieski) i trzy kolory przeciwstawne (fioletowy, zielony i pomarańczowy). Źródło: Wikipedia, domena publiczna

Jak rozróżniamy kolory

Zobaczmy, w jaki sposób nasz mózg tworzy wrażenie barwy. Celowo napisałem “tworzy wrażenie barwy”, a nie “odczytuje kolor”, ponieważ, jak się szybko przekonamy, kolor czy barwa to bardziej wrażenie odczytywane przez nasz mózg niż fizyczna właściwość jakiegoś obiektu. Aby jednak mogło powstać wrażenie barwy, musimy wpierw zarejestrować jakieś charakterystyki koloru.

Zacznijmy od receptorów światła, które znajdują się w oku. Na ściance siatkówki występują dwa rodzaje fotoreceptorów: czopki i pręciki. W pręcikach występuje światłoczuły barwnik rodopsyna, w czopkach występuje światłoczuły barwnik jodopsyna. Każdy z tych barwników reaguje z różną siłą na różne długości fal i to właśnie porównując reakcje receptorów, możemy rozróżniać kolory.

Bardziej precyzyjnie, w ludzkim oku występują trzy typy czopków, w których znajdują się trzy typy jodopsyny. Z uwagi na to, na jakie długości fal dany typ czopków jest najbardziej czuły, oznacza się go literą L (najbardziej czuły na fale długie, ang. long), M (najbardziej czuły na fale średnie, ang. medium) lub S (najbardziej czuły na fale krótkie, ang. short).

Pręciki są znacznie czulsze niż czopki, ale są aktywne w innych warunkach oświetlenia (co zostało dokładnie opisane w rozdziale pt. “Percepcja obrazu”). W zależności od tego, jakie długości fal padają na ścianę siatkówki, z różną siłą pobudzane są receptory L, M i S. Różnice w pobudzeniu różnych typów czopków mózg następnie przekłada na informacje o kolorach. Dominujące pobudzenie receptora L przekłada się na wrażenie koloru czerwonego, receptora M odpowiada wrażeniu koloru zielonego, a receptora S kolorowi niebieskiemu. Jednak, jak widzimy na rysunku 7, profile absorpcji fotoreceptorów częściowo na siebie nachodzą, więc powiązanie jednego typu fotoreceptora z jednym kolorem jest znacznym uproszczeniem.

 
Rysunek 7: Znormalizowany profil absorpcji różnych rodzajów czopków. Czopki L najbardziej czułe na fale długie mają szczytową absorpcję fal o długości 564 nm, czopki M (fale średnie) mają szczytową absorpcję dla fal o długości 534 nm a czopki S (fale krótkie) mają maksymalną absorpcję fal o długości 420 nm. Źródło: opracowanie na bazie wikipedii

Przez soczewkę oka przechodzi mieszanina fal o różnych długościach. W siatkówce dochodzi do transformacji reprezentacji falowej na trójwymiarowy opis pobudzeń trzech typów czopków. W dalszych warstwach drogi wzrokowej sygnały pobudzenia z czopków są wtórnie przetwarzane. Osobno transportowana jest informacja o jasności (suma pobudzeń wszystkich rodzajów czopków), osobno kodowane jest rozróżnianie sygnału z czopków M względem L, a osobno sygnału z czopków S względem M i L.

To istotny moment dla interpretacji koloru. Całe spektrum fal o różnej długości, które trafiają do naszego oka, zostaje zamienione na trójwymiarowy opis w skalach: jasność, zielony versus czerwony i żółty versus niebieski.

Nasze oczy, a tym bardziej nasz mózg, nie są w stanie rozpoznać, jakiej długości fale padają na siatkówkę naszego oka, ponieważ różne kombinacje fal mogą tworzyć takie same profile pobudzenia fotoreceptorów. To zjawisko nazywane jest metameryzmem i poświęcimy mu więcej uwagi w dalszej części tego eseju, tłumaczy ono bowiem, dlaczego nigdy nie zobaczymy tego samego obrazu w dokładnie ten sam sposób.

Z punktu widzenia percepcji kolorów wygodniej nam będzie od tej chwili opisywać barwy, opierając się o pobudzenia receptorów L, M i S, odkładając na bok falowy opis kolorów.

Rysunek 8: Schemat sposobu transportowania informacji o kolorze dalej do mózgu. Informacja o kolorze przesyłana jest trzema kanałami. Pierwszy odczytuje jasność, drugi rozróżnia fale krótkie od pozostałych (w uproszczeniu: kolor żółty od niebieskiego), trzeci rozróżnia fale średnie i długie (kolor zielony od czerwonego). Źródło: opracowanie własne

Jak opisać barwę liczbami?

Aby móc rekomendować wzorniki kolorów, potrzebujemy skali, w której można takie wzorniki opisać. Światło padające na siatkówkę oka jest mieszaniną różnych długości fal. Nie jest jednak wygodne mówienie o barwach, podając ich reprezentację spektralną. Ta reprezentacja nie jest też jednoznaczna, różne mieszaniny różnych długości fal mogą w oku indukować taką samą odpowiedź fotoreceptorów. Będziemy mieć wrażenie tej samej barwy choć fale wchodzące do mieszaniny mogą się różnić. Dlatego też wygodniej jest opisywać barwy w terminach reakcji czopków na oświetlenie, a nie w terminach długości fal.

Opis barwy w terminach natężenia pobudzenia czopków nazywamy opisem w trójwymiarowej przestrzeni kolorów LMS (od angielskich nazw czopków Long, Medium, Short). Współrzędne te odpowiadają pobudzeniu czopków (fotoreceptorów) na zadaną barwę. Innymi słowy, mówiąc o kolorze, moglibyśmy określać, jak bardzo pobudza on nasze fotoreceptory.

Sprawa jest jeszcze trochę bardziej skomplikowana, ponieważ w różnych miejscach siatkówki gęstość i proporcje różnych typów czopków są różne. Ta sama kombinacja fal wywoła więc inne wrażenie w zależności od tego, w jakiej odległości od centralnego pola się znajduje i na jaki obszar siatkówki trafi.

Aby zaradzić temu problemowi, Międzynarodowa Komisja Oświetleniowa, nazywana dalej CIE (fr. Comission Internationale de l'Eclairage), wprowadziła tak zwanego “standardowego obserwatora”. Chcąc być precyzyjnym, muszę napisać, że w roku 1931 wprowadziła “2-stopniowego standardowego obserwatora”, który opisywał jak na spektra kolorów reaguje obszar o szerokości kątowej $2^o$ wokół centralnego pola widzenia

Przyjmując punkt widzenia “2-stopniowego standardowego obserwatora”, można opisać kolor jako wektor trzech liczb odpowiadających pobudzeniom czopków L, M i S. Opis w takiej skali jest nazywany opisem w skali CIE LMS.

Wadą skali CIE LMS jest to, że jasność postrzeganego koloru jest inna, w zależności od tego, czy pobudzane są czopki L, M czy S. Najjaśniej (przy tym samym natężeniu fali) postrzegane są fale 550 nm odpowiadające wrażeniu barwy zielonej, aktywujące głównie czopki M. Aby unormować względne jasności kolorów, przekształca się liniowo skalę CIE LMS na skalę CIE XYZ pozwalającą na łatwiejsze operowanie na kolorach

W roku 1964 wprowadziła “10-stopniowego standardowego obserwatora”, który opisywał, jak na różne spektra kolorów reaguje obszar o szerokości kątowej $10^o$. Model z roku 1931 jest częściej używany, więc będę się do niego odnosić w dalszych rozważaniach

W tej nowej skali trójwymiarowy opis koloru został rozłożony na współrzędną odpowiadającą postrzeganej jasności (współrzędna Y) oraz współrzędne kodujące barwę (współrzędne X i Z). Współrzędna Z jest najsilniej związana z pobudzeniem czopków S reagujących na światło niebieskie, X na światło czerwone. Współrzędna Y jest związana z postrzeganą jasnością, tak się jednak składa, że postrzegana jasność silnie koreluje z pobudzeniem czopków M.

Na stronach Międzynarodowej Komisji Oświetleniowej dostępne są informacje o tym jak długości fal w widmie widzialnego światła przekładają się na barwę zapisaną w skali CIE XYZ (nazywaną też CIE 1931). Zależność pomiędzy współrzędnymi X, Y i Z a długością fali ilustruje rysunek 9.

Przejście ze skali CIE LMS na CIE XYZ jest liniowe i jest opisane przez równanie
Źródło: opracowanie własne

Skala CIE XYZ jest skalą trójwymiarową, ze współrzędną Y odpowiadającą jasności. Jeżeli ustalimy jasność, pozostaną nam dwa wymiary koloru, które można przedstawić na płaszczyźnie. W tym celu najwygodniej przekształcić skalę CIE XYZ na skalę CIE xyY. Ponieważ Y odpowiadało jasności, tę współrzędną się zachowuje, pozostałe dwie współrzędne x i y to unormowane współrzędne z przestrzeni XYZ wyznaczone w następujący sposób:

W nowej przestrzeni CIE xyY składowa xy opisuje kolor, a Y jasność. Dwuwymiarową składową xy przedstawia się na tak zwanym wykresie chromatyczności.

 
Rysunek 9: Profil składowych reprezentacji koloru XYZ jako funkcja długości fali. Źródło: opracowanie na bazie wikipedii

Wykres chromatyczności jest często używany do przedstawienia gamy kolorów, którą potrafi wyemitować ekran laptopa, telewizora czy innego urządzenia. Ponieważ za kolory w wyświetlaczach odpowiedzialne są trójkolorowe diody, więc zakres barw emitowanych przez ekran można opisać trójkątem, którego rogi odpowiadają barwom diod. Odpowiednio zmieniając jasność świecenia poszczególnych diod, można uzyskać mieszaninę barw wewnątrz tego trójkąta.

Każda matryca ma inną gamę kolorów, ale jaka ta gama by nie była, nigdy nie widzimy wszystkich kolorów z mapy chromatyczności. Nie ma bowiem takiego urządzenia elektronicznego, które potrafiłoby je wszystkie wyemitować. Ale możemy porównywać matryce zestawiając zakresy barw na mapie chromatyczności, które te ekrany mogą odwzorować.

Dochodzimy tutaj do kolejnych problemów z kolorami. Każdy, kto używa jednocześnie dwóch różnych ekranów, np. zewnętrznego monitora podpiętego do laptopa, zauważy, że po przeciągnięciu tego samego rysunku z jednego ekranu na drugi, zmienią się jego barwy. Tworząc wykres, na którym są kolory, miejmy zawsze na uwadze to, że te same kolory na innych urządzeniach mogą być różnie wyświetlane.

 
Rysunek 10: Schematyczny wykres chromatyczności mapujący kolor za pomocą współrzędnych x i y ze skali CIE xyY. Czyste barwy, odpowiadające pojedynczym długościom fali, przedstawione są na brzegu “podkowy”. Składanie kolorów w tej skali jest addytywne, a więc mieszając dwa kolory, otrzymujemy kolory na odcinku łączącym kolory mieszane. Zauważmy, że niektórym parom wartości xy nie odpowiada żaden kolor, takiego pobudzenia czopków LMS nie da się uzyskać w sposób naturalny. Źródło opracowanie na bazie wikipedii

Wcale nie jest łatwiej w przypadku wykresów drukowanych. Barwniki nadrukowane na papier pochłaniają fale o określonych długościach. Postrzegany kolor to światło oświetlające wydruk, z którego usunięto określone długości fal. To, jakie barwy zobaczymy na wydruku, zależy nie tylko od tego, jaka drukarka została użyta do druku, jakiej jakości był papier, ale również, w dużej mierze, w jakim świetle wykres jest oglądany.

Niestety to nie koniec problemów. Kolejnym zjawiskiem, które należy mieć na uwadze w doborze kolorów jest metameryzm. Pokazaliśmy powyżej, że różne widma/kompozycje fal o różnych długościach mogą być postrzegane jako ta sama barwa, ponieważ w ten sam sposób pobudzają receptory L, M i S. Zarówno złożenie fal “niebieskich” i “żółtych”, jak i fale “zielone” będziemy postrzegać jako kolor zielony. Ale fale, które wpadają do naszego oka, zależą od tego, jakie widmo światła oświetla rysunek i które z tych fal zostaną przez rysunek odbite, a które zabsorbowane. Może się tak wydarzyć, że w białym słonecznym świetle dwa kolory wyglądają identycznie, ale w żółtym świetle lampki dwa kolory wyglądają różnie. Pokazuje to, jak bardzo zagadnienie “dopasowania barw” jest trudne.

Czy to jednak akademicki problem? Bynajmniej! Na co dzień z problemem tym spotykają się kobiety robiące sobie makijaż, który inaczej może wyglądać w świetle halogenowej lampki, a inaczej w świetle dziennym. Podobny problem może się pojawić w sklepowej przymierzalni – odpowiednio dobrane światła zmieniają odbiór tego jak wyglądamy i co do czego pasuje. W galeriach sztuki przy oglądaniu obrazów, szczególnie impresjonistów, gra kolorów silnie zależy od oświetlenia. Chwilowość i ulotność, tak charakterystyczne dla malarstwa impresjonistów, nabierają w tym kontekście nowego znaczenia.

 
Rysunek 11: Trójkąt narysowany przerywaną linią odpowiada zakresowi barw emitowanemu przez ekran iPada 3 (obecnie jeden z najnowocześniejszych ekranów). Im bliżej brzegu tym czystsze kolory. Trójkąt narysowany ciągłą linią odpowiada standardowi UHDTV (telewizja ultra wysokich rozdzielczości), który ma pojawić się w produkcji w okolicach roku 2020. Dla drukarek bardziej naturalna jest skala CMYK, która jest skalą substraktywną. Kropkowany pięciokąt odpowiada normie DIN 16539, czyli gamie barw osiąganej przez dobrej jakości drukarki na dobrej jakości papierze oświetlonym silnym białym światłem. Źródło: opracowanie na bazie wikipedii

Rysunek 12: W zależności od oświetlenia barwa obiektów może się bardzo różnić. Ta sama plansza wygląda zupełnie inaczej gdy ją inaczej oświetlić. Źródło: kolaż zdjęć z wystawy w Centrum Nauki Kopernik

Wracając do tematu grafiki statystycznej, pamiętajmy, że stare ekrany, druk na słabej jakości papierze, słabe oświetlenie powoduje, że osiągana gama barw jest jedynie niewielkim wycinkiem całego zakresu. Łatwo zaplanować soczysty wykres, dobrze wyglądający na ekranie monitora, by później odkryć, że na wydruku lub podczas prezentacji nie jesteśmy w stanie rozróżnić większości z przedstawianych kolorów.

Zaletą skali CIE xyY i innych skal, o których pisaliśmy powyżej, jest możliwość addytywnego mieszania barw. Wadą jest niestety to, że rozdzielczość kolorów, które oko ludzkie może rozpoznać, jest różna w różnych miejscach tej skali. Rozdzielczość w obszarze koloru zielonego jest mniejsza niż w przypadku koloru niebieskiego, przez co oko ludzkie może nie być w stanie rozróżnić dwóch odcienie zieleni odległych o $\Delta$ na skali CIE xyY, a jednocześnie może rozróżniać dwie barwy oddalone o $\Delta$ będące odcieniami niebieskiego.

Jeżeli wykorzystujemy kolory na wykresie/grafice statystycznej do kodowania informacji, to kwestia rozdzielczości skali kolorów i postrzeganych odległości pomiędzy barwami nabiera pierwszorzędnego znaczenia. Prace nad równomiernością postrzegania barw (obszary różniące się percepcją barwy są od siebie tak samo odległe w całej przestrzeni barw) doprowadziły do powstania wielu nowych skal, które są lepszymi lub gorszymi przybliżeniami przestrzeni kolorów o równomiernej odległości percepcyjnej.

Rysunek 13: Gama kolorów opisana przez skalę HCL tworzy trójwymiarową, nieregularną bryłę w przestrzeni HCL. Współrzędna H (barwa) przyjmuje wartości od 0 do 360, współrzędna L (jasność) wartości od 0 do 100, zakres dla współrzędnej C (natężenie) zależy od pozostałych współrzędnych. Na przedstawionym schemacie prezentowane są dwuwymiarowe przecięcia tej bryły kolorów. Największą rozdzielczość można uzyskać dla koloru czerwonego. Dla barwy 10 można wydzielić najwięcej odcinków o tej samej długości odpowiadających tej samej odległości percepcji barw. Źródło: opracowanie własne

Uwzględnienie rozdzielczości naszej percepcji barw oraz sposobu, w jaki myślimy i postrzegamy barwy, doprowadziło do powstania wielu ciekawych skal, takich jak CIE Lab, CIE LUV, bardzo popularnej skali RGB, HSV, skali kolorów Alberta Munsella, zestawów kolorów wzorcowych, np. Pantone.

Wybór jest duży, ale jeżeli chodzi o dobranie kolorów do wizualizacji danych, najciekawsze właściwości ma skala kolorów Barwa-Natężenie-Jasność (ang. Hue-Chroma-Luminance), którą będziemy dalej nazywać w skrócie skalą HCL [Achim Zeileis, Kurt Hornik, and Paul Murrell. Escaping rgbland: Selecting colors for statistical graphics. Computational Statistics and Data Analysis, (9) 3259 -- 3270, 2009.] Ta skala jest pewną nieliniową transformacją skal CIE XYZ i pochodnych.

Zaleta skali HCL polega na percepcyjnej niezależności każdego z wymiarów tej skali. W przypadku skali RGB, znanej zapewne Czytelnikom, w której kolor opisany jest jako jasność świecenia czerwonej, zielonej lub niebieskiej diody w matrycy ekranu, nasza percepcja inaczej odczyta zmianę współrzędnej czerwonej o 10% w zależności od zarówno wartości tej składowej, jak i wartości pozostałych składowych.

Dla skali HCL możemy zmieniać jedną ze współrzędnych niezależnie od pozostałych i obserwator jest w stanie rozróżnić te zmiany, ocenić ich wielkość i określić, w którym wymiarze nastąpiły. Większość z pozostałych skal kolorów nie ma tej właściwości, to znaczy zmiana jednej współrzędnej będzie różnie postrzegana w zależności od tego, jakie są inne składowe.

Jest to bardzo użyteczna własność, gdy chcemy wybrać zbiór kolorów do prezentacji danych na wykresie. Jeżeli chcemy przedstawić pewną liczbę grup, gdy grupy nie są w żaden sposób uporządkowane, chcemy dobrać kolory tak, by można było zadaną liczbę kolorów możliwie dobrze rozróżnić. W takich przypadkach wygodnie wybrać kolory różniące się jedynie współrzędną H (Barwa), bowiem te nie mają żadnego naturalnego porządku. Jeżeli chcemy przedstawić grupy, które mają jakiś porządek, to naturalnym wyborem będzie określenie jednej tylko barwy i zmiana współrzędnych L (Jasność) lub C (Natężenie).

Posiadanie takiej mapy percepcji kolorów daje olbrzymie możliwości. Chcąc na wykresie wykorzystać kolor do przedstawienia informacji liczbowej, możemy wybrać barwy, by podobieństwo barw odpowiadało podobieństwu liczb, tak by optycznie było od razu widoczne, które wartości są bardziej, a które mniej podobne. Zanim powiemy jednak, jak to zrobić, musimy zmierzyć się z ostatnią przeszkodą, a mianowicie tym, że nie wszyscy tak samo widzą te same kolory. Czas zmierzyć się ze ślepotą barw.

Rysunek 14: Trzy zestawy siedmiu kolorów różniących się jedynie jedną współrzędną w przestrzeni HCL: barwą, jasnością lub natężeniem. Widzimy, że jednostajne rozłożenie współrzędnych przekłada się na jednostajne różnice w percepcji koloru

Wszystko jest względne

Jak już wiemy, postrzeganie kolorów zależy od sposobu prezentacji (projektor, wydruk, monitor), oświetlenia czy nastroju. Ale nawet na tym samym nośniku, przy takich samych warunkach oświetleniowych, ten sam kolor może być różnie postrzegany w zależności od otoczenia. Dlaczego? Na obraz, który wpada naszego oka i jest rejestrowany przez czopki i pręciki, nakładana jest siatka oczekiwań, związana z tym czego nasz mózg się spodziewa i co stara się kompensować. Ilustracją tego zjawiska jest szachownica przedstawiona na rysunku 15, a opublikowana po raz pierwszy przez Edwarda Adelsona w roku 1995.

Czy pola A i B na szachownicy mają różne kolory? Prawdopodobnie, bez cienia wątpliwości stwierdzimy, że pole A jest ciemniejsze niż pole B. Jednak gdyby usunąć z tego rysunku kontekst, np. zasłonić palcem wszystko poza tymi polami, lub też połączyć te pola pasem, wtedy zauważymy, że w rzeczywistości są one tego samego koloru.

Ale przecież wyraźnie pole A jest ciemniejsze!

Odbieramy pole A jako ciemniejsze, ponieważ nasz mózg, kompensuje spodziewany efekt cienia rzucanego przez zielony walec. Oczywiście nie jest to prawdziwy cień i na wyższych poziomach poznawczych wiemy, że to płaski wydruk i o żadnym cieniu nie ma mowy, ale mechanizmy korekcji tego nie wiedzą. Więc korygują nasze postrzeganie względnych jasności pól A i B. Szachownica Adelsona ilustruje problemy z postrzeganą jasnością pól, ale ten sam mechanizm wpływa na postrzeganie barwy. W zależności od kontekstu, możemy sprawić by kolor szary był postrzegany jako kolor żółty lub niebieski!

Rysunek 15: Szachownica Adelsona. Czy pola A i B są tego samego czy różnych kolorów? Wykonane przez Adriana Pingstona w oparciu o prace Edwarda Adelsona

Zaburzenia w postrzeganiu barw

To, jak kolory są tłumaczone na barwy, zależy od sprawności działania naszych czopków. Ta sprawność zmienia się z wiekiem i jest zróżnicowana w populacji. Nie wszyscy w ten sam sposób widzimy kolory, dlatego, że nie u wszystkich różne typy czopków pracują z tą samą efektywnością.

Przyczyn zaburzeń postrzegania kolorów jest wiele, od genetycznych, przez związane z nabytymi urazami, niepożądanym działaniem leków, chorobami czy wiekiem. Całkowita niezdolność do rozróżniania kolorów jest bardzo rzadka, zazwyczaj upośledzenie widzenia kolorów dotyczy możliwości rozróżniania określonych kolorów. Mutacje sprzężone z genami na chromosomie X powodują zaburzenia w rozwoju lub całkowity brak czopków określonego typu, rzadziej dwóch typów. Ponieważ kobiety mają dwa chromosomy X, a mężczyźni tylko jeden, to tego typu zaburzenia występują znacznie częściej u mężczyzn. Jest to też humorystyczne uzasadnienie stereotypu, że kobiety widzą więcej kolorów niż mężczyźni. Średnio tak jest, ponieważ 5–10% mężczyzn ma jakieś genetyczne problemy z postrzeganiem kolorów, w przypadku kobiet problemy te występują u mniej niż 1% populacji

Te najczęstsze zaburzenia związane są z nieprawidłowym funkcjonowaniem lub brakiem jednego typu czopków:

  • upośledzenie czopków L reagujących na fale długie prowadzi do protanomalii (w przypadku słabszego funkcjonowania) lub protanopii (w przypadku zupełnego braku tych czopków), upośledzone jest rozróżnianie kolorów zielonego i czerwonego;

  • upośledzenie czopków M prowadzi do deuteranomalii (w przypadku słabszego funkcjonowania) lub deuteranopii (dla zupełnego ich braku), upośledzone jest rozróżnianie kolorów zielonego i czerwonego;

  • upośledzenie czopków S prowadzi do tritanomalii (w przypadku gorszego funkcjonowania) lub tritanopii (dla zupełnego braku czopków), upośledzenie dotyczy widzenia koloru niebieskiego.

Rysunek 15: Jak wykres chromatyczności widzą osoby osoby zdrowe, osoby z deuteranopią, protanopią i tritanopią

Najbardziej powszechna z tych trzech jest dysfunkcja czopków rejestrujących fale średnie, rzadsza fale długie, a najrzadsza fale krótkie. Ponieważ problemy z identyfikacją kolorów głównie dotyczą rozróżniania kolorów zielonego i czerwonego, nie zaleca się konstrukcji skal kolorów rozpiętych pomiędzy zielenią a czerwienią. Z jakiegoś powodu to zalecenie jest szczególnie często łamane w bioinformatyce, gdzie bardzo popularne są zielono-czerwone skale kolorów używane do reprezentacji zmian ekspresji genów.

Jeżeli w opracowanej przez nas wizualizacji danych kolory pełnią kluczową funkcję i chcemy upewnić się, że przynajmniej osoby z typowymi dysfunkcjami widzenia kolorów będą w stanie odczytać informacje z wykresu, możemy wykorzystać symulator ślepoty barw. Jednym z takich symulatorów jest dostępny w serwisie Color Oracle, który pozwala zmienić obraz wyświetlany na ekranie komputera na taki, jakim widzą go osoby z najczęstszymi zaburzeniami.

Rysunek 16: Przykładowy test na ślepotę barw. Osoby z dysfunkcją czopków rejestrujących fale średnie lub długie (czyli nierozróżniające kolorów zielonego i czerwonego) nie będą w stanie odczytać liczby z powyższego obrazka. Źródło: Wikipedia, domena publiczna

Color Oracle. Design for the Color Impaired http://colororacle.org/

Wzorniki kolorów

Czas na rekomendacje wzorników kolorów. Wiemy jakich kolorów unikać z uwagi na trudności w ich rozróżnianiu przez osoby z defektem widzenia kolorów. Mamy też skalę HCL, dzięki której potrafimy wybrać zbiór barw o równej postrzeganej odległości pomiędzy barwami. Naturalnym wyborem w konstrukcji wzornika jest wybranie dwóch barw, a następnie skorzystanie ze skali HCL do konstrukcji barw równo rozłożonych pomiędzy dwoma wybranymi.

Czy jednak jesteśmy skazani na ręczne wybieranie kolorów ze skali HCL za każdym razem, gdy tworzymy nowy wykres? Na szczęście nie. Istnieje droga na skróty, a zbudowała ją profesor Cynthia Brewer zajmująca się zawodowo projektowaniem map. Jej dwa najpopularniejsze projekty dotyczą typografii stosowanej na mapach, jak i kolorów stosowanym do prezentacji informacji na mapach. Zbudowane przez nią skale kolorów są nazywane ColorBrewer [Cynthia A. Brewer. Color use guidelines for mapping and visualization. Visualization in Modern Cartography, pages 123 -- 147, 1994] i są obecnie wykorzystywane w najróżniejszych projektach. Są też dostępne w większości dobrych pakietów statystycznych.

Na stronie http://colorbrewer2.org/ znaleźć można różne propozycje skal, w zależności od tego, ilu kolorów potrzebujemy, oraz jaką rolę ma pełnić dana skala kolorów.

Skale podzielone są na trzy grupy:

  • skale sekwencyjne uporządkowane rozpinają się równomiernie pomiędzy dwoma kolorami,

  • skale rozbieżnych kolorów pozwalają na określenie wartości odniesienia (wartości neutralnej) najczęściej za pomocą koloru białego lub żółtego, skrajne wartości odpowiadają ciemnym kolorom z kontrastującą barwą,

  • skale jakościowe (czyli nieuporządkowane) pozwalają na możliwie największą rozróżnialność określonej liczby wartości, które jednak nie mają żadnego naturalnego porządku.

Różne schematy kolorów ze skali ColorBrewer mają różną liczbę wartości/kolorów, które mogą przedstawiać. Większość skal występuje w wersji od 3 do 7 kolorów. Niektóre pozwalają na przedstawienie od 8 do 10 wartości, a tylko jedna pozwala na przedstawienie 12 wartości. Z reguły jednak przy nie najlepszych warunkach oświetleniowych i tak nie jesteśmy w stanie zapamiętać i rozróżnić więcej niż 7-10 wartości, więc te ograniczenia na liczbę kolorów powinny raczej pomóc nam w wyborze tylko naprawdę istotnych poziomów.

ColorBrewer: Color Advice for Maps http://colorbrewer2.org/

Warto też zwrócić uwagę, że w tych schematach kolorów nie ma bardzo intensywnych barw. Dominują pastele i inne łagodne kolory. Jest to związane z faktem, że duże obszary bardzo intensywnych kolorów o bardzo dużym kontraście są na dłuższą metę dla oka bardzo męczące. Ostatnim efektem, jaki chcemy uzyskać naszą wizualizacją danych, jest efekt szybkiego męczenia się oka (i w konsekwencji całego obserwatora). Z tego też powodu warto stosować kolory stonowane, różniące się wystarczająco, by nasz mózg to dostrzegł, ale nie na tyle, by rozbolały nas od tego oczy.

Częstym błędem jest zestawianie na wykresie bardzo intensywnych czerwieni z intensywnymi zieleniami lub kolorem niebieskim. Użycie takich kolorów bierze się z pokusy zwrócenia uwagi odbiorców na wykres. W przypadku reklam jest to może i dobre podejście. Ale takie wykresy kończą podobnie jak neony reklamowe. Łatwo je zauważyć, można je odnaleźć w dużym zbiorze innych wykresów, ale nie będziemy chcieli długo na nie patrzeć tak, jak nie patrzymy i nie kontemplujemy silnie świecących neonów reklamowych.

Rysunek 17: Trzy zestawy siedmiu kolorów wybranych z zestawu palet kolorów ColorBrewer. Pierwsza znajdzie zastosowanie w prezentacji zmiennej o wartościach uporządkowanych (np. w skali od 100 do 200), druga w prezentacji wartości uporządkowanych z elementem neutralnym (np. od -10 do 10), trzecia w prezentacji zmiennej o wartościach nieuporządkowanych

Czym się kierować wybierając kolory?

Kolory towarzyszą nam od urodzenia. Są czymś tak naturalnym, że rzadko kiedy zastanawiamy się, skąd się biorą i jak bardzo ich postrzeganie zależy od kontekstu. Przy projektowaniu wizualizacji danych stajemy często przed koniecznością wyboru kolorów. Ale przypadkowe wybieranie kolorów często przynosi gorze efekty niż próba zagrania na pianinie przez losowe naciskanie przypadkowych klawiszy.

Jeżeli nie jesteśmy pewni, czy w danej sytuacji warto użyć koloru na wykresie, to zastanówmy się, czy nie lepiej z tego koloru zrezygnować.

Kolor będzie użyteczny, jeżeli chcemy wyróżnić jeden lub kilka elementów wykresu. Element wyróżniony kolorem jest bardziej widoczny niż gdybyśmy wyróżniali kształtem lub wielkością, łatwiej się do tak wyróżnionych obiektów odnosić. W takiej sytuacji dodanie koloru jest świetnym wyborem. Czerwona kropka natychmiast będzie widoczna na tle czarnych kropek. Warto jedynie zadbać, by kolor nie wpływał na postrzeganie innych istotnych charakterystyk, np. by przez wybór intensywnego koloru nie powiększyć optycznie powierzchni obiektów.

Kolor będzie użyteczny, gdy chcemy pogrupować obiekty. Odpowiednio dodając do wykresu kolor, możemy podzielić logicznie wykres na części, zaznaczyć strukturę wykresu, wyróżnić grupy obiektów do siebie podobnych. Obiekty o podobnych kolorach będą postrzegane jako obiekty mające ze sobą coś wspólnego. Warto to wykorzystać, jeżeli chcemy grupy obiektów opisać na kilku kolejnych wykresach. Oznaczenie tych samych grup tymi samymi kolorami ułatwi odczytywanie kolejnych wykresów.

Jeżeli chcemy użyć kolorów do opisania pewnej cechy liczbowej, możemy użyć sprawdzonych map kolorów opracowanych przez Cynthie Brewer lub tworzyć własne mapy używając skali HCL. Pierwszy wybór jest bezpieczny, drugi pozwala nam na większą kontrolę podobieństwa używanych kolorów. Jeżeli też z jakiegoś powodu chcemy na wykresie mieć kilkanaście różnych kolorów, musimy sami je wybrać używając skali HCL, Cynthia Brewer nie pozwala na takie ekscesy.

Dużo raf na tych kolorowych wodach. Ale mamy już całkiem precyzyjną mapę rejonów, których należy unikać. Wykorzystajmy wiedzę o percepcji barw, aby dobierać kolory do wykresów w sposób, dzięki któremu ułatwią one zrozumienie danych, odkrywanie różnic lub podobieństw widocznych w danych.



Kolory są muzyką dla oczu, gdyż dają się zestawiać jak nuty, Eugene Delacroix