「資料視覺化」課程心得

瞭解經典案例、視覺心理與設計方法,相關工具介紹。

這場由台灣資料科學愛好者年會舉辦的資料視覺化之理論、賞析與實作,請康仕仲老師分享在台大所開設的「資料視覺化」課程精華。上完後收穫豐碩,打開了新視野,這篇紀錄課程中對我非常有幫助的幾個段落。

我不是專業的工程或設計背景,只是喜歡研究資料呈現的愛好者,如果兩百多頁的投影片暫時無法消化,可以參考我寫的筆記囉。

資料視覺化之理論、賞析與實作 from 台灣資料科學愛好者年會


第0講 啟發

康仕仲老師的背景介紹,與課程的大綱:

資料視覺化是資料科學中重要的領域,尤其在現代資料巨量化的浪潮下,透過各種視覺化的呈現,能讓專業人員,快速從資料中快速判讀,發現關鍵問題。 也幫助跨領域的溝通,以圖像式的方式,說明、探索與分析資料背後的意義,提昇決策的效率與品質。


第1講 經典案例

挑戰者號的失敗案例:

研究人員在太空梭發射前,就察覺到這次可能會失敗,並提供相關資訊給指揮官,但最後仍然決定照常進行,以至於升空後不久就發生了悲劇。

當時的簡報內容,資料詳盡,但可能因為較不直覺,所以低估了嚴重性。

後來學者重新繪製圖表,下方的X軸是溫度,而右方的黑點是之前發射的紀錄,從圖上紅色箭頭可以看到,這次氣溫非常低,以往並沒有在這種條件下執行過,或許因此導致相關的問題發生。

這個例子很衝擊,因為不是所有人都能像做報告的研究者,有足夠的時間或專業背景瞭解問題。而好的資料視覺化,應該讓其他人能用專家的角度看事情,並讓大家站在同樣的理解基礎上討論。另外還有九個例子及重點提醒,請參閱投影片。


第2講 視覺心理

我們的視覺系統會幫忙選擇我們要看的,無法控制。

這邊舉了幾個眼動儀的實驗照片跟影片,讓大家知道使用者的視覺熱點會落在哪裡,嗯…這張圖讓現場傳出不少笑聲。

好的資料視覺設計師,應該要善用這點,強化大家的理解。重點有三個:顏色、形狀、動作,這樣就可以掌握八成了,而其中顏色幾乎佔了一半的重要性,因為顏色讓我們在專注思考之前,就自動化的進入到我們的印象中。

顏色

顏色需要謹慎設計來表達最重要的維度。

如果要數出畫面上有幾個數字”5”,左邊的我們必須一行行閱讀,費時八到十秒;如果加上顏色,眼睛掃一下馬上就能辨識出來了,甚至不需細讀。

但是如果混入了其他數字,就容易造成解讀錯誤。另外也要避免使用彩虹色當漸層色,因為容易讓人把資料分群,例如黃色會被視為獨立的一群,可能產生不必要的誤解。

形狀

形狀又細分長度、弧度、面積。

人們對長度特別敏感,些微的差距可以馬上辨識。

如果換成圓餅圖,讀起來就不那麼直覺,相差程度太小並不容易區分;但長條圖就算一列數十筆資料也能馬上看出差距。

我們在看正方形的面積,在對齊的情況下,大致可以推算出兩者的比例大小。

這邊帶出了「真實度」跟「忠誠度」的概念。以圓面積舉例,人無法很直覺的推算出兩者的比例,需要透過數學計算。左邊是圓面積實際的「真實比例」,數字300的圓是數字100的三倍,但一般人會覺得正確的比例,看起來並沒有想像中該有的大小;學者經過研究,右圖的圓面積才比較符合人類的「感官知覺」大小。

又好比電擊測試,就算只調高了一個等級,但是受測者很難精準的體驗出來,甚至會覺得痛上十倍不止。

動作

讓使用者一次專注在一件動態資訊上,減少誤判,並盡量減少記憶負擔;影片中球傳了幾次?大腦計算傳球次數就需要用到工作記憶。

第3講 設計方法

這個小考我選「以上皆是」,結果答案是「以上皆非」,當下好衝擊!這些選項不完全正確的原因,投影片解釋得很清楚,我簡單的摘要:

1. 許多為了「美學」的裝飾,反而成為解讀的雜訊。
2. 資料視覺應該是要客觀的,不是你覺得好,是使用者需要才做。
3. 好的設計,不是簡化資訊,是降低理解門檻。
4. 資料視覺需要反覆測試視覺化方式,達到最佳解決方案。



資料設計三元素:空間、互動、資料,從150頁開始到最後,都是非常棒的參考資訊,像是光X-Y軸就能有相當多種的呈現方式;以及資料的呈現方式種類,如線性關係、二維關係、三高維關係、階層、網狀、地理、時間。


空間

「真實度」跟「忠誠度」的拉扯,適當的扭曲空間以利表達相關資訊。例如捷運的地圖讓人可以方便理解,但不代表真實的地理位置;兩地之間的距離也可以用票價與交通時間傳達遠近;區域大小也能用人口多寡替代真實的地理面積,端看想呈現的是什麼樣的資料。


互動

網頁可以讓使用者自行探索,但是投影片只有講者切換才能被動的呈現。



資料


圖表類型介紹,與選擇的時機。

資料視覺化不是直接做簡單,例如直接排除雜訊,這樣是傷害了資料;重點是要呈現「完整的資料」,降低理解的難度,而如果做得很好,對方其實是沒感覺的。(比如說當身體健康,一切都很順利;當意識到某個器官,那就表示那邊可能出問題了。)


工具介紹

實作的部分,老師demo了五個學生的專案,然後簡單介紹了三個工具:D3.js、Tableau、Processing。因為我不是工程師背景,就我粗淺的理解,Tableau是可以用拖拉直接完成圖表的,並且可以快速切換圖形的種類,跟excel有點像,看起來頗親切,使用免費版資料必須公開,也可選擇企業版。另外兩個需要自己刻程式碼,但客製化的程度相對比較高,可以在yotuben搜尋相關介紹。

D3.js

Tableau

Processing

Pala

朝iOS Developer自學轉職中。紀錄過去兩年下班自學Python網頁設計Google Analytics分享;也推薦從架站、撰文到運營,首年12萬瀏覽的部落格心得;新文章是演算法與iOS動畫入門