Course 6 - Share Data Through the Art of Visualization

簡介

This is the sixth course in the Google Data Analytics Certificate. You’ll learn how to visualize and present your data findings as you complete the data analysis process. This course will show you how data visualizations, such as visual dashboards, can help bring your data to life. You’ll also explore Tableau, a data visualization platform that will help you create effective visualizations for your presentations.

章節大綱

  1. Visualize data
    認識各種類型的資料視覺化方法,並了解如何什麼是有效的視覺化,以及其他有助於資料視覺化的因素。
  2. Create data visualizations with Tableau
    學習利用 Tableau 平台建立視覺化,並且為視覺化注入創造力和清晰度,確保產生的圖表容易理解。
  3. Craft data stories
    了解什麼是數據故事,並學習使用 Tableau 的儀表板和過濾功能創造有吸引力的視覺化效果。
  4. Develop presentations and slideshows
    了解如何有效地演示數據分析,建立能夠引起觀眾共鳴的簡報。

內容筆記

Module 1 - Visualize data

資料視覺化要素 - The McCandless method

要素 解釋
Information 正在使用的資料
Story 清晰且有說服力的敘述或概念
Goal 明確的目標或功能
Visual form 有效的視覺表達

相關性 & 因果關係

類型 區別
相關性 衡量兩個變數相互關係的程度,並不意味著一個事件會導致另一個事件
因果關係 指事件導致特定結果的想法

例子:
糙皮病是一種以頭暈、瘡、嘔吐和腹瀉為症狀的疾病,一開始人們認為這種疾病是由不衛生的生活條件引起的,大多數患有糙皮病的人也生活在不衛生的環境中。之後的研究發現,糙皮病是缺乏維生素 B3 所造成,證明骯髒的生活條件與其只是有相關性,並非因果關係。

不同的視覺化方式

資料模式 視覺化類型
變化 隨著時間的推移而變化的觀察資料,適合透過折線圖或長條圖展示
聚類 資料集擁有相似或不同的值時,適合利用分布圖來展示
相對性 與事物的比例有關,或是包含一個整體的多個部分,適合使用圓餅圖
排行 需要排序的資料適合用長條圖來表示
相關性 表示兩個或多個事物之間的相互關係,可以使用散點圖表示

設計原則

原則 解釋
平衡 顏色和形狀等關鍵視覺元素均勻分佈
強調 使用顏色或是數值來表示出資料中的重點
移動 使用線條和顏色來吸引注意,並引導視線
圖案 使用形狀和顏色強調相似或相異的效果
重複 重複圖表類型、形狀或顏色,幫助觀眾回顧、比較之前的資料
比例 使用不同的顏色和尺寸有助於強調某些訊息
節奏 透過排列元素,形成流暢的視覺展現
多樣性 圖表類型、線條、形狀、顏色和數值方面應該具有一定的多樣性
一致性 所有內容應該保持前後一致,避免矛盾的情況

Module 2 - Create data visualizations with Tableau

避免誤導性圖表

避免 解釋
切斷 y 軸 改變 y 軸比例可能導致不同組別差異看起來更大
雙 y 軸 如果使用雙 y 軸而沒有清楚標示,可能產生誤導
錯誤的分組 錯誤的分組可能無法呈現數據全貌,或是掩蓋了重要的趨勢
錯誤的圖表類型 如果在圓餅圖中的數據總和並非 100% 可能產生誤導
人為平滑趨勢 在大規模的散佈圖中使用趨勢線,可能使資料比原本看起來有更加緊密的聯繫

詞彙

  1. Annotation (註解): Text that briefly explains data or helps focus the audience on a particular aspect of the data in a visualization.
  2. Cluster (聚類): A collection of data points on a data visualization with similar values.
  3. Data storytelling (數據故事): Communicating the meaning of a dataset with visuals and a narrative that are customized for an audience.
  4. Emphasis (強調): The design principle of arranging visual elements to focus the audience’s attention on important information in a data visualization.
  5. Framework (框架): The context a presentation needs to create logical connections that tie back to the business task and metrics.