Course 2 - Ask Questions to Make Data-Driven Decisions

簡介

This is the second course in the Google Data Analytics Certificate. You’ll build on your understanding of the topics that were introduced in the first course of this certificate program. The material will help you learn how to ask effective questions, make data-driven decisions, and meet stakeholders’ needs.

章節大綱

  1. Ask effective questions
    在這個單元內學習如何進行有效的提問,良好的提問可以讓整個分析的流程變得更加順利。
  2. Make data-driven decisions
    本單元介紹數據如何去驅動的各種業務方面的決策,並且學習如何透過報告和儀表板有效地展現數據。
  3. Spreadsheet magic
    了解資料分析師為何選擇使用試算表、試算表的使用方式,以及利用結構化思維理解並解決問題。
  4. Always remember the stakeholder
    學習如何了解利害關係人的期望與需求,同時與合作團隊建立良好且清晰的溝通。

內容筆記

Module 1 - Ask effective questions

資料分析的六個階段

上一個課程有提到過資料分析的六個階段,在這邊又提了一次,詳細說明了如何透過問問題的方式去了解各個階段要做的事情。

Ask

在這個階段應該做的事:

  • 定義要解決的問題
  • 確保完全了解利害關係人的期望
  • 專注於實際問題,避免任何干擾
  • 與利害關係人合作並保持開放的溝通管道
  • 結合背景觀察整體狀況

問題:

  • 我的利害關係人說他們的問題是什麼?
  • 既然已經確定了問題,那麼我該如何解決問題呢?

Prepare

在此階段應該決定要收集哪些數據並且組織這些數據來解決問題,必須考慮的點有:

  • 以哪些指標 (metrics) 來衡量
  • 以資料庫儲存數據
  • 以安全措施來保護數據

問題:

  • 我該如何想出問題的解決方案?
  • 我需要進行哪些研究?

Process

在這個階段需要清理數據以消除任何可能的錯誤、不準確或不一致,因此必須:

  • 使用試算表尋找錯誤的數據
  • 使用 SQL 函數檢查多餘空格
  • 刪除重複資料
  • 盡可能檢查數據中的偏差

問題:

  • 哪些錯誤或不準確的數據可能會影響我找出的答案?
  • 如何清理資料以使我擁有的資訊更有一致性?

Analyze

在此階段可以對資料進行排序和格式化,讓分析師可以更輕鬆地:

  • 執行計算
  • 合併多個來源的數據
  • 使用分析結果建立表格

問題:

  • 我的數據告訴我什麼故事?
  • 我的數據將如何幫助我解決這個問題?
  • 誰需要我公司的產品或服務?什麼類型的人最有可能使用它?

Share

在這個階段可能會透過圖表或儀表板等工具總結結果,向利害關係人展示你已經解決了他們的問題。

問題:

  • 如何使向利害關係人展示的內容吸引人且易於理解?
  • 如果我是傾聽者,什麼東西可以幫助我理解?

Act

根據您的發現向您的利害關係人提供建議,讓他們能夠做出數據所驅動的決策。

問題:

  • 如何利用在 Share 階段收到的回饋來滿足利害關係人的需求和期望?

六個常見的問題類型

類型
範例 & 說明
預測 預測最佳廣告方法來吸引新客戶,我們可以利用過去的廣告的位置、媒體類型以及獲得的新客戶數量等數據來做預測。
分類 公司提高客戶滿意度也可以利用分類的方式,根據某些關鍵字或分數對客戶服務電話進行分類,幫助識別表現最好的客戶服務代表,或將行動與滿意度分數相關聯。
異常情況 以有監測健康狀況功能的智慧手錶公司為例,分析匯總健康數據非常重要,可以在某些數據趨勢不正常時發現並發出警報。
確認主題 與分類的問題類似,確定主題可以幫助優先考慮要改進的正確產品功能,主題主要是將分類所形成的類別進一步分組到更廣泛的主題。
發現關聯 以物流公司與另一家公司合作將貨物按時交付給客戶為例,透過分析運輸中心的等待時間的關聯,可以確定適當的時間修改,以增加準時交貨的數量。
尋找規律 以分析機器故障時間為例,假設透過分析維護數據發現定期維護延遲如果超過 15 天就會發生故障,就是發現了一個規律。

SMART questions

提問 解釋
Specific 問題具體嗎?是否能解決困難?能幫助你獲得大量信息嗎?
Measurable 問題的答案可以量化嗎?
Action-oriented 答案會提供能幫助制定計劃的資訊嗎?
Relevant 問題的答案和目標有關嗎?
Time-bound 問題與研究的時間有關嗎?

利用這五個提問可以讓你提出高效的問題,讓之後的分析更加順利,這邊以人們在購買新車時會考慮的問題為例:

  • Specific:這個問題是否聚焦在車子的特定功能?
  • Measurable:問題是否包含功能評分?
  • Action-oriented:問題是否會影響未來的功能?
  • Relevant:問題是否能找出影響車輛成交的因素?
  • Time-bound:問題是否驗證了最近三年的數據?

透過以上的思考,我們可以提出以下幾個問題:

  • 從 1 到 10 評分,你認為四輪驅動對於汽車有多重要?並解釋原因。
  • 你最希望在汽車擁有的前五項功能是什麼?
  • 如果汽車是四輪驅動,是否會增加你的購買意願?

避免提出的問題:

  • 引導性問題:這個產品太貴了,不是嗎?
  • 封閉式問題:你對客戶試用滿意嗎?
  • 模糊問題:這個工具適合你嗎?

Module 2 - Make data-driven decisions

定性與定量數據

資料分析師通常會在工作中使用這兩種類型的資料,定性 (Qualitative) 資料可以透過提供原因或更全面的解釋來幫助分析師更好地理解定量 (Quantitative) 資料,換句話說,定量資料通常告訴你什麼 (what),而定性資料通常告訴你為什麼 (why)。

大數據與小數據

比較:

小數據 大數據
由短的、明確定義的時間段內的資料集 較長時間段、較不具體的資料集
在試算表中組織和分析 保存在資料庫中以供查詢
被中小型企業使用 被大型組織使用
易於收集、儲存、管理和直覺表示 進行相同行為需要花費大量的精力
已經是適合分析的大小 需要分成較小的部分才能進行分析

大數據的優點:

  • 成功分析後可以帶來許多好處,例如節省大量時間和金錢。
  • 幫助企業了解當前的市場狀況,保持領先地位。
  • 幫助公司追蹤客戶回饋,提供了改進方向。

大數據的缺點:

  • 可能包含許多不重要或無關的資訊。
  • 分析需要較長時間、效率較低。
  • 數據不易獲得。
  • 數據過多可能會導致不公平的演算法偏差。

大數據中的 4 個 " V ":

特點 解釋
Volume 資料量
Variety 資料種類
Velocity 數據處理速度
Veracity 數據的品質與可靠性

Module 3 - Spreadsheet magic

試算表裡的錯誤代碼

錯誤 意義 說明 & 舉例
#DIV/0! 除以 0 或是空白儲存格 =B2/B3 (當 B3 為 0)
#ERROR! 輸入的內容無法解釋 =COUNT(B1:D1 C1:C10) (中間缺少了逗號)
#N/A 公式找不到數據 找不到引用的儲存格 (常發生於 VLOOKUP 等函數)
#NAME? 無法辨識公式或函數的名稱 名稱拼字錯誤
#NUM! 儲存格具有無效數值 =DATEDIF(A4, B4, “M”) (A4 的日期晚於 B4 的日期)
#REF! 引用了無效的儲存格 使用的儲存格位於已刪除的欄位中
#VALUE! 公式或引用單元格存在問題 需要進行額外的工作才能找到問題的根源

其他公式

  1. ISERROR(範圍)
    如果儲存格會發生錯誤會返回 true 否則返回 false,可以利用其作為條件篩選出錯誤。
  2. COUNTIF(範圍, 目標)
    計算範圍內符合目標的儲存格數量。
  3. VLOOKUP(目標, 範圍, 回傳欄位, 大約符合 (TRUE)或完全符合 (FALSE))
    在範圍內找到目標之後回傳指定的目標欄位,詳細內容可以參考: 【EXCEL | VLOOKUP用法教學】5分鐘快速搞懂VLOOKUP函數

Module 4 - Always remember the stakeholder

與利害關係人建立良好溝通

  • 討論目標:利害關係人的需求通常是關於更大的專案或目標,嘗試詢問利害關係人想要什麼樣的結果,設定期望並且規劃下一步。
  • 嘗試說不:假設一位主管有一個「高優先級」項目,需要數據來支持他們的假設,要求你在明天早上之前完成分析,如果你認為他們的假設尚未完整,或是有更好的分析方式、需要更多時間,這時可以勇敢地說不,並提出並詳細解釋你認為更好的方案。
  • 為意外情況做規劃:在開始專案之前,列出潛在的障礙,並在預定時間表時預留一點時間處理問題。
  • 了解你的專案:透過電子郵件或報告追蹤相關的信息,準備好回答相關的問題,了解你的專案如何與公司其他部門聯繫起來,並參與提供盡可能多的見解。
  • 善用文字與視覺化:利用視覺化的方式可以幫助利害關係人更快的了解專案中的信息。
  • 經常溝通:定期更新專案,利用日誌紀錄專案的歷程與困難,讓利害關係人可以隨時介入並查看進度。

與聽眾的溝通技巧

溝通也是資料分析師的必備技能,在與聽眾進行報告前可以先問自己以下四個問題,讓之後的報告更加有效率。

  • 誰是你的聽眾?
  • 聽眾已經知道了什麼?
  • 聽眾應該要知道什麼?
  • 如何最好的傳達他們應該知道的信息。

詞彙

  1. Metric (指標): A single, quantifiable type of data that is used for measurement.
  2. Structured thinking (結構化思考): The process of recognizing the current problem or situation, organizing available information, revealing gaps and opportunities, and identifying options.