Google資料分析課程筆記-8
Course 8 - Google Data Analytics Capstone
簡介
This course is the eighth and final course in the Google Data Analytics Certificate. You’ll have the opportunity to complete a case study, which will help prepare you for your data analytics job hunt. Case studies are commonly used by employers to assess analytical skills. For your case study, you’ll choose an analytics-based scenario. You’ll then ask questions, prepare, process, analyze, visualize and act on the data from the scenario. You’ll also learn about useful job hunting skills, common interview questions and responses, and materials to build a portfolio online.
章節大綱
- Learn about capstone basics
了解綜整專案、案例研究和作品集,並使用它們如何讓雇主更好地了解你的技能和能力。 - Optional: Build your portfolio
進行案例研究,並將其放到平台上託管。 - Optional: Use your portfolio
學習在面試的過程中善用自己的作品集。 - Put your certificate to work
獲取課程證書,介紹求職平台。
內容筆記
Case Study
我挑選的是 Case Study 1 作為我的案例研究,此案例的主要內容是作為分析師為芝加哥的自行車共享公司 Cyclistic 進行資料分析,了解休閒騎士和年度會員使用自行車的方式有什麼不同,並且根據結果設計新的行銷策略。主要利用之前提到過的數據分析六階段 ask、prepare、process、analyze、share、act 進行。
Step 1 - Ask
主管指派了你一個問題: 休閒騎士和年度會員使用自行車的方式有什麼不同?
Guiding questions
- 你要解決的問題是什麼?
- 利用資料找出休閒騎士和年度會員之間的差異。
- 你的見解會如何影響決策?
- 幫助設計策略,將休閒騎士轉化為年度會員。
Step 2 - Prepare
Cyclistic 的歷史行程數據
- 資料來源: Lyft Bikes and Scooters, LLC
- 網址: https://divvy-tripdata.s3.amazonaws.com/index.html
- 授權: https://divvybikes.com/data-license-agreement
- 時間段: 2015 - 2024
我選擇了
202307
到202406
的資料作為我的案例分析。
Step 3 - Process
利用 R
進行資料合併、除缺失值,在表內增加了四個欄位,最後進行篩選。
- ride_length: 行程的時間 (單位為分鐘)。
- day_of_week: 行程結束時是星期幾。
- ended_month: 行程結束時的月份。
- ended_hour: 行程結束時是幾點。
1 | library(tidyverse) |
清理後的表格:

Step 4 - Analyze & Step 5 - Share
- 每月騎乘次數
比較各個月份的騎乘次數。
1 | # Numbers of rides by month |

騎乘次數在六月到九月時最高,且休閒騎士的數量成長明顯,我認為可能是因為這個時間段有較好的天氣,並且遊客數量較多。
- 星期內每日騎乘次數
比較星期內每日的騎乘次數。
1 | # Numbers of rides by days of week |

在圖中可以發現兩種使用者的騎乘趨勢是不同的,會員通常在工作日騎乘,而休閒騎士則在周末騎乘較多。
- 各小時騎乘次數
比較每個小時的騎乘次數。
1 | # Numbers of rides by hour |

在會員的圖中可以看到兩個峰值,分別是早上八點以及下午五點,而休閒騎士只有一個峰值在下午五點,綜合前一點可以推測,會員通常在通勤時間騎車上下班,休閒騎士則是在周末下午騎車休閒較多。
- 星期內各日各小時騎乘次數
比較星期內每日每小時的騎乘次數。
1 | # Numbers of rides by days of week and hours |

在假日時兩者的趨勢是相同的,但是在工作日時就有明顯的不同,符合我們之前的假設。
- 平均騎乘時間
比較兩種使用者的平均騎乘時間。
1 | # Average ride length |

雖然會員的騎乘次數比休閒騎士要多,但是休閒騎士的平均騎乘時間較高,如同我們之前假設的,原因可能是會員通勤時間較短,而休閒騎士主要是騎車進行休閒活動,因此騎乘時間較長。
- 總結
- 在
六月到九月
期間有較高的騎乘次數. - 會員與休閒騎士的差異:
差異 | 會員 | 休閒騎士 |
---|---|---|
周 | 工作日較高 | 周末較高 |
小時 | 通勤時間有兩個峰值 | 單一個峰值在下午 |
騎乘次數 | 較高 | 較低 |
平均騎乘時間 | 較低 | 較高 |
Step 6 - Act
建議:
- 將預算集中在有較多客戶的月份 (
六月到九月
) 去吸引更多會員。 - 在
工作日的通勤時間
提供折扣,吸引更多人騎車通勤,並且轉化為會員。 - 同時在
周末
也提供折扣,讓更多人騎車進行休閒活動,接觸到這項服務。