讀書筆記/2026.02.17 發佈/2026.03.01 更新

讀《大數據的關鍵思考》從個人成長到商業決策:解構大數據的底層思維

字數 4293閱讀時間 11 分鐘
讀《大數據的關鍵思考》從個人成長到商業決策:解構大數據的底層思維

type
status
date
slug
summary
tags
category
icon
password

前言

你是不是也有一堆「以後會有用」的東西?
Notion 裡躺著幾十篇沒整理的筆記,瀏覽器書籤資料夾塞滿了「待讀」文章,手機截圖多到自己都忘記截過什麼。我們總覺得先存起來,之後一定會用到。
但「之後」從來沒有到來。
《大數據的關鍵思考》的作者車品覺,曾任阿里巴巴集團的數據長。他在書中直接戳破一個迷思:
「先收集起來將來再使用,這個想法完全是偽命題。」
這是阿里巴巴初期犯過的錯。他們一開始以為資料越多越好,結果儲存成本暴漲,卻沒有人知道這些資料要拿來做什麼。
所以問題從來不是你收集得不夠多,而是:你有沒有帶著問題去看這些資料?
這本書講的是企業如何運用大數據,但讀完之後我發現,裡面的思考框架其實可以套用在個人身上。你的記帳紀錄、番茄鐘數據、學習筆記,都是你的「個人資料庫」。差別只在於,你有沒有一套方法,讓這些資料真的產生價值。

一、「感覺」最容易騙人,而數據讓你有一把尺

我們平常對生活的判斷,大部分都來自「感覺」。
你感覺最近工作很認真,感覺最近花錢花太兇,感覺自己好像有在進步。但問題是,「感覺」這種東西最容易騙人,因為它沒有標準,也沒辦法比較。
什麼時候你才能真的知道自己表現好不好?當你手上有一把尺的時候。

有了平均值,你才有標準

假設你開始用番茄鐘記錄專注時間,連續記一個月,你就會看到一個平均值。有了這個平均值,你就有了一個基準點。
當你知道自己平均每天能專注四小時,某天卻只有兩小時的時候,你就可以問自己一個具體的問題:是昨晚沒睡好?還是那天會議太多,時間被切太碎?
這就是數據最基本的價值:讓你從模糊的感覺中跳出來,有一個可以衡量好壞的標準。

從數據中鍛鍊思考

書裡提到一個概念叫「情境還原」(Context Restoration)。意思是說,同樣一筆數據,為什麼有人能從裡面看出東西,有人卻看不出來?差別在於你能不能還原這筆數據背後的「脈絡」。
作者舉了一個我覺得很有意思的例子:如果你想知道一家酒樓的生意好不好,該問誰?
答案不是問老闆,而是去問門口賣報紙的人。為什麼?因為香港人習慣喝茶的時候順便買份報紙,所以報紙的銷量會直接反映酒樓的來客數。報紙攤販不知道酒樓的財報,但他手上握著一個很實際的「情境指標」。
這讓我想到:數據本身是死的,但當你知道這筆數據是「誰」在「什麼情境下」產生的,它才會活過來。
你的番茄鐘紀錄如果不搭配當天的睡眠狀況、會議數量、甚至心情好不好,單看「今天專注了幾小時」這個數字,意義其實很有限。
記錄只是起點,能不能還原情境,才決定這筆數據對你有沒有用。

二、記錄不等於分析,你需要的是一個『數據框架』

為什麼有人記帳三年,還是不知道錢花去哪?
答案很簡單:因為他只是在「記錄」,沒有在「分析」。

數字本身不會告訴你答案

書裡有個案例讓我印象很深。
作者在分析某個電商網站的廣告投放時,發現一件有點反直覺的事:ROI(投資報酬率,Return on Investment)排名前 30% 的那些關鍵字,帶來的顧客幾乎都是「一次性消費」的人。
這些人就是因為看到便宜才點進來,買完就閃人,之後再也不會回來。換句話說,這些「績效最好」的關鍵字,帶來的其實是最沒有長期價值的客人。
結果呢?他們試著把這些關鍵字砍掉,業績幾乎沒有受到影響。
這個案例讓我意識到一件事:數字本身不會告訴你它代表什麼意思。你需要一個框架,才能正確地解讀它。

數據框架:解決問題的四個步驟

如果你記帳只是流水帳式地記「今天花了多少錢」,你很難發現問題出在哪裡。但如果你是帶著一個具體的問題去記,比如「我到底在哪裡花了最多冤枉錢」,你就會開始幫支出分類、比較不同類別的比例。
說不定你會發現:每次加班壓力大的那幾天,宵夜和手搖飲的開支就會暴增。這時候,你要解決的可能不是「少喝手搖」,而是「為什麼最近一直在加班」。
這就是作者說的「數據框架」(Data Framework)。他把這個過程拆成四個步驟:
  1. 確定問題:你想透過這些數據回答什麼問題?
  1. 整理數據:把資料放進一個框架裡,讓它可以被分類、被比較
  1. 分析關係:觀察數據之間的關聯,找出規律
  1. 採取行動:根據你的發現去做調整,然後看看有沒有效
這套流程不只能用在商業分析上。記帳、減肥、準備考試,其實都可以套用一樣的邏輯。
重點不是你記了多少,而是你有沒有一個框架,讓這些紀錄能回答你真正在意的問題。

三、迷茫時的指南針:先開槍,再瞄準

在讀這本書的時候,我發現一個有趣的矛盾:作者一方面強調要「帶著問題去記錄」,另一方面又提倡「先開槍,後瞄準」。
這聽起來像是叫你先亂打一通再說,難道不矛盾嗎?
深入思考後我才發現,這其實是針對不同人生階段的「數據策略」。

1. 探索期的「先開槍」:與迷茫共處

當你對一個新的知識領域、或是對未來的生涯規劃感到一片漆黑時,你根本不知道目標在哪裡。這時候,如果你堅持要先「瞄準」才行動,你可能永遠無法出發。
這就像生涯探索。在你什麼都不確定的情況下,比較好的做法是先廣泛嘗試:大量閱讀、參加不同的活動、接觸各種可能性,然後從過程中觀察,哪個嘗試讓你最有成就感?哪個方向做起來最順?
「先開槍」是為了快速產生數據,讓我們在海量的雜訊中,慢慢找到值得瞄準的目標。

2. 成熟期的「養數據」:精準的長期主義

一旦你透過「開槍」找到了方向,策略就要跟著變。這時候你不再亂打,而是開始精確地設計:我需要追蹤什麼數據,才能讓自己在這個方向上持續進步?
作者把這叫做「養數據」(Data Cultivation)。跟被動的「收集」不同,養數據是一種主動的、有策略的行為。
做法
心態
收集
有什麼記什麼,先存起來再說
被動的
養數據
想清楚要追蹤什麼,設計記錄的方式
主動的
打個比方:就像在森林裡打獵。一開始你不知道獵物在哪,所以到處走、到處看、到處留下足跡(開槍探索)。但當你發現了某種動物的蹤跡,你就要開始佈線、追蹤、記錄牠出沒的規律(養數據),最後才有辦法精準出擊。
先開槍是為了找到方向,養數據是為了走得更遠。階段不同,做法就不同。

四、釐清核心:「目的」跟「目標」不一樣

在數據驅動的思維裡,作者對「目的」跟「目標」的區分讓我很有收穫。這兩個詞語看起來很像,但其實是用來區分行動的層次。
意思
例子
目的(Purpose)
你想到達的終點
我想達到財務自由
目標(Goal)
衡量你有沒有到達的標準
四十歲前被動收入超過支出
很多人覺得「讀越多書、上越多課」,吸收就會越好。但大數據的思維告訴我們:如果沒有先搞清楚你的「目的」是什麼,你就只是在資料的海洋裡溺水而已。
順序應該是這樣:先確定目的,再設定可衡量的目標,最後才去執行。
這樣一來,你累積的數據才會是有意義的迭代,而不只是讓自己感覺良好的流水帳。

五、自我管理的靈魂拷問:老師的三個問題

書裡有一段讓我印象很深。
作者剛開始負責支付寶的數據營運時,完全沒有頭緒,於是打電話給他的老師求救。結果老師沒有給他答案,而是問了他三個問題:
  1. 你目前面對的三大問題是什麼?
  1. 未來三個月,你要解決什麼問題?
  1. 過去一個月,你做對了什麼?做錯了什麼?
老師說:「如果你五分鐘內答不出來,那你根本不應該坐在這個位置上。」
這三個問題本來是用來測試「商業敏感度」的,但我覺得拿來做自我管理,力道一樣強。
它本質上就是一套「自我監控機制」。如果你答不出來,代表你可能根本不知道自己現在在幹嘛。
不管是投資理財、職涯規劃、還是任何你想變好的領域,這三個問題都可以定期拿出來問自己。數據就像是你寫給未來的自己的信,如果沒有這些紀錄,你就沒辦法對齊過去跟現在的表現。

六、數據的盲點與心法:像「小偷」一樣觀察世界

讀到這裡,你可能會覺得:好,那我只要有框架、有標準,數據應該就能幫我做出好的決定了吧?
沒那麼簡單。數據也會騙人的。

停留時間長,不代表他真的在看

書裡有個「物理盲點」的例子:某電商網站發現有些商品頁面的停留時間特別長,一開始以為這代表使用者對這些商品很有興趣。
但實際去調查之後才發現,很多人只是把網頁開著,人就跑去開會了。停留時間長,根本不代表他有在認真看。
這讓我想到一個生活中的例子:你可能覺得自己每天都很忙、行程排得超滿。但仔細想想,忙的都是什麼?是真的重要的事,還是一堆讓你「感覺有在做事」的瑣碎雜務?

四種常見的數據盲點

作者整理了四種我們很容易踩到的坑:
  • 經驗盲點:拿過去的成功套用在環境已改變的當下。
  • 邏輯盲點:統計的標準不一致,導致數字根本不能比較(比如把電腦版跟手機版的數據混在一起算轉換率)
  • 人為盲點:為了自我感覺良好而修飾數據(如:記帳時故意漏掉大額消費)
  • 物理盲點:數據呈現的現象,跟真正的原因對不上(如:待在圖書館很久不代表有在唸書)

用「小偷思維」來檢查自己

那要怎麼避開這些盲點?作者提了一個我覺得蠻有趣的說法:「小偷思維」。
意思是:你要像個壞人一樣,主動去懷疑你眼前看到的數據。這個數字有沒有可能是錯的?有沒有其他的解釋方式?有沒有人在騙我,包括我自己?
另一個相關的概念是「負面思考」。我們習慣看成功案例,但作者建議也要多去觀察別人是怎麼失敗的。正面思考告訴你怎麼成功,負面思考告訴你怎麼避免搞砸。兩種視角都需要,但後者很容易被忽略。
數據是工具,不是答案。你怎麼解讀它,才決定它能不能真的幫到你。

結語:開始你的「個人數據管理」

所以,到底可以怎麼開始?
書的最後一章提到「個人的大數據管理」,裡面有幾個建議我覺得還蠻實用的:
  1. 選一個你真的在意的題目:可以是記帳、健身、學習、時間管理,但一定要是你真的想搞清楚的事情
  1. 從最小的地方開始:不用一開始就想建一個完美的系統,先用最簡單的方式記錄就好
  1. 帶著問題去記:不是「先記再說」,而是「我想透過這些紀錄弄懂什麼」
  1. 定期回頭看:記錄 → 分析 → 調整 → 再記錄,讓它變成一個循環

讀這本書之前,我一直覺得「大數據」是大公司、資料科學家在搞的東西,跟我沒什麼關係。但讀完之後我才發現,我的 Notion 筆記、記帳 App、番茄鐘紀錄,說穿了都是我的個人資料庫。
差別只在於,我以前只是在「收集」,從來沒有認真「養」過這些數據。
當然啦,這本書有些觀點我是持保留態度的。作者很強調「能識別使用者身份的數據最有價值」,但現在的趨勢是資料去識別化(De-identification)跟隱私保護,這個時代背景的落差,讀的時候要自己斟酌一下。
另外,書裡其實還有很多比較偏技術類型的內容,像是數據中台、標籤系統、模型分析之類的,篇幅有限就不展開了,有興趣的人可以自己去挖。
對我來說,這本書最大的收穫是這個想法:
數據不管大不大,都是你拿來反省跟做決定的依據。先有記錄,才會有標準;有了標準,才有辦法做出更好的選擇。
這不是什麼高深的技術,就是一種思考的習慣而已。
大數據的終點,其實是為了「確定性」買單。
我們記錄生活、分析盲點、定義標準,都是為了在充滿變數的人生中,增加一點點「確定的勝算」。當你開始用這套邏輯來打通自己的數據循環,你就不再只是被動地被社會巨輪推著走,而是一個能透過數據觀測自己、進而優化人生的「決策者」。

這篇有幫到你嗎?歡迎餵食煎餃 🥟

每篇文章都是踩坑後整理出來的,你的支持是最好的調味料。

請我喝杯咖啡
一杯咖啡看懂 Markdown、YAML 與 JSON:給初學者的 AI 語言指南寫 Prompt 之前,先學會問問題:用 Lyra 解鎖後設思維
Loading...
2025-2026閃電煎餃.

煎餃的調味實驗室 | 一個非本科文組生的 AI 自學筆記。用 n8n、Claude 與 Notion 打造自動化工作流,分享提早下班的數位食譜。

Powered byNotionNext 4.9.2.