你信任 AI 的判斷嗎?人機協作、透明度與 AI 治理入門

一、 AI 的職場人設:它到底是哪種員工?

1. 分析型 AI (Analytical AI):冷靜的「財務稽核」
- 核心能力:資料分析、商業智慧 (BI)。
- 應用場景:當你需要知道「上季營收為何下滑?」或者「這張報表有沒有異常?」時,找它就對了。
2. 預測型 AI (Predictive AI):精算的「風險評估師」
- 核心能力:需求預測、風險偵測。
- 應用場景:銀行用它來判斷「這筆刷卡是不是詐騙?」,電商用它來算「雙 11 要備多少貨?」。它幫我們在不確定性中找到規律。
3. 生成式 AI (Generative AI):瘋狂的「創意總監」
- 核心能力:內容生成 (文字/圖像/影音)。
- 應用場景:ChatGPT、Midjourney。你給它一個指令 (Prompt),它給你一篇文案或一張圖。
二、 現實與科幻的距離:我們在哪裡?

1. 弱 AI (Weak AI / Narrow AI)
- 定義:只能處理單一特定任務,不具備自我意識。
- 現狀:我們目前看到的所有 AI 都是弱 AI。
- 這很重要:即使是擊敗世界棋王的 AlphaGo,把它放到無人車上去開車,它也會立刻撞毀。因為它只懂圍棋,不懂交通規則。它很強,但很「狹隘」。
2. 強 AI (Strong AI / Artificial General Intelligence, AGI)
- 定義:具備人類般的泛用型智能,能跨領域解決未曾見過的問題,甚至擁有意識。
- 現狀:尚未實現。這是科學家追求的聖杯,但目前還在實驗室階段。
3. 超 AI (Super AI)
- 定義:智力全面超越人類。
- 現狀:僅存在於科幻電影中。
三、 拆解 AI 廚房:基礎設施層級 (Infrastructure)

1. 基礎層 (Foundation Layer):廚房與食材

- 數據 (Data):食材。AI 的糧食,沒有高品質的數據,再好的廚師也做不出好菜 (Garbage in, Garbage out)。
- 算力 (Computing Power):廚房設備。執行運算所需的硬體 (GPU/TPU)。
- 演算法 (Algorithm):食譜。處理數據的邏輯與步驟。
2. 模型層 (Modeling Layer):大廚的烹飪與試菜
- 特徵工程與訓練:大廚開始處理食材、進行烹飪。
- 關鍵概念:「泛化能力 (Generalization)」:這是一個好 AI 的標準。意思是模型不僅要把這道菜做給熟客吃(訓練數據),當面對沒見過的新客人(新數據)時,也要能做出正確的判斷。如果 AI 只能死記硬背考古題,那就沒有泛化能力。
3. 應用層 (Application Layer):外場服務與上菜
- 部署 (Deploy):將模型透過 API 整合到 APP 或網頁中。
- 維運:不僅要讓客人吃到菜,還要持續監控口味有沒有變調(模型監控)。
四、 智慧的本源:AI 是怎麼演化來的?

1. AI 發展的四大里程碑
- 1950 圖靈測試 (Turing Test):概念的起點。艾倫·圖靈提出:「如果一台機器能透過文字對話騙過人類,讓人以為它是人,那它就具備智能。」
- 1956 達特茅斯會議 (Dartmouth Conference):名詞的誕生。John McCarthy 等人正式提出「Artificial Intelligence」一詞,AI 成為獨立學科。
- 2016 AlphaGo:弱 AI 的巔峰。Google DeepMind 擊敗圍棋世界冠軍,證明了深度學習在複雜策略上的突破。
- 2022 生成式 AI 爆發 (Generative AI Boom):滲透的開始。
- 意義:這並非單一技術奇蹟,而是 Transformer 架構、大規模算力與 ChatGPT 人類回饋訓練(RLHF)的匯流結果。
- 差異:與 AlphaGo 不同,生成式 AI 的關鍵不在於「擊敗人類」,而在於它開始滲透人類的日常認知與工作流程,讓高度複雜的模型變成一般人可直接使用的工具,從而引發了制度、產業與治理層面的連鎖反應。
2. 不同流派對「智慧」的理解

- 符號主義 (Symbolic AI):或是稱為「老派 AI」。
- ⏰ 活躍年代:1950 年代中期 → 1970 年代(AI 的第一個黃金時期)。
- 核心:認為智慧就是「邏輯規則」。像是早期的專家系統,非黑即白,邏輯嚴謹但缺乏彈性。
- 認知運算 (Cognitive Computing):
- ⏰ 活躍年代:概念追溯至 1980s,盛行於 1990s–2010s(尤其是 IBM Watson 時期)。
- 核心:試圖模擬「人腦思考」。目標是理解自然語言,輔助人類決策而非取代人類。
- 具身智慧 (Embodied AI):
- ⏰ 活躍年代:1990 年代提出,2010 年代因深度學習與機器人學再度升溫。
- 核心:認為智慧需要「身體」。透過機器人與環境的物理互動來學習(像是小嬰兒透過觸摸來學習)。
五、 人機協作模式與批判:虛假的安全感?

1. Human-in-the-Loop (HITL):人在迴圈內

2. Human-over-the-Loop (HOTL):人在上方監控
3. Human-out-of-the-Loop (HOOTL):人被排除在外
六、 解釋性 AI(XAI):讓黑箱變得能被追問
- ❌ 誤解 1:XAI = AI 會講人話
- 模型沒有「理解」能力,解釋是人類層的產物。XAI 是要解釋「這個系統為什麼在這個情境下做出這個輸出」,而不是「它心裡真正的想法」。
- ❌ 誤解 2:只要準確率高,就不需要 XAI
- 這是無數 AI 災難的源頭。準確 ≠ 可監督。一個高準確率但完全黑箱的系統,在醫療或金融領域就是一顆責任地雷。
- ❌ 誤解 3:XAI 是給工程師看的
- 錯。XAI 真正的對象通常是醫師、法官、風控人員或被拒保的使用者。
2. XAI 到底在解決什麼問題?(三個層級)

- 🧠 1. 認知層:人能不能「理解這個判斷」
- 「為什麼這張 X 光被判為高風險?」、「為什麼這筆交易被擋?」如果人看不懂,就無法進行監督。
- ⚖️ 2. 責任層:出事時能不能「追責」
- 當 AI 出錯時,是資料偏差?是模型設計問題?還是使用者操作錯誤?如果沒有解釋,最後只剩下互相甩鍋。
- 🧩 3. 治理層:能不能「改規則」
- 這接續了上一章對 Human-over-the-Loop 的批判:如果人類只能修改單一個案,卻不知道系統「為什麼會一直錯」,那就根本談不上治理,只是在做無效的補救。
3. XAI 的兩大流派:翻譯蒟蒻 vs. 透明玻璃

- ① 事後解釋 (Post-hoc explanation):翻譯蒟蒻
- 模型照跑(可能是複雜的黑箱),事後再「幫人類生成一個容易理解的理由」。
- 重點:AI 在做決定時,並沒有用這個解釋。這只是人類事後補上的理解方式。
- 風險:這也是目前最大的爭議點。事後解釋必然不完全忠實,且容易在部分情境下嚴重失真。這會給決策者一種錯誤的安全感,反而可能造成災難性後果。
- ② 本質可解釋 (Inherently interpretable models):透明玻璃
- 模型本身設計就很簡單、透明(例如決策樹)。
- 好處:可監督性極高,所見即所得。
- 迷思破解:「準確度一定要用複雜黑箱換取」是個迷思。在多數有良好結構化特徵的任務上,簡單可解釋模型常能達到與深度學習近乎相同的表現。
4. 翻譯蒟蒻怎麼運作?四種常見的「事後解釋」工具

① LIME:在你家門口亂敲,猜你為什麼不開門
- 如何運作:LIME 並非直接讀懂 AI 的大腦,而是透過「試探反應」。它會在原始資料旁邊生成許多假的資料(擾動樣本),觀察 AI 判斷的變化,最後用一個簡單的線性模型來描繪局部的決策邊界。
- 生活比喻:就像你想知道鄰居為什麼不開門,於是你試著敲大聲一點、換個時間敲、或是換個人去敲,根據他的反應來「猜」:「喔,大概是因為在睡覺」。
- ⚠️ 提醒:它是猜測,不是模型真正的內部理由。
② SHAP:這次沒過,每個條件各自扣了幾分
- 如何運作:SHAP 利用合作博弈論 (Game Theory) 中的 Shapley value 概念,計算每個特徵(如收入、負債比)在這次預測中各自貢獻了多少影響力,精確量化了每個條件的「邊際貢獻」。
- 生活比喻:就像老師改考卷時告訴你總分 59 分的原因:作業扣 2 分、考試扣 3 分、出席扣 1 分。它幫你拆解各項因素的責任分攤。
- ⚠️ 提醒:這是在算影響力分攤,且是事後歸因,不代表直接的因果關係。
③ 反事實解釋 (Counterfactual):如果你改一點點,結果會不會不一樣?
- 如何運作:它不回顧原因,而是尋找輸入特徵的「最小可行改動」。它直接告訴你,資料要變動多少,才能讓 AI 的判斷翻盤(例如從拒絕變成核准)。
- 生活比喻:它不問「為什麼當掉我」,而是問「我要怎樣才會過?」。就像老師告訴你:「只要多對兩題就會及格了」。它在標示改變結局的門檻。
- ⚠️ 提醒:它在幫人「應對模型」,不代表模型本身的邏輯是公平或合理的。
④ 全局解釋 (Global explanation):整體來看,這個 AI 最在意什麼
- 如何運作:它不看單一個案,而是分析模型在整體資料分佈下的行為。透過特徵重要性分析或聚合 SHAP 值,識別出 AI 長期以來最依賴哪些特徵來做決定。
- 生活比喻:就像評價一所學校的校風:「這所學校整體最看重的是成績還是出席率?」。它描述的是模型的整體偏好。
- ⚠️ 提醒:「全局」指的是解釋的層級;如果它是從黑箱模型事後彙整而來的,本質上仍屬於 Post-hoc explanation。
⚠️ 批判:不透明往往是「商業選擇」而非「技術限制」企業往往有強烈誘因維持模型的不透明性,目的是保護商業利益(不想被競爭對手知道演算法)。
- 案例:刑事再犯風險評估工具 COMPAS 或 2018 年加州野火時的 BreezoMeter 空汙預測,都因為商業機密而拒絕公開模型細節,導致外界無法驗證其準確性或偏誤。
七、 人文價值的展現:治理與倫理
1. 歐盟「可信賴 AI 七大準則」:從道德呼籲到行動指引

- 人類的主體性與監督:AI 應賦權而非操控人類,必須確保 Human-in-the-loop 等監督機制。
- 技術穩健性與安全性:系統要有備案 (Fall back),確保出錯時不會釀災,並具備可重現性。
- 隱私與數據治理:不僅遵守 GDPR,更要確保數據品質,避免「Garbage in, Garbage out」。
- 透明度:人類有權知道「我在跟機器互動」(如 Chatbot),並理解系統的能力極限(即 XAI)。
- 多元、不歧視與公平性:從開發源頭避免偏見 (Bias),確保弱勢群體不被邊緣化。
- 社會與環境福祉:考量 AI 的耗能永續性,以及對社會結構的衝擊。
- 問責制:建立可審計 (Audit) 與補救機制,確保出事時有人負責,受害者有管道申訴。
2. 歐盟《人工智慧法》 (EU AI Act) 的風險分級

風險等級 | 定義與規範 | 典型案例 |
不可接受風險 (Unacceptable) | 🚫 絕對禁止。違反基本人權的應用。 | 社會信用評分、公共場所的遠程生物特徵辨識(大規模監控)。 |
高風險 (High) | ⚠️ 嚴格規範。需通過嚴格評估與上市後監控。 | 招聘系統、醫療器材、銀行信用評分、司法輔助系統。 |
有限風險 (Limited) | ℹ️ 透明化義務。必須告知使用者「你在跟機器互動」。 | 聊天機器人 (Chatbot)、情緒辨識系統。 |
最低風險 (Minimal) | ✅ 無額外限制。 | 垃圾郵件過濾器、電玩遊戲中的 AI NPC。 |
結語
- 有人在場不保證有人在判斷。HITL 會變橡皮圖章,HOTL 會變虛假安全感
- LIME 和 SHAP 在猜 AI 怎麼想,不是打開黑箱。事後解釋給了理解的錯覺
- 符合 GDPR 的 AI 系統照樣可能在結構上歧視弱勢群體
- 有些決策天生不該自動化。自主武器的爭議已經證明了這件事
參考資料
CybermaniacsRubber Stamp Risk: Why "Human Oversight" Can Become False Confidence
Rubber Stamp Risk: Why "Human Oversight" Can Become False Confidence
Oversight only works when it’s real. Learn how to prevent human review from becoming a rubber-stamp risk in your AI governance strategy.
Ethics guidelines for trustworthy AI
On 8 April 2019, the High-Level Expert Group on AI presented Ethics Guidelines for Trustworthy Artificial Intelligence. This followed the publication of the guidelines' first draft in December 2018 on which more than 500 comments were received through an open consultation.

Stop Explaining Black Box Machine Learning Models for High Stakes Decisions and Use Interpretable Models Instead
Black box machine learning models are currently being used for high stakes decision-making throughout society, causing problems throughout healthcare, criminal justice, and in other domains. People have hoped that creating methods for explaining ...
WikipediaDeath of Elaine HerzbergDeath of Elaine Herzberg
The death of Elaine Herzberg (August 2, 1968 – March 18, 2018) was the first recorded case of a pedestrian fatality involving a self-driving car, after a collision that occurred late in the evening of March 18, 2018. Herzberg was pushing a bicycle across a four-lane road in Tempe, Arizona, United States, when she was struck by an Uber test vehicle, which was operating in self-drive mode with a human safety backup driver sitting in the driving seat. Herzberg was taken to the local hospital where she died of her injuries.[2][3][4]
v2.0- 新增章節:補完 XAI (可解釋性 AI) 與人機協作相關考點。
- 全文優化:調整段落結構,提升易讀性。
- 壓縮圖片、調整格式、文字編排
這篇有幫到你嗎?歡迎餵食煎餃 🥟
每篇文章都是踩坑後整理出來的,你的支持是最好的調味料。
.png?table=collection&id=2ba70f01-9634-81f4-8376-000b1aff7bf1&t=2ba70f01-9634-81f4-8376-000b1aff7bf1&width=1080&cache=v2)









