你信任 AI 的判斷嗎？人機協作、透明度與 AI 治理入門

🎯

人才是 AI 治理的核心。三種人機協作迴圈（橡皮圖章、虛假安全感、倫理紅線）揭示監督失效的根因，XAI 重建透明度，歐盟 AI Act 用風險分級框架劃底線。搞懂這三層，你就知道 AI 該怎麼管、誰來管、管到哪。

❓

AI 不是都一樣嗎？為什麼要分三種？

因為你不會叫會計去做創意總監的事。AI 也有三種職能，搞清楚誰擅長什麼，才知道哪些任務該交給誰。

一、 AI 的職場人設：它到底是哪種員工？

如果我們把 AI 擬人化，它並不是全能的神，而是具備不同專長的三種「職人」。理解這些分類，你才知道該把什麼任務交給誰。

1. 分析型 AI (Analytical AI)：冷靜的「財務稽核」

這是最傳統但也最穩健的 AI。它的專長是看著後照鏡，分析過去發生的數據。

核心能力：資料分析、商業智慧 (BI)。

應用場景：當你需要知道「上季營收為何下滑？」或者「這張報表有沒有異常？」時，找它就對了。

2. 預測型 AI (Predictive AI)：精算的「風險評估師」

它不只看過去，更擅長利用機率模型來推算未來。

核心能力：需求預測、風險偵測。

應用場景：銀行用它來判斷「這筆刷卡是不是詐騙？」，電商用它來算「雙 11 要備多少貨？」。它幫我們在不確定性中找到規律。

3. 生成式 AI (Generative AI)：瘋狂的「創意總監」

這是 2022 年以後爆發的類型。不同於前兩者在處理「既有資訊」，它是無中生有。

核心能力：內容生成 (文字/圖像/影音)。

應用場景：ChatGPT、Midjourney。你給它一個指令 (Prompt)，它給你一篇文案或一張圖。

❓

AI 會不會有一天統治人類？

目前的 AI 發展，正處於從「分析與預測」邁向「生成與創造」的轉捩點，這也是為什麼現在大眾對 AI 如此有感的原因。但目前的 AI 仍只是「很強的專才」，離科幻電影還很遠。

二、現實與科幻的距離：我們在哪裡？

常有人擔心 AI 會毀滅人類，這通常是混淆了「弱 AI」與「強 AI」的區別。

1. 弱 AI (Weak AI / Narrow AI)

定義：只能處理單一特定任務，不具備自我意識。

現狀：我們目前看到的所有 AI 都是弱 AI。

這很重要：即使是擊敗世界棋王的 AlphaGo，把它放到無人車上去開車，它也會立刻撞毀。因為它只懂圍棋，不懂交通規則。它很強，但很「狹隘」。

2. 強 AI (Strong AI / Artificial General Intelligence, AGI)

定義：具備人類般的泛用型智能，能跨領域解決未曾見過的問題，甚至擁有意識。

現狀：尚未實現。這是科學家追求的聖杯，但目前還在實驗室階段。

3. 超 AI (Super AI)

定義：智力全面超越人類。

現狀：僅存在於科幻電影中。

❓

我又不寫程式，為什麼要知道 AI 怎麼運作？

不寫程式，你依然是「下指令的人」。

不了解 AI 運作，就像不會開車卻硬要上路，只能任由導航（AI）把你帶進死胡同，甚至因為它一本正經的胡說八道而踩雷。

理解運作，你才能精準控車、看破盲點，讓它成為幫你倍增生產力的最強助手。

三、拆解 AI 廚房：基礎設施層級 (Infrastructure)

AI 系統不是一個黑盒子，它的運作邏輯像極了經營一間「米其林餐廳」。我們可以由下而上，將其分為三層：

AI 基礎架構三層示意圖，區分 Foundation、Modeling 與 Application 層

1. 基礎層 (Foundation Layer)：廚房與食材

這是物理基礎，沒有這一層，上層無法運作。

數據 (Data)：食材。AI 的糧食，沒有高品質的數據，再好的廚師也做不出好菜 (Garbage in, Garbage out)。

算力 (Computing Power)：廚房設備。執行運算所需的硬體 (GPU/TPU)。

演算法 (Algorithm)：食譜。處理數據的邏輯與步驟。

2. 模型層 (Modeling Layer)：大廚的烹飪與試菜

這是智慧建構的過程。

特徵工程與訓練：大廚開始處理食材、進行烹飪。

關鍵概念：「泛化能力 (Generalization)」：這是一個好 AI 的標準。意思是模型不僅要把這道菜做給熟客吃（訓練數據），當面對沒見過的新客人（新數據）時，也要能做出正確的判斷。如果 AI 只能死記硬背考古題，那就沒有泛化能力。

3. 應用層 (Application Layer)：外場服務與上菜

這是交付價值的地方。

部署 (Deploy)：將模型透過 API 整合到 APP 或網頁中。

維運：不僅要讓客人吃到菜，還要持續監控口味有沒有變調（模型監控）。

❓

知道 AI 的歷史對我有什麼用？

AI 幾十年來都在重複同一個循環：高調吹捧、遭遇瓶頸、跌入寒冬、技術突破。 知道這個規律，你就不會在新技術誕生時陷入盲目崇拜，也不會在它犯錯時全面否定。

看懂歷史，你才能看清當下 AI 的本質依然是「機率與統計」的演化，而非真正的神祇。這能讓你保持冷徹的批判性，在浪潮中準確預判它下一個無能為力的盲點在哪裡，永遠走在技術的前面。

四、智慧的本源：AI 是怎麼演化來的？

AI 並不是突然蹦出來的，它是數十年來不同學派的競爭與融合。

AI 發展歷史關鍵點圖，包含圖靈測試、達特茅斯會議、AlphaGo 與生成式 AI 爆發

1. AI 發展的四大里程碑

1950 圖靈測試 (Turing Test)：概念的起點。艾倫·圖靈提出：「如果一台機器能透過文字對話騙過人類，讓人以為它是人，那它就具備智能。」

1956 達特茅斯會議 (Dartmouth Conference)：名詞的誕生。John McCarthy 等人正式提出「Artificial Intelligence」一詞，AI 成為獨立學科。

2016 AlphaGo：弱 AI 的巔峰。Google DeepMind 擊敗圍棋世界冠軍，證明了深度學習在複雜策略上的突破。

2022 生成式 AI 爆發 (Generative AI Boom)：滲透的開始。

意義：這並非單一技術奇蹟，而是 Transformer 架構、大規模算力與 ChatGPT 人類回饋訓練（RLHF）的匯流結果。
差異：與 AlphaGo 不同，生成式 AI 的關鍵不在於「擊敗人類」，而在於它開始滲透人類的日常認知與工作流程，讓高度複雜的模型變成一般人可直接使用的工具，從而引發了制度、產業與治理層面的連鎖反應。

2. 不同流派對「智慧」的理解

符號主義 (Symbolic AI)：或是稱為「老派 AI」。

⏰ 活躍年代：1950 年代中期 → 1970 年代（AI 的第一個黃金時期）。
核心：認為智慧就是「邏輯規則」。像是早期的專家系統，非黑即白，邏輯嚴謹但缺乏彈性。

認知運算 (Cognitive Computing)：

⏰ 活躍年代：概念追溯至 1980s，盛行於 1990s–2010s（尤其是 IBM Watson 時期）。
核心：試圖模擬「人腦思考」。目標是理解自然語言，輔助人類決策而非取代人類。

具身智慧 (Embodied AI)：

⏰ 活躍年代：1990 年代提出，2010 年代因深度學習與機器人學再度升溫。
核心：認為智慧需要「身體」。透過機器人與環境的物理互動來學習（像是小嬰兒透過觸摸來學習）。

❓

什麼是人機協作？都讓 AI 做不就好了？

人機協作不是「全自動放任」，而是「AI 出產能，人類負全責」。

AI 就像超強的數位學徒，能高速處理資料與生成草稿；但它缺乏真實世界的痛覺與道德感知，容易一本正經地胡說八道。

最終的決策、事實檢查與法律/道德責任，永遠必須由具備靈魂的人類來扛。

五、人機協作模式與批判：虛假的安全感？

三種人機協作模式圖，對比 Human-in-the-Loop、Human-over-the-Loop 與 Human-out-of-the-Loop

在導入 AI 時，最關鍵的問題往往不是技術，而是「決策權在誰手上」。根據人類介入程度的不同，我們可以分為三種迴圈模式。

但我們必須警惕一個核心批判：人類監督政策本身，往往提供了一種「虛假的安全感」。我們常假設「只要有人在場，就能有效審查」，但實際上人類往往沒有能力、時間或權力去做到這件事。

有人在場不等於有人在監督。只是形式上坐在那裡，腦子沒跟上，有跟沒有一樣。

1. Human-in-the-Loop (HITL)：人在迴圈內

Human-in-the-Loop 的人性弱點漫畫，說明自動化偏誤、橡皮圖章與制度性壓制

一句話定位：出現在「不能出錯、錯了要有人負責」的場景。

2. Human-over-the-Loop (HOTL)：人在上方監控

這類系統平常自動運作，人類只在異常時介入，看似保有主導權，但實際上常流於形式。

3. Human-out-of-the-Loop (HOOTL)：人被排除在外

當 AI 完全自主決策與執行時，效率最高，但也最容易踩到責任與倫理的紅線。

❓

AI 的判斷我看不懂，干我什麼事？

當然干你的事，因為扛責任、吞後果的人是你，不是 AI。

當 AI 做出一個攸關預算、策略或商譽的決定，而你因為看不懂就盲目盲從，一旦出錯，法律和社會不會去懲罰一段程式碼，只會追究按下「同意」的你。

XAI 就是在解決「看不懂就沒法追究」這個問題。

六、解釋性 AI（XAI）：讓黑箱變得能被追問

在深入之前，我們先打掉常見的錯誤觀念：

❌ 誤解 1：XAI = AI 會講人話

模型沒有「理解」能力，解釋是人類層的產物。XAI 是要解釋「這個系統為什麼在這個情境下做出這個輸出」，而不是「它心裡真正的想法」。

❌ 誤解 2：只要準確率高，就不需要 XAI

這是無數 AI 災難的源頭。準確 ≠ 可監督。一個高準確率但完全黑箱的系統，在醫療或金融領域就是一顆責任地雷。

❌ 誤解 3：XAI 是給工程師看的

錯。XAI 真正的對象通常是醫師、法官、風控人員或被拒保的使用者。

2. XAI 到底在解決什麼問題？（三個層級）

如果沒有可解釋性，就沒有真正的 Human oversight（人類監督）。XAI 試圖解決三個層次的問題：

🧠 1. 認知層：人能不能「理解這個判斷」

「為什麼這張 X 光被判為高風險？」、「為什麼這筆交易被擋？」如果人看不懂，就無法進行監督。

⚖️ 2. 責任層：出事時能不能「追責」

當 AI 出錯時，是資料偏差？是模型設計問題？還是使用者操作錯誤？如果沒有解釋，最後只剩下互相甩鍋。

🧩 3. 治理層：能不能「改規則」

這接續了上一章對 Human-over-the-Loop 的批判：如果人類只能修改單一個案，卻不知道系統「為什麼會一直錯」，那就根本談不上治理，只是在做無效的補救。

3. XAI 的兩大流派：翻譯蒟蒻 vs. 透明玻璃

XAI 其實分為兩大類，這是一個核心的權衡：

① 事後解釋 (Post-hoc explanation)：翻譯蒟蒻

模型照跑（可能是複雜的黑箱），事後再「幫人類生成一個容易理解的理由」。
重點：AI 在做決定時，並沒有用這個解釋。這只是人類事後補上的理解方式。
風險：這也是目前最大的爭議點。事後解釋必然不完全忠實，且容易在部分情境下嚴重失真。這會給決策者一種錯誤的安全感，反而可能造成災難性後果。

② 本質可解釋 (Inherently interpretable models)：透明玻璃

模型本身設計就很簡單、透明（例如決策樹）。
好處：可監督性極高，所見即所得。
迷思破解：「準確度一定要用複雜黑箱換取」是個迷思。在多數有良好結構化特徵的任務上，簡單可解釋模型常能達到與深度學習近乎相同的表現。

4. 翻譯蒟蒻怎麼運作？四種常見的「事後解釋」工具

所謂的 Post-hoc explanation，意思就是 AI 先做完決定，人類才回頭問：「你剛剛為什麼這樣做？」。以下將常見方法用一句話與生活比喻來解釋：

① LIME：在你家門口亂敲，猜你為什麼不開門

如何運作：LIME 並非直接讀懂 AI 的大腦，而是透過「試探反應」。它會在原始資料旁邊生成許多假的資料（擾動樣本），觀察 AI 判斷的變化，最後用一個簡單的線性模型來描繪局部的決策邊界。

生活比喻：就像你想知道鄰居為什麼不開門，於是你試著敲大聲一點、換個時間敲、或是換個人去敲，根據他的反應來「猜」：「喔，大概是因為在睡覺」。

⚠️ 提醒：它是猜測，不是模型真正的內部理由。

② SHAP：這次沒過，每個條件各自扣了幾分

如何運作：SHAP 利用合作博弈論 (Game Theory) 中的 Shapley value 概念，計算每個特徵（如收入、負債比）在這次預測中各自貢獻了多少影響力，精確量化了每個條件的「邊際貢獻」。

生活比喻：就像老師改考卷時告訴你總分 59 分的原因：作業扣 2 分、考試扣 3 分、出席扣 1 分。它幫你拆解各項因素的責任分攤。

⚠️ 提醒：這是在算影響力分攤，且是事後歸因，不代表直接的因果關係。

③ 反事實解釋 (Counterfactual)：如果你改一點點，結果會不會不一樣？

如何運作：它不回顧原因，而是尋找輸入特徵的「最小可行改動」。它直接告訴你，資料要變動多少，才能讓 AI 的判斷翻盤（例如從拒絕變成核准）。

生活比喻：它不問「為什麼當掉我」，而是問「我要怎樣才會過？」。就像老師告訴你：「只要多對兩題就會及格了」。它在標示改變結局的門檻。

⚠️ 提醒：它在幫人「應對模型」，不代表模型本身的邏輯是公平或合理的。

④ 全局解釋 (Global explanation)：整體來看，這個 AI 最在意什麼

如何運作：它不看單一個案，而是分析模型在整體資料分佈下的行為。透過特徵重要性分析或聚合 SHAP 值，識別出 AI 長期以來最依賴哪些特徵來做決定。

生活比喻：就像評價一所學校的校風：「這所學校整體最看重的是成績還是出席率？」。它描述的是模型的整體偏好。

⚠️ 提醒：「全局」指的是解釋的層級；如果它是從黑箱模型事後彙整而來的，本質上仍屬於 Post-hoc explanation。

⚠️ 批判：不透明往往是「商業選擇」而非「技術限制」
企業往往有強烈誘因維持模型的不透明性，目的是保護商業利益（不想被競爭對手知道演算法）。
案例：刑事再犯風險評估工具 COMPAS 或 2018 年加州野火時的 BreezoMeter 空汙預測，都因為商業機密而拒絕公開模型細節，導致外界無法驗證其準確性或偏誤。

❓

AI 法規離我很遠吧？

不論是著作權判定、個資保護，還是平台下架哪些功能，AI 法規都像一條隱形紅線，界定你手中工具的威力和邊界。

當你在商用作品中誤用了侵權 AI，法律責任在幾秒內就會找上你。

七、人文價值的展現：治理與倫理

當 AI 能力越來越強，我們需要的不是更快的演算法，而是更好的煞車系統。

1. 歐盟「可信賴 AI 七大準則」：從道德呼籲到行動指引

在 2019 年，歐盟高階專家組 (HLEG) 提出了七大關鍵要求，這成為了後來立法的基礎。這些準則確保了 AI 不僅是合法的，更是符合倫理與穩健的：

人類的主體性與監督：AI 應賦權而非操控人類，必須確保 Human-in-the-loop 等監督機制。

技術穩健性與安全性：系統要有備案 (Fall back)，確保出錯時不會釀災，並具備可重現性。

隱私與數據治理：不僅遵守 GDPR，更要確保數據品質，避免「Garbage in, Garbage out」。

透明度：人類有權知道「我在跟機器互動」（如 Chatbot），並理解系統的能力極限（即 XAI）。

多元、不歧視與公平性：從開發源頭避免偏見 (Bias)，確保弱勢群體不被邊緣化。

社會與環境福祉：考量 AI 的耗能永續性，以及對社會結構的衝擊。

問責制：建立可審計 (Audit) 與補救機制，確保出事時有人負責，受害者有管道申訴。

2. 歐盟《人工智慧法》 (EU AI Act) 的風險分級

歐盟《人工智慧法案》是世界上第一部全面性的 AI 監管法律框架，於 2024 年正式成為法律。它採用了一種聰明的「漸進式」做法：規範力度隨風險程度加強，既保護基本權利，也避免過度阻礙創新。

風險分級金字塔如下：

風險等級	定義與規範	典型案例
不可接受風險 (Unacceptable)	🚫 絕對禁止。違反基本人權的應用。	社會信用評分、公共場所的遠程生物特徵辨識（大規模監控）。
高風險 (High)	⚠️ 嚴格規範。需通過嚴格評估與上市後監控。	招聘系統、醫療器材、銀行信用評分、司法輔助系統。
有限風險 (Limited)	ℹ️ 透明化義務。必須告知使用者「你在跟機器互動」。	聊天機器人 (Chatbot)、情緒辨識系統。
最低風險 (Minimal)	✅ 無額外限制。	垃圾郵件過濾器、電玩遊戲中的 AI NPC。

結語

AI 最大的風險在過度信任和制度盲點，不在技術。

有人在場不保證有人在判斷。HITL 會變橡皮圖章，HOTL 會變虛假安全感

LIME 和 SHAP 在猜 AI 怎麼想，不是打開黑箱。事後解釋給了理解的錯覺

符合 GDPR 的 AI 系統照樣可能在結構上歧視弱勢群體

有些決策天生不該自動化。自主武器的爭議已經證明了這件事

還有一件事。AI 正在成為逃避責任的藉口。

當銀行拒絕貸款時說「這是 AI 算的」，當招聘系統排除族群時說「這是統計結論」，決策責任就被外包出去了。受害者找不到一個能負責的人。

AI 治理要解決的問題是「怎麼讓人類保持清醒」。演算法的黑箱有技術工具可以拆，制度和責任的黑箱只能靠人自己面對。

（延伸閱讀：AI 也會被騙？OWASP Top 10 for LLM 揭露的 10 個安全盲點）

📌

參考資料

CybermaniacsRubber Stamp Risk: Why "Human Oversight" Can Become False Confidence

Rubber Stamp Risk: Why "Human Oversight" Can Become False Confidence

Oversight only works when it’s real. Learn how to prevent human review from becoming a rubber-stamp risk in your AI governance strategy.

Shaping Europe’s digital futureEthics guidelines for trustworthy AI

Ethics guidelines for trustworthy AI

On 8 April 2019, the High-Level Expert Group on AI presented Ethics Guidelines for Trustworthy Artificial Intelligence. This followed the publication of the guidelines' first draft in December 2018 on which more than 500 comments were received through an open consultation.

PubMed Central (PMC)Stop Explaining Black Box Machine Learning Models for High Stakes Decisions and Use Interpretable Models Instead

Stop Explaining Black Box Machine Learning Models for High Stakes Decisions and Use Interpretable Models Instead

Black box machine learning models are currently being used for high stakes decision-making throughout society, causing problems throughout healthcare, criminal justice, and in other domains. People have hoped that creating methods for explaining ...

WikipediaDeath of Elaine Herzberg

Death of Elaine Herzberg

The death of Elaine Herzberg (August 2, 1968 – March 18, 2018) was the first recorded case of a pedestrian fatality involving a self-driving car, after a collision that occurred late in the evening of March 18, 2018. Herzberg was pushing a bicycle across a four-lane road in Tempe, Arizona, United States, when she was struck by an Uber test vehicle, which was operating in self-drive mode with a human safety backup driver sitting in the driving seat. Herzberg was taken to the local hospital where she died of her injuries.[2][3][4]

iPAS AI 規劃師初級筆記地圖

每篇對應一個考試主題，點標題可直接跳轉，想看哪篇點哪篇 🤤

章節	文章指路
L111	AI 人機協作、可解釋性與治理的真實問題
L112	別讓 AI 吃垃圾！一次搞懂資料清洗、特徵工程與統計
L113	機器學習全景圖：從演算法圖鑑、訓練優化到 MLOps 維運
L114	鑑別式 AI 與生成式 AI：從原理、挑戰到未來趨勢
L121	從 AI 玩家到數位指揮官：No-Code/Low-Code 如何重新定義開發？
L122	生成式 AI 的典範轉移：為什麼 AI Agent 是下一場工作革命？
L123	生成式 AI 導入指南：從策略評估到組織落地與風險治理