鑑別式 AI 和生成式 AI 差在哪？原理、應用場景與挑戰全比較

🎯

AI 有兩條路：鑑別式學「這是什麼」，生成式學「做一個像這樣的」。本文拆解 LLM 的 Tokenization 到 Transformer 四步驟，點出幻覺、模式崩潰、算力爆炸等天生缺陷，並說明 RAG、LoRA、RLHF 如何補位，最後展示兩類 AI 聯手的四大整合模式。

前言

當我們打開 ChatGPT 對話時，很少人會想到：這背後到底是什麼原理？為什麼它能「寫」？為什麼有時候又會一本正經地胡說八道？

這篇文章是我在準備「iPAS AI 規劃師初級」時留下的筆記。我按照官方學習指引科目一（L114）的架構，參考 2025 年第四次初級考試的內容，加入了圖解與輔助說明，希望能幫助你在短時間內理解鑑別式 AI 與生成式 AI 的本質差異。

讓我們從最根本的問題開始：AI 到底在學什麼？

一、AI 的兩大陣營：核心原理比較

簡單來說，AI 的學習方向只有兩種：「學著分類」跟「學著模仿」。

評估 AI 學習成效的難度差異：鑑別式 AI 像改選擇題有標準答案（Ground Truth），生成式 AI 像改作文，創意沒有標準答案，評分極為主觀。

1.1 核心概念對照表

特性	鑑別式 AI (Discriminative AI)	生成式 AI (Generative AI)
一句話解釋	這是什麼？（分類）	做一個像這樣的東西。（創造）
核心目標	分類、判斷、預測	創造新內容
學習重點	找出一條線，切分不同類別的邊界 (Boundary)	學會資料長什麼樣子，也就是分布 (Distribution)
運作方式	給它數據→ 它告訴你這是不是貓	給它一堆貓照→ 它畫出一隻不存在的貓

1.2 怎麼知道 AI 學得好不好？（評估指標）

生成式 AI 三大評估指標與盲點：Likelihood 常見不代表好、FID 看不懂畢卡索只懂真實照片、BLEU 算字串重疊太死板容易誤殺有創意的好回答。

這是兩者最大的分水嶺。評估「選擇題」很容易，但評估「作文」很難。

鑑別式 AI（好評估）：

因為有標準答案 (Ground Truth)。這張圖是貓就是貓，不是狗。
關鍵指標： 答對幾題 (Accuracy)、抓出多少個目標 (Recall)、抓得準不準 (Precision)。

生成式 AI（超難評估）：

因為「創意」沒有標準答案。文章寫得好不好？畫得像不像？很主觀。
關鍵指標與盲點：

Likelihood (可能性)：這句話「常見」嗎？

原理： 測量這段文字符不符合統計規律。

盲點： 常見不代表好。 「今天天氣很好」機率很高（Likelihood 高），但很無聊；詩人寫「燃燒的雪」，機率很低（不常見），但那是好詩。

FID (Fréchet Inception Distance)：這張圖「像真圖」嗎？

原理： 比較「生成圖」跟「真實照片」的統計距離。分數越低越好。

盲點： 它看不懂畢卡索。 FID 是拿真實照片訓練的，如果你生成抽象畫，FID 會覺得這跟照片差太多而給差評。它懂「真實」，不懂「藝術」。

BLEU：跟標準答案的字有多像？

原理： 算字串重疊度。常用於翻譯。

盲點： 太死板。 同一句話有很多種講法，只看字有沒有重疊，容易誤殺有創意但用詞不同的好回答。

1.3 常見演算法地圖

AI 演算法地圖：鑑別式陣營含傳統 ML（邏輯迴歸、決策樹、SVM）與深度學習（CNN、BERT），生成式陣營含圖像三巨頭（GAN、VAE、Diffusion）與文本生成（Transformer）。

🔹 鑑別式 AI (Discriminative AI)

傳統機器學習 (ML)： 邏輯迴歸、決策樹、SVM、隨機森林。

深度學習 (DL)： 卷積神經網路 (CNN) (看圖高手)、BERT (理解文字高手)。

🔹 生成式 AI (Generative AI)

圖像生成三巨頭：

生成對抗網路 (GAN)：

核心機制： 由 生成器 (Generator) 與 判別器 (Discriminator) 組成的零和賽局。
白話說明： 簡單說就是「左右互搏」。一個負責畫（騙人）、一個負責評（抓假），越吵越強。

變分自動編碼器 (VAE)：

核心機制： 利用 編碼器 (Encoder) 將資料壓縮到 潛在空間 (Latent Space) 的機率分佈，再用 解碼器 (Decoder) 還原。
白話說明： 把圖片壓縮成一組「特徵密碼」，再學著把密碼還原成新圖片。

擴散模型 (Diffusion Models)：

核心機制： 包含 前向擴散 (Forward Diffusion, 加噪) 與 逆向擴散 (Reverse Diffusion, 去噪) 兩個過程。
白話說明： 先逐步把圖片加上雜訊變成全雜訊（雪花），再練它「把雪花變回圖片」的功力（DALL-E, Midjourney 原理）。

文本生成：

Transformer 架構： 基於 自注意力機制 (Self-Attention)，解決了長距離依賴問題（GPT, Llama）。

二、大型語言模型 (LLM) 是怎麼煉成的？

要理解 GPT，我們得看它怎麼「讀」跟「寫」。這裡有四個關鍵步驟。

LLM 四步驟運作流程：步驟一切分（Tokenization）把句子切成小塊，步驟二向量化（Embedding）把文字變數字，步驟三 Transformer 架構處理關係，步驟四條件語言模型（Conditional LM）預測下一個字。

2.1 步驟一：切分 (Tokenization)

Tokenization 切分示意：廚師貓把整條魚（整句中文）切成小塊（Token），切得好語意才通順，切太碎則 Token 數變多、API 更貴、模型更難理解。

❓

為什麼要先有 Token 才能有 Embedding？

模型就像外國人，它看不懂整句中文，也沒辦法直接吃「字」。它必須先把文章切成它能消化的小碎塊，這些碎塊就叫 詞元 (Token)。

定義： 模型世界的「原子」。可能是一個字，也可能是半個詞。

為什麼重要？ 切分 (Tokenization) 決定了模型的世界觀。

切得好，語意才通順。
切得太碎（例如繁體中文常被切很碎），詞元 (Token) 數變多，API 就要付更多錢，模型也更難理解。

2.2 步驟二：向量化 (Embedding)

Embedding 向量化示意：魔法師貓把「愛情」「麵包」等詞元轉換成數字座標投射到語意空間，靠距離理解意義，Prompt 的本質就是把文字轉成向量座標丟給模型。

❓

電腦只懂 0 與 1，怎麼懂「愛情」跟「麵包」的差別？

這就是 向量化 (Embedding) 的魔法。它把 詞元 (Token) 變成一串數字座標（向量），投射到一個巨大的語意空間裡。

原理： 靠「距離」來理解意義。

在那個空間裡，「國王」跟「皇后」的距離，會等於「男人」跟「女人」的距離。
提示詞 (Prompt) 的本質： 當你打字給 GPT，其實是把文字轉成這種向量座標丟給它。

2.3 步驟三：Transformer 架構

Transformer 架構對比 RNN：舊時代 RNN 讀到句尾忘了句首且一個字一個字讀很慢，Transformer 用自注意力機制（Self-Attention）一次看完整篇並能並行處理所有字。

❓

為什麼 Transformer 能打敗所有對手稱霸武林？

因為它徹底解決了「無法平行運算」與「健忘」的痛點。

傳統 AI 像排隊報數，必須一句句慢慢讀；Transformer 引入「注意力機制 (Attention)」，能同時並行處理整篇文本，並精準抓出字詞間的遠距離關聯。

這種恐怖的吞吐量與長文本理解力，讓它直接開啟了大模型時代。

因為它解決了兩個舊時代模型 (循環神經網路, RNN) 搞不定的痛點：

它能「過目不忘」 (解決長距離依賴)：

以前的模型讀到句尾就忘了句首；Transformer 用 自注意力機制 (Self-Attention)，像開上帝視角一樣，一次看完整篇文章，知道哪個字跟哪個字有關聯。

它能「一心多用」 (並行訓練)：

以前要一個字一個字讀，慢到爆；Transformer 可以同時處理所有字。這讓它能吃下整個網際網路的資料，模型才有可能變這麼巨大。

2.4 步驟四：條件語言模型 (Conditional LM)

條件語言模型示意：無條件接龍時模型亂猜（今天→天氣/貓/星期三），有條件接龍時根據提示詞精準預測（今天→是→星期五），Prompt Engineering 就是設計條件控制接龍方向。

❓

LLM 到底在做什麼？

LLM 處理資訊的邏輯，就像是把全人類的文本打碎、重新洗牌，再用數學公式推導出下一個最可能出現的字：

輸入文本 ──> [ 斷詞與向量化 ] ──> [ 注意力機制計算 ] ──> 輸出機率最高的下一個字

它的本質工作只有一個：預測下一個詞元 (Token)。

但它不是瞎猜，而是「看著條件 (Condition) 猜」。

我們可以把它想像成一個超級接龍遊戲，但規則分兩種：

無條件接龍 (Unconditional)：

規則： 隨便講，沒有目標。

例子： 給它「今天」，它可能接「天氣不錯」、「心情很好」或「是星期五」。這是發散的，無法控制。

有條件接龍 (Conditional)：

規則： 這才是 LLM 的核心。它是在「特定限制下」找最適合接下去的字。

條件 (Condition) 是什麼？ 就是你給它的 提示詞 (Prompt)，或是圖片、聲音的向量。

💡

提示工程 (Prompt Engineering) 其實就是在「精準設定條件」。你給的條件越明確（例如規定格式、語氣、步驟），模型能選擇的「下一個字」範圍就縮得越小，輸出的結果就越符合你的期待。

三、為什麼 AI 會出包？（技術挑戰）

AI 不是神，它有天生的缺陷。

鑑別式 AI 兩大痛點：數據偏見（Data Bias）讓模型學壞人類的刻板印象，標記成本（Labeling Cost）每張訓練圖都需要人工精準分類，耗時費力又燒錢。

3.1 鑑別式 AI 的痛點

數據偏見 (Data Bias)： 給它看一堆白人醫生的照片，它以後看到黑人就不認為是醫生。

標記成本 (Labeling Cost)： 訓練 AI 看X光片，需要請專業醫生一張張標記「這裡是腫瘤」，這超級貴。

生成式 AI 四大痛點：幻覺（Hallucination）一本正經胡說八道、模式崩潰（Mode Collapse）偷懶只畫同一種東西、算力成本（O(n²) 爆炸性成長）、災難性遺忘（學新忘舊）。

3.2 生成式 AI 的痛點

幻覺 (Hallucination)：為什麼 GPT 會亂說話？

這是它的本性。
原因： 大型語言模型 (LLM) 的任務是 「接龍」 (接續下一個字)，而不是 「查證真相」。
當它不知道答案時，為了完成「接龍」任務，它會依據機率生成一個「看起來很通順」的句子。它在一本正經地胡說八道，因為「接龍」才是它的任務。

模式崩潰 (Mode Collapse)：為什麼 GAN 容易失敗？

原因： 生成器 (Generator) 發現了考試漏洞。它發現只要畫某種特定的圖（例如白色的貓）就能騙過判別器，於是它就偷懶，以後只畫白貓，不再嘗試畫別的。這就是 模式崩潰。

算力成本 (Computational Cost)：為什麼 LLM 這麼貴？

Transformer 的代價：注意力機制是個「吃資源怪獸」。
文章長度每增加一倍，計算量不是增加兩倍，而是平方倍 (O(n²)) 爆炸性成長。這就是為什麼長文本模型這麼難做。

災難性遺忘 (Catastrophic Forgetting)：為什麼它會變笨？

當你教模型新知識（微調, Fine-tuning）時，它的腦神經（參數）會被調整。如果調太多，它可能會「學了新的，忘了舊的」，連原本會的東西都不會了。

四、怎麼讓 AI 更聰明？（優化技術）

既然有上述缺陷，工程師們發明了各種補丁來解決問題。

微調與輕量化三種技術：微調（Fine-tuning）像送去補習班變領域專家，LoRA 低秩適應外掛小腦袋省錢又不忘舊知識，知識蒸餾（Knowledge Distillation）大模型教小模型學七八成功力。

4.1 解決「變笨」與「太貴」：微調與輕量化

微調 (Fine-tuning)：為什麼要送模型去補習？

定義： 在已經訓練好的 預訓練模型 (Pre-trained Model) 基礎上，使用特定領域的資料進行二次訓練，調整模型參數。
白話說明： 就像送資優生去上「法律衝刺班」。它本來就懂中文，但現在特訓它看懂判決書，讓它變成法律專家。

低秩適應 (LoRA, Low-Rank Adaptation)：如何高 CP 值補習？

定義： 一種 參數高效微調 (PEFT) 技術。不重新訓練整個大模型（凍結權重），而是在旁插入小型矩陣進行訓練。
白話說明： 外掛式大腦。 不用重練整個大腦（太貴又容易忘記舊知識），只外掛一個小小的腦袋去學新知識。省錢、省算力，又不容易發生 災難性遺忘。

知識蒸餾 (Knowledge Distillation)：如何讓小模型變聰明？

定義： 訓練一個小的 學生模型 (Student Model) 去模仿大的 教師模型 (Teacher Model) 的輸出機率分佈（Soft Targets）。
白話說明： 名師出高徒。 老師（大模型）把畢生功力濃縮教給學生（小模型）。雖然學生腦容量小，但能學到老師七八成的判斷邏輯，跑起來卻快很多。

4.2 解決「幻覺」與「失憶」：檢索增強生成 (RAG)

❓

為什麼大家都在講 RAG，而不是直接訓練更大的模型？

訓練太慢且昂貴。等你把 2024 年的新聞練進去，2025 年都過一半了。模型永遠跟不上時事（知識截止點問題）。

檢索增強生成（RAG）運作原理：不讓模型死背硬擠，而是教它先去外部知識庫（Vector Database）翻書查資料再整理回答，大幅減少幻覺且資料更新只需更新資料庫。

檢索增強生成 (RAG, Retrieval-Augmented Generation)：

定義： 結合 資訊檢索 (Retrieval) 與 生成模型 (Generation)。在生成回答前，先從外部知識庫（Vector Database）搜尋相關資訊，作為上下文 (Context) 餵給模型。
白話說明： 不讓模型死背，而是教它「翻書」。

當你問問題，AI 不會硬擠答案，而是先去 Google 或公司資料庫搜出資料，再整理給你。

優點： 資料更新只要更新資料庫就好，不用重練模型；而且因為有憑有據，大幅減少幻覺。

4.3 解決 GAN 的不穩定：WGAN

WGAN 解決 GAN 訓練不穩定：傳統 GAN 判別器只打及格/不及格導致生成器不知錯哪而放棄，WGAN 改用評分制告訴生成器進步幅度，避免模式崩潰。

❓

怎麼治好生成器的「偷懶」？

透過引入 Wasserstein 距離，不只給及格或不及格，而是明確告訴生成器「這次比上次進步了幾分」，讓它有清晰的優化方向，徹底根治因為梯度消失而只畫重複東西的偷懶行為。

傳統 GAN 的問題：

梯度消失 (Gradient Vanishing)： 判別器像個嚴格的老師，只打「及格/不及格」(二元分類)。如果生成器一直不及格，它會不知道錯哪，最後自暴自棄。

WGAN (Wasserstein GAN)：

定義： 引入 Wasserstein 距離 (Earth Mover's Distance) 來替代傳統的 Jensen-Shannon 散度。
白話說明： 改用「評分制」。即使不及格，老師會告訴你「這次比上次進步了 5 分」。這樣 生成器 (Generator) 就知道努力的方向，不會因為 模式崩潰 而只畫一樣的東西。

4.4 讓模型更聽話：對齊人類 (Alignment)

AI 對齊人類三種技術：指令微調（Instruction Tuning）教模型聽懂指令，RLHF 人類回饋強化學習用真人打分訓練禮貌回答，限制式提示（Constraints Prompting）用規則框住輸出格式。

早期的 GPT 講話很瘋，現在為什麼這麼有禮貌？這歸功於 對齊 (Alignment) 技術。

指令微調 (Instruction Tuning)：

定義： 使用標註好的「指令-輸出」對數據集進行微調，讓模型學會遵循指令。

白話說明： 訓練它聽懂「請幫我翻譯...」、「請總結...」這種指令格式，而不只是在那邊文字接龍。

人類回饋強化學習 (RLHF, Reinforcement Learning from Human Feedback)：

定義： 訓練一個 獎勵模型 (Reward Model) 來模擬人類偏好，再用 近端策略優化 (PPO) 等演算法調整語言模型。

白話說明： 請真人來幫 AI 的回答打分數，讓 AI 知道人類喜歡什麼風格（有禮貌、有用、不種族歧視），把 AI 訓練成人類喜歡的樣子。

限制式提示 (Constraints Prompting)：

定義： 在 Prompt 中加入明確的約束條件或格式要求。

白話說明： 強制規定它「只能輸出 JSON 格式」或「扮演翻譯官」，用規則框住它，這不是模型變聰明，而是人類學會了怎麼控制它。

五、鑑別式與生成式 AI 的強強聯手

小孩子才做選擇，成熟的 AI 系統通常兩個都要。

鑑別式與生成式 AI 互補聯手：鑑別式是數據狂魔，有資料就是神；生成式是腦洞大開，給指令什麼都變得出來。一個負責瞎掰一個負責吐槽，最佳損友組合。

5.1 為什麼要整合？

鑑別式 AI 的痛點：數據依賴 (Data Dependency)。它需要大量標註數據才能學會分類，但有些資料（如罕見疾病照片）非常稀缺。

生成式 AI 的強項：無中生有 (Creation)。它剛好可以創造逼真的合成數據。

結論： 讓生成式 AI 當「助教」產生考題，給鑑別式 AI 當「學生」練習。

5.2 核心戰術：四大整合模式與實戰應用

這部分是整合應用的精髓，我們將依照「解決什麼問題」來分類。

模式一：資料增強 (Data Augmentation)

資料增強（Data Augmentation）：真實資料太少或太貴時，用生成式 AI（如 GAN）產生大量模擬數據混合少量真實數據訓練模型，實戰案例為醫療影像診斷提高準確率。

解決什麼問題？ 缺資料 (Data Scarcity)。 真實資料太少或太貴。

戰術： 利用生成式 AI 生成大量模擬數據，混合少量真實數據來訓練鑑別式 AI。

實戰案例：

醫療圖像診斷： 罕見病理影像很難取得。醫院利用 GAN 生成逼真的病理 X 光片，訓練 CNN 模型，顯著提高了診斷準確率。

模式二：半監督學習 (Semi-supervised Learning)

半監督學習（Semi-supervised Learning）：標註太貴時，利用生成式 AI 分析大量無標籤數據的結構輔助鑑別式 AI 分類，實戰案例為工業產線與資安的異常檢測。

解決什麼問題？ 標註太貴 (Labeling Cost)。 資料很多，但請人一張張標註太花錢。

戰術： 利用生成式 AI 分析大量「無標籤數據」的結構，輔助鑑別式 AI 進行分類，只需少量人工標註即可。

實戰案例：

異常檢測 (工業/資安)： 工廠產線大多是良品，瑕疵品很少。生成式 AI 學習良品的分布，幫助鑑別式 AI 快速抓出「長得不像良品」的異常數據，提升檢測效率。

模式三：對抗性訓練 (Adversarial Training)

對抗性訓練（Adversarial Training）：模型太脆弱時，用生成式 AI 故意生成對抗樣本做魔鬼特訓，實戰案例為自動駕駛模擬極端天氣與網路安全模擬新型攻擊流量。

解決什麼問題？ 模型太脆弱 (Robustness)。 遇到一點雜訊或干擾就判斷錯誤。

戰術： 魔鬼特訓。 利用生成式 AI 故意生成「對抗樣本」（針對模型弱點設計的誤導性輸入），放入訓練集中讓鑑別式 AI 練習。

實戰案例：

自動駕駛： 生成式 AI 模擬濃霧、冰雪路面等極端環境（攻擊樣本），鑑別式 AI 在虛擬環境中練習識別路況，學會怎麼在惡劣天氣下安全駕駛。
網路安全： 生成式 AI 模擬新型攻擊流量，讓防禦系統（鑑別式 AI）提前演練。

模式四：多模態學習 (Multimodal Learning)

多模態學習（Multimodal Learning）：結合生成式 AI 做模態轉換與鑑別式 AI 做分析理解，構建能同時聽看讀的系統，實戰案例為智慧客服情緒分析與內容審核合規檢查。

解決什麼問題？ 感官單一。 以前 AI 只能讀字或只能看圖，無法理解複雜世界。

戰術： 眼耳通靈。 結合生成式 AI（處理模態轉換）與鑑別式 AI（分析理解），構建能同時聽、看、讀的系統。

實戰案例：

智慧客服： 用生成式 AI 理解用戶語音並生成回應文本，再用鑑別式 AI 分析語氣情緒（憤怒/滿意），提供高度個人化且合適的服務。
內容審核： 當生成式 AI 寫出廣告文案時，鑑別式 AI 同步檢查內容是否合規（有無暴力、侵權），確保輸出的安全性。

5.3 整合帶來的系統優勢

這四種模式解決了技術瓶頸，也創造了新的系統價值：

數據生成與判斷的融合： 形成「生成 → 判斷 → 優化」的閉環，不依賴外部數據也能自我進化。

即時分析與回饋： 支援動態環境下的快速應對（如自駕車即時路徑規劃）。

靈活性與適應性： 能根據不同需求動態調整流程（如客服系統根據情緒切換回應策略）。

結語

從「分類」到「創造」，從 CNN 到 Transformer，從 GAN 的左右互搏到 RAG 的知識檢索。回頭看，AI 就是一場機率遊戲，演算法製造出來的大型幻覺。

但當我們批判 AI 的缺陷時，或許也該停下來想想：

幻覺（Hallucination）。人類同樣會一本正經地編造記憶，堅信自己從未說過的話。

模式崩潰（Mode Collapse）。人類也會困在舒適圈裡，只做擅長的事，拒絕嘗試新的可能。

災難性遺忘（Catastrophic Forgetting）。人類更是常常學了新技能就忘了舊本事，考完試便把一切全數歸還給老師。

生成式 AI 跟人類的毛病，比我們想的更像。

甚至，它們的訓練方式也與人類極為相似：給數據、給回饋、調整行為、不斷迭代。只是 AI 學得比我們快，快到讓我們開始感到不安。

AI 不知道自己要去哪裡，方向盤還在人類手上。

問題是：握著方向盤的我們，有在看路嗎？

iPAS AI 規劃師初級筆記地圖

每篇對應一個考試主題，點標題可直接跳轉，想看哪篇點哪篇 🤤

章節	文章指路
L111	AI 人機協作、可解釋性與治理的真實問題
L112	別讓 AI 吃垃圾！一次搞懂資料清洗、特徵工程與統計
L113	機器學習全景圖：從演算法圖鑑、訓練優化到 MLOps 維運
L114	鑑別式 AI 與生成式 AI：從原理、挑戰到未來趨勢
L121	從 AI 玩家到數位指揮官：No-Code/Low-Code 如何重新定義開發？
L122	生成式 AI 的典範轉移：為什麼 AI Agent 是下一場工作革命？
L123	生成式 AI 導入指南：從策略評估到組織落地與風險治理