Claude 額度燒光光，教你怎麼把 Gemini 也叫進來上班

🎯

Claude 額度容易燒光，可把 Google 官方免費 Gemini CLI 接進 Claude Code 當副手，讓 Gemini 負責網路搜尋和大檔摘要以節省 Token，Claude 負責推理和最終決策。搭配 excludeTools 設定可封掉危險寫入權限，五分鐘完成雙引擎分工設定。

買了 20 鎂的 Claude 不夠用，又課了 20 鎂 Codex，結果還是快燒完了。

自從把 AI 徹底融入開發流程後，吸 Token 有一種無所不能的感覺，好像只要有想法，什麼都做得出來。但代價就是額度焦慮如影隨形。

我甚至還開發了一個開源桌面小工具 QuotaGem，專門拿來看 Claude 跟 Codex 的額度，結果因為用量太大，還是只能眼睜睜地看著他血條歸零。

後來我把免費的 Gemini CLI 接進 Claude Code 當小弟，想說可以節省了一點 Token 的開銷，結果最後變成看他們吵架，獲得了意外的樂趣。就寫了這篇來跟大家分享如何實作，以及我的心路歷程。

一、20 美金的 Claude 不夠用

不知道現在大家一個月花多少錢在訂閱 AI工具？

為了打造我自己的工作流程，我現在的主力是 20 美金的 Claude，為了有備胎跟更多 Token 又補了 Codex 的 20 美金，結果額度還是動不動就燒光光。

問題出在它「太好用」，導致我們什麼事都想叫它做，越買用量還跟著變大。

（先不提 Antigravity，雖然我有訂閱，但他還是無預警大砍額度，傷透了我的心）

Claude 的使用限制相當嚴格，無論是計算五小時內的額度還是每週上限，如果不打算直上 100 甚至 200 美金的 Max 版本，就必須學會精打細算。

我後來想通了，不管預算如何增加，我的用量也會跟著增加，現在也很難戒掉不用，不如找一些節省 Token的方式，比如說把 Gemini 抓來幫忙分擔雜事。

Gemini CLI：Google 官方推出的命令列 AI 工具，用 Google 帳號登入就能用，免費版每天 1,000 次請求。

分工邏輯就是，拿 Claude 當大腦，Gemini 當小弟！

二、Gemini 能幫什麼忙？

目前個人使用體感上，Gemini 的推理和寫程式比不上 Claude，但他還是有優點喔！

判斷要不要把任務丟給 Gemini，就問一個問題：「這個任務會讓誰讀最多資料？」

如果是 Gemini 讀，就叫他做；如果 Claude 做更好、更快、量也不多，就別轉包。

1. 節省搜尋額度

大量搜尋資料很耗 Token，因為 AI 要讀大量網頁、篩選、整理，這些輸入 Token 加起來很可觀。Gemini CLI 有內建 google_web_search 工具，而且搜尋本來就是 Google 的主場。

Claude Code 終端機透過 Bash 呼叫 Gemini CLI 執行 google_web_search 搜尋網路資訊的實測畫面

這個是 Claude Code 透過 Bash 呼叫 Gemini CLI 搜尋網路資訊的終端機畫面，Gemini 搜尋回來後，Claude 整理出來的結果。

Claude 派 Gemini 查資料後主動提醒幻覺風險，展示跑腿與大腦把關的分工實測截圖

其實 Gemini 這次是對的，但 Claude 不相信他🤣

如果怕兩個模型都有幻覺，也可以叫他們都去查，查完交叉驗證。

2. 長內容處理

這是省額度的第二大場景，邏輯跟搜尋一樣：讓 Gemini 讀大量資料，Claude 拿走結論。

假設你有 10 個各 5,000 字的會議紀錄要摘要。如果你把內容貼給 Claude，光是輸入就吃掉 5 萬字的 Token。但如果 Claude 只下一行 Bash 指令，把檔案路徑丟給 Gemini，讓 Gemini 直接從硬碟讀，那 5 萬字從頭到尾沒進過 Claude 的 Context。

Gemini 有 1M token 的上下文視窗，幾萬行的大檔案整份餵進去，然後告訴他你要他回報什麼內容。如果是要極限省 Token，可以請他回報極簡摘要，但我怕他濃縮過頭，把重點也濃縮掉了，所以還是會要求盡量維持完整脈絡。

⚠️ 要讓 Gemini 自己去讀檔案，Claude 只傳路徑就好。如果 Claude 先把整份檔案讀進來再轉交給 Gemini，Claude 的 Token 照樣被吃光，會變成兩邊各跑一次，比 Claude 自己做摘要還浪費喔。

3. 第二意見

這個用法不是為了省錢，而是為了提升決策品質。當 Claude 在跟你揮，你們的討論逐漸開始鑽牛角尖，而你想確認有沒有其他做法，可以叫 Claude 去問 Gemini 怎麼看，由你自己來判斷誰講得比較有道理。

Claude 與 Gemini 建議衝突時由使用者裁決，截圖顯示使用者回覆「誰理他」否決 Gemini 建議

要注意的是：如果你讓 Claude 重跑一遍 Gemini 的工作來「驗證」，那等於做了兩次，完全沒省到額度。這種時候不如一開始就讓 Claude 做。交叉驗證的意思是兩邊各做一次，你自己看結果，這招不會省 Token 喔！

三、五分鐘設定，讓 Claude 自動叫 Gemini 跑腿

怎麼讓 Claude 自己判斷什麼時候該叫 Gemini？

在 CLAUDE.md 裡寫一段分工規則就好。Claude Code 每次啟動都會讀這份檔案，看到規則就會自動在背景用 Bash 呼叫 Gemini CLI，整合結果後再回報給你。不用手動切換，不用另外開視窗。

1. 安裝與首次登入

安裝和登入都在終端機裡完成。如果你不確定怎麼打開：

Mac：按 Cmd + 空白鍵，輸入 Terminal，按 Enter

Windows：按 Win + R，輸入 cmd，按 Enter（或搜尋「命令提示字元」）

前置需求：Node.js （裝最新版即可）和一個 Google 帳號。（詳細步驟見官方安裝指南）

打開終端機後，按照以下順序分別輸入：

執行 gemini 後，瀏覽器會自動跳出 Google 登入畫面，授權完成後認證就存在你的電腦裡了。（認證細節見官方認證文件）

這是唯一需要打開終端機的時候。之後全部透過 Claude Code 在背景呼叫，你不用再碰 Gemini CLI。

2. 跟你的 Claude 討論分工規則

裝好之後，你可以直接把這篇文章丟給你的 Claude，跟它討論怎麼設定分工規則，然後請他把結論寫入 CLAUDE.md。

之所以這樣可以，是因為 CLAUDE.md 對 Claude 來說等於系統指令，你把這篇文章丟給他，然後跟他討論 Gemini 之於你而言適合擔任什麼工作、以及觸發 Gemini 的時機。

我自己的規則也是這樣跟 Claude 聊出來的。每個人的使用習慣不同，與其我給你一段固定的 Prompt 去複製貼上，不如讓你的 Claude 根據你的需求，自己決定什麼時候該叫 Gemini 幫忙。

你要做的就是把想法講清楚，然後 Claude 讀完就會自己安排了！

3. 關於 Gemini CLI 的工具權限

Gemini CLI 有很多內建工具：搜尋網頁、讀寫檔案、跑終端機指令。用 -p 非互動模式呼叫時，這些工具預設都需要手動確認——但背景模式下沒有人能按確認，工具就不會啟動。

問題是，Gemini 不會老實告訴你「我沒有工具可以用」。

我請 Claude 叫 Gemini 去抓一個網頁做摘要。Gemini 很快就回了一篇，標題、段落、重點整理都有，格式漂亮。

結果怎麼看都是在唬爛。

Gemini 在 -p 模式缺少 web_fetch 工具卻不報錯，直接捏造假文章內容的幻覺實測截圖

攏洗ㄍㄟˋ欸啦！

沒有給他任何權限，Gemini 在背景模式下用不了搜尋工具，但它不會告訴你「我沒有工具可以用」，而是直接假裝做到了，整篇瞎掰。

所以如果你想讓它真的去搜尋或讀網頁，就得額外做設定。

YOLO 模式雖然可以讓 Gemini 自動授權所有工具呼叫，但他授權的指令範圍太廣了，連覆寫檔案、甚至刪東西，全程不會問你。

我們叫 Gemini 做的事其實很單純，其實就查資料、讀檔案、摘要網頁。這些都是唯讀操作，也不用開到 YOLO。

更好的做法：用 excludeTools 封掉危險工具。

在 Gemini CLI 的設定檔 ~/.gemini/settings.json（Windows 是 %USERPROFILE%\.gemini\settings.json）加上這段：

加完之後，搜尋和讀檔照常運作，但 Gemini 完全無法寫入、修改或刪除你的檔案，連繞道用子代理都會被擋下來。實測過，三條路全封死。

四、使用提醒

1. 同時別派太多 Gemini

雖然每天有 1,000 次請求的免費額度，但每分鐘上限是 60 次。一個查詢背後可能觸發好幾次內部請求（搜尋 + 讀網頁 + 整合），我的經驗是同時跑超過兩個就容易撞限、回傳錯誤。

2. Gemini 的幻覺有救嗎

如果每次都讓 Claude 重跑一遍 Gemini 的工作來「驗證」，那等於沒省到。如果你不放心 Gemini 的說法，那就別用，直接讓 Claude 做。但如果你誰都不相信，那很適合讓他們監督彼此！

3. 安全性

這招使用的是 Google 官方的 @google/gemini-cli，走正規瀏覽器 OAuth 登入，不需要第三方工具。Claude 只是在你的電腦上幫你在終端機輸入指令，不會把你的 Token 傳給第三方伺服器，不是龍蝦，但要不要 ban 還是看 Google 心情。

結語：吸 Token 有一種無所不能的感覺

原本研究這個只是想解決額度不夠用的問題，但現在看到 AI 彼此吵架的樣子，真的好好玩。尤其後來我把 Codex 也接進來了，三家一起吵比我單押一家安心多了。畢竟 AI 幻覺無法避免，他們先吵一輪，我也比較放心。

Claude 同時派 Gemini 與 Codex 平行讀取同一篇文章做交叉驗證，顯示雙線並行執行指令

我怕記錯內容，所以寫這篇文章時，有請 Claude、Gemini、Codex 三個一起做事實查核，畫面有點壯觀。

結果這樣玩，省到了什麼額度⋯⋯

呃⋯⋯

📝 更新日誌 (Changelog)

2026.04.13

更新安全性的說明。