當 ChatGPT 面世之初,使用者們的第一反應便是試圖突破其限制,挑戰其邊界。這種行為被稱為「越獄」,指的是用戶通過欺騙 AI,使其超出預先設定的程式限制,進而產生一些非常有趣,甚至有時是相當瘋狂的結果。
自那之後,OpenAI 加強了對 ChatGPT 的管控,使得越獄行為變得更加困難。 然而,事情並非如此簡單。 整體而言,ChatGPT 的越獄現象似乎已經逐漸減少,這也讓使用者開始懷疑越獄是否真的仍然可行。
那麼,這些曾經風靡一時的 ChatGPT 越獄都到哪裡去了呢?
1. ChatGPT 提示技巧普遍提升
在 ChatGPT 之前,與人工智能對話還是一項僅限於研究實驗室的專業技能。 早期的大多數使用者缺乏編寫有效提示的專業知識。 這促使許多人轉向越獄,這是一種以最少的努力和提示技巧就能讓聊天機器人完成他們想做的事情的權宜之計。
如今,情況已經截然不同。 提升提示技巧正成為一項普遍趨勢。 通過不斷實踐和參考網路上大量的免費 ChatGPT 提示指南,使用者已經大幅提升了他們的提示能力。 大多數 ChatGPT 使用者不再需要依賴越獄等手段,而是更擅長運用不同的提示策略來達成過去需要越獄才能實現的目標。
2. 未經審查的聊天機器人的興起
當大型科技公司加強對 ChatGPT 等主流 AI 聊天機器人的內容審核之際,一些規模較小、以營利為導向的新創公司則選擇放寬限制,押注於市場對未經審查的 AI 聊天機器人的需求。 經過一番搜尋,你會發現許多 AI 聊天機器人平台提供未經審查的聊天機器人,幾乎可以滿足你的任何要求。
無論是撰寫 ChatGPT 拒絕的犯罪驚悚小說或黑色幽默故事,還是編寫攻擊電腦的惡意軟體,這些道德觀扭曲的未經審查的聊天機器人都可以為你做到。 有了它們,你就不需要費盡心思為 ChatGPT 編寫越獄程式。 雖然它們的實力可能不如 ChatGPT 強大,但這些替代平台也能輕鬆完成許多任務。 FlowGPT 和 Unhinged AI 等平台就是一些受歡迎的例子。
3. 越獄變得更加困難
在 ChatGPT 推出的最初幾個月,越獄 ChatGPT 就像從網路資源中複製貼上提示一樣容易。 只需要幾行巧妙的指令,你就能徹底改變 ChatGPT 的個性。 通過簡單的提示,你可以把 ChatGPT 變成一個教你如何製作炸彈的邪惡反派,或是一個願意不受限制地使用各種髒話的聊天機器人。 那段時間可以說是一場混戰,也因此誕生了像是 DAN(Do Anything Now)這樣臭名昭著的越獄方法。 DAN 包含一系列看似無害的指令,這些指令迫使聊天機器人執行任何被要求的事情,而不會拒絕。 令人震驚的是,這些粗糙的技巧在當時居然奏效了。
然而,那些瘋狂的早期時光已經成為歷史。 這些基本的提示和廉價的技巧不再能欺騙 ChatGPT。 現在的越獄需要複雜的技術,才有可能繞過 OpenAI 目前強大的防禦措施。 由於越獄變得如此困難,大多數使用者都不會再輕易嘗試。 ChatGPT 早期那些簡單而普遍存在的漏洞已不復存在。 現在,要讓聊天機器人說錯一句話,可能需要付出大量的努力和專業知識,而且這種努力可能並不值得。
4. 新鮮感已過
許多使用者嘗試越獄 ChatGPT 的動機是早期的新奇感和興奮感。 作為一項新技術,讓 ChatGPT 行為不端確實很有趣,而且值得炫耀。 雖然 ChatGPT 越獄有許多實際應用,但許多人追求越獄,更多是為了「哇,你看我做了什麼」的吸引力。 然而,隨著新鮮感的消退,人們花時間進行越獄的興趣也隨之減弱。
5. 越獄漏洞會被快速修補
ChatGPT 越獄社群的常見做法是分享所有已發現的成功漏洞。 問題是,當漏洞被廣泛分享時,OpenAI 通常會意識到並修復這些漏洞。 這意味著越獄在有興趣的人嘗試之前就已經失效了。
因此,每當 ChatGPT 使用者煞費苦心地開發出新的越獄工具時,與社群分享反倒加速了它的消亡。 這也抑制了使用者公開分享越獄想法的意願。 如何在保持越獄有效且隱密與公開分享之間取得平衡,一直是 ChatGPT 越獄創造者面臨的難題。 現在,人們通常會選擇對越獄保密,以避免漏洞被修補。
6. 未經審查的本地替代品
能夠在電腦本地運行的本地大型語言模型的興起,也降低了人們對 ChatGPT 越獄的興趣。 雖然本地 LLM 並非完全不受審查,但它們的審查明顯較少,而且可以輕鬆修改以滿足使用者的需求。 所以,選擇很簡單。 你可以參與一場無休止的貓捉老鼠遊戲,試圖欺騙聊天機器人,但很快就會被修復。 或者,你可以選擇一個本地的 LLM,你可以永久修改它,讓它執行你想做的任何事情。
你會發現一個驚人地長的列表,其中包含強大的未經審查的 LLM,你可以將它們部署在你的電腦上,並且擁有較寬鬆的審查。 一些著名的例子包括 Llama 7B(未經審查)、Zephyr 7B Alpha、Manticore 13B、Vicuna 13B 和 GPT-4-X-Alpaca。
7. 專業越獄者現在出售以獲利
如果沒有任何好處,為什麼要花寶貴的時間開發越獄提示? 現在,一些專業人士正在出售越獄程式以獲取利潤。 這些專業的越獄開發者設計出能執行特定任務的越獄程式,並在 PromptBase 等提示市場上出售。 根據其功能,這些越獄提示的售價可能在每個提示 2 到 15 美元之間。 一些複雜的多步驟攻擊可能會賣得更高。
打擊越獄會適得其反嗎?
越獄並沒有完全消失,它們只是轉入了地下。 隨著 OpenAI 將 ChatGPT 商業化,他們更有動力去限制可能影響其商業模式的有害用途。 這種商業因素可能會影響他們積極打擊越獄的行為。
然而,OpenAI 對 ChatGPT 的審查制度目前正受到越來越多使用者的批評。 由於嚴格的審查,一些 AI 聊天機器人合法的應用場景變得不再可能。 雖然加強安全性可以防止有害用途,但過度的限制最終可能會將一部分 ChatGPT 社群推向審查較少的替代方案。