🐹倉鼠週報18:怎麼寫出好 Prompt 的指南都放在這了
這週明顯感受 AI 熱潮沒有那麼火,可能因為焦點都在 apple 身上。趁著這個時候,把基本的 Prompt 溝通學好,使用這個 LLM 的 AI 來強化自己的能力吧!
卷首語
最近開始感覺 AI 熱潮沒有之前那麼火了,但是會有 AI 的人感覺都更精進了。
這週 OpenAI 因為被說效能是不是變差而推出了 Prompt 教學,再回頭看看過往的 Prompt 教學,其實怎麼下 Prompt 已經不再是秘密。
為什麼大多數人會覺得 ChatGPT 效能變差,有一派人的說法我比較認同是『因為當初使用的驚豔感逐漸消退,導致看到的缺點越來越多』。
是不是跟過了熱戀期一樣,我使用上並沒有感覺能力消退,結果不好的話我會覺得是因為自己沒有下好指令,然後再反覆測試。
AI 熱潮微微退去的當下,或許是一個靜下心好好學習 Prompt 指令的時候,常聽到說短期內 Prompt Engineer 會變很夯的職業,因為有著與 AI 溝通的強大能力。
但認真去看,Prompt 指南有時候也很像一本溝通指南,也許它少了一點情感交流的細節,情感交流的方式因人而異。除去這塊,Prompt 也許也會是一個如何線上溝通的溝通指南,熟練了好處多多。
相關資源放在文末。
🛠️ 本週 AI 新聞 & 工具
1. OpenAI 親授 Prompt 寫法:六大基本功,學會如何更有效地使用 ChatGPT
可能真的被大家瘋狂吐槽,OpenAI 給出了一份使用 GPT 的教學手冊。
以下是我經過 20 幾次的測試後拿到比較好的 ChatGPT 整理版本,然後再手動潤飾後的結果,後面也會附上我如何調整 prompt。
▎1. 明確清晰的指示:
想像 GPT 模型就像是一個需要明確指示的機器人。如果你希望它的回答更簡短,就要求它給出簡短的回答。
如果你希望它的回答更專業,就要求它以專家的角度來回答。如果你不喜歡它的回答格式,就示範你希望看到的格式。
你越明確地告訴它你想要的東西,它就越有可能給你你想要的答案。
壞的範例:「我該如何在 Excel 中加數字?」
好的範例:「我想要在 Excel 中加總一行美元金額,並且我希望這個動作可以自動應用在整張表格的每一行,所有的總計都會在右邊的一個名為"總計"的欄位中。」
▎2. 提供參考文本:
GPT 模型有時會創造出假的答案,特別是在被問到一些深奧的主題或需要引用和網址的時候。
就像學生在考試時如果有筆記會做得更好一樣,給 GPT 模型提供參考文本可以幫助它給出更少的假答案。
範例:「請使用以下的參考文字來回答問題。如果答案無法在文章中找到,請寫下 "I could not find an answer."」
▎3. 將複雜的任務分解成簡單的子任務:
就像在軟體工程中,我們會將一個複雜的系統分解成一組模組化的組件一樣,對 GPT 模型提交的任務也是如此。
複雜的任務比簡單的任務更容易出錯。
此外,複雜的任務往往可以被重新定義為一個簡單任務的工作流程,其中早期任務的輸出被用來構建後續任務的輸入。
壞的範例:「用戶會提供一段文本,請將這段文本總結並翻譯成西班牙語。」
好的範例:「使用以下的步驟來回答用戶的問題。
步驟一,用戶會提供一段用三引號包住的文本,請將這段文本總結成一句話,並在前面加上"總結:"。
步驟二,將步驟一的總結翻譯成西班牙語,並在前面加上"翻譯:"。」
▎4. 給 GPT 模型時間“思考”:
如果問你 17 乘以 28 的答案,可能不會立刻知道答案,但是只要給你時間就可以算出來。
同樣地,GPT 模型在嘗試立即回答問題時,會犯更多的錯誤,而不是花時間去找出答案。
在給出答案之前要求一個推理鏈可以幫助 GPT 模型更可靠地推理出正確的答案。
範例:「首先,請你自己解決問題。然後,將你的解決方案與學生的解決方案進行比較,評估學生的解決方案是否正確。在你自己解決問題之前,不要決定學生的解決方案是否正確。」
▎5. 使用外部工具:
通過將其他工具的輸出餵給 GPT 模型,可以彌補償 GPT 模型的弱點。
例如,一個文本檢索系統可以告訴 GPT 模型有關相關文件的信息;一個代碼執行引擎可以幫助 GPT 模型進行數學運算和運行代碼。
如果一個任務可以由一個工具更可靠或更有效地完成,而不是由 GPT 模型完成,那麼先用該工具再來用 GPT。
舉例來說:「使用基於 Embedding 的搜尋來實現高效的知識檢索。」
▎6. 系統地測試變化:
如果你可以衡量成效,那麼提高成效就會更容易。
在某些情況下,對提示詞的修改可能會在幾個個別的對話上做的更好,但是在整體對話上反而效果更差。
因此,為了確定一個變化對整個對話的成效是正面的,可能需要定義一個全面的評估方式。
例如:「對模型輸出與標準答案進行評估。提供徹底和詳細的評估。」
GPT best practices: https://platform.openai.com/docs/guides/gpt-best-practices
2. 為了抓到文章重點,調了 20 幾次的 prompt 都在調什麼
對話記錄分享: https://chat.openai.com/share/5e69d7e8-7807-4221-92f5-989d6109b6b6
以下是為了調整更好的輸出結果做的事情:
▎1. 輔助使用 Plugin
要瀏覽頁面 Browsing 跟 WebPilot 是我最常用的功能跟 Plugin,但我發現 Browsing 好像渲染 JS 的內容會失敗,所以用 WebPilot。
▎2. 『用中學生也看得懂的比喻』
這是我測了好幾次後覺得最有效的寫法,內容會相對平易好懂。
▎3. 潤色微調不同字詞對比結果,
轉換提問方式有時候會有意象不到的效果,但這需要多嘗試。
甚至什麼都不改,重新產生答案也可以。
▎4. 隨時小心 ChatGPT 遺忘,補充重要資訊
像是要 ChatGPT 讀取的網址它可能在後面遺忘了,就要重新給它補上網址,也可以請它在每一次對話重述關鍵資訊。
▎5. ChatGPT 開始崩壞時,終止並回到上一個動作
有時候它回答問題到要一半,會突然出現奇怪的語法甚至重新開始回答。
這時立刻停止,並告訴它『從第 O 點開始繼續說明』
O 就是沒說明完的部分。
▎6. 進行測試
這點也是上一篇提到的,如果要請它瀏覽網站的內容,可以抓取內文的特定段落來檢驗。
像是『請告訴我文章中有沒有"OOOO"這一段話』。
測試有個重要的目的是『避免幻覺』,所以驗證資料正確性很重要。
3. 嘿,ChatGPT!連結萬物的世界
以下是一點淺見,可能有疏漏、邏輯不順等,僅供參考。文中的 ChatGPT 也可用相似的競品來看,如 bard 或是 New Bing。
本文盡量以白話文清晰好懂的方式撰寫,若有不懂處歡迎隨時提問!
1️⃣ 理解人所說,學人用工具
ChatGPT 問世以來大家對它的語言能力已經有一定的了解,部分用戶在使用了 GPT-4 後的感受應該更明顯,文字流暢度、話癆、可用性更是大幅度上升。
但 ChatGPT 只是個聊天機器人嗎?這樣顯然太低估它的能力,早在第8期的電子報中就提到,但 AI 裝上了五官、搭配了手腳後,距離 AGI 的時代就更近了。
註:AGI是「人工通用智慧」(Artificial General Intelligence)的縮寫,也稱為強人工智慧,它是指一種具有人類水平的 AI 系統,能夠在各種不同領域和任務中自主學習、適應和表現出與人類一樣的認知能力。簡單來說,AGI 就像是一個能夠在各個方面與人類競爭的機器人。
因為 LLM(大型語言模型)在處理語言的能力上十分優秀,尤其將文字進行分類、結構化、理解語意等面向非常強大。
一旦 ChatGPT 裝入了一個身體後,它不只能夠聽懂人類的命令,還能將人類的命令轉換成特定的程式語言來調動工具。
就像我們日常使用各種工具一樣,將腦中所想變成神經訊號傳到手上去拿板手等工具。
但怎麼用工具還能分為虛擬及實體的部分,本篇先說虛擬的部分。
2️⃣ 當 ChatGPT 有了超強裝備功能:Plugin
雖然 ChatGPT 一直被靠北說內容不及時、數學賊爛等問題,但在 Plugin 功能出來之後,各種 ChatGPT 的缺點直接不見。
像是不會算數學、沒有即時資訊、不能畫畫等。
Plugin 中文譯為外掛,可以想像是安裝在 ChatGPT 的強力裝備一樣,不同裝備實現不同功能。
而且!每個人還能將自家提供的服務或內容整理打包,然後專門做成給 ChatGPT 使用的裝備。
提升 ChatGPT 的能力或是讓它抓取自家網站的內容。
舉例來說,我可以做一個『線上版抓取 Youtube 字幕的工具』。
然後製作一個給 ChatGPT 專用的 Plugin(裝備)後,使用者直接把影片放在 ChatGPT 對話框就能調用我這個抓取字幕的功能。
講的狠一點,只要你願意,要讓 ChatGPT 播放家裡攝影機的畫面也不是不可能。
這樣大家就知道 Plugin 這個裝備功能有多強了吧!那裝備了工具後 ChatGPT 可以做什麼事?
3️⃣ 萬物的入口
知道 Plugin 的作用後,這時就是要發揮想像力的時候了,安裝了 Plugin 我們能夠:
即時瀏覽最新資訊
查看天氣如何
訂旅館、訂餐廳
請 ChatGPT 規劃去義大利一週的形成,並且訂相關的飯店及機票(這是真實可以做到的)
授權 ChatGPT 相關銀行帳密,讓 ChatGPT 去理財(真實有人這樣做了)
是不是越想越腦洞大開!
但強大的功能需要一個人們能夠高頻率使用的載體才能快速傳播出去,而手機及智慧音箱正是需要的載體。
呼應標題的『嘿!ChatGPT』,模仿的是頻果的 Siri,因為 ChatGPT 很有機會取代 Siri(如果 Siri 沒有加入 LLM 的話)。
早期在 Amazon Alexa 以及 Google Home 的智慧音箱出品後,大家就期待音箱能改變日常生活。
但是由於語意理解能力不好,所以最終智慧音響只能做到基本設定的功能跟聽懂很基本的指令。
如今 ChatGPT 的出現正是一個契機,連結大型語言模型及落地場景,讓人們能夠將一切數位行為都在手邊的裝置就能完成。
真正實現在電腦、手機、智慧音箱都使用 AI 的場景。
甚至更進一步,Windows 已經將 AI Copilot 內建到作業系統當中,任何動作不必再進入 ChatGPT 或是 New Bing。
只需要在那個『小小對話框』即可連接萬物。
4️⃣ 未來該做些什麼?
以美好的想像來說(畢竟這也不一定會實現,只是一種預測),一個明確的需求就是透過 ChatGPT 的 Plugin 連接不同服務。
而且 New Bing、Bard 也都確定未來將加上 Plugin 的功能了。
所以現在、立馬,知道怎麼把自家的服務或內容『製作成 ChatGPT 的裝備』Plugin 就是一個開箱即用的好建議。
台灣已經看到如奧丁丁、Amazingtalker 都已經將自家的服務上架到 Plugin 中了,全球現在也有越來越多的服務開始打包成 Plugin 上架到 ChatGPT。
很難說未來會不會有『ChatEO』出現。SEO 是搜尋引擎優化,而 ChatEO 代表優化 Plugin 在 ChatGPT 上的排名位置。
現在排名機制並不明確,Plugin 搜尋功能也是最近才出來。
所以現在我們能做的就是先『發起 Plugin』並且『強力宣傳自家 Plugin 的知名度、實用性』,然後不斷『優化 Plugin 版本』。
我自己使用了一段時間,相同功能的 Plugin 我通常不會試到第三個(除非前兩個真的很爛)。
所以上架 Plugin 這件事,搶快有機會搶到先機甚至佔據特定服務在人們心中的位置。
希望這篇能給使用 ChatGPT 的讀者們多一點想像。
4. 完整 ChatGPT Plugin 總覽
推友 Lencx 製作。
起因是 Lencx 他原本要介紹 Pluginpedia 這款 Plugin,這款可以根據個人需求推薦 Plugin,結果生成太多不存在或虛假的 Plugin 了
但是推友卻也發現對接 Plugin 接口的資料非常完整,就把它抓下來然後用 GPT-4 翻譯了。
他之後應該也會把它變成一般網頁展示,使用上會更方便。
https://github.com/lencx/awesome-ai/discussions/7
5. 蘋果 Vision Pro AI助手上線:教你開飛機、打麻將、踢足球
相信大家都看過蘋果在發布會上展示的頭戴式裝置。
現今 Microsoft 的雷德蒙德研究院及南洋理工大學合作推出一款『多模態 AI 助手:Otter (水獺)』
小水獺可以即時辨識場景,並根據人們的需求回答提問。
訓練團隊明確的說了,這就是針對蘋果的穿戴式頭盔所準備的,影片視角也以該 AR 頭盔的第一視角做呈現。
完整影片:
論文: https://arxiv.org/abs/2306.05425
GitHub: https://github.com/Luodian/Otter
6. Google Workspace 的 AI 功能申請
現在申請很快就能馬上拿到試用資格了,雖然目前只有 Google Doc 跟 Gmail,但是相信很快就會相繼開放不同功能。
目前並不支援中文,所以只能用英文 Prompt。在 Google Doc 方面則是內建 4 個基本指令。
這邊也提供 PPT 內建的 AI 生成圖片 Demo:
▎Prompt 學習資源
真心想學好 prompt 並不難,最難的是 3 點:
花時間看這些學習文件
花時間不斷試錯、優化
願意不斷燒腦思考
認真說,這四個下來已經太多,我沒有全部學完更多的是實際操作還有看別人的特殊應用,現在 AI 的時代從頭學到尾的方式已經不適合了,摸索出另一套更有效率且適合自己的學習方式吧!