今天來分享一下如何使用 AI 工具來協助我解決問題。
前情提要:
我的寫程式能力弱,今年開始搭配 ChatGPT 根據自己的需求寫程式。
編寫邊學,然後查資料把一些知識累積起來。
這次要用上 NotebookLM,使用特定資料來讓 LLM 回答問題。
只要登入 NotebookLM,VPN 到美國,準備好資料就可以開始對話(限英文)
問題就是難在這個資料的準備,如果你有想要爬取的網站是公開的(最好是自己的網站,比較不會有版權糾紛),可以透過這個方式把內容先抓下來:
就算爬完資料了,不同的語言模型機器人仍會有資料格式的限制,今天我就是花了好幾個小時在解決該限制!
NotebookLM 是什麼?
NotebookLM 是 Google 在 2023 年中推出的一款實驗性產品,它是一種 AI 筆記應用,目的是利用語言模型的能力和潛力,可以結合你現有的內容更快地獲取重要見解。
NotebookLM 可以將上傳的文件添加摘要總結,或解答用戶針對文件提出的問題。例如,醫生可以上傳了一篇關於神經科學的科學文章,讓 NotebookLM 自己建立相關的關鍵術語詞彙表。
NotebookLM 的特點是,它可以將語言模型「植入」到筆記和資料中,圍繞一些來源基礎(Source-grounding)有效地建立適合自己的客製化 AI。
目前 NotebookLM 主要支援 3 種格式:
Google 文件
PDF 檔案
手動複製文字
值得注意的是,NotebookLM 開始使用 Google 的 Gemini Pro AI 版本來幫助理解文件,這表示 NotebookLM 的功能和效能將進一步提升,為用戶提供更加高效、智能的記事體驗。
還可以把這個筆記 AI 分享給朋友,不過目前只能用英文。
補充 12/08 新增的重要更新內容:
增加來源限制:NotebookLM 現在可以包含最多 20 個來源。
單詞數量增加:現在來源可以包含多達 20 萬字。
任務目標:把之前下載好的 Google SEO 官方文件餵給 NotebookLM
之前抓下來的檔案中,我是用一個檔案來放 152 個頁面的資料,因為剛剛說可以用複製貼上或 Google doc 來放,結果都失敗了。
後來才知道 20 萬字上限🫠。
我想嘗試用 Google doc 來抓,所以下了這個命令(當初文件有用======區隔)
💡 用 ChatGPT 來處理檔案或小量的資料非常方便喔。
但大家用過 Google 雲端應該都知道,文件上傳後,需要點一下儲存成 Google Doc 形式才能用,但我不可能 150 個檔案都點吧😵💫。
於是我詢問是否有方法可以協助:『能否批量將上傳到 google 雲端的 docs 統一 save as google doc』。
看來是可以,請 ChatGPT 來處理。腳本的部分是程式碼,先不用看。
💡ChatGPT 不一定知道我們程度在哪,所以可能會簡化操作流程,必要時請提問操作細節。
像這樣:
💡記得 ChatGPT 可是有眼睛的,截圖不懂的地方傳給它,最好是英文,中文它辨識起來怪怪的。
過程中搭配截圖貼上詢問,可以解決非常多問題。
設定完之後,也簡單 debug 後,程式就能順利幫我們批量將文件轉為 Google Doc 形式。
回到 NotebookLM,點擊 『ADD SOURCE > Drive』上傳資料來源。
如果你是還在轉換時點進來,就會看到檔案慢慢轉出現。
但我後來上傳後發現,NotebookLM 限制只能傳 20 個檔案,所以重新請 ChatGPT 處理,然後上傳到雲端後,用本地 python 執行程式批量轉換。
過程中多少會有錯誤,如何溝通及 debug 也蠻重要的。
最後出來的成果:
然後放到 NotebookLM 就能進行對話了。
我發現 json 檔很棒的地方是,他每次引用基本上都是讀完 json 某個特定文章全部的內容,這樣我要請它給我來源 URL 也沒問題。
另外,他引用的資訊會再做一次總結,這樣使用者可以快速知道來源的大致內容是什麼。
當我覺得英文不順眼時,我會用上『沉浸式翻譯工具』,直接按上我設定的快捷鍵『Cmd + a』直接翻譯。
沉浸式翻譯還有個很厲害的功能,只要我打完中文句子,然後按 3 下空白鍵,就可以在輸入框中直接翻譯,因為目前 NotebookLM 只能輸入輸出英文,所以這個功能特別好幫助我詢問英文問題。
有時候 OpenAI 的 API 翻譯會有簡中,所以我再搭配新同文堂的快捷鍵,一鍵全部簡轉繁。
小結
雖然過程中看起來很簡單,其實 debug 的部分還是很吃個人能力,如果當我們要解決的問題涉及多個系統、平台的話,複雜度就會上升。
這篇用到幾個重要的東西,推薦大家也能常用上:
ChatGPT 拿來處理小量資料非常方便
ChatGPT 的視覺功能很強,不要忘了(但請用英文截圖效果較好)
善用一些小工具,無論是不是 AI 的,把一些重複性高的動作給取代掉。
很多小工具的使用其實已經融入到日常工作流中了,很可能我自己都沒注意到跳過了,但這些方法是最適合我自己的方法,如果大家要調高自己的工作效率,請一定要有『流程意識』。
意識到自己怎麼做事、怎麼規劃、怎麼執行,就像一個站在自己背後看自己的人,才有辦法優化效率。
厲害的人不是一開始就很厲害,而是不斷在可以累積的地方上優化,直到一般人看不見車尾燈💡。