🐹倉鼠週報12:未來企業將擁有專屬的語言模型
這週增加了實作的內容,不確定大家對於實作的興趣如何,所以在內容中加入投票,歡迎投票或留言告訴我對於實作這方面的內容是否感興趣!封面是我直接用 cute ai 然後niji 風格畫的,感覺真不錯。
卷首語
這兩週為了訓練科技島讀的 AI 機器人,花了好多心力在 debug,在看到效果沒有理想中那麼好時心中不免有些小失望,卻讓我更確信人在策略思考與洞察這塊是很難取代的。
知識是客觀的存在,但想法卻伴隨立場、視角及經驗。
對我而言,有立場的想法才是好想法。『洞察』有個很直白的畫面,在一個牆後看著牆上的洞所觀察到的事物。會有事實、立場、偏見,卻也可能誕生很好的想法。
每個人都有不同的思考框架,經歷了幾十年的經驗後,面對不同的事物也會有獨特的思考工具、經驗,最終合成了的想法。
為什麼思考能力 AI 沒辦法取代,也許是因為『不同立場看到的事物並不存在誰最完美』,而判斷框架是靠經驗與立場。沒有什麼框架對 AI 來說是最優解,AI 現階段也被設定成盡量不能有立場(立場可能產生歧視,歧視會引發紛爭),所以 AI 目前還難以取代深度思考。
但基本的邏輯推理能力卻是 AI 能輔助我們的,從下圖來看,AI 已經可以取代很大一部分編輯的能力了,並且透過 AI 還能強化我們寫作的基本功力。
所以善用 AI 扎實自己的基本功,並小心不要過度依賴 AI。
🛠️ 本週 AI 新聞 & 工具
1. Track-Anything:影片元素分割 & 追蹤
還記得不久前介紹 Meta 的物體識別模型嗎( https://bit.ly/3n5sz3J
Track-Anything 在影片上的使用更為靈活了,它可以做到(臉書留言有 5 個範例影片):
1. 在影片中追蹤和分割任何物體。
2. 簡單易用,透過滑鼠或觸控筆在影片中選擇感興趣的物體,然後自動生成高品質的追蹤和分割結果。
3. 無論你的影片有多少鏡頭變化,Track-Anything 都能夠精準捕捉物體的動態和細節,還可以透過視覺化處理你的追蹤和分割過程,並對其進行修改和優化。
4. 最後,Track-Anything 還可以幫助你完成一些以特定物件為中心的影片任務,例如影片修復和編輯。』
abs: https://arxiv.org/abs/2304.11968
github: https://github.com/gaomingqi/Track-Anything
2. AI 專家吳恩達與 OpenAI 合作免費開課
想要花錢上課的朋友先緩緩,大神級的人物(前 Google & 百度的 AI 負責人)吳恩達親自下來教授免費課程了!!!
吳恩達與 OpenAI 共同合作推出了 1.5 小時的提示詞工程(Prompt Engineering)的課程。
除了可以學會寫 Prompt 之外,吳恩達還會在最後敎你怎麼用 LLM(大語言模型)開發出一個聊天機器人,這個課程絕對吊打很多付費課程。
另外 Twitter 上的大佬歸藏老兄把吳恩達的課翻成簡中雙語字幕了,英文不好需要中文輔助的讀者歡迎取用。
網友的詳細中文筆記: https://ec26ubh65w.feishu.cn/docx/PuULdQP3wojyZYxn157cnsDXnqe
另一名網友人工校正了一天的字幕,準度蠻好的,不過因為是簡體所以我簡單把它轉成繁體的:
https://github.com/GitHubDaily/ChatGPT-Prompt-Engineering-for-Developers-in-Chinese
繁體版:https://drive.google.com/drive/folders/1Tzk57MlpYHT-cm1v-eta1voeJgBsm1rU?usp=share_link
3. Finchat:讓 AI 踏入財務分析
這個工具對於有在做美股投資的人應該是個好工具,它提供了超過 750 間的巨頭公司,以及超過 100 個專業投資者的資訊。
並且他並不是單純串接 ChatGPT,他還有用以下最新訓練數據來訓練模型:
財務資料
季度/年度報告
投資類書籍
KPI 指標
目前每天可詢問數量為 10 次,覺得不錯再升級。
Finchat:https://finchat.io/
4. 強力 LLM 引擎 Lamini:讓每個開發者都能把 GPT-3 微調成 ChatGPT
前兩週剛自己微調科技島讀的機器人,所以特別懂微調時整理訓練資料的困難,而 Lamini 這個 LLM 引擎(大型語言模型引擎),可以根據現在市場上主流公司的基礎模型(OpenAI、HuggingFace、Meta 等)快速建立客製化模型。
詳細原理這邊不特別說明,但要特別指出一點是,未來訓練 LLM 的成本一定會越來越低,也會有越來越多 LLM 的引擎出現,『建構專屬於自家公司的 LLM』講成為一種趨勢。
5. 在本地機快速搜尋文件內容
Semantra 是個很方便的工具,簡單講他就是沒有對話功能的 ChatPDF,該工具會在本機端將文件轉成數學特徵,再透過比對問題特徵找出相近的內容。也就是所謂的 Embedding。
Embedding 可以比喻成把物品放到一個多維的空間裡。
多維空間是指一個具有多個特徵或屬性的空間。在我們生活中,我們熟悉的三維空間由長、寬、高三個特徵組成。而在機器學習中,多維空間可能包含更多的特徵,例如顏色、形狀、大小等。
以水果為例,我們可以把顏色看作一個維度(如紅、綠、藍等),形狀看作另一個維度(如圓形、橢圓形、長條形等),大小也是一個維度(如大、中、小等)。這樣,我們就能在這個多維空間中用顏色、形狀、大小等特徵來描述和區分不同的水果。
這個工具不用網路、資料隱私安全、支援多種模式、還能整合用 OpenAI 的API,是個很有潛力的工具,推薦使用!