卷首語
AI 正在改變我們的生活及工作方式,前期會有一段磨合期,也就是高成本的學習曲線,但對於前幾批願意投入的人來說,無疑是快速建議自身優勢的機會。
在使用新工具時可能會有兩種情況:『這東西好難用』以及『這東西也太驚人』。如果你發現自己是第一種人時,並不代表你比較笨,可能真的這個工具並不好用或是設計的不好。
這時推薦用一個方式來判斷是自己的問題還是工具的問題,那就是『聽到頻率』。
明明難用的工具在短短時間內聽到不同人多次提起、甚至新聞報導、長輩討論、大量教學應用等,這時候該工具可能就不是設計的不好了,而是自己使用上有誤,可以開始看別人如何學習/使用該工具。
『聽到頻率』只是一個口語化的方法,象徵著一項資訊在臉書、媒體、非同溫層等地方多次出現。(與其用一些浮誇的大詞彙,不如用簡單易懂的方式記得)
🛠️ 本週 AI 工具 & 資源
1. GPT-4 的 8 大重點項目
這應該是本週最大新聞了,這邊把臉書上的圖文整理好在這方便大家理解。
▎簡介
GPT-4 是一個『大型多模態模型』(接受圖像和文本輸入,發出文本輸出),在許多現實情況下比人類能力差,但在各種專業和學術基準測試中展現出超越人類級別的表現!
內容精華(看不完至少瞥完這 8 點):
GPT-4 是一個大型多模態模型,接受圖像和文本輸入,發出文本輸出。
Api 可以接收圖片作為輸入產生文字並分析
GPT-4 推理能力遠勝 ChatGPT。在專業和學術基準測試中展現出人類級別的表現,例如在模擬的律師考試中獲得了接近前 10% 的成績;在 USABO Semifinal 2020 的考試超過了 99% 的成績;GRE 寫作接近滿分。
ChatGPT Plus 訂閱戶可以優先在 chat.openai.com 上獲得 GPT-4 使用權限,並設置使用上限(Poe 已使用所以不是 plus 訂閱戶可以嘗試看看)。
更長的 Token 數量:8,192 個 token 數,最大 token 數可以達 32768 個 token 數
已經有許多合作夥伴正在測試 GPT-4:Duolingo、Be My Eyes、Stripe、Morgan Stanley、Khan Academy......甚至冰島政府!
圖像理解能力還沒有向一般用戶開放,OpenAI 正在與合作夥伴 Be My Eyes 進行測試。
New Bing 已經使用上 GPT-4 了。
▎GPT-4 的能力及視覺處理
GPT-4 在處理複雜任務時比 GPT-3.5 更加可靠、有創造力,能夠處理更加細緻的指令。作者們通過測試發現,GPT-4 在模擬人類原本設計的考試中表現優秀,也能夠更好地處理英語以外的多種語言的問題。
GPT-4 還能夠處理文字和圖片交替的輸入,並能夠生成自然語言和程式碼等輸出。這些功能的提升將使得GPT-4在更多的應用場景中發揮作用,並提高人工智慧的效率和準確性。
重點:
GPT-4 能夠處理英語以外的多種語言的問題,包括低資源語言如拉脫維亞語、威爾士語和斯瓦希里語。
GPT-4 能夠處理文本和圖像交替的輸入,並能夠生成自然語言和代碼等輸出。
圖文對話範例一:拿 VGA 線來充電
圖文對話範例二:給論文圖片來解讀
圖文對話範例三:給一張草圖產一個網站
GPT-4 在企業內部的應用有較大的幫助,能夠提高支援、銷售、內容審核和程式碼撰寫等方面的效率。
▎限制、風險及相關措施
GPT-4 是一個非常強大的語言模型,但仍存在一些限制和風險。其性能的提高帶來了新的風險面,需要不斷進行改進和監控。此外,模型的使用也需要謹慎對待,適當地進行人工審核、添加上下文或避免在高風險場景使用。
這也提醒我們,在發展 AI 技術的同時,需要關注其社會和經濟影響,並不斷進行評估和改進:
GPT-4 相對於之前的模型,大幅減少了誤判事實的情況。
模型輸出存在偏見,需要進一步改進。
GPT-4 缺乏對過去事件的知識,並且不能從經驗中學習。
模型的預測有時可能是錯誤的,需要加強校驗。
GPT-4 帶來了新的風險,例如生成有害建議、錯誤代碼或不準確的信息。
GPT-4: https://openai.com/research/gpt-4
2. 史丹佛大學開源 Alpaca 7B 模型
史丹佛大學將 Meta 發佈的 LLaMA 7B模型做基礎,僅用了 52 k 的資料便訓練出了與 GPT-3.5 差不多性能的模型,而且總成本成本不到 600 美元。
這樣的表現也讓人不禁在想,Meta 是不是有機會來一波彎道超車。
Alpaca: A Strong, Replicable Instruction-Following Model:https://crfm.stanford.edu/2023/03/13/alpaca.html
3. 在日常設備中,執行 LLM
國外有網友在樹莓派上執行了 70 億參數的 LLaMA,雖然速度很慢,卻也象徵著 LLM(大型語言模型)在消費級別的硬體上的開始。
在 Mac M2 Air 上執行 LLaMa 7B 的 Alpaca(Github 中的圖片演示),推理速度很快。
AI 登陸日常生活設備,改變人們使用習慣的時刻已然開啟。
4. 微軟推出 Copilot AI 助手
基於 LLM 的 AI-Copilot,適用於微軟的相關軟體:Word、Excel、PowerPoint、Outlook、Teams。
Word:透過 prompt 來寫作。
編輯、總結、改寫等等的,你還可以跟他『說根據昨天寫的某一篇』當素材,AI 就會自動理解是哪一篇。
Excel:透過 Copilot 來分析及探索數據。
可以請AI幫你分析 Excel 中的數據,甚至請它幫你做出部分洞察,他會給你相關性、提出假設情境,甚至根據你的問題建議新的公式。
PPT:根據現有文件來製作簡報內容。
不必在做簡報時分心在簡報設計及排版,先專心於內容要呈現什麼,再透過這份 word 內容讓 Copilot 來自動產生一份好看的簡報。
電子郵件:請 Copilot 助手協助信件撰寫。
這個應該蠻多人有試過類似的功能了。
Bussiness Chat:AI 抓取微軟相關集成軟體來回答問題。
在這個 Chat 中,你能問它昨天發生什麼事情,他會將文件、PPT、電子郵件、日曆甚至 Memo 及聯絡人的數據整合來回答。
Teams:視訊會議中的 AI 助理。
在 Team 的視訊會議中,Copilot 可以幫你總結會議重點,甚至可以問它大家對於特定主題的想法、TODO 是什麼、誰負責什麼任務等等的,非常實用的功能(可能也不用會議紀錄了)。
完整發布會:
其實 Google 也出了但被我當做一般文件忽略了….,因為它的 Workspace 結合 AI 的功能跟 GPT-4 一起出來,然後那一天都在關注 GPT-4。看 Google 這次的介紹其實跟微軟的 Copilot 非常像,希望差異化後能各自走出不同的路線。
5. Pebblely:快速生成產品圖
現在 AI 應用太多,大家應該也用到麻痺,所以我如果能實測會直接測試,然後說說我覺得好用的程度及試用人群。
▎適用人群:沒請設計師剛起步的網路賣家
這個的功能其實就是幫你把圖片去背後,快速生成各種風格的產品圖,我自己隨手拍了一下手頭的滑鼠,確實有些風格還不錯。
但很吃重『網站給的相關風格』,像彩妝產品搭配自然風格、廚房用品搭配廚房風格就很適合,但我的滑鼠沒有比較適合的風格。
實用指數(滿分 5 顆):⭐⭐⭐
一個帳號只有 40 張的扣打,而且一次生成會生 4 張,真的覺得不錯也能多用幾個 mail 或 10 分鐘信箱去註冊看看。
印象中看過有人用 controlnet(不確定有沒有記錯)生成產品圖,那才是真的漂亮,看到再拿出來分享給大家。
Pebblely: https://app.pebblely.com/studio