卷首語
近期重大的 AI 新聞越來越少,大眾的生活好像也逐漸歸於平凡。但其實大公司們都在積極籌劃著下一階段的佈局。
從 a16z 這篇經典的文章 Who Owns the Generative AI Platform 可以知道,現階段 AI 在競爭這塊主要分成 3 個面向:基礎設施層、模型開發商及應用。
想知道 AI 的商業發展及洞察可以就這三個面向切入,這邊簡單舉例可以思考的方向:
首先是基礎設施層,NVIDIA 作為基礎設施的龍頭,收益必定先經過這,有鑒於此利益,是否會有其它基礎設施(如博通)想嘗試跳出來瓜分市場?
而基礎設施又涉及到晶片,由於 AI 晶片的供不應求,Google、Microsoft、博通等皆開始自己研發晶片,晶片的開發成功與否、算力就會直接影響到企業的利潤及模型的算力。
再看雲服務,GCP、AWS、Azure 會如何整併 LLM 至整體產品線上佈局佈局?
最後是應用層,大家都會有感一件事,就是所有『AI 應用』幾乎都是套皮的 ChatGPT 而言,除了企業自有獨特資料或是自己燒錢另外訓練一個模型外,如何創造出 AI 應用的護城河?
不同層面環環相扣且錯綜複雜,而這也是我希望知識倉鼠可以呈現的價值,一層層抽絲剝繭來分析,應該也有讀者發現 AI 應用的部分越來越少,因為它能提供給讀者的價值較少,也容易被其它電子報所取代。
這次的卷首語只是快速拉出幾個值得切入的觀察點,未來也會就這些觀察點進一步做分析,歡迎回饋交流討論!
(下圖是 a16z 文章中提到生成式 AI 目前的生態系)
🛠️ 本週 AI 新聞 & 工具
1. TED 演講推薦:ChatGPT 的強大潛力與內幕故事
很值得一看的 TED 演講,由 OpenAI 的聯合創始人 Greg Brockman 主講,現場 Demo 了一系列 ChatGPT 外掛(大部分外掛都尚未完全釋出)如何串連使用,充分展現了 ChatGPT 在未來的強大。
並且引領人們重新思考了人機互動的關係、如何正確的透過 AI 使用工具以及在安全性上 OpenAI 如何盡力做到完善,不讓潘朵拉的盒子危害人類。
從 AI 工具的使用方式到最後的 FAQ 環節都很有深度,推薦看看。
2. Sam Altman 親口證實:我們目前並沒有訓練 GPT-5
以後看到再有人說 OpenAI 有 GPT-5 時,要知道這是謠言。
不過除了僻謠之外,另一個重點是,未開發 GPT-5 並不代表不會在 GPT-4 上強化(升級功能),並非持續往上的數字才能代表 GPT 的提升。
公開表示未訓練 GPT-5 存在著為了杜絕大家對於 AI 恐慌的可能,但其實能力上升也可以 4.5、4.5 turbo 等等的數字來體現,所以雖然 Sam 這樣說,但大家仍然會害怕 AI 的發展。
不過 Sam 也表示,依靠更大的模型參數來提升模型能力的時代已經結束了,一方面是成本考量有其極限(目前已經超過一億美金),二來是如此大的參數規模及 AI 原理仍是黑盒子的情況下,越來越多監管部門及群眾感到不安與恐慌。
OpenAI’s CEO confirms the company isn’t training GPT-5 and ‘won’t for some time’: https://www.theverge.com/2023/4/14/23683084/openai-gpt-5-rumors-training-sam-altman
OpenAI’s CEO Says the Age of Giant AI Models Is Already Over: https://archive.ph/CJyMw
3. 原來 AI 眼中的世界長這樣
超級酷!第一次看到用這樣的方式創造出 AI 看到、聽到的世界。
怎麼做的呢?國外有一名網友 Kris Kashtanova 用以下四個步驟創造了 AI 所在世界:
1. 先讓 GPT-4 描述自己所處的世界樣貌
2. 用該文字在 Midjourney 生成圖片
3. 透過 Kainber AI 將圖片變成影片
4. 在 Mubert 生成音樂
5. 合併影音後,透過 RunwayML 創造出了這段 AI 眼中的世界
GPT-4 怎麼形容自身所處世界:
"Imagine a sleek, metallic sphere with a smooth surface, representing the vast knowledge contained within the model. The sphere emits a soft, pulsating glow that shifts between various colors, symbolizing the dynamic nature of the AI as it processes information and generates responses. The sphere appears to float in a digital environment, surrounded by streams of data and code, reflecting the complex algorithms and computing power behind the AI"
想像一個光滑表面的流線型金屬球,代表模型中包含的龐大知識。球體發出柔和的脈動光芒,不斷變換顏色,象徵AI處理資訊和生成回應的動態特性。球體似乎漂浮在數字環境中,被數據和代碼流包圍,反映AI背後的複雜算法和計算能力。
Twitter 上還有其它人用類似敘述做出的圖,很精采看了有種『哇嗚這就是 AI 的世界』。
Twitter: https://twitter.com/icreatelife/status/1649873812295491584
4. MULTI·ON:ChatGPT 的超級 Plugin
(這款外掛目前只有極少數人能夠使用)
Waitlist 試用:
https://multion.ai/?ref=dJwZZg
這是一款可以根據文字需求直接控制瀏覽器達成任務的外掛,它會打開瀏覽器相應的網站然後進行互動,根據需求來解任務,像是:
查看天氣
Twitter 發文
訂機票/飯店(自動填入電話、地址等)
覺得蠻厲害的,但同時也覺得危險跟風險都蠻高的,影片中有一段提供給 ChatGPT 地址讓它填入,未來若有付費等相關動作從 ChatGPT 出發,就會存在一定程度的資安風險。
前一陣子才出現 ChatGPT 出現其它人的對話訊息而已,當然 ChatGPT 自己也會防範這類的事情發生,但有沒有可能建立在此基礎上會衍生出另類的安全需求。
便捷的背後常會伴隨著一些代價可能是隱私、個資、安全性等,是否為了便捷性做出交換則是我們可以思考的面向。
5. Firefly:未來的影片剪輯長怎樣?
最近 Adobe 又宣布了 Firefly 的新功能,很好的呈現出透過自然語言讓工具達成我們的目的。
以下是的新功能(很厲害!):
一鍵加入音樂、音效(海浪聲、蟲鳴鳥叫)
透過 AI 校正(調整喜歡的)顏色
動態生成文字特效
自動對影片匹配 B-roll 素材
針對腳本自動產生分鏡畫面
p.s. B-roll 素材是指攝影師在拍攝過程中收集的附加影像,用以補充主要影片,使影片更加豐富。
這是一個很好帶出想像的案例,今天當這些功能實現甚至在未來更強大,那會被取代的人往往是『不會運用 AI』的人。
對於善於運用這些功能的人來說,AI 不僅大幅度的提高工作效率、讓個人產值(團隊)提高,更增加了自身的競爭力。
也許會有人反駁說,說不定這些影片剪輯者也會被取代呀。可是就目前觀察來看,至少短期內(1~2年,再多不敢保證XD),創作這件事情仍然需要代入一點靈魂,而這目前還是人強過機器的。
生硬的只讓 AI 創作影片的話作品很難打動人心。
最後還是保留點空間,畢竟 AI 湧現能力有時無法預測。但我們仍要在我們有限的能力上盡量追趕,而不是把責任丟給一句『反正都要被 AI 取代』就開始擺爛。
詳細介紹: https://blog.adobe.com/en/publish/2023/04/17/reimagining-video-audio-adobe-firefly
6. 創 1 間網路公司需要的角色的 Prompt 都在這
Reddit 這個貼文太猛了,以一間 SaaS 公司出發,把所有角色會用到的 prompt 集合起來。
有前端、後端、自動化、行銷四大部門為主,但其中還有細分,像是前端有基本的 HTML/CSS、Bootstrap、React、Angular 等;後端則有 Node.js、Ruby on Rails、PHP Laravel 等相關 prompt。
佛心來的整理,不用拿著這份去創業,但當你缺少什麼暫時的伙伴時,帶上咒語到 ChatGPT 召喚一個月 600 元伙伴吧(?)
使用 ChatGPT prompt 從零開始建立公司:
https://www.reddit.com/r/ChatGPT/comments/12gjp5b/ultimate_guide_for_building_a_startup_with/