卷首語
本來這週想請假一週的,還是忍不住寫了,說不定創作就是要有這種熱情才能堅持下去(?)。
這週看到王建碩的『不要把研究 AI 新聞當做研究 AI』,其實更警惕自己寫作的方向。
Ray Dalio 為什麼會那麼成功,從《原則》這本書可見一斑,透過設定原則將自己束限在正確的方向上,才有機會離成功更近一點。
雖然還不知道電子報未來的發展是什麼,但至少我目前知道兩個重要的方向:
像經營產品一樣經營電子報,不斷迭代內容品質
累積自己的影響力及專業度
這兩項基石做的好,未來機會找上門時我們才有抓住機會的籌碼在。
以下 3 點值得謹記,也分享給喜歡研究 AI 的讀者們(截至文章 highlight):
AI 領域不缺新聞。千萬不要把研究 AI 新聞和研究 AI 混為一談,這兩個是完全不同的領域。
學習 AI 新聞或許能夠幫助自己成為一個不錯 AI 媒體編輯,或者在飯局上成為最健談的那一個人,卻並沒有辦法成為 AI 的從業人員。
遠離那些讓自己感覺學到了很多東西,卻在夜深人靜的時候不記得什麼的資訊源。花時間在相對不變的穩定的東西上面,才能幫助我們理解每天都在變化的東西。
🛠️ 本週 AI 新聞 & 工具
1. AI 研究報告:人們對 AI 的看法是什麼?
為了瞭解人們對於 AI 的真實想法及期望,The Verge 與 Vox Media 的團隊及研究諮詢公司 The Circus 合作。
對超過 2,000 名美國成年人進行關於 AI 的想法、感受和擔憂的調查。
我蠻喜歡這份報告的,因為它用了很鮮豔生動的圖,但比較美中不足的是,有些題目是多選題,所以數字感覺上怪怪的。
▎本篇 9 個重點如下(GPT-4 協助整理):
1. 儘管有廣泛的新聞報導,但這些新工具的使用仍然相對有限,並且主要是年輕用戶在使用。
2. 大多數人對於 ChatGPT 有所了解,但對於 Bing 和 Bard 則不太熟悉。
3. 儘管 AI 領域有許多新進者,如 Stability AI 和 Midjourney,但話語權仍然是大型科技公司手上。OpenAI 是主要的例外(因為與微軟的合作)。
4. 人們對 AI 對世界的影響有高度期待,超過其他新興技術。近四分之三的人認為 AI 將對社會產生大到中等的影響。
5. 人們主要使用 AI 來生成文字、幫助激發想法、編輯寫作,以及建立圖片、音訊和影片。
6. 人們對 AI 藝術的擔憂:AI 圖片生成器如 Midjourney 和 Stable Diffusion 提供了關於生成 AI 更廣泛問題的良好案例研究。
7. 人們對 AI 的未來感到興奮,擔憂,甚至兩者兼有。
8. AI 的普及程度和使用方式揭示了其在社會中的影響力,這種影響力可能會隨著技術的進步而增加。
9. 人們對 AI 藝術的擔憂,可能會影響 AI 在藝術領域的發展。
快速瀏覽重要統計圖
人們對 AI 工具的認知度沒有想像的高。
ChatGPT:57%
Midjourney:25%
使用 AI 的人主要都以千禧世代及 Z 世代為主。
千禧世代:指1981年至1996年間出生的一代人
Z世代:在千禧世代之後出生的一代人,通常指1997年至2012年間出生的人。
人們普遍對於 AI 還是抱有很高期待的,相比之下,電動車佔比為69%,NFT 只有34%。
AI 大多被用來腦力激盪、搜尋及藝術創作。
有一項發現特別明確:AI 正在擴展人們的創造力。
在調查的每個類別中,使用 AI 的人表示他們利用這些系統創造了一些本來無法做到的事情,藝術作品是這些創意領域中最受歡迎的類別。
根據調查顯示,人們對於如何應對這些倫理困境有褒貶不一的看法。
大多數人認為,當 AI 工具複製了藝術家的風格時,藝術家應該得到報酬,但同時也有多數人不希望這些能力受到限制。
事實上有近一半的受訪者表示,他們已經通過生成這種類型的輸出來測試該系統。
超過四分之三的受訪者都同意:『需要制定關於AI發展的法規和法律。』
法律目前正在制定中,歐盟 AI 法案正在進行最後的談判,而美國最近也舉行了聽證會,以制定自己的法律框架。
很明顯,人們對於 AI 系統的更高標準和使用透明度有強烈的需求。
例如大多數人都支持對 AI 生成的 deepfakes 進行標註。
當被問及對於 AI 可能對個人生活、職業生涯以及整個社會產生的影響感受如何時,人們的看法相當分歧,大致上可以分為擔憂和興奮兩派。
更常見的情況是,同時感到擔憂和興奮。
對於 AI 的不確定性,人們對未來可能發生的事情持有廣泛的開放態度。
根據調查,56% 的受訪者認為「人們將與 AI 建立情感關係」,而 35% 的人表示,如果感到孤單他們也願意這樣做。
大約一半的美國成年人預計,在未來某個時候會出現有感知能力的 AI,而接近三分之二的人對企業試圖創造這樣的 AI 並不反對。
原文:https://www.theverge.com/c/23753704/ai-chatgpt-data-survey-research
2. 用 DragGAN 隨意調整圖像細節
在倉鼠週報第 15 期中,我們曾經介紹過 DragGAN,那時候有介紹到:
『該功能背後的團隊提出了一種新的方法,你可以用筆在任何地方"拖"圖片的任何一點,精確地移動到你想要的地方,就像玩黏土一樣。』
而如今 huggingface 上也能實測了!
註:紅點是初始位置,藍點是最終位置。所以看影片 Demo 或是自己操作時需要稍微知道一下。
先用介紹幾個未來可能常用的功能。
1. 模特兒姿勢調整
小到臉部變化,大到身體姿勢,只要調整紅藍點就能快速變動表情姿勢。
可以說應該會是最高頻的使用場景之一了。 如果在搭配 SD 來產生模特兒,真人模特兒的需求也將大幅下降。
2. 臉部細節表情
剛剛是人整體的姿勢,細節表情的調整同樣很讓人驚豔。
改變臉面對的方向、開口笑、調整劉海高度、閉眼、瘦臉等等的都行。
3. 風景照
風景照也是人們最喜歡拍的相片。可以拉高樹木、甚至調高調低山的高度、調整湖面內的景色等,只要你想改什麼都行。
4. 其它物件(例如車)
就算今天圖片的物件是一台大車,也能透過簡單托拉改變汽車的大小、方向。
還能把一般車改成敞篷車。
.
其實最可怕的不是這種單一技術的突破或誕生,最可怕的是把這些突破性技術給整合起來。
同樣一套工具在,厲害的老師傅能夠透過強大的核心思考能力及相關經驗,串連這些工具上升到另一個層次。
所以,『不是這些工具取代人,而是善用這些工具的人取代人!』 請警惕之。
Huggungface 試玩:https://huggingface.co/spaces/DragGan/DragGan
3. Elon 跟 Mark 吵架,Jobs 和 Bill Gates 看戲
影片製作人汗青其實已經做過好幾期的 AI 影片,但是這次是我特別喜歡的一次!
他將 Elon 跟 Mark 的吵架用虛擬人物來呈現,再加入賈伯斯跟比爾蓋茲來看戲
但過程卻又把一些重要的 AI 議題與相關時事代入,像是迴紋針問題。
不只是有趣,更像真實的互動。
我也將對話透過文字形式來呈現:
=========================================
Elon Musk:
馬克,我們怎麼會在這裡呢?
Mark Zuckerberg:
在推特上吵架不如來一場古典決鬥,對吧?
Elon Musk:
這倒是有道理,尤其是你都沒有推特賬號。但你卻想創建一個更好的推特。你是不是在元宇宙中有點走火入魔了?
Mark Zuckerberg:
Elon,如果說要找出比管理 twitter 還要糟糕的事,那就是你的戰鬥技巧了。
Elon Musk:
嚇死我了。你怎麼練出那麼一身肌肉的?每天都做重型訓練嗎?
Steve Job:
他們真的打算打起來嗎?
Bill Gates:
哦,Steve Job,還記得高中門口那個愛嗆聲的小屁孩嗎?他們直到我畢業那天都沒有碰我一下。
Steve Job:
他們倆說話的方式,就像是 AI。
Bill Gates:
確實有點像 AI 在說話,是吧?
Mark Zuckerberg:
你為什麼還沒有發動攻擊?
Elon Musk:
因為,因為我媽媽說只用言語進行四尺之外的鬥爭,最有趣的人就是贏家。
Mark Zuckerberg:
等等,這不是 AI 的語言嗎?
Elon Musk:
再貼切不過了。
Mark Zuckerberg:
母親的建議確實無法反駁。
Bill Gates:
看,真正的企業家。
Steve Job:
說的多,做的少,總有一個藉口。
Elon Musk:
Mark,你一直炒作人工智慧和元宇宙這些概念,讓我覺得你就像在風投者的遊樂場裡不斷尋找新玩具,為他們創造一個好故事。
你是不是又打算改公司名字了?這次從元宇宙改成什麼,Avatar?
Mark Zuckerberg:
"哼,你真的必須飛到火星去證明你的夢想嗎?"
Elon Musk:
"馮·諾伊曼說,技術的加速進步好像讓我們接近一種本質的奇點,人類歷史上出現了一些基本的奇點,在這個奇點之後,我們所熟知的人類常態將無法持續。
AI正在將我們帶向那個奇點,所以我想帶領人類到達遙遠的火星。這並不是我為了讓股市漲幾分而做的事情。
Bill Gates:
我認為 Elon 和 Mark 之間的區別可能就是夢想家和企業家的區別。有時他們可能互相不喜歡,但他們以不同的方式改變著世界。
Steve Job:
夢想家是一群瘋子,不合群的人,叛逆者,麻煩製造者,他們看事情的方式不同。他們不喜歡規則,也不尊重現狀。他們創造了 iphone 和 OpenAI。
Bill Gates:
企業家創造了全球最大的社群,比如 Facebook 覆蓋了地球人口的 37%。他們通過實事求是和努力工作來發展各種行業。他們創造了微軟,微軟投資了 OpenAI。
Mark Zuckerberg:
Elon,你整天擔心人工智慧會把我們消滅,但老實說,我覺得自駕特斯拉比 AI 更危險。它們可以有自覺的意識嗎?
這就像莫拉維奇的悖論。對人類來說容易的任務,對AI來說可能就很困難,反之亦然。
對 AI 來說玩圍棋很容易,但是對 AI 來說擁有一個一歲孩子的感知和動作技能可能是非常具有挑戰性的,甚至是不可能的。
Elon Musk:
Mark,你聽說過迴紋針製造機這個思想實驗嗎?即使 AI 的目標被設定為完全無害,人類仍可能會被消滅。這是因為當機器試圖製造更多的迴紋針時,人類成為了它們可以利用的資源。
AI 不需要有意識地消除任何人,如果人類恰好阻礙了實現目標,他們會被無情地輾過,而不是被避開。
Mark Zuckerberg:
是的,而你投資了 OpenAI,並研究人腦機接口。這就像在說,“嘿,AI 很危險,所以讓它開車,還讀取你的思想,但別忘了它很危險。”
Elon Musk:
人腦機接口的意義並不像你想的那樣,它的目的是糾正人類的某些缺陷。
Mark Zuckerberg:
你現在又開始談技術的真善美了?這讓我立刻想到《駭客任務》,它給我們上了兩個課。
一,往大腦亂放東西是危險的。
二,絕對不要拍第四集。
Steve Job:
我開始懷疑這場辯論是否會有結論。在人類歷史上,對科技的預測大多難以得出正確結論。我們傾向於只記住那些偶然正確的例子。
無論是 Mark 還是 Elon 對 AI 的看法,並不一定源於智慧。
Bill Gates:
那麼這場辯論的意義是什麼呢?只要看一下當前 Twitter 和 Facebook 直播頁面的流量就清楚了。
對於矽谷的明星來說,注意力就是一種資產。很多時候,辯論的目的往往就是辯論本身。
這就像 Netflix,在娛樂行業賺夠了錢之後,制作了一部像《千萬別抬頭》這樣的節目來諷刺娛樂狂熱的文化,多麼划算的交易啊。
Mark Zuckerberg:
你在說謊。
Elon Musk:
我沒有。
Mark Zuckerberg:
你是在說謊。
Steve Job:
我們在年輕時吵架的時候不也一樣幼稚嗎?
Bill Gates:
不,絕對不是這樣。
=========================================
汗青的 twitter:https://twitter.com/hanqing_me?s=20
4. 推薦閱讀:AI 工程師的崛起
推薦原因除了文章本身的脈絡清晰外,內容同時也被 Andrej Karpathy(OpenAI 的核心成員)認同與轉發。
▎為什麼開始出現這個職位?
只看 AI 工程師這個詞可能覺得陌生,但前一陣子出現的『Prompt Engineer』大家應該就不陌生了。
但 Karpathy 認為 AI 工程師是比 Prompt Engineer(提示詞工程師)更準確的用詞。
因為 Prompt Engineer 似乎只涵蓋了設計和優化 AI 模型的提示(prompt)這一部分。但 AI 工程師的工作範疇實際上遠遠超過。
AI 工程師需要不斷理解各種模型(GPT-4、LLaMA、Claude 等等 ),還要知道各種工具應用及相關產品(embedding、langchain、autoGPT 等等)。
然後是每天滿天飛的論文、模型、技術發展等新聞,要完全跟上基本上跟做全職工作差不多了。
根據上述工作加上作者對於 AI 相關工作職位進行深入理解後,認為『AI 工程師』是一個最好概括的職稱。
並且不同以往的 ML 工程師(機器學習工程師),不再需要將那些原理從頭到尾深入學習過。
▎為甚麼這個職位會開始崛起
現在的基礎模型有著一定水平的能力,在這些基礎模型上建構的產品有一定的成熟度。不用再自己從頭設計和訓練模型。
開源跟 API 讓各種 AI 相關的應用程式遍地開花,而且不用深入理解技術原理也沒關係。
各個領域在 AI 上的發展也形成一個必然趨勢,從各個國家的動作及大公司的策略可以很好驗證這個趨勢。
快速發展的技術及 API 的應用,讓產品需要以快速試錯的方式在市場上驗證,『快』形成了一個重要的競爭因素。
我認為核心的可以用這幾句話來說明:
『LLM(語言模型)的成熟讓 AI 技術快速發展,加上各種 API 及開源的普及,使得 AI 相關產品的試錯成本變的非常低,需要透過敏捷開發(快速試錯、快速迭代)的方式來適應市場。』
『我認為這篇文章大部分是正確的。
語言模型(LLM)創造了一個全新的抽象層和專業。
我之前稱這個角色為"提示工程師",但我同意這個稱呼有些誤導人。這個角色不僅僅是關於提示,還有編寫程式碼/維護基礎設施在其中。儘管它將一些過於具體的東西變得過於廣泛,但或許"AI工程師"這個稱呼是比較可以被接受的,。
機器學習的人們通常從頭開始訓練演算法/網路,通常在較低的能力下。
LLM 的訓練因其系統密集型的工作負載而變得足夠與機器學習不同,並且也正在分化為一種新的角色,專注於在超級電腦上進行大規模的 transformer 訓練。
從數量上來看,可能會有遠多於機器學習工程師/LLM 工程師的 AI 工程師。
一個人可以在這個角色中非常成功,而不需要受過任何技術訓練。
我並不完全理解軟體 1.0/2.0 的劃分。在我看來,軟體 3.0(即提示LLM)很有趣,因為提示是人類設計的"程式碼",但是用英語寫的,並由 LLM(現在是軟體 2.0 的產物)來解釋。AI工程師同時在所有3種範疇中程式設計。這有點讓人頭暈。』
補充:
基本上通篇 Karpathy 都是認同的,只有在軟體 1.0~3.0 那段他有點困惑。
文章暗示著 AI 工程師可能需要掌握軟體 1.0~3.0 的各種開發範疇,像是編寫和維護與 AI 模型相關的程式碼(軟體 1.0)、設計和訓練 AI 模型(軟體 2.0)、設計和優化模型的提示(軟體3.0)。
但 Karpathy 提到一個有趣的現象,即在軟體 3.0 階段,開發者實際上是在用人類語言(即模型的提示)來編寫程式碼,而這些程式碼又被一軟體 2.0 的產物(即已經訓練好的模型)來解釋和執行。
這種將人類語言視為程式碼的方式,可能也會讓人感到有些困惑。
《The Rise of the AI Engineer》:
5. 如何用 ChatGPT 寫一篇研究型電子書
自從 ChatGPT 加入了 Plugin 之後,就有非常非常多好玩有趣的玩法。這邊來介紹一組 Plugin 的組合:AI Agent + ScolarAI + Noteable。
AI Agent:將你規定的任務詳細分解,並盡可能達成任務。
ScolarAI:搜尋論文非常方便的 Plugin。
Noteable:用來寫程式並視覺化數據的平台提供的 Plugin,但是這邊我們用來當外部儲存空間。(使用前需要先註冊喔!)
首先我們要召喚 AI Agent,必須要先給一個開頭『AI Agent Objection:』,這樣可以觸發 Ai Agent 來幫我們分解目標任務。
AI Agent Objection: 請幫我寫一本關於飛蚊症及乾眼症的電子書,提供詳細的資訊,包括這些疾病的原因、最新研究成果,以及相關的研究方法。
然後對話中,我們要告訴 ChatGPT 把內容儲存到 Noteable 中。
如果你請它做的是英文相關的研究,只需要一直說繼續直到電子書完成,但難的是用中文呈現。
一開始就叫它找中文資料,它很有可能找不到資料!因為文獻通常是以英文的形式呈現,所以最好請它『Search in English.』。
然後在寫內容時也不要先用中文寫,我自己的經驗是先用中文寫內容真的會很少,而且沒什麼資訊量,所以請它先用英文寫完完整的內容,我們再自己翻譯成中文。
這邊就推薦自己將內文抓出來另外翻譯,因為請 ChatGPT 讀取、抓取、翻譯也很容易遇到問題。
像是中文寫入 Noteable 容易因為字元太長,很容易遇到寫入問題。這時我會給它一句話:『請減少每次輸入 noteable 的內容在 300字內,確保參數能正確結束,不要導致JSON解析失敗。一旦寫入失敗將寫入內容減少,未完成的內容請在透過下一輪對話中重新輸入。』
如果真的想要它在 Noteable 中完成,我目前嘗試比較好的方式是讓它把內容都寫到 ChatGPT 上,翻譯後再寫入另一個 notebook 中。
過程中真的非常非常容易遇到麻煩,所以要很有耐心的去解決,這邊附上我的最終成果及一開始給的指令讓大家參考。
一開始的指令:
『AI aegnt objection: Please help me write an e-book on dry eye syndrome and floaters, providing detailed information on the causes, recent research on these conditions, and related research methods.
Please translate the content of the e-book back into Traditional Chinese and write it in Markdown syntax in Noteable, providing proper citations in the format of a research paper.
Every time you input content into Noteable, make sure it is within 300 words to ensure the parameters are correctly processed and prevent JSON parsing failure. If a write failure occurs, reduce the amount of content being written. Please re-enter any unfinished content in the next round of conversation.』
最終成果:https://share.cleanshot.com/MrRjKmys
過程遇到什麼狀況都歡迎回信或留言告訴我!