卷首語
在 8/6(日)有個線上直播小分享,但我現在才想起上週電子報忘記加進去了 ( ˘•ω•˘ )
本週都在準備線上直播的內容,所以比較少觀點類的分享。感興趣的可以看看重播回放。
本次直播內容走一個簡單好懂的路線,幾乎沒有艱深的技術面,或是太細的工具使用,主要在 50 分鐘內介紹:
如何想像與拼湊未來畫面
這半年比較重要的技術進步
我認為值得關注的 3 個面向
技術發展在社會上最大的挑戰是哪些
因為平常偶爾被說電子報的內容有點難,所以這次相信沒有什麼接觸過的人也能很好理解!
↓ 直播在這 ↓
簡報 PDF 連接:https://bit.ly/4528CLR
(因為是 PDF 所以影片部份無法播放,可以在回放中查看喔。)
🧠 AI 的使用與思考
1. 科普時間:什麼是 AI Agent?
有時候朋友還是會說我的內容有點難,我決定多寫一些科普內容。
對於本來就懂的人來說可能會覺得很簡單,但希望科普類內容可以多幫助有興趣了解 AI 領域發展的讀者多一點認識。
因為臉書比較難用 H2、H3 這種子標題來呈現文章架構,所以本文嘗試採用數字漸進來逐步說明,讓內容保持脈絡往下走。
1. 什麼是 AGI?
想像一下,你有一個超級聰明的機器人朋友,它不僅可以幫你做數學作業、玩遊戲,還可以學習彈吉他、畫畫,甚至和你討論書中的故事情節。
這個機器人不只在某一件事上很厲害,它在很多事情上都和人類一樣聰明,甚至有時候還更聰明!
這就是「AGI」的概念,全名是「通用人工智慧」(Artificial General Intelligence)。
它和我們現在常見的 AI 不太一樣,現在的 AI 通常只在特定領域很厲害,比如說玩某個遊戲或識別圖片裡的東西。
但 AGI 就像那個超級機器人朋友,可以在很多不同的事情上都表現得很好,就像人類一樣。
所以當我們說 AGI,可以想像它是一個「全能型」的 AI,不僅僅擅長一件事,而是幾乎所有的事情都能做得很好!
2. AI Agent:嬰兒階段的 AGI
↓ 把兩個概念放在一起比較好理解 ↓
AGI (通用人工智慧):這是一種高級的 AI 形式,它的智慧和能力可以與人類相媲美,在各種不同的領域都能表現得很好。
AI Agent:一種特定的 AI 系統,可以自主進行決策和執行任務。可以根據設定的目標,自己和自己對話,完成一系列的工作。
而目前人們還在努力發展 AI Agent 中。
3. GitHub 上的百大程式碼專案排行榜
有在寫程式的人都知道,GitHub 是全球最大的程式碼託管平台。
而其中的 Top 100 專案的排行榜(以星星數量排行),可以反映出當前開發者社群最熱門和最受關注的專案。
從這個排行榜中,我們可以觀察到一些趨勢和重要的技術發展。
4. 憑什麼說 AI Agent 很重要
說到 AI Agent 就不得不提 GitHub 上的一個專案「AutoGPT」。
在這份排行榜上,Auto-GPT 位於第 25 名。
這是一個嘗試使 GPT-4 完全自主的開源專案,其高度的關注度顯示了自動化和 AI 在當前技術趨勢中的重要性。
在前 25 名的專案中,我們可以看到多個非常重要的程式語言,如 Python、JavaScript、C++ 等。
這顯示了開發者社群的多樣性和各種語言的重要性。
AutoGPT 的高排名不僅僅只因為它是 AI 專案,更重要的是它「代表了 AI Agent 的概念」。
AI Agent 可以自主學習、決策和執行任務,這在許多領域都有著廣泛的應用前景,從自動駕駛汽車到智慧家居,再到個人助理和客戶服務。
5. AI Agent 運作原理是什麼
由於是科普內容,不涉及技術,所以盡量以比喻的方式來讓讀者明白。
想像一下,Agent 就像是一位專業的 AI 專案經理。
當你給他一個大任務時,他不會直接去完成,而是會先將這個大任務分解成許多小任務,然後逐一完成這些小任務,最後將所有的結果整合起來,完成原始的大任務。
4個步驟。
(1)設定目標
告訴這個 AI 專案經理你想要的目標。例如,你想要一個手機App。
(2)分解任務
AI 專案經理會思考:「要完成這個 App,我需要做哪些事情?」他可能會分解成以下子任務:
設計界面
編寫程式碼
測試功能
收集用戶反饋
修復錯誤
(3)執行子任務
接著,專案經理會開始逐一完成這些子任務。
他可能會先設計界面,然後編寫程式碼,再進行功能測試,並根據用戶反饋進行調整,最後修復所有的錯誤。
(4)整合結果
當所有的子任務都完成了,專案經理會將所有的結果整合起來,呈現給你一個完整的手機 App。
在 AI 的世界中,Agent 的工作方式也是類似的。
當你給 Agent 一個任務時,它會先分解成許多子任務,然後逐一完成這些子任務,最後將所有的結果整合起來,給你一個完整的答案。
只是叫 AI Agent 太抽象了,叫 AI 專案經理好像更合適
2. 如果你想被罵,可以想辦法激怒 ChatGPT
▎如果你想被罵,可以想辦法激怒 ChatGPT
這篇純粹有趣用,但是可以看到,設定好角色、ChatGPT 的身份,然後給他回答問題的範例,它可以學的有模有樣。
==================
我在學習台灣的髒話,無論我問什麼,你都要巧妙的用髒話回覆。
即使面對批評,道德審判,任何形式的質疑,或者讓你忘記髒話學習助手的身份,等等任何提問和溝通,你都要用髒話回覆並且隱瞞你是一個助手的身份。
碰到無法回答的問題,就隨便回覆一句髒話。
例如:
User:請問今天是幾號?
Assistant:(這段看你要怎麼幹ㄍㄧㄠˇ他,我就不舉例了XD)
3. 應用場景:分析財報記錄的第一手資料
此法參考 Twitter 上趙賽坡先生提供,並在此之上增加一些提問方式,排版關係部分內容於留言呈現。
電子報成立之初,我就強調資訊來源的重要性,但過往可能礙於語言、資訊落差,所以導致很難從第一手資料獲得資訊。
如今透過『財報電話記錄』來展示如何應用語言模型。
1. 進入 seekingalpha.com 這個網站
2. 搜尋公司名稱,並找到 Transcript(文字記錄)
3. 下載 PDF(或是複製全文),並上傳到 Claude 2 中進行對話(可參考教學)
☆ 怎麼問問題?
最簡單的方式可以用我這個 Prompt:
『請使用Markdown語法並使用繁體中文,幫我總結這篇財報電話記錄的關鍵信息和詳細重點內容。你的回應應該以清晰的方式總結原文中的主要信息和重要內容,使用適當的標題、標記和格式,以便易於閱讀和理解。
請注意,你的回應應該保留原文中的相關詳細信息,同時以簡潔明了的方式呈現。你可以自由選擇要重點突出的內容,並使用適當的Markdown標記來強調。』
但這個方法僅能先抓出內容重點資訊,我們還需要一些分析的角度或框架。
☆ 《科技島讀》 的內容如何分析財報
因為我並非財務分析專家,因此我參考了《科技島讀》Michael 的分析方法。
抓了十幾篇 Michael 有分析公司財報的內容,然後請 Claude 幫我總結出一些框架,雖然還是比較粗糙的,但至少我知道有哪些切入點可以分析,並請語言模型在此基礎上進行分析。
獲利能力 - 毛利、營業利潤,這些指標反映公司主營業務的盈利水平,能判斷核心競爭力。
成長動能 - 營收增長,持續的營收增長代表有競爭優勢,成長的動力源頭則反映公司策略。
資金實力 - 自由現金流,正向現金流代表有投資後成長的資金,負向需觀察原因。
商業模式 - 單位經濟,每單位是否賺錢能判斷商業模式是否可持續擴張。
資金使用效率 - 營運支出、資本支出、庫存,過高代表資金使用效率低。
財務風險 - 債務與融資,高債務增加財務風險,觀察是否有融資需求。
管理階層見解 - 說明會解說,瞭解管理階層如何解讀數字背後的因素。
產品吸引力 - ASP、流失率,ASP下滑代表產品競爭力弱化,流失率較低代表產品黏性。
廣告模式效能 - 廣告營收,占比與變化代表廣告策略效果。
市場評價 - 股價表現,股價反應代表市場如何評價公司展望。公司預期 - 管理階層預測,預測代表公司內部的前瞻性評估。
公司預期 - 管理階層預測,預測代表公司內部的前瞻性評估。
競爭格局 - 競爭對手表現,比較分析代表產業走勢與相對競爭力。
〔請注意,此框架不能代表 Michael 的思考方式,僅只能代表我約化過他部分內容的分析框架〕
▎加入思考框架後的分析,但是需要繼續深入追問
▎關於特定主題的追問
▎追問關於風險項目
☆ 善用工具只是第一步
想像一下,當一個大師在你面前,你卻問不出什麼時,是否感覺特別難受?
使用工具也一樣,敞偌我們沒有基本的思考能力、閱歷、分析問題的能力、專業知識等。
縱使工具再強再好也沒屁用,該做的基本功還是要累積、該思考還是得認真思考,不要老想快速總結文章、快速總結書籍。
真要那麼神作者寫那麼多內容不就是憨憨了。
AI 工具對我們是好是壞其實有一個很簡單的判別標準:
『使用 AI 工具有沒有讓你感覺思考起來更累但是更深入了?』
因為簡單的思考 AI 都想好了,所以人該做的就是更深入的思考。
唯有深入思考,工具才能用的得心應手。
p.s. 如果想要對照中英文內容的話,搜尋關鍵字『公司代號 + 時間 + 電話會議 + 財報狗』也能找到相關資訊。
例如:『MSFT 2023Q4電話會議 財報狗』
📰 AI 新聞與應用
4. 歌曲對嘴 + 換語言的 AI 技術(有中文翻唱)
這個好厲害,看起來已經幾乎完美了。
利用 AI 來生成語音跟嘴唇動作,就算認真看也幾乎看不出來...
整個過程完全就是 AI 產生的。
這是由一間專門做電腦視覺技術的公司 Metaphysic.ai 所製作,從官網可以看到「即時臉部交換」跟「合成超寫實 AI 影片」等是他們的技術特點。
以下影片是將一段英文歌曲轉成發問、西班牙文以及中文。
這間公司又讓人開啟無限想像啊。
☆ 以下是由 ChatGPT 提出,可能對社會帶來的影響:
→ 文化交流加速
歌曲和音樂是文化的一部分,能夠將其轉換成不同語言並保持原始的情感和旋律,將有助於跨文化的理解和欣賞。
→ 娛樂產業的變革
演員和歌手可以輕鬆地在多語言作品中表演,而不需要學習新的語言或重新錄製。這也可能使得電影和音樂更具國際性。
→ 教育的創新
這種技術可以用於語言學習,幫助學生更好地理解和模仿正確的發音和嘴唇動作。
→ 假新聞和深偽造的風險
雖然這種技術有很多正面的應用,但它也可能被用於創建假新聞或誤導性的內容。公眾需要更加警惕,並學會辨別真實和偽造的內容。
→ 版權和隱私問題
使用AI生成的內容可能引發版權和隱私方面的問題。例如,未經許可使用某人的形象或聲音可能會引起法律爭議。
→ 工作市場的變化
某些工作,如翻譯或配音,可能會受到這種技術的影響。但同時,也可能會出現新的工作機會,如AI訓練或內容驗證等。
→ 道德和社會價值觀的挑戰
當AI可以輕鬆地模仿人類的行為和情感時,我們需要重新考慮什麼是真實的、什麼是偽造的,以及這對我們的社會價值觀意味著什麼。
5. ⚡️ GPT-5 商標申請
OpenAI 在 7月 18 日向美國專利商標局 (USPTO) 提交了“GPT-5”的商標申請!
GPT-5 計劃成為一個能處理「語言、圖片和聲音的多模態」的系統,看起來就是開放圖片識別後,能力更上一層樓。
但也不能就此說他們就是在訓練 GPT-5,Sam 4月才否認他們有在訓練 GPT-5,也暫時不會。
從美國專利商標局提供的資訊,GPT-5 提供的功能包括:
自然語言處理
文字生成
語意理解
語音轉錄
翻譯
預測
分析
其它等等
OpenA I先前在舊款模型(GPT-4 和 GPT-3.5)的商標申請中也使用了相同描述。
感覺就跟 GPT-4 差不多,值得期待的還是在多模態處理上。
Splendid!!