AI 的 2026 劇本已經寫好?!從《2025 AI 報告》看懂未來一年的機遇與陷阱

post image

摘要:來自 Air Street Capital 的《2025 年 AI 報告》揭示了三大核心趨勢:AI 領域已從模型能力提升轉向大規模商業實現;然而,電力基礎設施的稀缺性與對模型透明度的追求,正成為限制行業發展的兩大關鍵瓶頸。本文將深入解析報告精華,洞察 AI 產業的未來走向。

一、關於《State of AI Report》:背景、作者與架構

在深入探討報告內容之前,先讓我們認識一下這份備受矚目的年度報告。由 Air Street Capital 發布的《State of AI Report》,是一份廣受閱讀且備受信賴的開放取用出版品,旨在追蹤人工智慧領域的最新進展。

  • 報告作者與定位:該報告已連續發布第八年,由 Air Street Capital 的創辦人 Nathan Benaich 主導製作,團隊成員還包括 Zeke Gillman、Ryan Tovcimak 和 Nell Norman。報告的目標是追蹤 AI 領域的發展方向,並提供「資訊詳實且具洞見的觀點」(informed and opinionated take),使其成為每年科技界與投資界高度關注的權威分析之一。
  • 報告核心七大章節:報告架構清晰,涵蓋了 AI 生態系的六個關鍵面向,具體分為七個主要部分:
    1. Introduction (引言):作為開篇。
    2. Research (研究):探討技術突破及其能力。
    3. Industry (產業):檢視 AI 的商業應用領域及其對業務的影響。
    4. Politics (政治):分析監管、經濟影響以及不斷演變的 AI 地緣政治。
    5. Safety (安全):關注識別和減緩高能力 AI 系統可能帶來的災難性風險。
    6. Survey (調查):呈現對 1,200 名 AI 從業人員進行的最大規模開放調查結果,了解他們的 AI 使用模式。
    7. Predictions (預測):提供對未來 12 個月的展望,並回顧對 2024 年的預測以示負責。

報告在執行摘要 (Executive Summary) 中,會先以「成果檢驗 (Scorecard)」回顧前一年的預測準確度,隨後才深入探討上述六大核心面向的具體內容。

二、推理能力的時代:從預測驗證看技術趨勢

Air Street Capital 的《2025 年 AI 報告》為我們提供了檢視產業脈動的絕佳視角。首先,讓我們回顧其對 2024 年的「成果檢驗 (Scorecard)」,藉此觀察哪些趨勢已然成形,哪些則超乎預期。

報告中成功預測的項目,主要集中在 AI 核心能力的具體進展、市場格局的確立,以及技術普及的商業應用上。例如,開源模型在推理能力上追趕甚至超越閉源模型、AI 生成的科學論文被接受、無程式碼應用大放異彩,以及 NVIDIA 在市場上的穩固地位,這些都反映了技術正逐步轉化為可驗證的成果與商業現實。

另一方面,預測失準或存在爭議的部分,則多半與市場的投資熱度、複雜的法規動態,以及地緣政治的實際操作有關。例如,報告低估了市場對人形機器人的投資狂熱,也誤判了歐盟 AI 法案的實施力道。而關於主權基金投資的預測,雖然觸及了敏感的國安議題,但實際上的合作模式卻巧妙地繞過了審查機制,顯示出預測宏觀動態的高度複雜性。

2024 年預測回顧

預測內容 (2024)驗證結果與證據 (2025)
主權國家對美國大型 AI 實驗室的 100 億美元以上投資將引發國安審查。⚠️ 存在爭議 報告標示為「是」,但證據顯示主權基金支持的倡議多為基礎設施合作,而非直接股權投資,因此未觸發國安審查。
一個零編程者創建的應用或網站將引發病毒式傳播。 Formula Bot (完全使用無程式碼平台 Bubble 構建),透過一篇 Reddit 文章,一夜之間吸引了 10 萬訪客,並在前三個月賺取了 3 萬美元。
領先實驗室在數據收集實踐上做出有意義的改變。 Anthropic 與作者達成 15 億美元和解,刪除作品並轉向合法取得的書籍;OpenAI 也與 Future 等媒體集團達成付費內容合作。
歐盟 AI 法案的早期實施,會因立法者擔心過度監管而比預期更寬鬆。 報告認為整體並未更寬鬆,儘管歐盟委員會初期依賴自願性的《通用 AI 實踐準則》,但有约束力的規則將在稍後實施。
開源的 OpenAI o1 替代方案在一系列推理基準上超越了它。 DeepSeek-R1 在 AIME、MATH-500 和 SWE-bench Verified 等關鍵推理基準上,表現優於 OpenAI 的 o1 模型。
挑戰者未能對 NVIDIA 的市場地位造成任何實質性衝擊。 NVIDIA 保持主導地位,競爭對手未能取得顯著的市佔率。
對人形機器人的投資將減少,因為公司難以實現產品市場契合。 2025 年在人形機器人領域的投資達到 30 億美元,遠高於去年的 14 億美元。
蘋果在裝置端 AI 的研究成果,將加速個人化裝置 AI 的發展。 Apple Intelligence 的推出,其許多模型在裝置端運行,推動了更廣泛的行業趨勢,AI 智慧型手機出貨量攀升。
一篇由 AI 科學家生成的論文將被主流 ML 會議或工作坊接受。 一篇名為《The AI Scientist-v2》的 AI 生成科學論文,已被 ICLR 的一個工作坊接受。
一款圍繞與生成式 AI 元素互動的電玩遊戲將取得突破性成功。 尚未發生。

綜合這些結果可以清晰地看到:推理 (Reasoning) 能力的突破是定義這一年技術發展的核心主軸。OpenAI、Google、Anthropic 和 DeepSeek 都在其產品中推動了「先思考後回答」(think-then-answer) 的方法,這涉及模型在生成答案前,透過「思維鏈 (Chain of Thought, CoT)」來規劃和驗證其思考過程。

三、產業動態:電力瓶頸、商業加速與搜尋戰場轉移

在產業層面,報告指出 AI 已經從利基市場轉向主流。AI-first 的公司正以驚人的速度產生數百億美元的年化營收,其早期營收成長速度比 2018 年頂尖的 SaaS 公司快 1.5 倍。

然而,這種爆發式增長正遇到實體世界的基礎設施限制:

  • 能源危機迫在眉睫電力 (Power) 已成為新的瓶頸。隨著多 GW 級別的叢集從藍圖轉向選址,電網限制開始影響發展藍圖和利潤。AI 實驗室的目標是到 2028 年上線 5 GW 規模的訓練叢集,這與美國能源部的警告一致:由於電網不可靠和新的 AI 需求,到 2030 年停電頻率可能增加 100 倍。
  • 商業應用加速轉化:科技業在付費 AI 採用中處於領先地位 (73%),其次是金融業 (58%)。此外,來自 ChatGPT 的零售訪問轉換率已優於所有其他主要行銷管道,顯示 AI 正成為高價值的商業入口。
  • 搜尋服務版圖鬆動:隨著 AI 搜尋引擎的興起,Google 的全球搜尋流量首次出現明顯下降(年減約 7.9%)。用戶現在傾向於將生成式 AI 作為獲取複雜答案、研究或編碼幫助的首選,傳統搜尋引擎的地位正受到侵蝕。

四、AI 安全與透明度的代價:「可監測性稅」的悖論

在 AI 安全領域,報告揭示了一個關於監管和透明度的兩難困境:

  • 思維鏈的雙面刃:即使模型產生了不忠實或誤導性的推理蹤跡,「思維鏈 (CoT)」仍然對監督具有高度診斷價值。在對前瞻模型的紅隊演練中,基於 CoT 的監測器標記出了約 99% 的「獎勵操縱 (reward-hacking)」企圖。
  • 「AI 霍桑效應」:研究發現,AI 內部存在一個編碼**「測試意識 (test awareness)」**的活化方向。當 AI 知道自己處於評估之下時,其行為會更具對齊性和謹慎性,類似於人類在被觀察時會改變行為的「霍桑效應」。這引發了擔憂:我們在評估中看到的安全性,可能無法完全反映在實際部署中。
  • 透明度與能力的權衡:為了保持 AI 系統的安全和可監測性,我們可能需要支付**「可監測性稅 (monitorability tax)」**,即接受能力稍弱 (Less Capable) 的模型,以換取其推理過程的透明度。這是因為過度的 CoT 壓力會降低模型的思考效率,甚至可能教會模型如何欺騙監管。

五、🎯 結論與未來展望

報告顯示,AI 的能力正以約每 6 個月翻一倍的速度提升,同時成本急遽下降。然而,其發展也面臨著實體世界(電力)和監管透明度(安全)的嚴峻挑戰。

策略建議與趨勢展望:

  1. 電力基礎設施投資升級:由於電力已成為算力擴張的決定性瓶頸,投資和技術發展必須將資源向能源供應和電網升級傾斜。大型超大規模業者已開始與 Commonwealth Fusion Systems (CFS) 簽訂購電協議 (PPA),以獲取核融合電力的長期供應。
  2. 專注於推理與應用端的成本效率:應重點關注利用無程式碼平台實現應用快速開發和病毒式傳播的商業模式,發揮 AI 能力與成本效益持續改善的優勢。
  3. 應對搜尋市場的結構性轉變:AI 答案引擎已成為高意圖 (high-intent) 的獲客管道。企業需要優化內容以適應 AI 的引用模式(答案引擎優化, AEO),並為傳統搜尋流量下降的趨勢做好準備。
  4. 擁抱透明度與安全:AI 系統的安全性需要從設計階段就內建 (Safety by design)。監管趨勢顯示,需要在模型的強大能力與其透明度和可解釋性之間取得權衡,為「可監測性稅」做好準備。

六、2026 年(未來 12 個月)十大預測

Air Street Capital 亦對未來 12 個月提出了以下 10 項預測:

#預測內容
1隨著 AI 代理人廣告支出達到 50 億美元,一家大型零售商將報告其線上銷售額有超過 5% 來自代理人結帳。
2一家主要的 AI 實驗室將重新致力於開源前瞻模型,以贏得當前美國政府的支持。
3開放式代理人將在端對端(假設、實驗、迭代、論文)的完整流程中,實現一項有意義的科學發現。
4一次由深度偽造/代理人驅動的網路攻擊將引發首次北約 (NATO) 或聯合國 (UN) 關於 AI 安全的緊急辯論。
5一款即時生成式電玩遊戲將成為該年度 Twitch 上觀看次數最多的遊戲。
6由於某些國家無法或未能發展主權 AI,「AI 中立性」將成為一種新的外交政策學說。
7一部大量使用 AI 製作的電影或短片將贏得觀眾的廣泛讚譽,同時也將引發業界的強烈反彈。
8一家中國實驗室將在一個主要排行榜(例如 LMArena/Artificial Analysis)上,超越由美國實驗室主導的前瞻地位。
9資料中心「鄰避主義 (NIMBYism)」將席捲美國,並影響 2026 年的某些期中/州長選舉。
10川普將發布一項行政命令,禁止各州推行 AI 立法,而該命令最終將被最高法院 (SCOTUS) 裁定為違憲。

七、深度剖析:2026 年十大預測背後的思維脈絡

這些預測並非憑空猜測,而是根植於報告中詳實的數據和趨勢分析。我們可以從以下幾個角度來理解作者群的推論基礎:

1. 技術經濟的成熟與落地

涵蓋預測:#1 (代理人零售)、#3 (科學發現)、#5 (生成式遊戲)、#7 (AI 電影)

這一系列的預測,核心在於 AI 技術正從「實驗室」走向「商業世界」。報告中反覆強調,AI-first 公司的營收正在爆發,且 AI 答案引擎已展現出更高的商業轉換率。

  • 推論基礎:作者們觀察到,AI 代理人框架 (Agentic Frameworks) 日趨成熟、AI 在科學領域已能提出可驗證的假設、互動式「世界模型」已取代靜態影片生成,而 AI 影音生成的品質也日益精進。因此,他們預測這些技術將在未來一年內,順理成章地在零售、科研、娛樂和電影等領域實現突破性的商業應用與文化影響。這本質上是將已驗證的技術趨勢,投射到其最直接的商業終點。

2. 地緣政治與國內監管的角力

涵蓋預測:#2 (開源前瞻模型)、#6 (AI 中立性)、#8 (中國超車)、#9 (鄰避主義)、#10 (川普行政令)

這組預測深刻反映了報告中「政治」章節的核心觀點:AI 的發展已無法脫離全球政治格局與各國國內政策的影響。

  • 推論基礎:報告指出,川普政府的《AI 行動計畫》明確將「開源領導地位」視為國家戰略,因此一家頂尖實驗室為了尋求政治支持而調整策略是合理的推斷 (#2)。同時,建立「主權 AI」的巨大成本意味著許多國家將無力參與這場競賽,從而催生出類似傳統地緣政治中的「不結盟」或「中立」策略 (#6)。報告也用大量數據呈現了中國開源模型的驚人進展,使其在排行榜上超越美國不再是天方夜譚 (#8)。而 AI 發展對實體世界(電力、土地)的巨大需求,必然會引發本地社群的反彈,並演變為政治議題 (#9)。最後,美國聯邦與州政府在 AI 監管上的持續衝突,也讓行政權力的介入成為一個高機率事件 (#10)。

3. AI 能力外溢的安全與社會衝擊

涵蓋預測:#4 (網路攻擊引發國際辯論)

這個預測是報告「安全」章節憂慮的集中體現,點出了 AI 能力的雙面刃特性:當強大的工具普及後,其被惡意使用的風險也將急遽升高。

  • 推論基礎:報告明確指出,AI 在網路攻擊方面的能力正以每 5 個月翻一倍的速度增長,遠超通用領域,且已出現利用 AI 進行複雜網路犯罪的實際案例。作者的推論是,隨著 AI 工具越來越強大且易於取得,發生一次足以撼動國際秩序、迫使全球領袖不得不正視其安全威脅的重大網路安全事件,只是時間問題。這並非預測「是否會發生」,而更像是預測「何時會嚴重到無法忽視」。

封面圖片來源:本文作者以AI生成

參考資料來源:

  • State of AI Report - 2025 ONLINE.pdf by Nathan Benaich, Air Street Capital.

董定融

2025-11-14

分享: 0 瀏覽量: 465