OpenAI DevDay 2025:Sam Altman 的開場主題 — 開發者如何在 AI 世代更快打造產品

Featured

在 OpenAI 發佈的 DevDay 2025 開場主題中,執行長 Sam Altman 向全球開發者介紹一系列能讓「從構想到產品」速度大幅提昇的新工具與模型。本文以第三人稱報導的方式,整理本次主題演講的重點:ChatGPT 內建 App 的 Apps SDK、讓代理(agents)更容易上線的 Agent Kit、改變工程團隊工作流程的 Codex,以及最新的模型與創作工具(包含 GPT‑5 Pro 與 Sora 2)。

Sam Altman 在舞台上開場致詞

Indholdsfortegnelse

一場以開發者為中心的宣言:成長與目標

Sam Altman 開場時回顧了過去兩年 OpenAI 與開發者生態的增長:

  • 開發者人數從 2023 年的 2 百萬成長到 4 百萬。
  • ChatGPT 每週使用者突破數億等級(演講提到超過 8 億每週用戶)。
  • API 處理量從每分鐘約 3 億 token 提升到超過 60 億 token。
Sam 強調:「現在是成為建造者(builder)最好的時代。從想法到產品的速度比以往快很多。」
成長數據與平台處理量展示

一、在 ChatGPT 裡建構原生應用:Apps SDK(預覽)

OpenAI 宣佈推出 Apps SDK(即日提供預覽),目標是讓開發者能在 ChatGPT 內建、發佈與商業化原生互動式應用。主要特色包括:

  • 完整堆疊(full stack):連接資料、觸發動作、渲染互動式 UI。
  • 基於 MCP 標準,開發者可完全掌控後端邏輯與前端呈現。
  • 應用能直接觸及數以百萬計的 ChatGPT 使用者,並支援未來在對話中即時結帳(Agentic commerce protocol)。

演示由工程師展示幾個合作夥伴的應用場景:

  • Coursera:在 ChatGPT 會話中播放課程影片,模型能即時「看到」使用者正在看的內容並解釋影片中段落。
  • Canva:從會話上下文直接產生海報、再轉為簡報,並支援內嵌全螢幕編輯。
  • Zillow:內嵌互動地圖,使用者可在對話中篩選與詢問,App 將回傳情境與細節給 ChatGPT 以供合成答案。
Apps SDK 發表投影片

開發者流程與上架機制:

  • Apps SDK 已發表開發者指南草案,提供上架標準與分級曝光機制。
  • 預覽階段開放開發;稍後可提交審核上架至目錄,並將有更多發現與推薦機制協助流量分發。

二、Agent Kit:把代理從實驗推向生產

Sam 指出,代理(agents)正從「可以問任何事」進化為「能替人做事情」的系統,但要把代理做成可用、可量產的產品,仍有不少工程與流程難題。為此 OpenAI 推出 Agent Kit,提供從原型到生產的一整套元件:

  • Agent Builder:視覺化畫布,拖拉節點建立工作流程(包括分類、工具呼叫、if/else、guardrails 等)。
  • Chat Kit:可嵌入、可客製化的聊天介面,讓產品帶入一致的聊天體驗。
  • Evals for agents:針對代理的性能衡量工具,包括 trace grading、資料集評估、Prompt 自動優化,以及在平台上直接測試外部模型。
  • Connector Registry:透過管理面板安全連接內部工具與第三方系統,維持存取與治理。
Agent Kit 功能概覽投影片

實際案例與現場示範

實務案例:

  • Albertsons:為全美兩千多家量販與超市打造代理,當某品類(例如冰淇淋)銷量意外下降時,主管可詢問代理,代理會跨時序分析、考量季節性與外部因素,並提出操作建議。
  • HubSpot (Breeze):使用 Agent Kit 改善客服助理回應,系統會結合知識庫、當地環境條件與公司政策,提供具體的診斷與建議。
Agent Builder 視覺化工作流程介面

現場展示由 Christina 在 8 分鐘內用 Agent Builder 打造「Ask Froge」代理,流程包括:

  1. 建立分類節點與兩個專責代理(sessions agent、devday agent)。
  2. 透過 widget builder 加入視覺化排程元件,並把會議資料檔案接入代理。
  3. 加入 guardrails(如 PII 偵測),測試預覽並發佈,最後不用改動程式碼就把代理內嵌到 DevDay 官網中。
Ask Froge 代理發佈與部署到 DevDay 網站

三、Codex:改變寫程式的方式

OpenAI 將先前的研究預覽產品 Codex 正式升級為 GA(正式版),並以專門為程式設計任務訓練的 GPT‑5 Codex 模型為核心。Codex 的定位是工程師的「軟體工程夥伴」,特點與新功能包括:

  • 在 IDE、終端機、GitHub 與雲端皆可運作;ChatGPT 帳號串接工作流程。
  • 更擅長程式重構(refactoring)、程式碼審查與根據任務調整思考時間。
  • 新功能:Slack 整合、Codex SDK(可擴充與自動化團隊工作流程)、企業管理工具(環境控管、監控、分析)等。
Codex 與 GPT‑5 Codex 模型介紹

Codex 現場展示亮點

Raman 以實際示範說明 Codex 的能力:從無人寫碼,讓 Codex CLI 生成控制舞台上攝影機的 Node.js 控制面板,接著在 VS Code 展示自動產生的伺服器與 UDP 封包實作,甚至讓 Codex 自動支援 Xbox 控制器作為操控介面。

Codex 控制攝影機的現場示範啟動

更多延伸:

  • Codex 能在背景長時間執行複雜任務(示範提到可持續數小時進行重構),並會在需要時查找外部文件或呼叫工具。
  • 與 Realtime API 結合,可在語音會話中呼叫 Codex,現場示範包含語音指令控制場地燈光、拍照與製作片尾名單疊加(credits overlay)。
語音指令觸發場地燈光控制示範

四、模型與創作者工具的更新

在模型方面,OpenAI 分享了幾個重要更新:

  • GPT‑5 Pro:在 API 上推出,定位為「最強大的模型」,適用於金融、法律、醫療等需要高準確度與深入推理的領域。
  • Sora 2(API 預覽):提供高品質、可控且能同步聲音的影片生成能力。Sora 2 支援詳細指令、保持場景狀態,以及生成同步的環境音效與音景。
  • Realtime Mini:現場亦提到實時語音模型的進展,將語音做為主要互動方式之一。
GPT‑5 Pro 在 API 上的宣佈

Sora 2 的應用包含概念開發、商品廣告生成、以及把實體照片物件帶入影片(例如把真實狗狗照片變成影片角色),Mattel 也示範了如何用它把玩具設計概念快速視覺化。

結語:從「要做什麼」到「如何更快做出來」

整場主題環繞一個核心:降低從想法到可用產品之間的摩擦。OpenAI 透過 Apps SDK、Agent Kit、Codex 與新模型,嘗試在多個層級提供建構方塊,讓單人開發者、小型團隊與大型企業都能更快速地驗證與上線 AI 驅動的產品。

演講重申:「你不需要龐大的團隊,只要一個好點子,就能比以前更快把它做成產品。」
Sam 對開發者的感謝與未來願景

常見問答(FAQ)

Q1:Apps SDK 現在可以馬上使用嗎?

A:Apps SDK 當時以「預覽」形式開放給開發者試用。開發者可以依據公開的開發者指南草案開始開發,稍後會有上架審核與目錄機制。

Q2:Agent Kit 能否用於生產環境?

A:Agent Kit 的設計就是為了把代理從原型帶到生產。套件包含視覺化建立、測試(預覽)與評估(evals)工具,以及連接企業內部系統的 connector registry,能支援部署到生產環境的需求。

Q3:Codex 可否取代工程師?

A:Codex 是用來加速工程師、擔任協作夥伴與自動化繁瑣工作,不是完全取代。OpenAI 的數據顯示,使用 Codex 的工程師能在 PR 數量與審查速度上顯著提升,但仍需人工監督與設計系統架構的判斷。

Q4:GPT‑5 Pro 與 GPT‑5 的差異為何?

A:GPT‑5 Pro 被描述為 OpenAI 迄今最具深度推理與高準確度的模型,特別適合需要嚴謹推理的專業領域(如金融、法律、醫療)。

Q5:Sora 2 在商業使用上有何限制?

A:Sora 2 已以 API 預覽方式提供給開發者,包含控制影片長度、畫面比例與解析度等功能。使用時應遵守 OpenAI 的使用政策與版權規範。

延伸閱讀與行動建議

  • 想快速上手的開發者:可先申請 Apps SDK 與 Agent Kit 的預覽,試著把現有服務用作為 ChatGPT app 或建立簡單代理。
  • 工程團隊:評估 Codex SDK 與 Slack 整合,規劃如何把 Codex 引入程式碼審查與自動化流程,並利用管理工具控制使用與治理。
  • 創作者與影像團隊:探索 Sora 2 的 API 預覽,將概念草圖快速轉為視覺化影片與聲音素材。

OpenAI 在這場主題演講中提出了多項工具與模型更新,重點在於讓開發者「更快地把想法變成產品」。對於台灣的開發者與創作團隊而言,這些平台與工具提供了新的工作模式與可能性:少量人力、快速迭代、更多跨領域整合。若想更深入了解實作細節,建議關注官方發布的開發者指南與 SDK 文件。