OpenAI DevDay 2025:Sam Altman 的開場主題 — 開發者如何在 AI 世代更快打造產品
在 OpenAI 發佈的 DevDay 2025 開場主題中,執行長 Sam Altman 向全球開發者介紹一系列能讓「從構想到產品」速度大幅提昇的新工具與模型。本文以第三人稱報導的方式,整理本次主題演講的重點:ChatGPT 內建 App 的 Apps SDK、讓代理(agents)更容易上線的 Agent Kit、改變工程團隊工作流程的 Codex,以及最新的模型與創作工具(包含 GPT‑5 Pro 與 Sora 2)。
Indholdsfortegnelse
- 一場以開發者為中心的宣言:成長與目標
- 一、在 ChatGPT 裡建構原生應用:Apps SDK(預覽)
- 二、Agent Kit:把代理從實驗推向生產
- 三、Codex:改變寫程式的方式
- 四、模型與創作者工具的更新
- 結語:從「要做什麼」到「如何更快做出來」
- 常見問答(FAQ)
- 延伸閱讀與行動建議
一場以開發者為中心的宣言:成長與目標
Sam Altman 開場時回顧了過去兩年 OpenAI 與開發者生態的增長:
- 開發者人數從 2023 年的 2 百萬成長到 4 百萬。
- ChatGPT 每週使用者突破數億等級(演講提到超過 8 億每週用戶)。
- API 處理量從每分鐘約 3 億 token 提升到超過 60 億 token。
Sam 強調:「現在是成為建造者(builder)最好的時代。從想法到產品的速度比以往快很多。」
一、在 ChatGPT 裡建構原生應用:Apps SDK(預覽)
OpenAI 宣佈推出 Apps SDK(即日提供預覽),目標是讓開發者能在 ChatGPT 內建、發佈與商業化原生互動式應用。主要特色包括:
- 完整堆疊(full stack):連接資料、觸發動作、渲染互動式 UI。
- 基於 MCP 標準,開發者可完全掌控後端邏輯與前端呈現。
- 應用能直接觸及數以百萬計的 ChatGPT 使用者,並支援未來在對話中即時結帳(Agentic commerce protocol)。
演示由工程師展示幾個合作夥伴的應用場景:
- Coursera:在 ChatGPT 會話中播放課程影片,模型能即時「看到」使用者正在看的內容並解釋影片中段落。
- Canva:從會話上下文直接產生海報、再轉為簡報,並支援內嵌全螢幕編輯。
- Zillow:內嵌互動地圖,使用者可在對話中篩選與詢問,App 將回傳情境與細節給 ChatGPT 以供合成答案。
開發者流程與上架機制:
- Apps SDK 已發表開發者指南草案,提供上架標準與分級曝光機制。
- 預覽階段開放開發;稍後可提交審核上架至目錄,並將有更多發現與推薦機制協助流量分發。
二、Agent Kit:把代理從實驗推向生產
Sam 指出,代理(agents)正從「可以問任何事」進化為「能替人做事情」的系統,但要把代理做成可用、可量產的產品,仍有不少工程與流程難題。為此 OpenAI 推出 Agent Kit,提供從原型到生產的一整套元件:
- Agent Builder:視覺化畫布,拖拉節點建立工作流程(包括分類、工具呼叫、if/else、guardrails 等)。
- Chat Kit:可嵌入、可客製化的聊天介面,讓產品帶入一致的聊天體驗。
- Evals for agents:針對代理的性能衡量工具,包括 trace grading、資料集評估、Prompt 自動優化,以及在平台上直接測試外部模型。
- Connector Registry:透過管理面板安全連接內部工具與第三方系統,維持存取與治理。
實際案例與現場示範
實務案例:
- Albertsons:為全美兩千多家量販與超市打造代理,當某品類(例如冰淇淋)銷量意外下降時,主管可詢問代理,代理會跨時序分析、考量季節性與外部因素,並提出操作建議。
- HubSpot (Breeze):使用 Agent Kit 改善客服助理回應,系統會結合知識庫、當地環境條件與公司政策,提供具體的診斷與建議。
現場展示由 Christina 在 8 分鐘內用 Agent Builder 打造「Ask Froge」代理,流程包括:
- 建立分類節點與兩個專責代理(sessions agent、devday agent)。
- 透過 widget builder 加入視覺化排程元件,並把會議資料檔案接入代理。
- 加入 guardrails(如 PII 偵測),測試預覽並發佈,最後不用改動程式碼就把代理內嵌到 DevDay 官網中。
三、Codex:改變寫程式的方式
OpenAI 將先前的研究預覽產品 Codex 正式升級為 GA(正式版),並以專門為程式設計任務訓練的 GPT‑5 Codex 模型為核心。Codex 的定位是工程師的「軟體工程夥伴」,特點與新功能包括:
- 在 IDE、終端機、GitHub 與雲端皆可運作;ChatGPT 帳號串接工作流程。
- 更擅長程式重構(refactoring)、程式碼審查與根據任務調整思考時間。
- 新功能:Slack 整合、Codex SDK(可擴充與自動化團隊工作流程)、企業管理工具(環境控管、監控、分析)等。
Codex 現場展示亮點
Raman 以實際示範說明 Codex 的能力:從無人寫碼,讓 Codex CLI 生成控制舞台上攝影機的 Node.js 控制面板,接著在 VS Code 展示自動產生的伺服器與 UDP 封包實作,甚至讓 Codex 自動支援 Xbox 控制器作為操控介面。
更多延伸:
- Codex 能在背景長時間執行複雜任務(示範提到可持續數小時進行重構),並會在需要時查找外部文件或呼叫工具。
- 與 Realtime API 結合,可在語音會話中呼叫 Codex,現場示範包含語音指令控制場地燈光、拍照與製作片尾名單疊加(credits overlay)。
四、模型與創作者工具的更新
在模型方面,OpenAI 分享了幾個重要更新:
- GPT‑5 Pro:在 API 上推出,定位為「最強大的模型」,適用於金融、法律、醫療等需要高準確度與深入推理的領域。
- Sora 2(API 預覽):提供高品質、可控且能同步聲音的影片生成能力。Sora 2 支援詳細指令、保持場景狀態,以及生成同步的環境音效與音景。
- Realtime Mini:現場亦提到實時語音模型的進展,將語音做為主要互動方式之一。
Sora 2 的應用包含概念開發、商品廣告生成、以及把實體照片物件帶入影片(例如把真實狗狗照片變成影片角色),Mattel 也示範了如何用它把玩具設計概念快速視覺化。
結語:從「要做什麼」到「如何更快做出來」
整場主題環繞一個核心:降低從想法到可用產品之間的摩擦。OpenAI 透過 Apps SDK、Agent Kit、Codex 與新模型,嘗試在多個層級提供建構方塊,讓單人開發者、小型團隊與大型企業都能更快速地驗證與上線 AI 驅動的產品。
演講重申:「你不需要龐大的團隊,只要一個好點子,就能比以前更快把它做成產品。」
常見問答(FAQ)
Q1:Apps SDK 現在可以馬上使用嗎?
A:Apps SDK 當時以「預覽」形式開放給開發者試用。開發者可以依據公開的開發者指南草案開始開發,稍後會有上架審核與目錄機制。
Q2:Agent Kit 能否用於生產環境?
A:Agent Kit 的設計就是為了把代理從原型帶到生產。套件包含視覺化建立、測試(預覽)與評估(evals)工具,以及連接企業內部系統的 connector registry,能支援部署到生產環境的需求。
Q3:Codex 可否取代工程師?
A:Codex 是用來加速工程師、擔任協作夥伴與自動化繁瑣工作,不是完全取代。OpenAI 的數據顯示,使用 Codex 的工程師能在 PR 數量與審查速度上顯著提升,但仍需人工監督與設計系統架構的判斷。
Q4:GPT‑5 Pro 與 GPT‑5 的差異為何?
A:GPT‑5 Pro 被描述為 OpenAI 迄今最具深度推理與高準確度的模型,特別適合需要嚴謹推理的專業領域(如金融、法律、醫療)。
Q5:Sora 2 在商業使用上有何限制?
A:Sora 2 已以 API 預覽方式提供給開發者,包含控制影片長度、畫面比例與解析度等功能。使用時應遵守 OpenAI 的使用政策與版權規範。
延伸閱讀與行動建議
- 想快速上手的開發者:可先申請 Apps SDK 與 Agent Kit 的預覽,試著把現有服務用作為 ChatGPT app 或建立簡單代理。
- 工程團隊:評估 Codex SDK 與 Slack 整合,規劃如何把 Codex 引入程式碼審查與自動化流程,並利用管理工具控制使用與治理。
- 創作者與影像團隊:探索 Sora 2 的 API 預覽,將概念草圖快速轉為視覺化影片與聲音素材。
OpenAI 在這場主題演講中提出了多項工具與模型更新,重點在於讓開發者「更快地把想法變成產品」。對於台灣的開發者與創作團隊而言,這些平台與工具提供了新的工作模式與可能性:少量人力、快速迭代、更多跨領域整合。若想更深入了解實作細節,建議關注官方發布的開發者指南與 SDK 文件。



