OpenAI DevDay 發布四大更新強化 AI 互動和效率

OpenAI 推出即時 API、視覺微調、模型蒸餾和指令快取等功能，提升 AI 互動體驗、模型效率和開發彈性。

OpenAI在稍早舉辦的DevDay活動上公布四項更新，分別包含即時 (Realtime) API、視覺微調 (Vision fine-tuning)、模型蒸餾 (Model distillation)，以及指令快取 (Prompt caching)，藉此強化用戶透過OpenAI技術資源打造的人工智慧服務使用體驗。

雖然此次並未宣布推出全新人工智慧模型，但此次更新的技術資源則是讓開發者能更完善、加強人工智慧互動體驗，並且針對運算功能進行最佳化。

即時API

其中，在即時 (Realtime) API部分主要加強人工智慧語意理解與反應互動效率，讓使用者能更貼近真實交談互動方式與人工智慧「對話」，而與OpenAI技術合作的英語學習平台Speak也宣布採用此API資源，用於全新即時角色扮演功能，而包含旅遊規劃服務Wanderlust也透過此API加快使用者互動體驗。

OpenAI說明，傳統運作是透過系統理解使用者語意，再將相關內容轉換為文字讓系統處理運算，最後再以運算結果的文字內容轉換成語音播放呈現，而即時API則可直接將音訊透過GPT-4o模型運算，並且直接反應運算結果，藉由省去中間轉換處理流程，讓人工智慧服務能以更快效率呈現結果。

而目前即時API可對應6種語音風格，並且強調與ChatGPT服務提供版本不同，更考量版權、隱私問題，目前並未開放使用第三方語音包客製對話風格。

即時API先以公開測試形式提供使用，計費方式以每100萬組輸入文字詞元 (token)將以5美元計費，而每100萬組輸出文字詞元則以20美元計費，而每100萬組輸入音訊詞元則以100美元計費，而每100萬組輸出音訊詞元則是以200美元計費。

除了對應文字、音訊內容處理，OpenAI接下來也會在即時API擴大支援圖像、影片內容，並且讓開發者更容易在透過Python、Node.js開發語言打造應用服務整合此API資源。