OPENAI為ChatGPT推出多模態版本 可以語音對話以及識別圖像內容 – 藍點網
[熱點] 時間:2025-12-07 02:14:13 來源:桑間濮上網 作者:娛樂 點擊:80次
OPENAI 昨天晚上宣布 ChatGPT 將支持語音對話,推出態版該功能僅限于 Android 和 iOS 版 ChatGPT,多模對話點網并且可以上傳圖片由 ChatGPT 進行分析、本可別圖識別并給出回答。語音
當這個功能可用后,及識用戶轉到 ChatGPT 設置里點擊新功能,像內然后就可以開啟語音對話功能,容藍還可以從 5 個聲音里選擇一個。推出態版

OPENAI 表示:
新的多模對話點網語音功能由心的文本轉語音模型提供支持,能夠僅從文本和幾秒鐘的本可別圖樣本語音中生成類似人類的音頻。我們與專業配音演員合作創作了每一個聲音,語音我們還使用我們的及識開源語音識別系統 Whisper 將您的聲音轉錄為文本。
第二個功能是像內圖像識別功能,用戶可以使用移動端 ChatGPT 拍照或選擇照片發送給 AI,容藍然后 ChatGPT 會像素級分析圖片內容并按照用戶提問給出詳細的推出態版回答,例如分析工作圖表、在設備工作異常時進行故障排除等等。
OPENAI 表示:
圖像理解由多模態 GPT-3.5 和 GPT-4 提供支持,這些模型將其語言推理技能應用于廣泛的圖像中,例如照片、屏幕截圖、包含文本的和圖像的文檔等。
新功能將在接下來幾周推出,首先獲得該功能的是 ChatGPT Plus 和企業版用戶,不過這些功能也會在后續支持免費版用戶,同時也會開放 API 給開發者們。
最后,OPENAI 上周推出了圖像生成模型 DALL-E 3,這個模型將可以與 ChatGPT 集成,將在 10 月份推出。
(責任編輯:探索)
相關內容
- 小臟豬與白天鵝的故事
- RPG《境天戰役》DLsite領先出售 稍后Steam搶測
- 記念:邁克我杰克遜戰與他有閉的游戲
- 《三國殺OL》玩家團設念無貧,CP攻略散!
- 調酒師模擬《夜弦酒吧員工守則》現已登陸Steam
- 天王邁克我·杰克遜本日回天 曾受權游戲
- 2020北京秋節廟會哪個最好 時候天面戰交通指北
- 智能電視擔當IoT重要入口?多設備聯動才是遠方
- 起猛了?秦時明月和鎧甲勇士一起拍電影!國產第一IP宇宙擊破多廚次元壁
- 295位好男批示民表態!《白警OL》“最好批示民”突圍賽本日啟動!
- 曝好豪杰網游《懦婦正在線》最新截圖
- 北京現代庫斯途官圖發布 將于2021年內上市
- 《地痞街道2》將延期至10月22日開啟搶先體驗
- 大年夜財主弄法《鬼滅之刃》游戲肯定去歲4月出售
