驅(qū)動(dòng)中國(guó)2024年5月13日消息,在科技界持續(xù)熱炒的人工智能領(lǐng)域,OpenAI公司即將于北京時(shí)間5月14日凌晨1點(diǎn)舉行一場(chǎng)備受矚目的線上發(fā)布會(huì)。雖然該公司CEO阿爾特曼明確表示,此次發(fā)布的不會(huì)是之前盛傳的GPT-5模型,但最新的泄露信息顯示,新的ChatGPT語(yǔ)音功能和GPT4-Lite引擎有望成為此次發(fā)布會(huì)的主角。
近期,有關(guān)OpenAI的研究進(jìn)展和技術(shù)動(dòng)態(tài)不斷被媒體披露。從曝光的信息來看,OpenAI正在密集測(cè)試一款名為GPT4-Lite的新模型,并考慮將其作為搜索引擎原型的基礎(chǔ)。據(jù)悉,這一模型可能是對(duì)速度更快的GPT4進(jìn)行的優(yōu)化,且代碼已悄然上傳至互聯(lián)網(wǎng)。
此外,OpenAI的搜索引擎設(shè)置中還出現(xiàn)了多個(gè)選項(xiàng),包括是否開啟自動(dòng)建議、選擇語(yǔ)言模型、選擇搜索引擎等。其中,除了已知的GPT3.5和GPT4模型外,新出現(xiàn)的GPT4-Lite引起了廣泛關(guān)注。同時(shí),與微軟合作的Bing搜索引擎也名列其中,而Sydney和Fortis兩個(gè)選項(xiàng)的真實(shí)身份尚未揭曉,但推測(cè)可能與早期的Bing AI“里人格”有關(guān)。
在內(nèi)部搜索方面,代碼中的“拉布拉多”一詞暗示了可能使用了RAG技術(shù)(Retrieval Augmented Generation),意味著該功能或許能夠檢索ChatGPT內(nèi)的聊天記錄。這些傳統(tǒng)搜索引擎常用功能,如查詢天氣、體育比賽信息等,SearchGPT似乎也有意涉足。
最引人注目的是,OpenAI可能將推出一項(xiàng)新的語(yǔ)音功能,它不僅能理解人類語(yǔ)音中的停頓和語(yǔ)氣,還能判斷提問時(shí)的情緒色彩。結(jié)合之前申請(qǐng)的“Voice Engine”商標(biāo),外界普遍猜測(cè)OpenAI正開發(fā)一種端到端的神經(jīng)網(wǎng)絡(luò),它能直接根據(jù)語(yǔ)音輸入預(yù)測(cè)語(yǔ)音輸出,無需經(jīng)過語(yǔ)音到文本的轉(zhuǎn)換過程。
這項(xiàng)技術(shù)的推出,預(yù)示著未來的對(duì)話將更加流暢,延遲大幅降低,讓人聯(lián)想到電影《她》中的AI伴侶薩曼莎。阿爾特曼形容這項(xiàng)即將發(fā)布的功能“感覺像魔法”,而總裁菠蘿曼也公開為其造勢(shì)。
盡管發(fā)布會(huì)上的內(nèi)容尚未完全明朗,但OpenAI的這些最新技術(shù)動(dòng)向已經(jīng)引發(fā)了業(yè)界的廣泛討論。從搜索引擎的原型到語(yǔ)音識(shí)別技術(shù)的進(jìn)步,OpenAI的創(chuàng)新步伐顯示出其在人工智能領(lǐng)域的領(lǐng)導(dǎo)力量。隨著發(fā)布會(huì)的臨近,外界對(duì)于OpenAI將如何改變當(dāng)前人工智能應(yīng)用和服務(wù)的期待日益高漲。