驅(qū)動中國2023年8月15日消息,今日14:00,科大訊飛召開了星火認知大模型V2.0的發(fā)布會,正式公布了一些新能力,將上線“代碼生成、圖片生成、視頻生成、星火插件”等新功能。
其中代碼生成能力可以實現(xiàn)代碼生成、代碼補齊、代碼糾錯、代碼解釋、單元測試生成等。
在發(fā)布會現(xiàn)場,科大訊飛還演示了通過星火認知大模型V2.0來一句話編寫代碼,僅僅是發(fā)出了用Python寫一個貪吃蛇小游戲的指令,就自動生成了一個簡單的小游戲,能力非常強大。
科大訊飛董事長劉慶峰介紹,訊飛星火V2.0代碼能力實現(xiàn)大幅度提升,從業(yè)界參考測試集上的效果對比來看,星火V2.0基于Python和C++進行代碼寫作能力已高度逼近ChatGPT,差距僅為1%和2%。
從Python語言的代碼生成、補齊、糾錯、解釋和單元測試生成這幾個維度都可以看到,現(xiàn)在訊飛星火V2.0代碼生成和補齊已經(jīng)超過了Chat GPT,其他幾項能力也在快速追趕中。
據(jù)劉慶峰介紹,當前訊飛星火V2.0對于代碼的邏輯、算法、方法、體系、數(shù)據(jù)準備已經(jīng)全部就緒。
基于此,科大訊飛公布了基于星火2.0的智能編程助手:iFlyCode 1.0。
據(jù)悉,iFlyCode 1.0擁有星火大模型的所有代碼生成相關能力,并可以無縫集成至開發(fā)環(huán)境。
此外,它還可以幫助開發(fā)者生成功能實現(xiàn)思路,提供修改建議,并解答相關的專業(yè)提問。
根據(jù)訊飛內(nèi)部的研發(fā)效能統(tǒng)計,超過2000名員工在使用iFlyCode 1.0后,代碼的采納率提升30%以上,編碼效率提升30%以上,綜合效率提升超過了15%。
可以說,iFlyCode 1.0的推出,解放了開發(fā)的生產(chǎn)力,大大提升了效率。
此外,訊飛星火認知大模型V2.0還展示了語音生成圖片、虛擬人等功能。據(jù)現(xiàn)場展示,訊飛星火認知大模型V2.0能夠快速根據(jù)指令生成準確圖片,同時還能根據(jù)新指令對圖片進行修改。
比如,生成一副雪山壯麗景色,高聳山峰被白雪覆蓋的圖片后,又新增“加上小女孩登山”的需求,訊飛星火認知大模型V2.0都能正確生成內(nèi)容。
在中文理解方面,訊飛星火認知大模型V2.0也能完美生成像“關羽騎摩托車”“山重水復疑無路,柳暗花明又一村”等圖片,領先競品。
除圖片外,訊飛星火認知大模型V2.0還支持生成帶有虛擬人的視頻,對公司企業(yè)來說,可以省去請真人拍攝產(chǎn)品等宣傳片的成本。
劉慶峰表示,當前代碼能力的邏輯、算法、方法體系、數(shù)據(jù)準備已就緒,所需要的就是時間和算力。
訊飛星火認知大模型V2.0的代碼能力和多模態(tài)能力均持續(xù)提升,2.0版本中,文本生成能力提升72%,語言理解提升78%,知識問答提升70%,邏輯推理提升60%,數(shù)學能力提升72%。
訊飛星火認知大模型的數(shù)學能力在國內(nèi)首屈一指,在高考后各大第三方評測中遙遙領先。發(fā)布會上,訊飛還演示了一道三角形數(shù)學題,并表示國內(nèi)只有訊飛星火認知大模型V2.0能解答這一數(shù)學問題。
此次發(fā)布會的重頭戲就是代碼能力,訊飛稱,從代碼生成、補齊、糾錯、解釋和單元測試生成,這幾個維度都可以看到,現(xiàn)在在代碼生成和補齊上已經(jīng)超過了ChatGPT,其他各項能力也正在快速追趕。
劉慶峰表示,我們已經(jīng)定了非常明確的目標,到今年10月24號,各個代碼的能力都會超越ChatGPT,明年上半年將正式對標GPT4。
在訊飛看來,代碼是一個硬碰硬的能力,不存在任何主觀評分的標準,所以它也應該被當成是大模型聰明程度的非常重要的標志。
評論 {{userinfo.comments}}
{{child.content}}
{{question.question}}
提交