6月1日,阿里云峰會·粵港澳大灣區(qū)分會在廣州隆重舉行,AI大模型仍是峰會重要話題。繼發(fā)布“通義千問”大模型之后,阿里云在本場峰會上又秀出了最新成果:“通義聽悟”AI大模型正式上線,主要提供音視頻內容轉寫、檢索、摘要整理等服務,聚焦音視頻內容賽道。
據悉,“通義聽悟”是國內首款開放公測的大模型應用產品,能充當各行業(yè)從業(yè)者的AI助手。阿里云CTO周靖人在會上表示,“通義聽悟”瞄準的音視頻內容賽道具有較高知識附加值,應用范圍十分廣泛。包括日常開會、教學、訪談、培訓、面試和直播等場景,“通義聽悟”都能通過自身技術提高用戶工作效率。
比如在會議場景中,可以智能總結發(fā)言人觀點、生成會議記錄和統(tǒng)計待辦事項。在教學場景中,該產品則具備直接抽取視頻內的PPT截圖、提供實時翻譯和章節(jié)回顧等功能。更重要的是,“通義聽悟”這才剛剛上線,之后將會繼續(xù)優(yōu)化,提供更多定制化功能。
對于這款全新的大模型產品,阿里云CTO周靖人表示十分滿意,并對其應用前景充滿信心。
根據周靖人介紹,“通義聽悟”集成了阿里云最先進的語音、語言技術,包括自研的語音語義多模態(tài)算法、新一代阿里工業(yè)級語言識別模型等,都在“通義聽悟”中得到應用。此外,“通義聽悟”還將和阿里云盤全面打通,支持轉寫內容直接上云,為用戶提供更大的儲存空間。
花了那么多資源、精力開發(fā)“通義聽悟”,阿里云的最終目的是惠及更多行業(yè)、企業(yè),為數(shù)字經濟的發(fā)展出一份力。目前,“通義聽悟”已全面開放公測,公測期間阿里云官方微博、微信和各大平臺會發(fā)放大量轉寫口令碼,用戶的權益可以疊加、累積,服務免費時常將達到100小時以上。
正如周靖人所說,“通義聽悟”可以讓音視頻閱讀、整理、分享變得更輕松,為各個行業(yè)打開通往AI的大門。
從產品形態(tài)來看,科大訊飛旗下的“訊飛聽見”語音平臺是阿里“通義聽悟”的子集?!坝嶏w聽見”目前較多被媒體人等文案工作者應用,比如用來進行采訪錄音速記的文字轉寫提取。不過,阿里云“通義聽悟除了能進行音頻內容處理外,還能處理視頻內容。
還有一點區(qū)別是,“訊飛聽見”是深度學習AI時代的產品,“通義聽悟”則是大模型時代的應用。“訊飛聽見”目前采取收費模式,轉寫30分鐘大概需要10元左右的成本,用戶也可以通過購買小時卡、月卡會員等方式獲得語音轉寫時長。
作為后來者,“通義聽悟”采取了半免費的策略,公測期用戶每天可以獲得2小時轉寫時長,每邀請一名用戶還可以獲得2小時時長,顯然,“通義聽悟”希望通過裂變的方式去獲取用戶,以“半免費”的模式推動大模型AI產品普及,至于賺錢多少其實不重要,因為這樣的產品即便收費賺到的錢在阿里云的營收規(guī)模前可能連“蚊子肉”都算不上,阿里云也無意通過C端消費者賺錢,做產業(yè)數(shù)字化和智能化升級的基礎設施才是它要做的事情。
事實上,早在發(fā)布“通義聽悟”之前,阿里云就已經為數(shù)字經濟的發(fā)展做出了很大貢獻。
在粵港澳大灣區(qū)分會場,阿里云首席商業(yè)官蔡英華也公布了一組數(shù)據:截止目前,阿里云已經服務粵港澳大灣區(qū)近75萬付費客戶,包括金融、政務、水利、制造等行業(yè),幫助無數(shù)中小企業(yè)實現(xiàn)數(shù)字化升級轉型。以制造業(yè)為例,阿里云工業(yè)互聯(lián)網全國總部就落戶在廣東,扶持了當?shù)爻^500家制造企業(yè)上云。
展望未來,在“通義聽悟”等AI大模型產品面世后,相信阿里云的數(shù)字服務能力將進一步加強,并給更多企業(yè)帶去幫助。
評論 {{userinfo.comments}}
{{child.content}}
{{question.question}}
提交