陳朝暉博士,江蘇省雙創人才、滿幫集團首席科學家 ,負責滿幫大數據平臺和數據創新業務。加入滿幫前,為阿里云大數據人工智能研究員,負責城市大腦數據資源平臺和算法的研發和交付。加入阿里云之前是硅谷創業公司Celential.ai的聯合創始人。陳朝暉畢業于西安交通大學,在美國哈佛大學工程和應用科學學院獲得PhD,曾長期在硅谷Oracle,Yahoo,eBay等知名互聯網企業擔任技術研發和技術管理工作。
前言:
人工智能技術的發展與成功應用已經成為21世紀科技領域最大的新現象。從目前的進展來看,科學地理解人工智能原理已經超出了現有科學體系的范疇。顯然,人工智能是人類科學技術發展的產物,人工智能科學也將是人類科學進步與發展必然實現的目標。
大型語言模型是包含了數百億以上模型參數的深度神經元網絡,它使用自回歸學習方法通過大量無標注文本、圖像進行訓練。自2018年以來,Google、OpenAI、Meta、百度、華為等公司和研究機構都相繼發布了包括BERT,ChatGPT等在內多種模型,并在幾乎所有自然語言處理任務中都表現出色。2019年大模型呈現爆發式的增長,2022年11月ChatGPT 3.5發布,用戶可以使用自然語言與系統交互,從而實現包括問答、分類、摘要、翻譯、聊天等各種任務。
隨著ChatGPT火爆出圈,AI領域又迎來了新的一輪投資熱潮。大模型展現出了強大的對人類自然語言以及世界知識的掌握和理解能力,通過多模態數據的增強,它同時還具備了對圖形、圖像、音頻數據的理解和推理能力,這引發了人們對于大模型技術和應用的廣泛關注。創投集團邀請到了滿幫集團首席科學家陳朝暉博士,和我們一同解讀預訓練大模型在各行業中的影響。
創投集團:預訓練大模型持續火爆,在AI領域為什么會形成這樣的熱點?
陳朝暉博士:基于信息檢索的知識問答系統很早就有嘗試,與谷歌同期在硅谷有一家創業公司PowerSet,直接從各類網頁內容中總結出答案反饋給用戶。谷歌也基于相似的理念推出了自己的知識搜索服務(Knowledge Search)集成在自己的網頁搜索結果頁面中。本世紀初算力與存儲的爆發式增長促進了機器學習中神經元網絡規模的大幅提升,各類基于深度學習的模型取得了重要的突出。OpenAI經過了一個相當長的研發歷程,從ChatGPT 1.0一直持續投入,堆積了在過去看來天量的計算資源,直到最近推出目前最新的ChatGPT 4.0 Turbo。最新的大模型展現出了對人類對話深度的理解能力,除了知識整合之外,還具備了很高的推理邏輯性。在特定領域,通過海量數據的學習,模型已然形成了超出普通人類的理解和推理能力。OpenAI團隊自己也表示對ChatGPT所涌現出的“智力”無法完全理解??梢员容^確定地說,大部分行業都將面臨大模型的重塑和改造。
創投集團:大模型相較于傳統機器學習有哪些異同點?
陳朝暉博士:機器學習早期研究的主要工作大量聚集在特征維度的提取和選擇上,這些維度包括自然屬性特征、統計特征和各類人類根據業務場景主觀設計的特征或者說標簽。深度學習實現了特征自動化抽取,但仍然依賴一個復雜的優化過程,特別是訓練數據集合的選擇。而預訓練大模型通過大量地“投喂”通用數據,捕捉到了語料中存在的統計意義上的規律。傳統的機器學習方法,遇到新問題通常需要重新構建完整的訓練數據集,與此不同的是,預訓練大模型由于有事前巨量預訓練的支撐,對于各個垂類領域通常只需要相對少量數據和提示詞(prompting)訓練,就可以有不錯表現。深度學習為大模型的研究帶來了巨大的推動力,大模型當前所展現的能力主要受益于以下幾個關鍵因素的推動:1)大規模、多模態訓練數據集合;2)近乎無限的超強計算能力(成本不低);3)使用更為先進學習框架,例如Transformer架構就比之前的CNN卷積神經元網絡更容易提取上下文注意力(Attention)。
創投集團:基于大模型的盈利模式有哪些?
陳朝暉博士:大模型的商業變現非常重要,與巨大的投入成本相比,當前的收入能否覆蓋各項成本支出仍未可知。目前,我們可知的主要商業落地的方法如下:1)基于通用大模型的基礎服務:算法服務調用可以作為標準化的產品進行售賣,形成類似于云計算資源的服務提供商。這一部分各個大模型會在廠商服務的比較中表現出優勢,國外如OpenAI、國內如智譜AI等都表現的不錯。2)部分領域也會出現垂類大模型應用,通過對行業/產業知識、問題的適配,提供特定領域的專項服務。例如Stability AI推出的文生圖和圖生圖,公司在對輸出圖片結果質量上的控制占據了明顯的技術優勢,因此吸引了一批用戶。3)各個細分行業企業內部也會基于各類開源預訓練大模型,構建各自賽道上的大模型應用,幫助行業消減人力成本和溝通成本。大模型的價值目前主要還體現在“降本”這一側,能否因為大模型的推動產生新的業務需求,這也是一個非常值得關注的領域。目前看這方面的進展還比較有限。
創投集團:結合您所從事的行業,請介紹在大模型如何得到運用?
陳朝暉博士:滿幫集團是國內最大的公路貨運車貨匹配信息平臺,積累了大量運輸場景的數據包括貨、車、路、人、場五個方面。不同于滴滴等客運平臺的直接派單機制,貨運訂單的達成存在更長時間的溝通過程。目前公路貨運下單平均單價約2000元,在交易過程中,貨主和車主的決策流程更重,因此交易的摩擦成本相應的也更高。據滿幫內部統計,車主方面為每單貨運信息大約要支付200元的發現成本,貨主為每單貨運也要承擔約40元的調度成本,其中還有不菲的時間支出。因此滿幫從提升溝通效率、降低行業交易成本出發,正在研發基于大語言模型的司機智能助理和貨主智能助理,幫助雙方進行交易前期的信息匹配和交互,提升撮合效率,如果按公路客運每年20億單量預估,僅這一項將有望為行業降低千億成本。
創投集團:您對大模型的未來發展趨勢有什么展望?
陳朝暉博士:從技術能力角度,大模型和算力互相促進發展的循環已經得到初步驗證,未來隨著更多高質量、結構化數據的投入,大模型可能會迎來超出人類預期的能力躍升。在模型層方面,到今年年底,國內有幾家成熟的頭部通用大模型廠商的能力可以達到 ChatGPT 3.5的水平。預計明年,應該會出現進入到大規模商用的階段的大模型。從應用角度,目前來看這一輪預訓練大模型的發展,至少國內廠商的產品,還沒有來到屬于它的“iPhone”時刻。目前看,除了降本增效,提供一部分溝通能力之外,預訓練大模型引發的新需求空間也非常值得期待??傊?,我們應當為大模型能力的爆發式增長做好心理建設、能力管控等各方面的準備工作。我個人對大模型的未來的能力以及它所能引發的產業革命的前景是非常樂觀的。但與此同時,大模型的倫理、法理、安全性規范也是非常值得關注的領域。
感謝陳朝暉博士的分享。我們相信,通過用戶反饋和實踐創新反哺大模型,將進一步夯實基礎大模型技術,推動大模型的場景化落地。
來源:投資四部張蘇榮
審核:薛瑤
發布:尤異