百“?!睜幜?#xff0c;誰能爭先?全球領先的IT市場研究和咨詢公司IDC最新發(fā)布的《AI大模型技術能力評估報告2023》給出了答案。報告顯示,百度文心大模型3.5拿下12項指標的7個滿分,綜合評分第一,算法模型第一,行業(yè)覆蓋第一,足見百度文心大模型的基礎技術深度和產業(yè)應用覆蓋廣度。
IDC《AI大模型技術能力評估報告,2023》:百度7項滿分、綜合評分第一
“算法模型”、“行業(yè)覆蓋”兩個核心指標獲唯一滿分
當前大模型正處于快速發(fā)展階段,IDC評估報告圍繞產品技術、服務生態(tài)以及行業(yè)應用三大維度,考察大模型的10余項指標,其中“算法模型”和“行業(yè)覆蓋”成為衡量大模型能力極其重要的兩個指標,這也影射了大模型的產品技術能力和行業(yè)應用能力。
產品技術能力中,“算法模型”維度是重中之重,是大模型能力最為核心的要素,也是決定大模型應用效果的根本所在。只有通過算法模型技術的突破,實現(xiàn)具有通用效果優(yōu)勢的大模型底座,才能支撐更廣泛的行業(yè)覆蓋,才能使各行各業(yè)充分享受技術突破帶來的紅利,破解AI落地門檻高的困境。
行業(yè)應用能力中,應用覆蓋的廣度是當下大模型廠商最為關注的指標?!靶袠I(yè)覆蓋”通過企業(yè)級客戶數量和落地行業(yè)數,體現(xiàn)了大模型在產業(yè)落地上的實力,是大模型效果通用領先性、行業(yè)結合能力兩方面的綜合體現(xiàn)。
“算法模型”、“行業(yè)覆蓋”兩個核心指標有其內在的關聯(lián)性,行業(yè)覆蓋的廣度是算法模型通用領先性的集中體現(xiàn),也將為算法模型能力持續(xù)提升提供源源不斷的正向反饋,形成持續(xù)迭代提升的飛輪。
本次評估中,百度文心大模型兩項指標在眾多廠商中均獲得唯一滿分,充分體現(xiàn)了文心大模型產品技術的領先性和行業(yè)應用的廣泛性。
行業(yè)首個大模型評估框架,綜合評分第一、唯一算法滿分
這是IDC首次提出AI大模型技術能力評估框架,包括百度、阿里、騰訊、華為、科大訊飛、360、商湯等在內的14家國內主流大模型廠商參與了本次評估。結果顯示,百度AI大模型整體競爭力位于領先水平,成為大模型技術突破者和應用引領者。百度文心在模型能力、工具平臺、生態(tài)布局以及行業(yè)覆蓋上優(yōu)勢明顯,并已提前進入商業(yè)化落地探索階段。
IDC《AI大模型技術能力評估報告,2023》:百度獲算法模型、行業(yè)覆蓋唯一滿分
文心大模型在此次IDC評估中獲得了算法模型維度的唯一一個滿分,充分體現(xiàn)了百度在大模型核心技術上的領先優(yōu)勢。百度自2019年開始深耕預訓練模型研發(fā),先后發(fā)布知識增強文心系列模型。前不久,百度正式發(fā)布文心大模型3.5版本,進一步在基礎模型、知識增強、檢索增強等多項核心技術上取得創(chuàng)新,新版本在各項能力上均有明顯提升。
多個公開測評顯示,文心大模型3.5版支持下的文心一言中文能力突出,甚至有超出GPT-4的表現(xiàn);綜合能力在評測中超過ChatGPT,遙遙領先于其他大模型。多項“第一”的取得得益于百度“芯片-框架-模型-應用”四層技術棧優(yōu)勢、知識增強的核心特色和繁榮的大模型生態(tài)三大優(yōu)勢。
據報道,百度自研的深度學習平臺飛槳有力支撐了大模型的高效訓練和推理。飛槳與文心的協(xié)同優(yōu)化,讓文心大模型3.5最新版本的模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。知識增強作為文心大模型的核心特色之一,實現(xiàn)了更高的效率、更好的效果、更強的可解釋性。
在大模型生態(tài)方面,百度文心已形成企業(yè)、教育、社區(qū)三位一體的生態(tài)體系。最新數據顯示,百度有超過750萬開發(fā)者基礎,20萬企業(yè)生態(tài)基礎,多層次開展大模型人才培訓、企業(yè)賦能、開發(fā)者運營。百度還設立了10億創(chuàng)投基金,鼓勵大模型創(chuàng)意,繁榮大模型生態(tài)。
文心擁有中國最大產業(yè)應用規(guī)模,行業(yè)覆蓋獲評唯一滿分
AI大模型已經從拼參數發(fā)展到拼應用,進入大規(guī)??蓮椭频漠a業(yè)落地階段。百度文心大模型源于產業(yè)實踐,服務于產業(yè)實踐,業(yè)內首次提出了行業(yè)大模型的落地思路,聯(lián)合國家電網、浦發(fā)銀行、泰康、吉利、哈爾濱市、深圳燃氣、TCL、上海辭書出版社等企業(yè)單位,合作發(fā)布了11個行業(yè)大模型,是業(yè)內最早和廣泛深入推動行業(yè)大模型的廠商。
百度文心大模型全景圖
IDC評估結果顯示,百度文心大模型在行業(yè)覆蓋上獲得唯一滿分成績,在能源、金融、教育、醫(yī)療等領域已經實現(xiàn)廣泛業(yè)務布局和落地場景探索。
據介紹,文心大模型已經擁有中國最大的產業(yè)應用規(guī)模,目前有15萬家企業(yè)申請接入文心一言測試。百度智能云與300多家生態(tài)伙伴,在超過400個場景中已取得相當不錯的測試效果。
以能源電力為例,在全球最大的公用事業(yè)企業(yè)——國家電網有限公司,面向復雜電網的專業(yè)場景,基于百度文心大模型,百度與智研院聯(lián)合訓練電力行業(yè)大模型,在電網設備、客服等實際業(yè)務場景進行試點驗證,可以顯著增強電網運營的精細化、自動化、智能化水平。百度也和深圳燃氣聯(lián)合發(fā)布了燃氣行業(yè)大模型,破解燃氣企業(yè)運營場景繁雜、安全風險識別困難等難題。
未來,幾乎所有的企業(yè)都會強依賴大模型,幾乎所有的產品都會基于大模型來開發(fā)。百度文心大模型將持續(xù)發(fā)揮算法模型基礎技術優(yōu)勢,助力千行百業(yè)中國企業(yè)將大模型內化為自身的生產力工具,走上智能化轉型升級的快車道,構建面向全球的強大競爭力。
相關稿件