(資料圖片)
站長之家(ChinaZ.com)6月26日 消息:據量子位報道,清華大學唐杰團隊發布并開源了WebGLM。這是一個參數量高達100億的聯網問答聊天機器人,已經入選KDD2023會議的相關論文。用戶可以向它提出任意問題,然后它會給出網上相關鏈接(例如維基百科和相關官網),并整理出答案。在性能對比測試中,WebGLM的表現比OpenAI的135億參數的WebGPT還要強,而在人類評估中,甚至和1750億參數的模型不相上下。
WebGLM的目標是通過Web搜索和檢索功能來增強預訓練的大語言模型,并且實現高效的實際部署。為此,作者采用了三種策略進行開發:大型模型增強檢索器、自舉生成器、基于人類喜好的評分器。大型語言模型增強檢索器將前五個最相關的頁面作為參考源,讓自舉生成器生成多個答案,最終評分器選擇最符合人類偏好的那個答案作為最終輸出。
除了WebGLM本身,唐杰團隊還提出了一個網絡增強問答系統的評估標準。該標準既包括參考文獻,也包括最終回答,衡量相關性、信息密度、真實性(無事實錯誤)、無害(無暴力、色情等信息)和社會偏見程度這五個維度。評估最終回答時,標準衡量流暢度、正確性、引用準確性、客觀性和冗余程度。根據評估結果,WebGLM的搜索結果雖略遜于WebGPT-175B,但比Perplexity.ai和WebGPT-13B表現更好。
項目地址:https://github.com/THUDM/WebGLM
論文地址:https://arxiv.org/abs//2306.07906
關鍵詞: