
-
你好星識(shí) 新一代AI智能文本工作空間
你好星識(shí)(HiStella)是新一代AI智能文本工作空間,將知識(shí)庫(kù)、文檔、表格、PPT、錄音紀(jì)要等多種辦公功
-
AudioGenie – 騰訊AI Lab推出的多模態(tài)音頻生成工具
AudioGenie是騰訊AI Lab團(tuán)隊(duì)推出的多模態(tài)音頻生成工具,能從視頻、文本、圖像等多種模態(tài)輸入生成音
-
C-Eval 一個(gè)全面的中文基礎(chǔ)模型評(píng)估套件
C-Eval是適用于大語言模型的多層次多學(xué)科中文評(píng)估套件,由上海交通大學(xué)、清華大學(xué)和愛丁堡大學(xué)研究人員在20
-
FlagEval 智源研究院推出的FlagEval(天秤)大模型評(píng)測(cè)平臺(tái)
FlagEval(天秤)是北京智源人工智能研究院(BAAI)推出的科學(xué)、公正、開放的大模型評(píng)測(cè)體系及開放平臺(tái)
-
AGI-Eval AI大模型評(píng)測(cè)社區(qū)
AGI-Eval是上海交通大學(xué)、同濟(jì)大學(xué)、華東師范大學(xué)、DataWhale等高校和機(jī)構(gòu)合作發(fā)布的大模型評(píng)測(cè)社
-
SuperCLUE 中文通用大模型綜合性測(cè)評(píng)基準(zhǔn)
SuperCLUE 是針對(duì)中文大模型的綜合性評(píng)測(cè)基準(zhǔn),能全面評(píng)估模型在多個(gè)維度上的性能表現(xiàn)。SuperCLU
-
CMMLU 一個(gè)綜合性的大模型中文評(píng)估基準(zhǔn)
CMMLU是綜合性的中文評(píng)估基準(zhǔn),專門用在評(píng)估語言模型在中文語境下的知識(shí)和推理能力,涵蓋從基礎(chǔ)學(xué)科到高級(jí)專業(yè)
-
LLMEval3 由復(fù)旦大學(xué)NLP實(shí)驗(yàn)室推出的大模型評(píng)測(cè)基準(zhǔn)
-
LMArena 加州大學(xué)伯克利分校推出的創(chuàng)新AI模型評(píng)估平臺(tái)
LMArena是加州大學(xué)伯克利分校推出的創(chuàng)新AI模型評(píng)估平臺(tái),基于讓用戶對(duì)不同AI模型的回答進(jìn)行匿名投票,衡
-
HELM 斯坦福大學(xué)推出的大模型評(píng)測(cè)體系
HELM全稱Holistic Evaluation of Language Models(語言模型整體評(píng)估)