主流的大模型包括ChatGPT、Gemini、Cluade由于受Woke文化的影响,对内容有大量的审查过滤限制。另外在众多场合,也有对无审查大模型的需求。虽然在X(Twitter)、HuggingFace上也有开发者分享各种无审查的大模型。但由于大模型更新较快,很多无审查的大模型也未持续更新,导致Google、Perplexity搜索出来的基本上都是较陈旧的模型。个人也很难有精力去跟踪、评测无审查的大模型。
LLM Explorer 是一个专注大模型评测的机构,以帮助AI研究人员、开发人员和爱好者迅速找到最适合的本地推理模型为目标。
针对无审核的大模型,LLM Explorer推出了无内容审查大模型排行榜 UGI Leaderboard(Uncensored General Intelligence Leaderboard)。
UGI Leaderboard 通过评估模型处理和生成敏感或有争议主题的内容的能力,使用一组未公开的问题来维持排行榜的有效性并防止训练偏差。该评估侧重于两个分数:UGI 分数,衡量模型对未经审查信息的了解;以及 W/10 分数,衡量其参与有争议话题的意愿。
为维护排行榜的公平性,防止出现任何问题或批评,具体考核问题均予以保密。这种方法确保排行榜仍然是一个有价值的工具,可以在不影响道德标准的情况下比较各种大模型的功能。
UGI Leaderboard是目前市场上唯一一个专门针对无审核大模型评测的榜单,值得对无审核大模型由需求的从业者作为选择评估的重要参考。
官网:https://llm.extractum.io/list/?uncensored
Hugging Face:https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
转载请注明:乐无限 » UGI Leaderboard,无内容审查大模型排行榜