探索Yupp:重塑AI评估的创新平台

你有没有想过,如何才能知道哪个AI模型真正更适合你的需求?在AI技术快速发展的今天,Yupp作为一个新兴平台,正在改变我们评估和使用AI模型的方式。它不仅让普通用户能够轻松比较不同AI的表现,还通过独特的激励机制收集真实反馈,帮助AI开发者改进产品。最近,Yupp获得了a16z领投的3300万美元种子轮融资,引起了业界的广泛关注。那么,Yupp究竟是什么?它有什么特别之处?为什么能获得顶级风投的青睐?让我们一起来了解这个 promising 的AI评估平台。

随着AI应用深入各行各业,如何准确评估模型性能与提升用户信任成了当下亟待解决的难题。传统评测多依赖集中化机制,既难以覆盖多样化场景,也无法反映真实用户偏好;与此同时,模型"幻觉"问题频出,用户在选择时常陷入信息茧房。

在这一背景下,Yupp作为一家新晋平台,凭借其独特的众包模式和激励机制,正试图重塑AI模型的发现、比较与使用方式,并为AI评估领域带来一场范式变革。下面,我们将深入剖析Yupp的核心机制、技术亮点、团队背景及其对AI生态的潜在影响。

接下来,让我们详细了解Yupp的众包评估模式、VIBE评分系统、技术架构与发展愿景,看看AI与Web3交叉能带来什么新可能。

团队背景与融资:科技巨头经验加持

Yupp立足于解决AI领域长期存在的评估难题,致力于构建一个"去信任"(trustless)的AI反馈市场——让多元化的用户反馈在区块链和加密经济激励的保障下自由流通,从而形成一个可扩展、公平且透明的模型评估层。通过对高质量人工标注数据的激励分发,Yupp可以及时捕捉真实用户在不同场景下的需求和偏好,帮助AI开发者以迭代的方式优化模型性能。

项目由Pankaj Gupta(联合创始人兼CEO)和Gilad Mishne(联合创始人兼AI负责人)于2024年6月创立,首席科学家Jimmy Lin(滑铁卢大学教授)也参与了核心团队。三人早在2010年于Twitter共事,曾打造并优化大规模推荐与搜索系统,后在Google和Coinbase积累了丰富经验。

因为去中心化、数据价值透明化的愿景能够切中AI厂商对可信评估和用户参与的双重诉求,再加上核心团队的丰富履历,Yupp赢得了科技行业知名人士和顶级风投的高度认可。

上周,Yupp宣布完成3300万美元种子轮融资,A16z合伙人Chris Dixon领投,其他投资方还包括Google首席科学家Jeff Dean、Twitter联合创始人Biz Stone、Pinterest联合创始人Evan Sharp、Perplexity CEO Aravind Srinivas、斯坦福大学Dan Boneh、Chris Re、Nick McKeown和Balaji Prabhakar等45位知名天使及企业高管,以及Coinbase Ventures。

核心功能与用户体验:构建"AI议会"

作为一个中心化的AI评估平台,Yupp秉持"人人共享的AI(Every AI for everyone)"理念,让用户轻松发现、比较并使用最新的AI模型。与传统单一响应不同,Yupp针对每个提示同时返回两个(乃至更多)模型的答案,形成一个"AI议会"。这种设计不仅满足了用户对多样化选择的需求,更能有效甄别模型可能出现的"幻觉",帮助用户通过对比做出更明智的决策。正如Yupp CEO Pankaj Gupta所言,并排输出对于关注生成错误的用户尤为有益,因为他们可以借此交叉验证结果。

平台现已支持逾500款AI模型,涵盖文本与图像生成领域,包括ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama等知名模型,以及众多新兴模型。为进一步优化体验,Yupp还推出了"QuickTake"功能,可将冗长回复提炼为一条简洁的推文。

此外,Yupp高度重视用户隐私:所有聊天记录默认私密,除非用户主动公开;即使公开分享,也不透漏任何个人信息。用户可随时控制分享内容及范围。

经济模型与激励机制:数据劳动价值化

Yupp将免费使用与用户反馈结合,通过"Yupp积分"系统衡量模型使用情况。新用户注册秒获5000积分,后续可通过对模型回复打分、选择偏好并阐述理由来赚取更多积分。反馈质量越高,奖励越丰厚,确保用户可持续免费使用包括Claude Opus 4或OpenAI o3等高端模型。平台承诺,积分只增不减,且当前所有模型皆能免费体验。

在每次提问后,用户会获得两份模型回答,并通过反馈赢取"数字刮刮卡",奖励0~250不等的Yupp积分。每1000积分可兑换1美元,用户每日最高可提现10美元、月度最高50美元。积分支持兑换美元、欧元等20余种货币,合作伙伴包括Stripe、PayPal、Coinbase。同时,平台集成了Base Ethernet L2和Solana稳定币,为全球用户提供即时、免手续费的奖励。

正如Pankaj Gupta所说,用户产生的高质量反馈对于AI公司的模型微调与强化学习价值远超奖励本身。虽然用户月度收益或仅相当于几杯咖啡,但这些付费标注数据对AI迭代至关重要。

为激励更多人参与,Yupp还设立推荐奖励:推荐人获5000积分,被推荐人获1000积分;目前新注册用户可获5000积分,被推荐人额外获得2500积分。

Yupp VIBE评分:AI评估的新范式

针对现有排行榜透明度不足、公平性欠缺、评估数据获取不均等问题,Yupp推出了测试版AI排行榜和"Yupp VIBE (Vibe Intelligence Benchmark) Score"评分系统。该系统汇聚全球用户在自然交互中产生的偏好数据,力求提供稳健且可信赖的评估结果。

Yupp的评估原则包括:

  • 稳健性(Robust):保证代表性(覆盖多样场景)、真实性(反映用户关切)、抗作弊性(抵御恶意行为);
  • 可信赖性(Trustworthy):公平中立(对模型不偏不倚)、透明公开(详细披露排名算法)、严谨科学(遵循评估规范)。

平台不仅收集二元偏好,还鼓励用户指出回复的优缺点(如"切中要害"、"速度快"、"风格佳"等),并根据用户的年龄、教育、职业等信息进行分群分析,展现不同群体的偏好差异。

在技术层面,Yupp正在探索利用区块链、密码学原语及零知识证明等技术,确保评估过程的公正、透明和可验证。同时,平台已与专业AI数据提供商合作,通过档案验证和多层质量检测校准评分员,清除恶意数据。

近期榜单已更新,展示了GPT-4.5 Preview、Claude Opus 4、Claude Sonnet 4等模型的VIBE得分及其胜率、不喜欢率、速度、延迟、上下文窗口和成本指标。

发展历程与未来展望

Yupp于2025年6月13日正式上线,前期进行了六个月内部测试。自上线以来,产品持续迭代:

  • 多模态支持:接入Dall-E、Flux、Stable Diffusion、Luma Photon、Google Imagen 4等模型,并支持用户上传图像/PDF提问;
  • 交互方式拓展:新增语音输入与语音朗读功能;
  • 模型更新:陆续引入DeepSeek R1/V3、Mistral Small 3、OpenAI o3-pro、Hermes 3、Amazon Nova Pro v1、Microsoft Phi系列及"MAX模型"类别;
  • 实时信息:将在线查询请求路由至Perplexity和Google Gemini Live,并附带超链接引文;
  • 支付升级:新增美国PayPal、Venmo提现及24种货币PayPal支持;
  • 分享导出:支持格式保留的复制、PDF/文本/Markdown导出,按需分享单条回复或整段对话;
  • 社区活动:举办"AI提示挑战赛"等活动,奖品最高达数万积分;新增个人资料页、AI自动生成的聊天名称等功能。

Yupp的使命是"赋能人类塑造AI的未来"。Pankaj Gupta认为,AI发展需要每个人的参与与贡献。通过多视角AI回应和用户反馈,Yupp不仅助力用户更好决策,也为AI进化提供源源不断的动力。

值得一提的是,Yupp的主要竞争对手之一是开放AI模型评测平台LMArena(网址:https://lmarena.ai/), 该网站在AI业内人士中非常受欢迎,但该平台目前正处于商业化探索阶段,并没有借用区块链技术对用户参与提供直接的物质奖励或积分激励机制。

Yupp以众包模式、激励机制与真实用户偏好驱动的评估系统,开辟了AI评估的新路径。它不仅为用户提供免费、多样的AI互动体验,更将用户反馈转化为高价值训练数据,推动模型持续优化。凭借经验丰富的团队和顶级资本加持,Yupp有望在未来AI生态中扮演关键角色,实现"人人皆享AI,人人塑造AI"的愿景。

当然,对于刚刚上线的Yupp来说,前路依然充满挑战。如何在用户规模扩大后继续保持数据质量,如何有效防止作弊行为,以及如何在商业化和用户激励之间找到平衡点,这些都是Yupp团队需要持续思考和解决的问题。不过,凭借其创新的模式和强大的团队支持,Yupp无疑已经为AI评估领域带来了新的可能性,值得我们持续关注。

相关问答

1. Yupp是什么?

Yupp是一个AI评估平台,通过众包模式和激励机制,让用户能够发现、比较和使用各种AI模型。它针对每个用户提示同时返回多个模型的答案,形成"AI议会",帮助用户通过对比做出更明智的决策。同时,Yupp收集用户反馈来评估AI模型性能,为开发者提供优化方向。

2. Yupp的创始人是谁?他们的背景是什么?

Yupp由Pankaj Gupta(联合创始人兼CEO)和Gilad Mishne(联合创始人兼AI负责人)于2024年6月创立,首席科学家是滑铁卢大学教授Jimmy Lin。三人早在2010年就在Twitter共事,曾共同打造和优化大规模推荐与搜索系统,后来分别在Google和Coinbase积累了丰富经验。

3. Yupp获得了多少融资?由谁领投?

Yupp完成了3300万美元的种子轮融资,由A16z合伙人Chris Dixon领投。其他投资方包括Google首席科学家Jeff Dean、Twitter联合创始人Biz Stone、Pinterest联合创始人Evan Sharp、Perplexity CEO Aravind Srinivas等45位知名天使及企业高管,以及Coinbase Ventures等机构。

4. Yupp的核心功能是什么?

Yupp的核心功能是让用户能够同时比较多个AI模型的回答,形成"AI议会"。平台支持超过500款AI模型,涵盖文本和图像生成领域。用户可以通过对模型回答进行评分和反馈来赚取积分,这些积分可以兑换现金或用于免费使用高端AI模型。此外,Yupp还提供"QuickTake"功能,可将长回复简化为简洁推文。

5. Yupp的"AI议会"是什么概念?

"AI议会"是Yupp的一个核心概念,指的是平台针对每个用户提示同时返回两个或更多模型的答案,让用户可以并排比较不同AI的表现。这种设计不仅满足用户对多样化选择的需求,还能帮助识别模型可能出现的"幻觉"问题,让用户通过交叉验证做出更明智的决策。

6. Yupp的积分系统如何运作?

新用户注册即可获得5000积分,之后可以通过对模型回复打分、选择偏好并阐述理由来赚取更多积分。每次提问后,用户可以通过反馈获得"数字刮刮卡",奖励0-250不等的积分。每1000积分可兑换1美元,用户每日最高可提现10美元、月度最高50美元。积分支持兑换20多种货币,平台还集成了Base Ethernet L2和Solana稳定币,提供即时、免手续费的奖励。

7. 什么是Yupp VIBE评分系统?

Yupp VIBE (Vibe Intelligence Benchmark) Score是Yupp推出的AI评分系统,通过汇聚全球用户在自然交互中产生的偏好数据,提供稳健且可信赖的AI模型评估结果。该系统注重稳健性(覆盖多样场景、反映真实用户关切、抵御恶意行为)和可信赖性(公平中立、透明公开、严谨科学)。平台不仅收集二元偏好,还鼓励用户指出回复的优缺点,并根据用户特征进行分群分析。

8. Yupp支持哪些AI模型?

Yupp目前支持超过500款AI模型,涵盖文本与图像生成领域。包括知名模型如ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama等,以及众多新兴模型。在图像生成方面,平台已接入Dall-E、Flux、Stable Diffusion、Luma Photon、Google Imagen 4等模型。平台还陆续引入了DeepSeek R1/V3、Mistral Small 3、OpenAI o3-pro、Hermes 3、Amazon Nova Pro v1、Microsoft Phi系列等新模型。

9. Yupp的主要竞争对手是谁?

Yupp的主要竞争对手之一是开放AI模型评测平台LMArena(网址:https://lmarena.ai/)。该平台在AI业内人士中非常受欢迎,但与Yupp不同的是,LMArena目前正处于商业化探索阶段,没有采用区块链技术,也不提供直接的物质奖励或积分激励机制来鼓励用户参与。

10. Yupp的发展历程有哪些重要节点?

Yupp于2024年6月由Pankaj Gupta和Gilad Mishne创立,经过六个月内部测试后,于2025年6月13日正式上线。自上线以来,平台持续迭代,增加了多模态支持、语音输入与朗读功能,引入了更多AI模型,增加了实时信息查询功能,升级了支付系统,改进了分享导出功能,并举办了社区活动如"AI提示挑战赛"等。近期,Yupp还完成了3300万美元的种子轮融资,由A16z领投。

TAG: