小白全新自研推理大模型O3网页版上线啦!上周预告一发,炸出许多技术粉,评论区小伙伴都很期待上线,现在终于可以告诉大家:O3网页版开始内测啦,而且是限时免费的哦!
这次不是普通升级,它是问小白自研的新一代原生Agent大模型。
简单来说:它就像你的私人调研助理一样,收到你输入的任务后,O3会进行深度推理,然后自己上网查找最新的相关信息。根据检索到的信息,O3会继续思考并进行下一轮的搜索,必要时还会调用不同的工具。最终,经过多轮推理、搜索,它会交付给你一份图文并茂的回复内容。
web端和手机端位置有所不同,具体请看以下图示:
web端,打开「问小白」网页版访问
手机端周五上线,下载「问小白」App
目前小白大模型处于内测阶段,已开放给30%的用户体验。您可以查看自己是否在被选中的体验名单中,后续我们将逐步扩大覆盖范围。
2.我们想解决什么问题?你有没有遇到过这样的情况:
问个简单问题,AI答得支离破碎
想要一个完整的答案,结果要追着AI问好几次才能拼凑完整
看到一堆文字、数据但不知道重点在哪里
想要一个有温度的回答,结果全是硬邦邦的AI语气
小白大模型O3就是为了解决这些问题而生的。
3.为什么选择小白大模型O3精准可信:边想边查,循环验证,告别 AI幻觉
传统AI:往往依赖单次搜索生成答案,容易遗漏关键信息或产生错误。
小白O3:多想一步,更准一分。多轮验证,自动交叉核对多个可信数据源,确保答案的完整性和准确性。
🔍 案例对比:输入:"小米手机2024年Q1销量"O3:直接输出完整报告:4080万台出货量(IDC数据),同比增长12.3%,东南亚贡献60%增量传统 AI:需要你先问"具体数据",再问"增长率",最后还要问"地区分布"...深度高效:快速生成研报级内容,一答胜多文
传统AI:只列要点不挖深度,浅尝辄止
小白O3:在极短时间内输出结构清晰、信息饱和的答案,覆盖宏观趋势、细分要点和未来展望,避免碎片化信息。
🔍 案例对比:输入:"欧盟2030碳关税应对策略"O3:输出完整策略:① 三步战略路径 ② 行业影响矩阵表 ③ 实施时间轴。传统 AI:需要你先问"政策内容",再问"影响分析",最后还要问"时间安排"...需多次拼凑。自然生动:人味儿满满,告别“AI味”,语言更鲜活
传统AI:干巴巴的数据堆砌,明显AI生成
小白O3:引入类比、情感与叙事节奏,读起来像真人写作
🔍 案例对比:输入:"写8000字科幻小说,关于冥王星外神秘行星"O3:完整的故事包括世界观设定、情节发展、科学细节嵌入传统 AI:只能总结或分段输出,干巴巴,明显 AI 生成图文联动:灵活适配呈现方式,展示更友好
传统AI:统一的文本输出,信息获取门槛高
小白O3:O3会根据问题类型智能选择最易读的展示方式,图片表格双加持,让你一眼抓住重点。
🔍 案例对比:输入:"4人4000块暑假行程"O3:智能匹配:景点推荐照片+行程规划表 + 预算分配饼图传统 AI:可能只列出零散选项✨小白大模型O3 = 减少追问、降低幻觉、提升决策速度的全能型AI写作与分析助手。
4.使用场景作为强大而灵活的AI大模型,O3能化身:
✓ 职场人的效率中枢
✓ 创业者的决策智囊
✓ 创作者的灵感协作者
✓ 生活家的全能助手
小白大模型O3给你的不只是答案,而是一次到位的完整解决方案。给大家整理了一些典型使用场景的懒人“提示词”,你可以根据自己的问题自由替换。
5.我们使用了什么技术
小白技术团队在训练原生Agent模型过程中,主要使用以下几种技术——1. 基于知识图谱的Agentic任务合成2. 端到端的Agent强化学习
具体来说,在任务准备阶段,我们的数据合成Agent(Data Synthesis Agent)会通过多轮网络环境交互,从网络环境中抽取知识图谱,随后生成复杂的代理任务(Agentic Task),并包含特定任务的评分准则(Task Rubrics)。
这些代理任务中,大多都是需要进行深度推理、多轮网络搜索以及复杂的工具调用才能完成的。这些复杂的代理任务随后被我们用于端到端代理强化学习中(End-to-End Agentic RL)。在端到端代理强化学习中,我们让Agent自由地与环境交互、调用多种工具来尝试解决任务,并记录下Agent与环境的交互轨迹(Agent Trace)。
在它完成任务后,我们使用任务生成阶段获得的评分准则(Task Rubrics)来给它的答案评分;同时我们还会通过比对交互轨迹与相关的知识图谱来评估“Agent在完成任务的过程中获取了多少必要知识”。
这两种评估分数会作为强化学习中的奖励信号优化Agent的行为,让他逐渐学会如何根据不同的任务调整搜索策略、调用合适工具并最终完成任务。
6.结语问小白的宗旨是:以最可及的方式,让先进的 AI 技术服务于最广泛的人群。未来,我们将持续推出更轻量且高效的推理模型。
小白诚邀各位精神股东一键三连,给问小白技术团队一些鼓励,感谢~🙏