秘塔AI推出“极速”模型,响应速度达400 tokens/秒,AI搜索实现“秒回”

boyanx2周前技术教程2

智东西AI前瞻(公众号:zhidxcomAI)

作者 | 江宇

编辑 | 漠影

智东西AI前瞻5月27日消息,秘塔AI搜索今日宣布推出其全新“极速”模型,实现了在单张H800 GPU上高达400 tokens/秒的响应速度,承诺用户在大部分问题上都能体验到2秒内完成的“秒回”搜索体验。

秘塔AI搜索团队表示,实现这一速度提升得益于对GPU的kernel fusion以及CPU的动态编译优化。这些技术改进旨在优化数据处理流程,以期缩短生成答案的时间。

此次技术升级在追求速度的同时,也关注答案的准确率和逻辑清晰度。

秘塔AI搜索官方提供了两个测试示例:“为什么撕拉片突然火了?”这类快速响应型问题,以及“请总结2015年至今关于CRISPR-Cas9在治疗遗传性疾病中的研究进展”这类需要一定信息整合的问题,分别展示了“极速”和“极速·思考”两种模式下的表现。

为了让用户能有一个直观的感受,秘塔AI搜索还提供了一个限时开放的测速站点(kuai.metaso.cn)。用户可以通过这个站点输入问题,体验新模型的响应速度。

新模型究竟表现如何?智东西AI前瞻第一时间在测速站点进行了体验,以下几个维度或许能帮助你更全面地了解秘塔AI“极速”模型的实际表现:

1. “计时挑战”:感受“秒回”的速度

日常问题,秘塔AI能多快搞定?试试下面这道逻辑题。

  • “两人从100枚硬币中轮流取1-5枚,取最后一枚者胜。请问先手第一步取几枚硬币才能确保必胜?”

测评表现:在实测中,秘塔AI搜索在 2.42秒 内完成了该问题的解答,响应速度达 366 token/秒,总输出字数886 token,并明确指出先手应取1枚硬币以确保必胜。这展现了它在复杂逻辑推理中快速给出有效策略的能力。

2. “刁钻问题大考验”:测试AI的逻辑与整合

除了速度,新模型在处理复杂逻辑和整合信息方面表现如何?

  • “请解释一下‘薛定谔的猫’思想实验,并谈谈它对量子力学的意义。”

测评表现:仅用 1.86秒,秘塔AI搜索就完成了对思想实验的阐述,响应速度高达 353 token/秒,输出658 token。它不仅清晰解释了该实验如何揭示量子叠加态,还深入分析了其对波函数坍缩和量子实在性等核心量子力学概念的影响。“极速”模型在快速理解并阐述复杂物理原理方面表现出色。

3. “效率实验”:AI能否助你高效规划?

面对需要多方信息才能得出结论的问题,AI搜索能否显著提升效率?

  • “下个月去日本东京旅行五天,请给我一个详细的行程规划,包括交通和特色美食推荐。”

测评表现:面对这一信息量大、要求具体规划的问题,秘塔AI搜索在 4.30秒 内就输出了长达1550 token的详细方案(响应速度达 360 token/秒)。这份方案不仅涵盖了五天的景点、交通和美食安排,还包含了住宿区域建议、交通卡使用提示乃至特色餐厅推荐,展现了它在处理复杂任务、整合多方信息并生成详细文本方面的效率与能力。

秘塔AI搜索此次推出的“极速”模型,无疑在追求AI搜索的响应速度上迈出了一步。从测试的逻辑题、物理概念逻辑推演到复杂的旅行规划,该模型展现出了在不同类型问题下快速生成答案的能力。

这种速度上的提升,会让用户在日常的信息获取和复杂任务处理中感受到更直接的便利。这不仅仅是技术参数的进步,更可能意味着未来AI搜索体验将变得更加流畅、即时,就像随手可得的智能助手一样。

相关文章

你抢不到的专家号,他们0.02秒就能挂一个

原标题:“专家号”凭空消失?黄牛抢号的速度是患者的3000倍守着时间卡点心仪的专家号却“秒无”着急的你是否想过去网上找“黄牛”试试看?南京警方调查有不法分子在超强算力“加持”下利用宝贵的医疗资源牟利他...

有了这款在线笔记 碎片化学习和剪藏都不愁

现在大家都忙得脚不沾地,想系统学习很难,碎片化学习就成了提升自我的重要方式。可零碎时间里学到的知识、看到的干货,要是没有好工具整理,很容易就丢了。这些年我测评过不少在线笔记软件,今天挑出几款真正能解决...

番茄小说打字录入员怎么申请?(番茄小说打字录入员官网)

番茄小说本身通常不会直接对外招聘单纯的打字录入员岗位,但如果想从事相关工作,可参考以下途径和方法来尝试申请:通过番茄小说合作方或外包公司1. 招聘网站搜索 ○ 在智联招聘、BOSS直聘、前程无忧等大型...

发现一个神器 让记录灵感变得如此便捷

作为一名内容创作者,找对记录灵感的工具能事半功倍。今天就给大家分享几款超实用的软件,其中话袋AI笔记的功能尤为亮眼,带你轻松告别灵感丢失的烦恼。 发现一个神器 让记录灵感变得如此便捷做自媒体、写文章,...

AI输入法越来越聪明,但我们打字反而变慢了

这两年很多人都换上了所谓“AI输入法”,不管是手机端还是电脑端,只要一打字,推荐词组就像开了外挂一样飞快弹出。一开始你觉得自己成了效率高手,几乎不用动脑,AI就能帮你预测下一句。但用久了你可能会发现一...

3D高斯泼溅,可输入视图量高达500,推理速度提升3倍,内存少80%

ZPressor能高效压缩3D高斯泼溅(3DGS)模型的多视图输入,解决其在处理密集视图时的性能瓶颈,提升渲染效率和质量。通过信息瓶颈原理,将视图分为锚点和支持集,利用交叉注意力机制压缩信息,显著降...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。