更新时间:
新智元报道
编辑:编辑部 HYZ
【新智元导读】最近,奥特曼豪掷数千万美金购买域名、组建AI浏览器团队,展现了互联网的时代轮回,标志着AI互联网时代的来临。AI改造互联网,首当其冲的就是搜索引擎。几乎与奥特曼的动作同步,纳米搜索的出现,代表着我们正式进入「多模态内容创作引擎」的搜索引擎3.0时代。
谁懂啊,就在昨晚的发布会上,周鸿祎竟自上阵出演了一部短剧,剧情可谓是「亮瞎」了所有人。
拒绝了山姆·奥特曼追求的女主,回国后被迫变身扫地阿姨。
在男主小帅训练大模型受阻被刁难时,正扫地的女主瞟了一眼就指出:「这个bug,是因为预训练过拟合了。强化学习的奖励模型参数也设置得不对,这样就导致大模型的指令遵循很差,你堆再多的训练语料也没有用……」
随后,男主、女主和老周合伙成立的公司,立马引起了山姆·奥特曼和马斯克的注意。
前者打来电话求婚,表示CoE架构的AI搜索才是AI的未来,但惨被拒绝。马斯克则主动奉上域名X、出资5000亿,还贡献出自己刚建的10万卡H200集群……
如此别树一帜的发布会,周鸿祎到底卖的是什么关子?
原来,他已经做出了下一代AI搜索产品,希望颠覆传统搜索、改变国内市场格局,甚至成为下一代互联网产品。
这个产品,可以说是开启了AI搜索3.0时代。
搜索引擎,奥特曼都在重金布局
曾经,在互联网方兴未艾之时,率先崛起的便是以搜索领域为首的科技巨擘。
如今,在AI互联网时代,也同样如此。
随着AI对互联网的不断重塑,不管是微软谷歌这样的老牌巨头,还是OpenAI、Perplexity这样的明星初创,无一不在AI搜索领域展开了自己的布局。
这点,在后发制人的OpenAI身上尤为明显。
11月初,ChatGPT正式推出AI搜索体验,成为一款搜索引擎;11月中,奥特曼正式官宣ChatGPT新域名——chat.com,据称为此豪掷了1500-2000万美金。
11月底,OpenAI又被曝出正在紧锣密鼓地开发一款产品,将AI聊天机器人和网络浏览器相结合。
将谷歌的两员大将——Chrome团队创始成员Ben Goodger和负责Chrome浏览器的工程副总裁Darin Fisher,双双收入麾下,不难看出OpenAI必成的决心。
搜索引擎的1.0、2.0和3.0时代
不过,尽管发展AI搜索已是全球AI圈的共识,然而对于「AI时代的搜索」究竟该是什么模样,业内仍然是众说纷纭。
就目前的状况而言,我们可以根据其中的「AI含量」将路线简单分为三个阶段——1.0(网页搜索引擎)、2.0(答案生成引擎)、3.0(多模态创作引擎)。
所谓1.0时代,就是在网页搜索引擎上添加AI功能模块,以谷歌的AI Overviews为代表。这其中的AI含量最低,会存在信息质量参差不齐,深度信息获取困难等问题。
接下来的2.0时代,则通过AI对搜索引擎进行了更深入的改造。比如,Perplexity和360AI搜索,就是这类答案生成引擎。它们能够精准理解用户需求,提供个性化、智能化的搜索答案。
美中不足的是,它们无法提供更强大的多模态搜索和输出能力,给出的答案也不易改写,导致生成的内容有时并不适配用户的最终需求场景。
而到了搜索引擎的3.0时代,搜索将不仅仅局限于搜索总结,而是一切皆可生成的状态。不论是图片、文档、语音、视频,一个搜索引擎全能搞定。
在这一阶段,就是以纳米搜索为代表的AI原生「多模态创作引擎」了。
谈到这里,就不得不抛出这样一个刨根问底的问题:用户想要的,究竟是什么样的搜索?
从移动互联网到AI互联网,我们正站在一个历史性转折点。两者之间最为根本性的变化,就是AI互联网是一个生成式的互联网。
过去,传统搜索引擎是被动的、静态的。用户输入关键词之后,获得的是一堆冰冷的链接,然后开始漫无目的的浏览。
但对很多用户来说,搜索并不是需求的终点,而只是需求的起点。
想象一下,未来的搜索引擎如同一个智能助手,不仅可以理解你的需求,还可以为你生成文字、图片、语音甚至视频。
甚至更大胆设想一下,下一个搜索可能不只是「下一个搜索」,还可能是「下一个抖音」。而这种「AI时代的抖音」必然是生成式的。
有趣的是,国内已经有成形的产品,在践行这个理念了!
这个产品,就是纳米搜索。
PC端:N.cn
App端:纳米搜索
AI搜索,是生成式的搜索
首先,纳米搜索继承了360AI搜索在AI搜索领域积累的丰富经验和技术沉淀,彻底抛弃了传统搜索的「蓝色链接」,转而采用原生的生成式AI答案引擎直接生成答案。
更重要的是,作为搜索引擎,它会在回答中附带引文来源,这使得每一句回答,都有据可依。
而接下来我们会看到,纳米搜索首先亮相的功能,就直接颠覆了我们对于「搜索」的想象。
一切皆可搜
在输入方式上,纳米搜索可以说是「非常AI」了。
上至80岁老人、下至5岁小朋友,不管是说话、拍照还是拍视频,都可以进行搜索。
其中,针对特定高频的功能——计算卡路里、美食评论、发朋友圈、MBTI、CP合拍感、今日运势等,纳米搜索还有单独的模式。
比如爆火的计算食物卡路里功能,只要对着食物拍一张,就能得出卡路里总量了。对于减肥人士来说,这个功能可真是太实用了。
给它一些食材,它还能告诉你菜品种类,以及怎样做出一份健康的减脂餐。
一切皆可学
搜索只是手段,搜完后,还能对内容进行分析。
在纳米搜索中,无论是图片、书还是视频,它都能给我们读出来,还是以完全不一样的方式。
而且在读图、读PDF、读视频的这个过程中,纳米搜索还对信息进行了知识蒸馏,进一步进行了分析理解。
比如,我们把张朝阳开讲的一节物理课,配上李雪琴的声音。
直接就整出个脱口秀版物理课,开头就是一个爆梗,结尾还能整个call back。
「这磁场一变,哈密顿量也跟着变,本来是对角的,结果现在变成非对角的了。就像一个好好站着的人,突然歪着身子了,变得贼复杂。」
一切皆可写
用户搜出来的知识和文档,它可以进行改写、润色、加工。
看起来费时费力的长篇文章、报告和视频,是打工人不能言说的痛。
纳米搜索,则完全帮助打工人解决了这些问题。
只要上传文件,它就能帮着突出重点,高效总结,无需了解每一处细节,即可掌握精髓。
把链接放进搜索框,还能实现视频转文字。无论想要的是简介、全文还是重点,纳米搜索都可以信手拈来。
甚至,视频内容还能快速转换成脱口秀、评书、悬疑、直播带货形式的文字和视频。
对于短视频时代来说,这些功能实在太令人兴奋了!用户的创作门槛将大幅降低,创作效率噌噌up。
举个例子:「根据这两个人的外貌特征,他们适合拍一部什么样的正能量短剧?」
纳米搜索改写的短剧剧本,可以说是爆笑如雷了:「一个潮流外套加身的科技狂想家,偶遇身着经典红杉、沉稳如山的科技界大师,他们将如何携手书写一场从青涩到辉煌的蜕变传奇?」
一切皆可创
正如在开篇提到的,纳米搜索给出的结果,可以直接变成下一步的工作内容——对个人,可以转视频;对工作,可以转PPT、转报告。
并且,还能生成带货、口播、教学等数字人视频,甚至把视频翻译成多语言版本也不在话下。
接下来,老周直接化身主播,带货面膜了。
整个操作流程非常简单,上传一段单人原声视频,再输入一段带货文案,不出几秒红衣教主也能电商带货了。
这样,就真正做到了「一切皆可视频」,无论是在博客、微博还是抖音,只要有想法,我们就可以迅速生成奥特曼/马斯克/罗永浩/李雪琴风格的视频。
这,可谓是对人真正的解放和赋能。
而动作的开始,仅仅是一个搜索而已。
此前,受益于Gemini 1.5 Pro谷歌的NotebookLM,可以把文本、视频、PPT、录音等一键转为幽默风趣的播客,直接在国外掀起一股狂潮。
前OpenAI联合创始人Andrej Karpathy只用了两个小时,就创建了10集长度的「历史谜团」播客,大赞这个产品让自己想到了ChatGPT时刻。
连OpenAI CEO奥特曼也称赞NotebookLM是一款很酷的产品。
现在,我们不仅有了堪称国内版的NotebookLM,而且纳米搜索在PC端实现的动画效果、解说配音、字幕制作,也开始紧锣密鼓地向App端迁移了,实在令人期待。
AI搜索的护城河
Demo很酷炫,AI搜索很有前景,却并不是人人都能做的。为什么这么说?
AI搜索,从根本上来说还是AI定义的搜索。数据、算力、算法三要素,构成了AI搜索的护城河。
从数据层面上讲,动辄就需要投入百亿级资金去构建智能索引库,才能保障AI搜索准确性、时效性。
而且,为了弥补LLM幻觉问题,还需要借助RAG、工具使用等方式。
但光有这些技术,并不意味着能做好AI搜索。因为就算法层面上来讲,AI搜索≠大模型+搜索。
本质上讲,LLM+RAG就是用搜索引擎对LLM做「检索增强」和「知识校正」。
当用户询问一个问题时,大模型会先把问题传递到搜索引擎中,然后将搜索返回的网页遍历一遍,最后根据问题和网页内容推理出答案。
这种看似简单的方案,其实暗藏两个致命的问题。
传统搜索引擎追求点击转化率(CTR),答案往往倾向于点击率高的网页,而非准确的答案。
比如,此前被网友玩坏了的谷歌AI Overviews,在回答「石头怎么吃」和「如何不让芝士从披萨上滑落」时,直接被Reddit网友的搞笑热帖带入坑,堪称AI版的「答非所问」。
不难看出,搜索引擎返回的结果往往包含大量「噪声」,会把大模型结果带偏。
另外,LLM缺少是非分辨的能力。
面对复杂问题时,搜索结果往往是众说纷纭,没有专为搜索任务训练的LLM,经常被绕得团团转,最后给出了自相矛盾的答案。
所以,真正的AI搜索,远比大模型+搜索这个简单组合要复杂得多。
与很多AI搜索引擎的「单兵作战」不同,纳米搜索背后的360则是走的「AI生态」全开放道路。
技术层面,360首创了CoE(Collaboration-of-Experts,专家协同)技术架构,让多个大模型组队分工协作、并行工作,执行多步推理。换句话说就是让多个模型组成了一个「专家智囊团」。
其中,每次查询不仅调用多个模型,而且进行了多次调用,通过CoT(思维链)强化了推理过程。
值得一提的是,CoE采用了与OpenAI o1同样的技术原理,但它的诞生要比o1早了近2个月的时间。
基于CoE架构,360开放的AI搜索等明星产品吸引了包括BAT在内的大厂,以及智谱AI、月之暗面、MiniMax等AI初创公司的合作。
通过集各家所长,打造出以80.4测试总分大幅超越GPT-4o(69.22分),媲美o1,且在11个能力维度上全面领先的混合大模型。
基于CoE架构,360又率先在产品上搭载了,能让AI在解答问题时模拟人类思考过程的「慢思考」模式。
比如问它「为什么洗澡时会觉得自己唱歌格外好听」时,AI就会从声学环境、身体状况和心理状态等方面,对问题进行拆解并逐一分析。
在算力层面上,AI推理对算力需求更大。
360智算中心拥有国内为数不多的万卡GPU算力集群,100+数据中心,10W+服务器,为全球200多个国家的15亿用户提供持续服务。
除了算力算法数据之外,AI原生,则是AI搜索对于传统搜索引擎的护城河。
真正的AI搜索,需要从底层重构每个环节,正如造车一样,不是说在马车上安个引擎就能叫汽车。
既然称之为「原生」,那便是基于AI打造、用AI重构搜索的每一个链路,要让AI在搜索长处充分发挥出来。
比如,在意图识别、任务路由、CoE专家协同推理、构建AI工作流,这些环节都对传统搜索引擎产生了质的变革。
最后,想要在AI搜索领域站稳脚跟,还需要有强大的生态支撑。
360在这方面具备了天然的优势,旗下桌面(安全卫士)、浏览器、搜索引擎,构成了三大入口。入口之间相互依托形成具有协同关系的产品生态,互相带动,为纳米搜索的长期增长提供了稳定支撑。
截至目前,纳米搜索的「同胞兄弟」——360AI搜索月访问量近3亿,月活跃用户近1亿,已成为全球最大AI原生搜索引擎;如果把基于传统搜索改造而来的AI搜索也算上,则位列全球第二大AI搜索,仅次于New Bing。
要知道,这种生态优势并非短期就能建立,这也是为什么很多新玩家难以真正在此赛道中打开市场的原因之一。
从纳米搜索身上可以看到,搜索的边界正被重新定义,而「搜学写创」则赋予了AI搜索新的生机。
这种全链路的能力,让纳米搜索成为了信息获取的入口,更成为了创意激发的平台、生产力提升的工具。
随着多模态大模型的来临,图片、声音、视频、论文、PPT、软件界面都可以被大模型理解和操纵,搜索跟大模型的结合变成了1+1>2。
要让AI产品真正用起来,多模态大模型跟搜索引擎的原生结合是必经之路。
而现在,纳米搜索或许代表着AI搜索的演进方向,将为未来互联网的图景留下浓墨重彩的一笔。
未来AI互联网时代进一步的发展方向,从中也可窥见一斑。