参观美术馆时,在“腾讯元宝”APP上输入墙上作品的拍照,用户随即会收到关于作品的更多详尽信息:这幅作品是谁创作的,有怎样的寓意……这是用户日常使用腾讯大模型APP的一个案例。
日前,腾讯宣布旗下混元大模型全面升级,基于腾讯混元大模型的APP“腾讯元宝”正式上线。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,腾讯元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个人智能体等玩法。
已有小程序为何推APP
大模型AI赛道非常火热,但对很多普通用户来说,依然“无感”。
腾讯云副总裁、腾讯混元大模型负责人刘煜宏对此解释,一是大模型技术还处于非常早期的阶段,满打满算到现在也就一两年时间,产品成熟度不足,在产业领域落地能力、离用户需求等方面,和场景匹配度还比较低。
二是对用户而言,认知方面也还不够,大家都在探索。很多人谈到大模型应用,第一场景还是私人客服,非常窄。过去一年多,腾讯把内部几百个应用接入大模型,根据小程序端看到的用户使用场景发现,大家主要还是把大模型当成搜索来用,其余则是辅助编码、辅助文本的提炼总结。此外画图或者写创作文案、营销文案等,都是比较窄的探索。
针对这些问题,基于腾讯混元大模型的APP“腾讯元宝”上线,一方面,整个技术架构做了较大升级,相比过去的参数量大了,从千亿级别升到万亿级别,从之前的稠密模型升级成为混合专家(MoE)模型。喂给它的知识含量也高了很多,特别是在逻辑层面,过去大模型经常有幻觉,这方面已经取得了很大进步。
刘煜宏说,大模型一般不会对实时知识做出反应,对新闻类时事类的知识也要很长一段时间,腾讯现在可以让大模型更了解时事,比如问它现在的天气,甚至交通都能够实时告知。
另一方面,腾讯混元256k长文模型已经向企业和个人开发者开放,能“读懂”数十万字的长文。这一能力也在元宝中上线。“一些大模型有支持千万文字的能力,这个其实在技术上不是问题,但对于大部分用户意义不大,256k 的长度已经足够支持99%的需求。”
刘煜宏解释, “我们希望元宝APP能够变成一个全能AI助手角色,不管我练练口语,或者去西班牙或者土耳其,‘超能翻译官’都能帮忙做翻译,也可以帮用户写邮件写报告”。
他说,希望把元宝APP做成放到口袋里的好助手,除了很好用也非常好玩,可以用它来做各种各样创意的创作、画图、儿童绘本,和小孩一起玩,也可以用它来口语陪练,旅游、做菜、健身乃至工作中,都可以给出好的建议。
语音能力之外,腾讯还在法律、金融、医疗等行业推动行业大模型,带动腾讯混元技术覆盖更多行业。
商业化还处于早期探索
有意思的是,也有部分实时资讯,并不能在元宝APP上显示。刘煜宏对此解释,其实有时候并非技术问题,而关乎诸如版权等其它问题,比如关于股价查询。目前腾讯也在沟通中,希望能在未来接入更多内容。
提到国内大模型发展情况,就不可避免进行国内外比较,在模型评测中,中国大模型一些指标反而超越国外。
刘煜宏就此回应道,中国的优势在于工程能力很强。有相关报告显示,华人在专利、论文等占了绝大多数,其实已经具备能力做更底层的创新和突破。
同时,国内还有生态优势,表现在应用特别火,很多领域里国内做应用做得更好,从应用层面反过来驱动底层的创新和演进。
关于商业化,各个AI助手都说现阶段谈商业化比较早。对于腾讯元宝App来说,是否也考量过如何实现商业化?
刘煜宏对此表示,大模型应用确实还处于早期,谈商业化确实太早,现在整体处于摸索阶段。接下来,腾讯会把大模型的能力开放给到很多产品,比如腾讯会议、腾讯文档、广告等等,这些应用有自己的商业化路径。腾讯云也会支持企业用户做不同行业大模型的构建,帮助企业降本增效,再实现商业化。
“人工智能和人脑有什么区别?从成本来看,现阶段人工智能还是非常昂贵的,先不说训练,推理一次也要消耗不少资源。同等计算量的情况下,人脑更便宜,一天可能吃个鸡蛋就能够维持很久,很低功耗。整个深度学习或者神经网络都是模仿人脑,在这方面还是要和人脑好好继续学习。”刘煜宏幽了一默。
刘煜宏说,腾讯通过MoE架构,有一个相对更好的架构降低功耗,比过去稠密大模型激活的参数量更少,同等效果情况下成本会更低。
南方+记者 郜小平