商汤日日新大模型90天大升级！CEO现场整活，主打突破想象力

2023-07-08 21:18:05 来源: 和讯

商汤“日日新”AI大模型，如其名，真的做到了日日新。

这不，从发布到现在，时隔仅仅3个月，商汤便正式宣布：

(资料图)

商汤日日新（SenseNova）大模型体系全面升级。

那么这个升级版本又有哪些优化？

话不多说，直接上结果。

例如基于日日新的千亿参数语言大模型商量2.0（SenseChat），在三个全球权威测评基准中的表现，均超越了ChatGPT：

△各大语言模型在MMLU、AGIEval、C-Eval三个评测基准中得分情况

除此之外，基于日日新的其它各大AIGC平台，这次也一口气也都来了个大升级：

秒画3.0（SenseMirage）：参数量提升至70亿量级，实现专业摄影级图片细节刻画。

如影2.0（SenseAvatar）：语音和口型流畅度提升30%以上，实现4K高清视频效果。

琼宇2.0（SenseSpace）：空间重建效率提升20%，渲染性能提升50%。

格物2.0（SenseThings）：渲染精度大幅提升，对物品纹理及材质的还原达到毫米级精细度。

在现场，商汤CEO徐立也拿着秒画3.0搞起了花活：

人没去CVPR 2023现场领奖（商汤斩获今年最佳论文），那就直接让秒画来生成。

不会弹吉他、不会画画，没关系，继续生成：

咱就是说，城会玩儿了。

那么全新升级的日日新，更多产品的具体表现如何？我们继续往下看。

不只是超越了ChatGPT这么简单

让老子和孔子对话

整体来看，商量的模型基础能力在2.0版本有了大幅的提高，这点我们从上文提到的性能超越ChatGPT便可有直观感受。

在模型的体系方面，商汤除了推出商量2.0（SenseChat XL）之外，还推出了一个商量S版（SenseChat S），也就是小模型版本。

徐立便在现场展示了用这两个模型展示了一波“孔子对话老子”的情景：

在语言方面，它新增了一些地区语言，例如阿拉伯语和粤语等；以及支持简体中文、繁体中文、英语等多种语言交互。

同样是这场“孔子对话老子”，粤语版本是这样的：

同时，商量2.0还突破了大语言模型输入长度的限制。

例如给它一个指令：将超长的英文文本总结为中文概要，商量2.0便可立即执行这样复杂的任务。

不仅如此，用户还可以基于此进一步进行多轮对话：

最后，商量2.0还发布了一个“外挂”——知识库挂载：

无需训练模型，就可以快速融合知识生成；搭配企业知识库可以快速解决相关领域问题。

生成摄影级图像，提示词可以自动补充了

在文生图方面，商汤的秒画升级到了3.0版本，从功能升级的内容上来看，主打的就是一个“突破想象力”。

例如在轻量级方面，现在每个人都能通过拖拽的动作，在10分钟内微调模型，并且定制化个人专属的生成AI。

我们在上面提到的徐立“搞花活”便是个很好的例子。

在“智能化”方面，根据提示词（prompt）来生成AI绘画作品不会再变得很繁琐，因为现在就连提示词都可以自动补充了。

以往我们想让AI生成一条龙，可能就会输入“中国龙”、“蓝色摆件”、“珠宝风格”，但往往由于提示词过于简单，并不能达到特别精细的效果。

而现在，同样是只输入这三个短语，秒画3.0会自动对提示词做补充，然后生成更为惊艳的作品：

再来感受一下提示词“阳光下的塑料袋”，在被自动扩充后的效果：

最后在效果方面，秒画3.0现在生成的图像，无论是成片水准还是细节与元素，都能够达到影视级的效果。

除了单打独斗的能力之外，当商量2.0和秒画3.0结合之后的多模态大模型，也衍生出了一种新玩法——热点事件理解。

在对话过程中“喂”它一张图片或视频，便可以看图说话，更加深入且精准的描述素材中的内容。

延参法师也“来现场”了

数字人方面的如影2.0也是本次商汤产品大升级的重点。

这不，在现场商汤便展示了延参法师等知名人物的数字人效果，无论是声音（口音）亦或是神情，真的可以说是栩栩如生。

，时长01:05

还有包括主持人张泉灵、经济学家任泽平、上交大教授季卫东等等，堪称上演了一出“百变大咖秀”。

在语言方面，如影2.0打造的数字人在英语、日语、西班牙、阿拉伯语等多语种的精准度提升30%以上，而且口型和语音匹配得更加自然。

在生成效果方面，如影2.0支持实现影级4K高清视频的输出，可以让成片更加精良。

如影的升级也同样带来了一种新玩法——

现在，用户可以通过输入提示词自动生成与描述匹配的专属数字人形象了！

而且还是可以实现数字人歌唱功能的那种。

，时长01:29

这便极大地降低了虚拟网红、数字人短片等内容生成的门槛。

无论1万平米还是1毫米都能hold住的3D重建

最后在3D重建、数字孪生领域，商汤同样带来了大升级——琼宇2.0和格物2.0。

先来看下这样一个恢弘的场景：

如果不说这是琼宇2.0 3D重建的结果，或许很多小伙伴都会以为是航拍的视频了。

据了解，琼宇2.0目前已经实现了厘米级三维重建精度，室外每1万平米精度达5厘米，室内每1000平米精度达1厘米。

同时，重建效率提升20%，渲染性能提升50%，100平方公里场景的建图时间仅需38小时即可完成（1200 TFLOPS/秒算力支持）。

除了这种宏观场景的3D重建之外，在微观层面上的3D重建能力，随着格物迭代到2.0版本也有了大幅提升——

对物品纹理及材质的还原达到毫米级精细度，能够带来更清晰、更真实的产品细节体验。

更重要的是，格物2.0还突破了高反光和镜面物体采集这种老大难的问题，是无需贴纸或标签，即可精确还原商品的外观和特征的那种。

不难看出，日日新大模型在步入2.0时代之后，各项AIGC平台的能力都有了显著的提升。

那么接下来的一个问题便是：

如何在3个月内做到的大升级？

早在三个月前，商汤站在AGC新时代下，围绕数据、算法和算力三要素给出了一个新公式：

计算量（GPU数量 x 运行时间 x 并行效率）=模型参数量x处理数据量。

我们先来看下等式右边的两个因素：

模型参数量要足够多，才能实现AI智慧的涌现，而这也带来了对算力的剧增，需要更高的并行效率，才能有效支持大参数模型训练。

数据方面，高质量自然语言数据逐渐稀缺，而视觉数据相较自然语言在数量、质量、容纳信息等方面有多种优势，能够使得AI更好地理解世界。

二者的深度结合，便有了等式左边的计算量；而之于这两者，商汤有自己的一套“打法”——

大模型+大装置。

首先便是大模型方面，日日新虽然是商汤于数月前发布，但它并非是这一波AIGC热潮中一蹴而就的产物。

因为早于5年前，商汤便已经着手于此，而且在2019年便使用上千张GPU进行单任务训练，推出了10亿参数规模的视觉模型，算法效果达到了当时业界最佳。

在后来的2021年至2022年期间，商汤还训练并开源了30亿参数的多模态大模型“书生”。

因此，商汤能够迅速推出千亿参数大模型并实现版本迭代，可以视为是长期以来各种“小作业”的汇总而成的“大作业”。

其次是在大装置方面，也就是商汤在大算力中的“打法”，它与自身大模型的发展也有异曲同工之妙——同样也是早有布局。

在2022年1月，商汤交付使用了首付高达56亿元的人工智能计算中心（AIDC），而且是“出道”即成为亚洲最大的AI超算中心之一。

一年前它的算力就已经高达了3740 Petaflops，可以轻松应对万亿参数的大模型；而时隔仅1年，这个数值便翻了一小番，达到了5000 Petaflops。

这又是什么概念呢？

举个例子，在如此大装置的加持之下，它可以以最大4000卡规模集群进行单任务训练，并可做到七天以上不间断的稳定训练。

……

总而言之，有大数据、有大算力、有大模型，所以商汤能让日日新在3个月内完成版本迭代也就不难理解了。

但有一说一，这还是“商汤速度”的一隅而已。

大模型的落地也在提速

“商汤速度”的另一面，正是体现在了落地应用上。

如果你认为日日新的全面升级只是一个“提出”和“宣布”的动作，那就大错特错了，因为它已经是“上岗”了的那种。

例如结合商量2.0和秒画3.0的能力，商汤在移动端给客户带来了多种交互方面的“解法”。

针对信息获取的问答交互、生活场景的知识交互、语言和图像生成的内容交互等等，正因为商汤的大模型拥有轻量化版本，所以可以轻松在移动端上部署。

再如琼宇2.0为济南马山镇区域开发、合肥中国视界园区、上海瑞金医院等真实线下场景，打造了相对应的数字孪生，使得运营效率得到了大幅提升。

商汤还通过大模型能力为电网巡检带来长尾故障识别、复杂缺陷判断等智能解决方案。

而且商汤产品的升级，并非是单打独斗的那种，而是强强联手出奇迹。

例如我们刚才提到的“热点事件理解”便是其中之一，除此之外，商汤在智能汽车领域的绝影，更是融合了多个“看家本领”。

例如多模态大模型（多模态感知）、语言大模型（车舱大脑）、知识融合（专属记忆模块）和AIGC大模型（定制数字人）等等。

也正如徐立在现场所述：

大模型的突破掀起了人工智能的新一轮技术革命，随之而来的是产业需求呈现爆炸式增长，全新的应用场景和应用模式正迅速涌现。
商汤希望通过‘大模型+大装置’持续推动AI基础设施能力的跃进提升，不仅打造通用能力更加强大的基础模型，也进一步高效融合不同垂直领域的专业知识，构建更懂行业、更具专长的专业大模型，从根本上降低大模型的下游应用成本和门槛，让大模型的产业价值在千行百业中绽放。

总而言之，现在的大模型之战，不仅是拼技术迭代的速度，更是拼应用和落地的速度。?

文章转载自量子位

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

恭城250亩旱地

1小时13分钟！

百色市田阳区坡

巩固拓展脱贫攻

三季报密集披露

【文明执法】全

商汤日日新大模型90天大升级！CEO现场整活，主打突破想象力

不只是超越了ChatGPT这么简单

让老子和孔子对话

生成摄影级图像，提示词可以自动补充了

延参法师也“来现场”了

无论1万平米还是1毫米都能hold住的3D重建

如何在3个月内做到的大升级？

大模型的落地也在提速

热门资讯

商汤日日新大模型90天大升级！CEO现场整活，主打突破想象力

民生证券股份有限公司上调姚记科技评级

光大证券：保利发展(600048.SH)增收增利边际改善 销售龙头地位稳固

河南体育产业博览会开幕 河南体彩邀您共赴公益体彩之约

这些近视防控知识 家长应该早知道

怎么知道自己电脑适合什么系统（如何知道自己电脑到底适合那个系统）

退休养老金如何计算（在线计算器）退休金在线计算公式2023

云南是不是盛产花卉（云南是鲜花的生产地吗）

不存在的大学—“虚假大学”行骗何时休？

中信建投：人形机器人是AI最有前景的落地方向之一 建议关注两类公司

励志！51岁的他，与女儿一起考上研究生

具身智能是什么？智能体如何匹配人类价值？上海期智研究院青年科学家们这么说……丨WAIC 2023

诺奖得主菲尔普斯：经济活力的核心就是渴望创新

检察机关首创“诉救协同”机制 让斑海豹平安“回家”

蓉宝、蓉光、蓉火 记者带你逛成都大运会博物馆

黑河水运口岸首次进口散装粮食

2023年7月8日铸造砂价格最新行情预测

雅达股份：7月7日接受机构调研，开源证券股份有限公司参与

最后的武士（关于最后的武士介绍）

交通银行与华为联合创新实验室揭牌

普定一培训学校被挂牌督办

十年后撤销硕士学位！论文剽窃，多久都不会翻篇

上海杨浦：围绕数字经济、生命健康新趋势打造具竞争力的产业集群

近300亿A股巨头内斗升级！监事会自行召集股东大会！罢免4位董事，“宝能系”出局？

晕了晕了！这一火爆板块指数跌破1000点，机构却大手笔加仓！医疗、酒、游戏ETF份额也在本周齐创历史新高

ST金鸿：股东拟减持不超过0.44%的股份

这剧除了cp，还有这些好看？

碑林区举办“送法进社区 普法零距离”防范电信网络诈骗宣传活动

伸出中指和无名指的手势是什么意思

晕了晕了！这一火爆板块指数跌破1000点，机构却大手笔加仓！医疗、酒、游戏ETF份额也在本周齐创历史新高

2023安全创客汇总决赛落幕 网络靶场平台厂商软极网络获总冠军

千亿市值化工龙头重磅布局 新材料子公司打造“新成长曲线”

蚂蚁链FAIR平台推出基于零知识证明的可信计算架构

暑假研学游，到底多少“坑”？

清华北大开启火热暑期参观！校方提醒，这些地儿谢绝参观

好消息！这些群体可免费游览长沙A级景区

专访燧原科技首席公共事务官蒋燕：不仅自研硬件架构，也自研软件框架平台丨WAIC 2023

中国人民银行货币政策委员会蔡昉：中国经济发展步入新常态 三方面变化凸显

“网信国家队”中国电子参展WAIC，有哪些看点？

教育部：合理安排孩子暑期生活，慎重选择夏令营、研学、游学和校外培训

布兰妮被打视频曝光！文班亚马撒谎了？警方确定不会起诉马刺保安

ipad阴阳屏修复教程_ipad阴阳屏

全市场：赖恩德斯与皮奥利通话并谈得很投机，米兰正加速签下他

长光华芯：公司开发的新产品（56G PAM4 EML光通信芯片）目前处于验证阶段

蚂蚁集团启动回购：回购比例不超过总股本的7.6%

警惕市场情绪太乐观！空头“认命”出逃，美股上涨推力又少了一个

快手(01024)内测短视频直播行业首个搜索智能问答产品

预计上半年扭亏为盈 顺丰同城或将成为即时物流盈利第一股

证监会启动公募基金费率改革 涉及六方面内容

拜登不支持乌克兰现在加入北约：那意味着我们与俄罗斯开战

我国新能源汽车保有量达1620万辆

乌鲁木齐：经济腾飞的希望之城

佳缘科技：7月7日接受机构调研，东方阿尔法、海通计算机参与

迈向贵金属新材料制造 贵研铂业筹划子公司分拆上市

新希望上半年实现生猪销售收入137.29亿元 专家预计下半年猪价或先跌后涨

为陪女儿考耶鲁放弃高管职位，哥大本科一职难求……留学光环背后几多困境？

懂点心理学｜哪个年级暑假最可怕？不少家长表示被广告整蒙了

平安兴鑫回报一年定开混合基金经理变动：增聘俞瑶为基金经理

蚂蚁整改完成后启动股份回购，补充员工激励池

危化品重大危险源企业部级督导核查启动 做好防范工作

国家卫健委成立国家级医疗应急工作专家组

中国气象局：全力以赴做好当前防汛救灾气象服务工作

云南划分野生菌中毒高、中、低风险区

教育部发布《关于做好校外培训机构从业人员准入查询工作的通知》

乐鑫科技（688018）5月17日主力资金净卖出6358.26万元

气动清废机价格_气动清废机

湖南最大跨度钢混组合梁斜拉桥“湖北造”

新疆交建07月07日被深股通减持56.45万股

Omdia 称苹果 11 和 13 英寸款 iPad Pro 将于 2024 年初量产

时代变局：5000所幼儿园5000所小学消失_热消息

先导式溢流阀图形符号图（先导式溢流阀图形符号）

光大证券：保利发展(600048.SH)增收增利边际改善销售龙头地位稳固

河南体育产业博览会开幕河南体彩邀您共赴公益体彩之约

这些近视防控知识家长应该早知道

中信建投：人形机器人是AI最有前景的落地方向之一建议关注两类公司

检察机关首创“诉救协同”机制让斑海豹平安“回家”

蓉宝、蓉光、蓉火记者带你逛成都大运会博物馆

碑林区举办“送法进社区普法零距离”防范电信网络诈骗宣传活动

2023安全创客汇总决赛落幕网络靶场平台厂商软极网络获总冠军

千亿市值化工龙头重磅布局新材料子公司打造“新成长曲线”

中国人民银行货币政策委员会蔡昉：中国经济发展步入新常态三方面变化凸显

预计上半年扭亏为盈顺丰同城或将成为即时物流盈利第一股

证监会启动公募基金费率改革涉及六方面内容

迈向贵金属新材料制造贵研铂业筹划子公司分拆上市

新希望上半年实现生猪销售收入137.29亿元专家预计下半年猪价或先跌后涨

危化品重大危险源企业部级督导核查启动做好防范工作

范弗里特：签合同时面对9位数数字就是一种压力必须进季后赛！

新一代硅片组件尺寸有望标准化隆基绿能等9家企业发出倡议

多家上市公司回应镓、锗相关业务情况专家建议多方入手推动稀缺资源高质量发展

数据可信、算法可信、交互自然可信商业助理“天眼妹”亮相华为开发者大会