据悉,商汤科技即将在12月15日开始举办产品发布周。从近期开源的多模态架构NEO到实时数字人技术SekoTalk,不难看出商汤正展现出一条清晰的路径:以底层创新推动产品体验升级,让实用主义成为AI落地的核心逻辑。

AI应用技术地基:NEO架构重构多模态效能,SekoTalk重塑数字人交互
商汤开源的NEO架构从底层重新设计了多模态模型的“骨架”,突破了此前业内拼凑式方案存在的效率低、融合浅瓶颈,实现了视觉与语言的深度统一,该架构仅需业界十分之一的数据量即可达到旗舰模型性能。
这种“降温增效”的特性,让高质量多模态从高耗能的大型模型向轻量化部署迈出实质性一步,这将催生更多实用、好用的C端产品,让AI普惠到各个细分生产生活场景。
如果说NEO架构体现了商汤在基础模型层面的深耕,那么SekoTalk技术则展现了其在应用层的精准洞察。SekoTalk实现了多语言环境下的精准唇形同步和长视频生成的稳定表现,在8卡服务器上达到24fps的生成速度,将首帧延迟降至3.5秒,使实时交互数字人从概念走向实用,解决了行业长期面临的“嘴不对音”、延迟漂移等痛点。
这一突破不仅指向视频制作、虚拟偶像等内容市场,更为情感陪伴等交互场景开辟了新空间。
从技术蓄力到产品价值,实用主义构建AI产品逻辑
除此之外,近期商汤还迎来了“1+X”新成员——剑指具身智能场景化商业落地的“大晓机器人”,近期频频的技术动作可见商汤正在构建的产品逻辑:
以底层架构创新降低AI使用门槛,以场景化技术解决实际痛点。这种“实用主义”思路,标志着AI企业从追逐参数规模向关注用户价值的转变。
技术研发的长期主义,最终需要穿透到用户可感知的产品价值。商汤近期的技术蓄力,正在具象化为日常使用体验的提升。从模型推理效能的显著提升,到数字人交互的自然流畅,这些技术细节的进步,实则是AI技术真正融入产业的关键一步。
在产品发布周即将到来之际,期待商汤将展示更多如何将前沿技术转化为实用产品的思考,为行业带来新的启发。

