上海证券近日发布互联网传媒行业周报:周观点,Neo采用高扭矩低转速电机,专注泛任务化具身智能。
Neo明确定位为家庭使用场景,采用不一样于传统人形机器人的驱动方案,专注于完善泛任务化的具身智能,以适配家庭复杂多样的使用场景。
1、不同的驱动方案:不同于传统刚性连杆驱动,Neo采用柔性驱动技术(串联弹性驱动器:高扭矩低转速电机+类肌腱设备)。根据腾讯科技,Neo明确定位服务于家庭应用场景,其他双足机器人基本定位服务于工业场景。1X机器人AI副总裁Eric Jiang表示多数人形机器人采用“低扭矩、大齿轮比、高动能”的驱动方案,Neo则采用“高扭矩、小齿轮比、低动能”的驱动方案。人形机器人整体运动方案由“直线运动”及“旋转运动”组成,其中传统机器人的“旋转运动”主要是采用“高速电机+减速器”的方案,即大多数电机功率不足以施加大量扭矩,因此机械工程师采用高速电机并为其添加齿轮,以速度换取扭矩。而Neo通过低齿轮比的设置,降低电机输出速度,以此来降低核心关节的功耗,同时通过“高扭矩”来弥补电机低运转带来的力量不足问题。所以我们大家都认为Neo“高扭矩低转速电机”的方案将减少对“减速器”的依赖。我们大家都认为该套驱动方案会产生较低的能量,再加上柔性皮肤设计,Neo在家庭使用场景的可靠性和安全性预计明显提升。
2、泛任务化的具身智能:我们大家都认为Neo着眼于多样性的任务完成能力,以适配家庭复杂多样的使用场景。1X认为机器人最终落地的家庭和办公场景会产生多样化且不确定性的目标任务,因此就需要足够多样性的数据集才有意义,Eric Jang认为数据采集公式是“多样性质量数量算法”,为此1X专门组织了机器人操作员团队去亲自训练各类行为模型(直接微调模型的采集工程师,根据场景收集数据、重新训练及调整模型,直至模型完善)。我们大家都认为1X更注重适配任务场景的泛化,从而适配家庭内多样化的复杂使用场景。因此1X倾向构建一个可理解一系列广泛物理行为(包括清洁、整理家居、拾取物品、社交等)的通用基础模型,即依靠单一模型从事多样化任务。并且1X在构建了视觉到自然语言命令对的数据集后,下一步将开始利用GPT-4o、VILA和Gemini Vision等视觉语言模型来自动预测高级动作。截至2024年3月,Eve总共使用了1400小时的训练数据,涉及7000种不同的独特动作,拥有数百项独立能力。
按照我们“大模型+小模型+应用”的研究框架,我们大家都认为生成式AI有望在硬件端率先落地,包括人形机器人、AI手机、AI可穿戴设备等硬件载体。即我们大家都认为AI软件属于核心能力、硬件载体属于承载平台,围绕硬件载体拓展的应用或使用场景才具备大规模商业化的可能。根据新智元,Open AI内部将AGI划分为五大等级:
目前Open AI自称其AI模型正处于L1,并很快可达到L2。2024年2月15日Open AI发布的文生视频大模型Sora在综合处理信息能力上(Sora模型在处理复杂的多模态信息方面表现出更高的技术复杂度,可巧妙地融合视频、文本和语音信息,通过更复杂的模型结构和精细的算法设计,实现了对信息的综合处理)及可模拟和再现物理世界能力上(通过深度学习和分析海量的视频数据,“学习”视频中物体的运动规律、力的作用效果等物理现象,从而精准捕捉和模拟物理世界的细微变化,实现对物理世界的模拟和再现)均表现出领先的技术创新优势。
我们认为人形机器人是实现L2中表现特征(像人类一样)的重要解决方案之一,并且1X有望充分的利用Open AI在AI大模型上的技术优势,同时我们大家都认为人形机器人的核心能力体现在软件(AI)上,所以我们判断1X发布的新一代人形机器人在语义分析及处理、视觉识别及处理上相比其他人形机器人更具优势。此前中坚科技于2024年初完成了对1X的股权投资,并在后续进程中积极地推进与1X的全方位合作(包括供应链合作),为1X整合国内相关产业链资源,帮助1X实现新一代人形机器人快速降本及市场渠道拓展。建议关注1X人形机器人产业链的投资机会。
我们认为“AI+硬件”有望率先落地,人形机器人、AI手机、AI可穿戴设备均为AI较为理想的承载平台,着重关注“AI+硬件”的产业化落地趋势。
AI推进进度没有到达预期、人形机器人落地没有到达预期、AR技术发展没有到达预期、AR终端消费需求弱于预期、游戏基本面恢复没有到达预期、内容监管趋严。( 上海证券 陈旻)