核心观点
特斯拉Optimus人形机器人原型机面世,基础功能场景与指关节高精度与高灵敏度打开应用想象空间。北京时间10月1日上午,特斯拉2022 AI日举办,活动中特斯拉人形机器人擎天柱Optimus原型机正式亮相。初代原型机Bumble C现场展示了行走、挥手等功能,并播放了该版本机器人在办公室浇水、在工厂搬运盒子与零部件的视频,展现了基本功能实现与承重能力。二代机Optimus由于出厂时间短尚未将行走功能训练成熟,但指关节快速进行了1、2、6、握拳等动作,展示了高精度与高灵敏度,给未来功能迭代提供了极大想象空间。
各项物理指标全披露,直线传动、指关节指标惊艳。1)Optimus全身具有40个执行器。分别为身体上28个结构执行器与手部12个执行器。2)身体执行器分为6类,从各项指标推测,为3类使用谐波方案与3类直线传动方案,分别为肩部6个、肘部2个、腕部6个、腰部2个、髋部6个、膝部2个、踝部4个。3)直线传动髋部和膝部推测使用8000N直线传动方案,视频展示其可以将一台钢琴吊到半空。4)手部指关节具有6个执行器,11个自由度,单手抓力可达20LBS。从功率与体积推测,执行器电机大概率为空心杯电机。6)BOT芯片为特斯拉特制SOC,电池为统一高集成电池,容量为2.3度电,理论电压为52V。
算法框架与相关AI软硬件储备是最大亮点,将是特斯拉BOT快速迭代与实现功能的重要支撑。1)本次发布会演示环节超过80%时间都在展示算法框架与AI软硬件储备,包括执行器统一优化、移动训练与路径规划、仿生型机器人动作训练、共同适用于FSD与BOT的占用神经网络、海量数据、自动标注模型、仿真、数据引擎等算法框架,以及以DOJO及DOJO机柜为代表的包括编译器、内存优化、电源优化、视频分割优化、网络预测优化、系统托盘等AI软硬件储备。2)初代原型机BUMBLE C从迈出第一步到脚离地快速行走仅训练5个月时间,极强的算法框架与AI软硬件储备是实现机器人功能的真正核心,在各类场景中体现的精度、灵敏度均易通过其来训练,TESLA BOT将进入快速迭代时代。
Optimus将近期量产并在特斯拉自有工厂环境中训练,中期预计价格在2万美金以下,3-5年内可进入民用市场。1)根据马斯克透露,Optimus有望在几周内达到并超越BUMBLE C行动水平,近期将量产并在工厂环境的各项任务中进行训练,推测发布会邀请招聘顶尖AI人才也由此原因。2)中期量产价格有望低至2万美元以下,产量目标有望达到数百万台。3)马斯克表示不断的AI训练会使Optimus具备各种各样的功能,预计3-5年内民众可以直接订购。
人形机器人不一定是单一场景效率最高的形态,但却是能推动算法框架与AI软件生态迭代进步的必然选择,而这一点容易被产业及市场低估。特斯拉机器人的产品迭代过程及大量算法、软件发布显示,软件生态进步才是推动目前机器人应用场景实现的关键要素。对标苹果IOS生态可发现,当年苹果正是靠着统一硬件+开放算法框架,建立起了百花齐放、牢不可破的强大生态。最初IOS系统相对封闭,然而自2008年3月开放生态后,苹果APP STORE上应用数量爆发式增长,截止2022年3月苹果app store上上架的app数量已接近480万。对标智能手机的发展路径,统一硬件下,算法开发框架及软件生态才有可能迭代,从而推动BOT应用百花齐放。而任何一种非人形机器人硬件形态均导致场景应用有限,不同场景应用不同形态机器人会导致算法开发、软件生态难以形成,人形机器人是必然选择。
投资建议:建议关注1)三花智控、绿的谐波、鸣志电器、双环传动;2)江苏雷利、禾川科技、拓普集团、中科三环 3)软件相关:科大讯飞、拓尔思、海康威视、优必选、云从科技。4)AI训练硬件:海光信息、寒武纪。
风险提示:特斯拉人形机器人技术迭代不及预期风险;假设和测算误差风险;销量不达预期、经济下行超预期风险。
正文
一、特斯拉人形机器人Optimus正式发布,可完成多项功能
特斯拉Optimus人形机器人原型机惊喜亮相,可完成行走、挥手、浇水等动作。北京时间10月1日上午,特斯拉2022 AI日举办,活动中特斯拉人形机器人擎天柱Optimus原型机正式亮相。现场展示了两代机器人:1)没有安装外壳的初代版本Bumble C:该版本现场演示了行走、挥手等功能,并播放了该版本机器人在办公室浇水、在工厂搬运盒子与零部件的视频。



二代版本训练时间短未能行走,组合动作及手部动作惊艳。装有外壳的最新版本(二代机Optimus),该版本刚出厂不久未得到充分训练,现场未展示其行走功能但展示四肢组合运动及手部组合精细运动,指关节快速进行了1、2、6、握拳等动作,展示了高精度与高灵敏度,给未来功能迭代提供了极大想象空间。

以AI算法为核心的运动迭代展现开创性思路,5个月时间从艰难移步到脚离地快速行走。在特斯拉之前,本田ASIMO与波士顿动力机器人等其他人形机器人问世已久,能够实现的功能大体为直立行走、挥手、握手、搬运物品、拧瓶盖等。而根据特斯拉发布会官方说明,特斯拉Optimus开发至今仅六个月,却已经能基本实现直立行走、挥手、给植物浇水、搬运盒子等算法功能,平衡性及移动速度大幅提高仅用时4个月,软件迭代高效。当前,由于二代机面世仅一个月,尚未调试完全;但我们预计二代机在落地后能在应用中快速学习,实现技术的快速进步与迭代。

软件算法支撑硬件研发,整体硬件结构具有仿生性。特斯拉拥有分析高度复杂系统的仿真能力,精确模拟model系列汽车撞击测试系统已成熟应用,包括所有螺栓、焊点,一辆汽车有3500万个自由度,汽车行业积累的结构分析能力对机器人同样具有借鉴意义,既有的碰撞模拟软件可以模拟机器人摔倒、外力撞击等情形对齿轮箱、手臂传感等部位影响。通过模拟机器人完成任务所需的动作,了解执行器的细节,在模拟中先试运行,可以帮助优化组件研发。以机器人膝关节的机械结构为例,通过对人体膝盖关节力学仿真,在机器人上运用四连杆取代两连杆结构,运动效率得到极大提升。

二、各项物理指标全披露,直线传动、指关节指标惊艳
针对特斯拉Optimus原型机基础参数情况,我们从动力系统、驱动系统及控制系统进行梳理:

- 体重73kg,电池为统一高集成电池,涵盖充放电、热管理及电源分配等系统,容量为2.3kWH,理论电压为52V,正常状态下,足够机器人一天使用;

- Optimus全身具有40个执行器。分别为身体上28个结构执行器与手部12个执行器。身体执行器分为6类,从各项指标推测,为3类使用谐波方案与3类直线传动方案,分别为肩部6个、肘部2个、腕部6个、腰部2个、髋部6个、膝部2个、踝部4个。


- 直线传动髋部和膝部推测使用8000N直线传动方案,视频展示其可将半吨重钢琴吊到半空,性能超过此前预期。手部指关节具有6个执行器,11个自由度,单手抓力可达20LBS,较高的精度及抓力,有望加大Optimus适用场景。从功率与体积推测,执行器电机我们预计为空心杯电机。

- BOT芯片为特斯拉特制SOC,同时具备AI能力、音频能力与安全防护能力。机器人所用算法将采用特斯拉的超级计算机系统 Dojo进行训练。

机器人全身几十个执行器使得任务与执行器之间的关系复杂度大幅提升,借助算法寻找各执行器最优解。对于Optimus而言的高等级任务,如爬楼、搬运等需要被解构成关节的动作,从而记录下单个动作下各个关节的扭矩-速度图示,最终产生一个任务累计能源消耗与时间的关系,定义某种执行器设计的系统成本,将其视为目标函数,通过大量模拟,寻求效率最佳区域,选择最佳执行器设计。

利用机器人“对称性”特征,寻求执行器理论工作效率与生产规模性的平衡。每个关节都需要重复上述优化过程,Optimus躯干有28个关节需要优化,通过云端数据进行解析,找得到每一个关节的最优执行器设计,虽然每一个针对每个关节进行独特的执行器设计可以获得最佳理论工作效率,但是后期量产的成本将大大提高,利用机器人“对称性”优势,对共性问题加以解决,既寻找效率比较好的执行器设计,同时满足尽量多的关节设计,最后确定6类执行器,每一个都有较好的单位重量下的扭矩输出性能,能吊起半吨重的音乐会大型钢琴。

对生拇指为设计亮点,手指自由度高。1)生物学角度看,对生拇指是适应性进化的重要特征,即拇指可与其他四指对握,从而赋予灵长类动物抓握物品的能力。Optimus左右手都有5根手指,单手具有6个执行器和11个自由度,其中拇指为对生。

除了手指灵敏度显著领先同业之外,金属肌腱仿真设计,有能力完成大口径物件的大力量抓取,同时针对脆弱小型物体进行优化,单手抓力可达20LBS,较高的精度及抓力,有望加大Optimus适用场景。

抓取能力通用,使用工具后极大提高可用性,较波士顿动力球形手竞争优势明显。1)Optimus搭载了能够驱动手指运动并感知的传感器,可分析抓取物件的特征,并对手的位置进行感知。目前,Optimus手指在金属肌腱的驱动下,既可完成大口径物体抓取,也能满足抓取精巧物件的需求。2)工厂中的工具依据人体工程学设计,即使是从未见过的工具,也能够被人抓握,也即工厂中的工具是为手设计的,而不需要对手进行修改。Optimus手部对生拇指、高自由度等,保证了其抓取能力的通用性,未来抓握使用不同工具后,将极大提高机器人的可用性。

除手指之外,躯干的机械结构的差异也使得Optimus在统一硬件、专注算法实现及量产降成本等方面较Atlas具有一定优势。1)相对液压系统,电机非常好控制,Optimus从小到手指的串联关节,大到胯部膝盖脚踝,基本采用电机控制器+电机+减速器,配合角度/电流检测/扭力传感器做反馈;而Atlas从最开始的设计多贯彻MarcRaibert的“液压完爆其他一切”的理念,几乎每一个版本都是全部基于液压的,根据官网信息,Atlas全身上下用了二十八个液压系统,除了少量对称关节,几乎每一个制动器都有其独特的形态,结构和反馈方式,其结果必然导致在硬件统一水平及规模化降成本推广商用等方面存在一定劣势;2)电机行业本身有大批的成品方案可以采购,特斯拉通过整合产业链有望保持较高硬件模块化水平,步态及服务场景算法工程师可以真正的聚焦算法而不用太纠结机器人本身的实现,同时Tesla在躯干控制关节电机也充分考虑了输出动力问题,整体竞争力突出。

三、算法框架与相关AI软硬件储备是最大亮点
感知端与控制端是人形机器人算法的重点,特斯拉电动车、Space X、Neural link等几类了大量感知、控制算法框架,为人形机器人提供技术储备。
在感知端,人形机器人与外界环境进行交互,实现应用场景拓展,需要感知周围的环境,具备良好的空间处理能力:
- 复用电动车计算机视觉神经网络,Optimus提高感知与决策能力。1)特斯拉占用网络模型(OccupancyNetworks):占用网络模型可以测量物体所占据空间,并在BEV内生成由立方体组成的环境,在路径规划过程中有意避开这些立方体空间,使车辆可以在不识别具体的障碍物的情况下提前做出避让动作。2)道路神经系统(FSD Lanes):将车辆摄像头视觉用道路导航模型进行强化,预测道路情况以及路口未划线区域的相应的连通情况;此外,道路神经系统可以识别道路坡度与曲率,根据实际道路情况提前控制车辆加减速。Optimus复用电动车计算机视觉神经网络,将推进人形机器人的自治能力和对空间和时间信息的感知,并做出准确决策。

- 数据训练框架提升训练效率,有望加速人形机器人迭代。特斯拉10月1日AI Day介绍了三种数据训练方案:1)自动标记技术(AutoLabeling):采用人机合作的方式,,让系统在模型上自主标记道路线,并辅助少量的人工进行复核校正。根据Autopilot 团队成员介绍,目前特斯拉仅用5分钟时间,即可生成与现实世界接近的虚拟场景。2)仿真模拟(Simulation):基于数字孪生让AI在虚拟世界中训练模型。3)数据引擎(Data Engine):将车辆数据与驾驶者的决策比较,将不一致的数据放入评估集后人工进行修正,减少特殊案例对模型架构的影响。通过三种数据训练方案,有利于提升模型预测准确率,或将加速人形机器人走向成熟。


在控制端,人形机器人双足站立的特征,要求其拥有强大的平衡控制算法,提升各类应用中的运动精度与抗冲击能力。
- “仿生”运动学习系统+运动优化算法,“捕捉学习”人类运动,加速机器人应用实现。机器人在观察现实世界的同时,对真实物件进行操作,特斯拉工程师将这一过程分为两步:1)生成运动参考库:通过现实视频的演示进行动作捕捉,将代表性位置(手、肘等)运动的关键帧映射到机器人,在多个视频演示后,可形成运动参考库。2)运动优化算法。由于现实世界和演示的情况不完全一致,抓取某个物件时,需要对运动轨迹进行优化,例如手应该处于什么位置、如何在现实环境中保持运动平衡等。通过运动参考库的不断丰富,优化器能够更加准确地判断树形结构下的方案选择,提升运动精度,同时减少需要调整的偏误幅度,加快在不同场景中的推广速度。

- 汽车模拟撞击软件复用,运动重心控制算法提高抗冲击性。特斯拉利用汽车模拟撞击的软件进行机器人撞击测试,保证撞击情况下人形机器人核心功能不会出现严重损伤。Optimus采用运动重心控制算法,不仅可以平稳行走,也能在少量外部干扰的情况下依旧保持平衡。现场视频中,特斯拉还展示了Optimus被工作人员用木棍戳刺上半身,但并未摔倒或长时间摇晃,仅稍微前倾后便稳住姿态。

极强的AI软硬件综合储备,提升后续开发效率。1)人形机器人除了对感知及控制算法的高要求外,其应用训练需要密集计算负载,需要强有力的硬件平台承载,也需要适宜的开发工具和软件框架来完成;2)同时,算法模型的迭代升级,可以促进Ai芯片性能水平提升,协助解决长尾场景难题。融合软硬件与AI算法,更有利于进一步激活生态,促进机器人未来场景拓展。
DOJO及DOJO机柜进行软硬件升级,其设计配合了深度神经网络训练的运用,从芯片到机组再到机房的传输带宽扩展性强,使得AI硬件与AI软件匹配度提升,与A100相比有利于降低延迟和性能损失。
1)硬件端:DOJO采用对称的分布式架构结构,并优化电力输送、冷却系统,开展跨系统的管理。
- 可扩展的系统:DOJO具备均匀高带宽和低延迟的特点,DOJO接口处理器具备800GB/s高带宽储存、全带宽存储,可拓展性极强。
- 存算一体:每个Dojo节点都有一个内核,每个内核拥有一个1.25MB的SRAM, SRAM能以400GB/秒的速度加载,并以270GB/秒的速度存储,列表解析器引擎(list parserengine)嵌入SRAM中,可以将信息一起发送到其他节点或从其他节点获取信息。
- CET管理能力: DOJO需要对热膨胀系数(CET)进行很好的管理,否则会引起材料破碎,特斯拉自行研发开展CTE管理,根据特斯拉AI Day披露,其CTE降幅已经高达54%,能量提升2.9倍。

2)软件端:根据特斯拉AI Day,软件性能=硬件TOPS+利用率+加速器占用率。
- 利用率受编译器影响:DOJO特殊的计算架构需要与之配套的软件进行堆栈,因此编程便捷度和灵活性为DOJO关注的重点。由于内核方案迭代时间较长,所以特斯拉放弃内核思路,围绕编译器进行设计。根据特斯拉AI Day,其25个Dojo编译器操作只需要5微秒,同样的操作在24个GPUS上需要150微秒,与GPU相比性能显著。
根据特斯拉AI Day,DOJO与GPU相比处理复杂模型的优势显著:
1)帧率:DOJO在ResNet-50下的帧率为2926FPS,高于A100的2887FPS;
2)复杂模型处理能力:对比占用网络模型(OccupancyNetworks)与自动标记技术(AutoLabeling),DOJO在两种复杂模型下性能超越A100,特别是在占用网络模型(Occupancy Networks)模型下,DOJO相比英伟达A100可以实现最高4.4倍的单芯片训练速度。
3)成本:DOJO可以完成6个GPU Box任务的同时,成本低于1个GPU Box。
4)时间:DOJO能将GPU几个月的工作减少到1周。


算法框架与AI软硬件储备加速训练,TESLA BOT将进入快速迭代时代。极强的算法框架与AI软硬件储备是实现机器人功能的真正核心,未来随着FSD逐步成熟与DOJO的投入使用,其算法和数据的闭环将进一步巩固。人形机器人在各类场景中体现的精度、灵敏度将更易训练,TESLA BOT将进入快速迭代时代。
四、近期量产并在工厂环境训练应用,3-5年民众可直接采购
Optimus将近期量产并在特斯拉自有工厂环境中训练,应用场景不断拓展 1)根据马斯克透露,Optimus有望在几周内达到BUMBLEC行动水平,近期将量产并在工厂环境的各项任务中进行训练。2)Optimus开发至今仅六个月,却已经能基本实现直立行走、挥手、给植物浇水、搬运盒子等算法功能,软件迭代高效,场景也在不断拓展。

中期预计价格在2万美金以下,3-5年内民众可直接采购,推测2B场景可在此前实现。1)中期量产价格有望低至2万美元以下,产量目标有望达到数百万台。2)根据AI Day现场直播问答环节,马斯克表示不断的AI训练会使Optimus具备各种各样的功能,预计Optimus在3-5年内能够开辟出更多应用场景,民众可直接采购。由于企业具备自主训练能力,预计2B场景可在此前实现。

五、非人型难以形成生态,算法框架才是迭代关键
机器人是超越版的智能手机,仅有硬件无法应用,需要配合软件算法形成综合协同。
1)统一的硬件是机器人作业的基础,要求的是高精度、高灵敏度、高力矩,以最大限度地满足不同活动对机器人活动的要求。2)而机器人的功能实际上则由综合算法来实现,需要智能感知能力、运动控制能力、感控一体技术、AI算法等软硬件能力的综合配合。一言以蔽之,硬件是机器人的躯体,软件是机器人的灵魂,软硬综合、灵肉结合,才能形成完整可用的智能机器人。3)特斯拉机器人的产品迭代过程及大量算法、软件发布显示,软件生态进步才是推动目前机器人应用场景实现的关键要素。

对标苹果IOS生态可发现,统一硬件+开放算法框架有望塑造出异彩纷呈的强大生态。
- 回顾苹果生态发展之路:
- 1)最初的封闭:2007年1月MacWorld大会,划时代的苹果iPhone首次面世,将创新的移动电话、宽屏幕的触控 iPod、突破性的通讯装置融于一体,引入多点触摸屏幕和全新的用户界面,并开创了移动设备尖端功能的新纪元,重新定义智能手机,一经推出即产生极大影响。然而起初,iPhone 只能运行第三方的 Web 应用程序,利用Safari引擎,开发者可以借助 Web 2.0 + AJAX 创造出应用程序,然而当时移动网络速度较慢,因此该路径发展速度并不理想,第三方应用程序功能开发受限;同年七月,iPhone 的破解使得黑客们开始自行编写程序,iphone生态日渐繁荣。在此基础上,原本反对开放的乔布斯最终亦走向官方开放苹果生态。

- 2)走向开放:2008年3月,苹果召开一次特殊的发布会,正式发布了iPhone SDK。对于如何进行开发,Scott Forstall 首先揭秘系统架构(Cocoa Touch、媒体、服务、内核),其次介绍开发基础(API)、开发工具(Xcode)、应用商店(AppStore),最后展示首批应用,标志着IOS系统从此向开发者开放生态。
- 3)快速繁荣:在此之前,iPhone OS 已有上千款的 Web 应用程序和数百款原始应用。虽说如此,由于没有官方支持、底层接口尚未探清,黑客破解后工具链来开发的原始应用并不稳定,程序显得相当稚嫩。iPhone SDK 则终结了这一乱象——它为 iPhone OS 提供可靠、快速和安全的开发方式,免除开发者的后顾之忧,掀起一股移动开发狂潮。根据statistia数据,截止2022年3月,苹果app store上上架的app数量已接近480万。

- 苹果不仅可以从appstore中出售的应用处收取佣金,并且应用生态的存在具备平台规模效应,极大地巩固了苹果的竞争护城河。根据analysisgroup由苹果支持撰写的报告预计,2020年苹果App store总销售额高达约640亿美元,2021年该金额预计可达860亿美金。

其他机器人形态具备硬件局限性,唯有人形机器人有望形成生态。非人形机器人硬件形态单一,功能受限,无法承载多种场景应用。例如机械臂,一般固定使用,无法移动,功能单一,适用场景有较大的局限性。而四足机器人如机械狗、机械马等,其一是形态较矮,无法完成需要高度的任务;其二是没有手部结构,无法完成更复杂的功能,因而无法吸引大量开发者,也无法形成生态。因此,唯有人形机器人才相当于超越版的智能手机。我们认为,人形机器人具备和智能手机发展类似的特征,因此具备硬件能力、软件基础以及开放框架的机器人厂商有望复刻智能手机时代的发展,随着渲染、开发语言、开发工具、应用经验日益丰富,开发者越来越多,应用不断迭代升级,创造出异彩纷呈的强大生态。

投资建议
建议关注:
1)核心机械标的:三花智控、绿的谐波、鸣志电器、双环传动;
2)其他相关机械标的:江苏雷利、禾川科技;
3)产业链相关标的:中科三环、拓普集团、保隆科技、恒帅股份、旭升股份、银轮股份;
4)竞品产业链:汉宇集团、中大立德、大族激光、国茂股份;
5)其他技术供应商:奥普光电、汉威科技;
6)软件相关:科大讯飞、拓尔思、海康威视、优必选、云从科技、奥普特、奥比中光、凌云光等具备机器人布局的AI龙头。
风险提示
特斯拉人形机器人技术迭代不及预期风险:特斯拉人形机器人若技术迭代不及预期,若产品未达到公司预定效果,则对产业链相关公司会造成一定不利影响。
市场竞争加剧风险:若内外厂商加大本土化经营力度,国内市场竞争将日趋激烈,面临市场竞争加剧的风险。
经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响,人形机器人渗透率也会放缓。
本站内容来源于网络或网友发布,如有侵权请点此联系