在ITF World 2023 半导体大会上,黄仁勋表示,人工智能的下一个浪潮将是具身智能(embodied AI),即能理解、推理、并与物理世界互动的智能系统。黄仁勋也介绍了英伟达的多模态具身智能系统Nvidia VIMA,其能在视觉文本提示的指导下,执行复杂任务、获取概念、理解边界、甚至模拟物理学,这也标志着AI 能力的一大显著进步。
图片来源于:网络
具身智能是什么?
具身智能(Embodied AI),简单来说就是AI的大脑加上躯体。它能够跟我们生活的环境进行交互,从而展现出智能行为。原来的人工智能可以看作第三人称的智能,也就是投喂数据给机器,让它学习什么它就学习什么,就好比Chat GPT。而现在具身智创造了一种机器自主学习的新方式,能够以第一人称的视角来感知和学习物理世界,并像人类一样理解和感知事物的能力,才能在此基础上进行相同思维的发展,最后表现出人类期待的行为方式。
图片来源于:网络
比方说具身智能的典型案例是机器人,以特斯拉(TSLA.US)Optimus 为例,边缘智能能力是具身智能实现的关键之一。特斯拉人形机器人的核心是其Dojo D1 芯片,该芯片采用7nm制造工艺,拥有500 亿个晶体管,芯片面积为645mm²,算力达362TFLOPS。
图片来源于:网络
所以从这也可以得知,AI域是具身智能机器人未来发展的重要趋势,无论是工业机器人、服务机器人,还是特种机器人,AI域是赋能千行百业的前提。
微软(MSFT.US)的实现路径
目前机器人的应用基础是代码,工程师需要经常编写代码和规范来控制机器人的行为,过程缓慢、昂贵且低效在微软研究院发布“ChatGPT for Robotics”的文章中,研究者使用ChatGPT大型语言模型(LLM)将人的语言快速转换为机器人的高层控制代码,从而控制机械臂、无人机等机器人,ChatGPT带来了一种新的机器人应用范例。比方说:目前已经能够通过给ChatGPT的对话框输入指令,让其控制机器人在房间中找到“健康饮料”、“有糖和红色标志的东西”(可乐)。
图片来源于:网络
谷歌(GOOG.US)的实现路径
今年3月,谷歌与德国柏林工业大学的一组人工智能研究人员公布了视觉语言模型PaLM-E (Pathways Language Model with Embodied) ,总参数量达到5620亿,是目前已知的最大的视觉-语言模型。PaLM-E通过分析来自机器人摄像头的数据来实现对高级命令的执行,而无需对场景进行预处理,这消除了人类对数据进行预处理或注释的需要,并允许更自主的机器人控制。
图片来源于:网络
·服务器网卡数量剧增
面对千亿、万亿参数规模的大模型训练,仅仅是单次计算迭代内梯度同步需要的通信量就达到了百GB 量级。在要充分发挥GPU 计算资源的强大算力的同时,必须构建一个全新的高性能网络底座,用高速网络的大带宽来助推整个集群计算的高效率。AI 服务器网卡配置数量和GPU 数量成正比,因此GPU 的高增长将直接带动服务器网卡数量的剧增。
图片来源于:网络
整体来说,真正需要的人形机器人目前还缺少具身智能特质。马斯克也表示:未来会将特斯拉的视觉技术用于人形机器人的研发中。而对于具身智能和人形机器人所能够创造的价值,也非常明了了。具身智能的应用场景没有局限性,所以市场空间更广阔。
英伟达(NVDA.US)一季度英伟达AI芯片所在数据中心业务的营收创历史新高,保持10%以上同比增速,发布财报后暴拉近30%,将创历史新高
浪潮信息(000977)公司服务器蝉联中国第一,自2017 年以来,浪潮信息已连续5 年保持中国AI 服务器市场份额超过50%,浪潮信息全球市场占有率达20.9%,保持全球市场第一。
海光信息(688041)海光CPU 产品可以应用于高端服务器、数据中心、中低端服务器以及边缘计算服务器等计算领域中,DCU 产品专门用于为人工智能和深度学习提算力支持。
寒武纪-U(688256)云端智能芯片及加速卡产品应用于服务器的CPU、GPU 中,提供算力支持。
景嘉微(300474)GPU 芯片产品已完成与国内主要的CPU 和操作系统厂商的适配,JM9 系列可以应用于人工智能、云计算等高端应用领域,提供算力支持。
注:本文来自天风证券2023年5月26日发布的证券报告。
粉丝特惠:好股票APP五个热门产品任选一款,体验五天!欢迎下载注册体验!