必一运动这几天中关村的小伙伴们都发现了:这里已被机器人占领!机器人和各色生物们纷纷登场表演,让在场观众们目瞪口呆。
逼真的动作,灵活的手指,连口型都是搭配的,两位美女机器人给到来的游客们耐心介绍着AI主题日的相关信息,在人群中分外吸睛。
展会之外的广场上,一只机器狗在围观群众的众目睽睽之下现场炫技。作揖、双腿站立、打滚撒娇,这套动作一气呵成,可谓是相当熟练。
Sam Altman力推的人形机器人Figure 01,马斯克的叠衬衫擎天柱,波士顿动力划时代登场的电动机器人Atlas纷纷登场,视频一出即成全网爆款必一运动。
国内这边,优必选去年年底上市,已形机器人第一股;工业版人形机器人Walker S,已经进厂打工了;宇树H1,直接火到了国外,让OpenAI联创Karpathy大呼想要。
最近,医学博士、人类免疫学家Derya Unutmaz表示,当前AI技术产生最大影响三个领域,是生物技术、机器人技术和教育
在特斯拉2023年年度股东大会上,马斯克也表示,人形机器人将是今后特斯拉主要的长期价值来源。
大模型与机器人的融合,直接让后者长出了「脑子」。这种超能进化,带来的是能理解、推理、与物理世界互动的智能系统,给我们以无限的想象空间。
就在几天前的2024中关村论坛年会「人工智能主题日」未来人工智能先锋论坛上,来自星动、傅里叶智能、智元机器人、银河通用机器人、宇树科技、小米等业界大佬开启了具身智能的炉边谈话,分享了众多令人受益匪浅的精彩观点。
瞅一瞅近期圈内的技术发展,只能用「震撼」二字形容了。如此之震撼,以至于不少大佬已经公认,在未来的5到20年内,AGI一定会到来。
「人工智能主题日」未来人工智能先锋论坛组织了具身智能圆桌对话,业界的诸位大咖,分享了自己对此的观点。
李航老师介绍说,我们现在看到GPT大模型,其中一个重要的特点就是通用性。尽管以LeCun为代表的专家,对这条技术路线并不看好,但在李航老师看来,通用的人工智能一定会实现。
因为沿着应用层发展,所有任务和评测标准都很清楚,在这种层面下,就一定能开发出这样的AI。然而,并不是说所有这些和人的智能相关的特点或能力,我们就一定能实现。
人智能的三个特点——情感、创造力和自由意志,AGI不一定能去覆盖。AGI的定义标准,往往是从功能的角度去定义的。
而具身智能,更跟机器人相关,包括硬件、软件的结合。届时,它们不仅会完成数字空间里的任务,还会完成物理世界里的任务,相信在未来,它们将达到或超过人的能力。
李航老师认为,具身智能的两大重要特点,一个是有自主性;二是依靠与环境交互积累经验,得到不同的训练数据构建的模型必一运动,在机器人身上涌现出不同的智能;三是具备多模态能力,拥有五感的具身智能可以完成更加智能的任务。
如果要进入物理世界,最重要的就是视觉听觉嗅觉。未来的具身智能,应该是结合多模态技术,从而完成智能性的任务。
在银河通用机器人创始人、智源具身智能研究中心负责人王鹤老师看来,具身智能与非具身智能非常互补,他们的全集才是AGI。
中国有一句老话,读万卷书,行万里路。如今的互联网上的信息对具身智能来说,就是读万卷书,让它了解了人类的思维和对图片的感知,但它无法代替行万里路。
而人类的身体力行、在真实世界里的劳作,都不可能通过读书、看图、看视频来替代。即使看10个小时视频,也无法学会怎么骑自行车。
而具身智能,就赋予了智能体与物理世界交互和在交互中学习的能力。这种能力,是无法通过看图/看文这样的数字世界和典型的数据模态及经验而获得的。
还有一个有趣的问题就是:具身智能必须是人形吗,必须是双足吗?靠机器狗,可不可以实现具身智能呢?
对此,傅利叶智能创始人兼CEO顾捷表示,具身智能的最终形态,一定是人形的。对此,整个硅谷都达到了共识。英伟达GTC大会上,出现的也全是人形形态的机器人。
不过,高矮胖瘦、用什么驱动这样的细节,目前还很难统一,但大家都在朝人的形态开始做收敛,朝这个方向努力。
虽然他也认为,对于具身智能或AGI,机器人形态不是特别重要,但大家都比较喜欢这种心态,受到整个社会的公认。
做数据采集的时候,人形机器人就可以去人生活的各个地方,做跟人一样的动作,比如开车、散步、跟人或机器人交互等等,这些都更加接近跟真实人类的交流。
所以,当下具身智能人形机器人,可能是相对最合适的路径,它虽不是唯一路径,但确实是效率比较高的方法。
如今,大模型虽能思考,但指挥不动本体。所以,我们是该先让硬件达到一定水平,迎来具身智能蓬勃发展,还是该脱离本体,独立分开发展具身智能呢?
具身智能的本体还不够结实时,能干的活很少,在此基础上开发具身智能是难度较大的。当然,如果本体开发得很好,大脑却没有跟上,应用场景也会受到制约。
正确的做法是,先从本体迭代切入点,再加入基本应用,达到一定程度后,再将本体做比较大的收敛,然后就会出现应用的蓬勃发展。智能手机发展到现在的形态,也是如此。
如果脱离实体,目前的大语言模型与物理世界的理解是远远不够的,这也就是为什么,如今很多顶尖AI学者提出要做世界模型。
特斯拉的无人驾驶,也是采集的真实数据训练,而非虚拟数据。因为虚拟数据中,实时与物理世界交互的数据太少。
特斯拉通过电动车收集了海量数据之后,开始了训练端到端的自动驾驶大模型,甚至可能实现线,甚至更高层级的无人驾驶。
第一,就是大家一窝蜂上来就要做L4,做Robotaxi,都以为两三年内能搞定,但实际上要困难得多。
第二是,当时AI还并未发展到如今这个阶段,ChatGPT之类的大模型还没诞生,做决策、执行和控制时,完全没有AI的办法。
不过,具身智能和无人驾驶不太一样的地方在于,无人驾驶面临的基本是特定的场景,但具身机器人要解决的场景极多,包括家庭场景、流水线场景等。
王鹤表示,当前具身智能最大的瓶颈,就是缺乏数据。特斯拉FSD,就是利用了百万车主上亿小时的驾驶数据,进行模仿学习的。
然而很可惜,人形机器人并不存在这样的数据。并没有上百万群众会自发地买一个机器人,用遥控器指挥它做事。这种数据集在地球上还不存在。
所以要实现具身智能数据0到1的突破,最实际的方法就是通过物理仿真,把现实世界的物理规律通过图形学的引擎,真实仿真摩擦力、接触力、光线追踪渲染等,制造一个模拟真实世界训练的数字训练世界,这也是英伟达系列工作背后的初衷。
当未来,机器人在我们的世界充分存在的时候,也就有了在真实世界交互的数据闭环,成为具身智能的源头活水。
陈建宇表示赞同,并且表示,仿真的优势非常快,靠英伟达的GPU,可能一天就能采集到相当于真实世界上百万年的数据。
所以,在前期,我们只能从仿真里拿出稍微简单一点的场景,让机器人快速学习。当它们能做复杂场景时,我们就需要在真实世界里采集数据了。
作为AI发展的下一个浪潮,具身智能深度融合了LLM、机器人等多学科技术,正加速推动智能经济到来。
为了抓住这一机遇,海淀区在27日发布了《打造全国具身智能创新高地三年行动方案》(以下简称《行动方案》)。
《行动方案》明确指出,到2026年,将初步建成全国具身智能原始创新策源地、应用示范新高地和产业加速集聚地。
具身智能的最终目标是,通过LLM的赋能,让AI机器人可以在物理世界中,形成交互、自主学习的能力。
其中「本体」就是机器人身体的物理呈现,而注入LLM的「大脑」能让其听懂人类语言、交流,「小脑」则负责控制身体运动。
当前,国内诸如文心4.0、商量5.0、Step-1V等多模态LLM已取得了重大突破,未来还需进一步追赶世界技术前沿。
这主要取决于控制算法的进化必一运动,其中便涉及到步态平衡、动力学模型、控制框架等等,与此同时,还要实现「大小脑」协同。
简单来说,「脑身协同」就需要提升机器人在物理世界的模拟能力,以及从数字世界迁移到物理世界的能力。
所以,未来企业还需要加强在数字世界模拟能力、数字到物理世界迁移技术的研发,并优化其在不同领域中的应用。
比如,四足机器人的典型代表——机器狗、还有工业机械臂、餐饮酒店中轮式送餐机器人等「多元形态的机器人」,更加适合自身的场景应用。
当前,可以看到许多科研机构,包括企业都在做机器人开发,却有时难以将其应用,创造出的成果只能停留在研发阶段。
而我们所见的各种炫酷的demo,其实很多都是,机器人在特定场景中完成目标,而遇到未见过的场景时,就无能为力了。
一般来说必一运动,训练机器人完成任务的通常做法是,在一个虚拟环境中,不断优化算法,再将其投入现实世界。
不排除,机器人已经有了一些智能的体现,比如踹倒后的机器人能够自主站起来,并非依靠编程而是训练所产生的「应激反应」。
但是,在「大脑」智力这方面的涌现,还未真正见到。因为,它涉及了很度,诸如语言、图片、视频等。
有的机器人手是三指、四指,甚至五指的都有,因此传感器数量多少,也就决定了数据维度获取的不同。
对此,海淀打造了一系列平台,比如「具身智能创新中心」,为企业提供训练环境,以便获取实时数据。
同时,海淀还将打造一系列产业创新孵化平台,以加快提升样机研发、检验测试、中试服务、生产制造等产业公共服务能力。
现在,海淀在区域北部温泉科技园三期,将打造一个机器人小镇必一运动,为企业提供了办公、以及开放测试环境。
然后,还要探索制定标准规范,鼓励优势企业参与国际/国家标准、行业标准制定,提升具身智能科技伦理治理能力。
最后,还要加强开放合作交流,支持建设具身智能开源社区,举办具身智能论坛、峰会、大赛等活动,形成开放合作的产业生态。
当然,除了亲自牵头之外,海淀区还通过首次「人工智能主题日」,把从事具身智能领域研究和生产的高校和企业汇聚到了一起。
在这里,突破性的成果展示,以及前沿性的演讲讨论,不仅可以激发一波又一波的讨论,让更多的人了解到具身智能的进展。
而且,还能让校企们藉此发现与自己志同道合,或者细分方向正好互补的伙伴,进而展开一轮全新的合作。
这是因为,这里不仅有硬核的科技力量、丰富的AI人才,还有完善的应用场景,专业的平台支持,具备了发展具身智能产业得天独厚的优势。
而且,拥有89位AI TOP2000全球顶尖科学家和产业领军人才,还有1.23万AI学者,占北京市八成。
海淀的大模型企业超过了90家,且数量持续增长,其中有36款LLM通过备案,占全市七成,在全国率先形成AI大模型产业集聚区。
还有,1300家集聚企业占全市七成,提供了全产业链部署芯片、框架、大模型、数据技术与处理服务。
一方面,清北、北航、北理、中科院等一批高校院所和专家人才,已经在机器人领域做出的诸多的研究。
另一方面,近200家机器人企业占全市40%,包括10+家人形机器人本体企业,占全市50%还要多。
下一步,海淀将凝聚各方力量全力保障方案的落地实施,在具身智能共性技术服务平台建设、重点企业培育与引进、推进应用场景落地、打造具身智能特色园区等方面持续发力,加快形成具身智能创新发展的良好格局。
智元机器人联合创始人、上海人工智能研究院院长宋海涛表示,如今全球80亿人口,核心的生产力创造,还是来自于我们的智慧群体。仅仅是完成全球的生产力创造,我们就至少需要100亿台人形机器人。