白沙pvc排水管专用胶水 Genesis AI 发布新模型:机器人开始挑战西红柿炒鸡蛋

 56     |      2026-05-12 09:53:20
防火门专用胶厂

作者|Li Yuan白沙pvc排水管专用胶水

编辑|靖宇

机器人终于开始学做西红柿炒鸡蛋了。

过去几年,人形机器人行业擅长的事情,是跳舞、翻跟头、搬箱子,以及在里越走越像人。但普通人对机器人的期待,往往还是会回到个很朴素的问题:它到底什么时候能帮我做务?

这件事直很难。

务不是套标准动作。鸡蛋会碎,番茄会滑,蛋液会流,刀会改变食材形状。但对机器人来说,它们是难的类物理世界问题。

5 月,机器人创业公司 Genesis AI 发布了自己的个机器人基础模型系统 GENE-26.5。里,机器人完成了组很密集的灵巧操作 demo:单手鸡蛋、双手切番茄、做奶昔、实验室移液、解魔、整理线束、单手同时抓多个物体。

相比于过去很多让人短暂激动、随后又归于平静的机器人演示,放出的 demo 虽然不连贯,但是全自主操作,并且以 1 倍速展示,没有通过加速制造果。

重要的是,demo 里些动作已经开始显得很像人,也碰到了些机器人灵巧操作里的标志难题。

比如魔。过去机器人解魔,通常依赖为魔任务门训练的系统。OpenAI 2019 年的 Shadow Hand 解魔,就是单手灵巧操作的里程碑,但它像个围绕魔造的门系统。Genesis AI 这次的意义不在于公布了成功率,而在于它声称把魔放进了个通用双手机器人系统里:外部求解器生成步骤,再转成语言指令,由机器人通过手眼协调和双手操作执行出来。

当然,它还远没有真的达到人类水平。

Genesis AI 面表示,做饭 demo 中多数步骤成功率约 90 到 95,但难的两个子任务——单手蛋和用刀转移切好的番茄——拍摄时成功率只有 50 到 60。机器人整体速度大约达到人类的 60 到 70。但这个果已经让人感到十分惊艳。

Genesis AI 本身也很年轻。公司成立于 2025 年初,已经完成 1.05 亿美元初始融资,是法国规模大的种子轮之,投资包括前 Google CEO Eric Schmidt、Xavier Niel、Bpifrance 等。它正在与法国、德国、意大利的潜在客户入谈判,目标行业包括汽车、电子、制药、物流等。

但这公司并不是从 GENE-26.5 才开始冒出来的。

Genesis AI 背后有条早的技术线索:Genesis 仿真平台。这个开源项目被定义为面向 Robotics、Embodied AI 和 Physical AI 的通用物理仿真平台,核心是套从头重建的 universal physics engine,用来模拟刚体、液体、气体、可变形物体、薄壳、颗粒材料等多种物理现象。

Genesis AI 的 CEO 周衔是 CMU Robotics Institute 机器人博士,也是生成式仿真这条研究路线的重要发起者之。联创始人 Th é ophile Gervet 则是前 Mistral AI 研究员。

某种意义上,这次 demo 选择做道西红柿炒鸡蛋,也带着点 CEO 作为华人科学的生活经验和幽默感——它没有选择标准化的西餐摆盘,而是选择了道人再熟悉不过、但对机器人非常麻烦的常菜。

这次发布真正重要的,不是机器人已经会做务,而是它让我们看到:机器人开始认真挑战那些人类习以为常、机器却难学会的动作。通用机器人难解决的,可能不是走路,而是手。

Genesis AI 在技术博客里写道:Human-level dexterity and capability is closer than it appears。人类灵巧操作,可能比看起来近了。

01

奥力斯    pvc管道管件胶批发    联系人:王经理    手机:15226765735(微信同号)    地址:河北省任丘市北辛庄乡南代河工业区

采用人类操作数据训练模型

 

按照 Genesis AI 的说法,这个模型面向的是机器人操作任务,输入包括语言、视觉、本体感知、触觉等多模态信息,输出的是机器人动作轨迹。它使用  flow matching  来建模轨迹的联分布,目标不是简单识别物体,而是让机器人在真实世界里完成连续操作。

这次公开的任务,除钢琴外,大多由个共享权重模型完成,并以 1 倍速自主执行。钢琴是例外,它是单通过仿真强化学习训练的 policy,主要用于测试控制栈的速 tracking 能力。

数据是这套系统的核心。

Genesis AI 官称,GENE-26.5 背后的数据引擎主要由三类来源组成:手套数据、视角、三人称。

手套数据负责捕捉保真手部动作和触觉信号;视角捕捉人在真实任务中的自然操作;三人称则提供大规模的物理互动覆盖。Genesis AI 还称,已经与作伙伴收集了过  20 万小时  跨模态数据。

虽然 Genesis AI 的团队在仿真域有很强的能力,但在 GENE-26.5 的公开数据里,核心仍然是真实人类操作数据。仿真多承担的是 closed-loop evaluation,也就是闭环评估和迭代加速的角。

换句话说,真实数据负责让模型学习物理世界,仿真负责让模型快被测量和迭代。

这套路线后落到了几组 demo 上。

做饭 demo 是个 4 分钟长时序任务,官称其中包含 20 多个子任务。机器人要单手蛋,双手配切番茄,还要使用毛巾、盐磨、蛋器、刀、铲子、平底锅等工具。

其中个细节很能说明问题:在转移切好的番茄时白沙pvc排水管专用胶水,机器人不是简单把刀当成铲子,而是用刀背和砧板形成支撑,再通过双手协同把番茄转移出去。这个动作已经非常像人。它不是简单的 pick-and-place,而是涉及长时序、工具使用、易碎物体、软硬混物体,以及接触状态不断变化的真实厨房环境。

实验室移液 demo 则像工业和科研场景。机器人要抓住移液器,插入枪头,把液体转移到试管里,弹出枪头,拧上约 1 厘米的小管盖,开离心机按钮,并把试管放进转子里。

线束整理则接近制造业。Genesis AI 把线束缠绕认为是圣杯的任务。线缆柔软、会变形、路径约束强,还需要胶带缠绕和双手协同,对传统工业机器人来说直很难标准化。

不过,GENE-26.5 还不是 zero-shot。

周衔在 Business Insider 采访中说,做饭 demo 里的蛋、切番茄等技能需要几百条相关任务轨迹。个 30 秒复杂技能,需要几小时人类数据,再加上不到半小时机器人执行数据。

它也会失败。Zhou 说,做饭 demo 中多数步骤成功率约 90 到 95,但单手蛋和用刀转移切好的番茄,拍摄时成功率只有 50 到 60。机器人速度大约达到人类的 60 到 70。

GENE-26.5 不能被写成「机器人已经会做务了」。它像是在证明条技术路线:大规模人类操作数据预训练 + 少量机器人数据适配 + 仿真闭环评估,正在让机器人操作能力进入类似基础模型的训练范式。

这也反映了今年具身智能行业的个明显变化。

过去,很多公司强调模型架构、机器人本体,或者单个 demo 的任务果。现在越来越多公司意识到,真正的瓶颈是质量、可规模化、可迁移的操作数据。仅靠遥操作机器人采数据太贵、太慢,也覆盖不了人类真实劳动里的细节。于是,视角、训练手套、互联网、人类自然工作流数据,开始变成新的竞争中心。

02

手不是模型的外设,

Genesis AI 要做个系统

 

这次 Genesis AI 引人注意的,不只是模型,还有手部的灵巧操作。

里那只手看起来非常像人,有接近人手的比例、手指形态和多接触能力。

能反应手部的灵巧操作的 demo 之,是单手同时抓多个物体。

已关注

关注

重播 分享 赞

机器人用只手同时抓起四个不同尺寸的物体,直接夹在指缝中搬运。这个动作之所以让人印象刻,不只是因为它次抓了很多东西,而是因为它展示了人手常见、也难被机器人复刻的种能力:同只手里的手指可以分工。

人类平时拿钥匙、手机、杯子、纸巾,常常就是这么做的。它不是次标准抓取,PVC管道管件粘结胶而是组临时组出来的多接触姿态。

这种动作会让人觉得机器人突然「像人」了。就像 Figure 的机器人学会用屁股洗碗机样,真正动人的不是动作本身有多复杂,而是它突然出现了种人类在日常生活里自然形成的身体策略:手不够用时,就用指缝;正面不便时,就用身体别的部位顶下。

这当然需要灵巧手本身有足够强的能力。但至少在 Genesis AI 这里,个判断已经很清楚:如果终目标是人类操作,系统的每层都要支持它。模型、手、手套、控制栈和仿真,不能再被拆成彼此立的模块。

周衔在 Business Insider 采访中,把 Genesis AI 和 Physical Intelligence 这类偏模型路线的公司区分开来。他说,Genesis AI 要做的是整套系统,包括模型、机器人手、训练手套、仿真器,终还包括机器人本体。全栈公司的好处在于,当你设计硬件时,你知道自己到底需要什么。

这句话几乎可以解释 Genesis AI 为什么这么重视手。

在目前的 demo 中,GENE-26.5 使用的是舞肌科技的灵巧手,已经很让人印象刻。

Genesis AI 展示了个 1 倍速弹 Rush E 的。它能看出这只手本身的速度、落点精度和多指协调能力已经很强。只是从技术归因上看,它不是 GENE-26.5 通用模型能力的直接证明,而是个单通过仿真强化学习训练、并由人类示范引的策略,主要用来验证控制栈的速准确跟踪能力。

而 Genesis AI 与舞肌共同设计了下代手。简单说,下代手要像人。

公开材料里,Genesis AI 将这只下代手称为 Genesis Hand 1.0。它会接近人手,目标是 1:1 匹配人手尺寸,拥有 20 个主动、可反驱自由度,手掌和手指覆盖软材料,用来模拟人类皮肤的软接触物理。在 Business Insider 采访里,Zhou 也提到,未来手部的电机将直接放在手内。

这条路线本身也很值得看。

绳驱手接近人类「前臂肌肉 + 手部肌腱」的结构,优点是手指可以轻、细,手型自然。但它也会带来摩擦、松弛、回差、张力维护和长期磨损等工程问题。Figure、Tesla、1X 都在不同阶段探索过类似向。

Figure 近展示的新代手型也引发了不少讨论。相比 Genesis AI 这只看起来非常像人手的案,Figure 的手仍然工程化、笨重。公开讨论中,Figure CEO Brett Adcock 曾表示,Figure 代手采用过类似 Tesla 和 1X 的绳驱案,但后来认为这是错误工程选择,很早就转向了掌心集成电机、再通过机械结构传动到手指的案。

这说明,灵巧手的路线之争,并不只是「像不像人」。

Figure 要解决的是:这只手能不能装进台要量产、要进庭或工厂、要长期干活的人形机器人里。它要考虑可靠、维护、整机集成、成本、重量、供电和耐久。

Genesis AI 关注的的是:人类手部能力能不能尽量低损失地进入模型。

人类手部数据非常丰富,但人手和机器人手形态不同。传统法往往要做复杂的动作重映射,把人类动作重新映射到机器人关节空间里。这个过程会带来信息损失,也会让模型学习到很多不属于人类动作本身、而是机器人硬件限制带来的东西。

这也是为什么「严肃的具身智能公司,后都会重新遇到硬件」这个判断开始变得越来越有解释力。

03

从物理引擎长出来的机器人公司

 

Genesis AI 不是已经反复出现在聚光灯下的机器人公司。

它成立时间很短,但这次 GENE-26.5 发布,就迅速进入了具身智能圈的讨论中心。

要理解这公司为什么能在次模型发布里做出这样的展示,不能只看这次 demo,也要看另个 Genesis AI:Genesis 仿真平台。

这个开源项目早被外界关注。它被定义为面向 Robotics、Embodied AI 和 Physical AI 的通用物理仿真平台,核心是套从头重建的物理引擎,可以模拟刚体、液体、气体、可变形物体、薄壳、颗粒材料等多种物理现象。

这也是 Genesis AI 和很多机器人公司的不同之处:它不是只从机器人本体开始,也不是只从大模型开始,而是从「物理世界如何被模拟、生成和评估」这个问题长出来的。

早在 2023 年,周衔、Th é ophile Gervet、Zhenjia Xu、Yi-Ling Qiao、Tsun-Hsuan Wang 等人就在篇 position paper 中提出过个向:用生成式仿真自动生成任务、场景和训练监督,规模化训练机器人技能,终走向通用机器人。

这个思路后来变成了 Genesis AI 很重要的竞争力。

客公园了解到,Genesis AI 的能力之,是自动化、规模化地生成多样任务和数据。传统仿真往往服务于个明确任务,比如火星车着陆、某个机械臂流程、某类工业装配;但通用机器人要面对的是开放世界,任务、物体、材质、工具和动作组几乎限扩展。

在 GENE-26.5 这次发布里,Genesis AI 公开呈现出来的路线,是用真实人类操作数据训练模型,再用仿真做闭环评估和迭代加速。也就是说,真实数据负责学习物理世界,仿真负责测量模型、筛选模型、加快模型迭代。

客公园还了解到,围绕「自动化、规模化生成任务」这件事,Genesis AI 已经有了进步的思考,后续可能会公布。

这会是个很关键的变量。

如果说近期的技术路线切换中,大已经比较明确:真实、但不依赖真机遥操作的数据,是下步的关键;那么仿真在机器人基础模型中的位置,仍然没有被确认。它到底会主要用来评估,还是能进步承担任务生成、数据生成和训练环境扩展,仍然是行业正在回答的问题。

但可以确定的是,它定仍然在未来的具身智能中十分重要。

这也是 Genesis AI 的底:它不只是有个机器人模型,也不只是有只灵巧手。它背后还有套试图生成物理世界、生成任务、评估模型的 Genesis AI 平台。

除此之外,虽然此次发布了庭场景的 demo,Genesis AI CEO 周衔对具身智能未来节奏的判断,并不是「机器人马上进入庭」。

客公园了解到,周衔认为,具身智能在实验室环境中,有望在到两年内进入类似 GPT-3.0 的阶段。也就是说,业研究者会看到明显的能力跃迁,并对技术路线形成相对基本的共识。

但这距离公众能安全、可靠地使用机器人,还有很长段路。

语言模型进入 GPT-3.5 或 GPT-4 阶段后,普通人才真正感受到它能稳定完成日常任务;机器人要达到类似阶段,门槛会。因为机器人不是在屏幕上输出文字,而是直接和物理世界交互。语言模型说错句话可以撤回,机器人翻水杯、撞坏设备、划破食材,都是现实损失。

也因此,周衔判断,具身智能真正走向大规模商业部署,可能需要达到类似 GPT-4.0 甚至 GPT-4.5 的成熟度。参考自动驾驶十多年仍在持续迭代的经验,机器人商业化不会是两年内完成的事情,5 年甚至久,都是理的预期。

* 头图来源:Genesis AI

本文为客公园原创文章,转载请联系客君微信 geekparkGO

客问

你如何看待   Genesis AI  ?

相关词条:管道保温施工     塑料挤出设备     预应力钢绞线    玻璃棉厂家    保温护角专用胶

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。