IT 之家 12 月 26 日音信,联想汽车今晚发布"联想 AI Talk 访谈实录 02 ",联想汽车董事长兼 CEO 李想、智能驾驶研发副总裁郎咸一又回复了对于智驾方面的部分问题。
IT 之家附"联想 AI Talk 访谈实录 02 "部分要点内容如下:
张小珺:第一次试驾端到端是什么样的体验?
郎咸一又:我第一次试到这个车,从中关村开到了北京交通大学。开了几公里我就问控制的贾鹏,这是轨则照旧奈何作念的?奈何我以为开得这样好呢?他说一句轨则都没写,十足是系统按照我们给它的数据我方西宾出来的。
我们开车都知说念,若是前边有个车刹停的话,它是要拖拉减慢,以致还再抬起少许刹车,有这样非常忻悦的刹车经由。这个经由我们团队在轨则阶段写了很永劫刻的代码,都莫得达到一个完全拟东说念主、惩处系数场景的发挥。
但我第一次试驾端到端,它的纵向就还是比之前试过系数的都要好的景色,这才用了短短不到 15 天。是以我以为那时候配置了一个信心,即是端到端一定能作念出来。何况一朝它作念出来,就一定会比现时系数的智能驾驶软件都要好。
张小珺:既然端到端是灵丹仙丹,为什么客岁不上?特斯拉客岁就上了,你客岁在干嘛?
郎咸一又:我们在等,等满盈的数据和算力,比及了我们就能上了。
端到端 VLM 大模子其实最终的内容是用东说念主工智能来作念自动驾驶。东说念主工智能的三个要素:算法、数据和算力。这三个要素必须十足都备。我们是本年是准备好了,是以我们能作念这个事情。
联想 AD Max 车型的销量,客岁起来了之后到本岁首(高质地西宾)数据量达到 10 亿(公里)控制限制,这是一个基础。第二是算力基础,本岁首我们算力也到了 5EFLOPS。再加上第三步,即是端到端的一些预研也有一定效用,是以到本岁首是天时地利东说念主和,不错作念这个事情了,客岁我们还在补课的一个经由。
张小珺:为什么许多企业的端到端是两个模子,而不是 One Model?
郎咸一又:这个是算法和理念的问题。我们要作念端到端时就给我方定了一个目的,一定要用纯数据驱动的形态来作念这件事情,而不是集会了之前的轨则来作念,是以说它的性能上限会非常高。
张小珺:为什么联想是端到端 + VLM,不像特斯拉只用端到端?你们对我方的端到端不够自信吗?
郎咸一又:不可这样讲,我们在作念时期决策时充分参考了全国上系数的先进决策,但长期无法惩处一个问题是,当一套自动驾驶或智能驾驶系统,它使命时若是遭受之前莫得见过的场景,应该奈那处理?我们认为即是端到端 + VLM,即是系统 1 + 系统 2 的形态,很好地师法东说念主类大脑的使命形态。
张小珺:特斯拉没灵验激光雷达,你们为什么要用?
李想:许多东说念主不太剖析说:为什么要保留激光雷达,照旧为了安全。是不是因为你时期不好?不是,中国和好意思国事不一样的,若是你通常在中国晚上夜路开车,你会看到有尾灯坏了的大货车、以致可能尾灯坏的大货车会径直停在主路上,至少我们今天的录像头,粗疏在夜深里莫得光辉下看到的距离,其实惟有 100 米出面。
然而激光雷达,在莫得任何光辉的情况下是不错看到 200 米的。这就不错匡助我们齐全 130 公里 / 小时的 AEB 自动紧迫制动。那我以为这个黑白常首要的,因为我们是个面向家庭的车,每个东说念主生命安十足非常的首要,是以这是我们连续保留激光雷达根底场所。何况后边的车型仍然会保留。我驯服若是马斯克在中国,在夜深里不同的高速开过车,他也会聘请把前边的一颗激光雷达保留住来。因为特斯拉对于安全通常地爱重,仅仅他要在这个环境里来看到。
张小珺:联想激进的用惟有一个模子的端到端,其他车企还在用两个模子,为什么?
李想:许多时候可能跟我们有一些比拟好的外脑经营,像王兴、陆奇博士,他们会给我们带来许多启发。有一次陆奇博士跟我们讲,你们应该想考一下东说念主是奈何使命的?我以为这个那时对我们匡助很大。
本岁首我还逼着智驾团队去好意思国,他们在不同的城市开 FSD V12。另一方面我们议论使命也在进行,那时还是在发端到端 + VLM 的多样议论论文了。回顾以后我以为要么你作念这个,要么我们就不要再作念自动驾驶了。今天你靠这些轨则上来作念的,跟请个供应商作念出来的东西有啥区别?莫得啥区别。
我劝服郎博他们很首要的少许,我说你们通常惩处了一个 Corner Case(极点情况),又出现三个其他的 Corner Case。你们一辈子都在惩处 Corner Case,惩处不完。
张小珺:环球都说联想作念智驾是插足最晚最慢的,你奈何看?
郎咸一又:2018 年 1 月我加入联想时,跟李想议论过这个问题。什么才是决定最终智能驾驶或自动驾驶齐全的最要津成分?我们那时聊的即是数据。东说念主才不错流动、算法不错晋升、算力也非常首要,然而只须有健康的资金、合理的资金使用亦然能买获取的。
那么最首要即是数据,数据它是买不到的,必须我方有这样一个非常高质地、限制非常大的数据,才不错作念好自动驾驶。是以我们要按照节律来作念自动驾驶,刚驱动我们要先把车造好、把车卖好,然后麇集更多的资金、东说念主才和数据,到了一定时刻点再无数插足,去达到更好的自动驾驶的效果。其实从现时肆意上亦然能看出这少许的:我们自动驾驶的节律黑白常好的。
张小珺:什么时候联想意志到,智驾对于卖车是有匡助的?
郎咸一又:从执行发挥来看是从本年驱动的,本年智能驾驶确乎对于销量有非常好的促进作用。我们 2 月 AD Max 的委用量占比只到 20% 控制,然后到本年下半年跳跃 50% 了,这是实打实的功绩。早期环球认为自动驾驶是一个功能,它跟座椅加热莫得大的区别,并莫得惩处用户宽泛出行的忻悦性。直到现时我们用 AI 来作念自动驾驶,端到端 + VLM 果真自若用户永劫刻的驾驶疲倦。当我们能达到抽象 MPI(城市 + 高速抽象接纳里程)100 公里、几百公里时,环球就果真气象为自动驾驶买单了。
张小珺:联想提议有监督智能驾驶,跟自动驾驶 L1 到 L5 传统分级有什么区别?
郎咸一又:这内部其实体现我们对自动驾驶研发的想路分歧。之前许多东说念主认为 L3 自动驾驶是 L2 援救驾驶的延续,只须把 L2 援救驾驶的场景越作念越多,总有一天能无穷趋近于 L3,以致可能就粗疏作念到 L3。
但在我们看来,L3 或者有监督智能驾驶,它并不是 L2 的延续,而是 L4 或者自动驾驶的先导规范。执行上我们是锚着异日的自动驾驶智力去研发、去成长和迭代的,而不是沿着往日一套用 L2 的想路,去作念现时的自动驾驶。
张小珺:你说自动驾驶是智力、援救驾驶是功能,两者内容区别是什么?
郎咸一又:功能是预设条目,智力是搪塞系数条目。你不可能穷尽系数的预设。
功能的话,照旧用上一代的这种软件 1.0 决策来作念自动驾驶。最大的问题是在研发之初,就要明晰地设定系数条目、系数领域,以及最终笃定性的肆意。这在自动驾驶里黑白常艰难的。
智力的话,是用东说念主工智能的形态来作念自动驾驶。当我们把自动驾驶当成智力来迷惑,从最内容想考东说念主是奈何学会开车的。最驱动东说念主去驾校学习,掌捏基本驾驶妙技再锻练。考完掌捏基本智力之后,动作实习司机一边引申一边晋升智力,渐渐地成长为老司机。我们系统 1 + 系统 2 的决策,让自动驾驶系统辖有这种智力去迭代和成长,跟着数据量的增长,它会渐渐地让性能随之晋升,这个即是环球通常说的限制效应。
张小珺:你们考据了自动驾驶的限制效应吗?
郎咸一又:我们已教化证出来了。这不是我们发明的,系数的大模子愚弄都适应这种划定,也即是说数据限制和数据质地的增长,会带动性能的增长。何况性能增长是接近于线性的,这即是我们用大模子最内容的克己。
张小珺:有监督智能驾驶阶段,联想委用给用户的家具长什么样?
郎咸一又:全场景的、一体化端到端家具。要想齐全存监督智能驾驶,一个前提是齐全车位到车位,也即是惩处最前边一百米和终末头一百米。以前智驾是从干说念驱动,现时不错从小区车位驱动,然后包括园区说念路、停车、城市说念路,还有高速和收费站 ETC 都会一齐买通。
高速城市全场景升级端到端 + VLM,以及编削的 AI 推理可视化的交互,将在近期随 OTA 全量推送给系数的 AD Max 用户。
张小珺:L3 什么时候齐全?
郎咸一又:按照现时的端到端 + VLM 这套体系,智力连续迭代的话,我们是有但愿在 2025 年去齐全 L3 的。
张小珺:濒临李想岁首对于智驾的生气,你的处事危险是什么时候铲除的?
郎咸一又:我觉获取现时还没铲除,因为还莫得作念到极致。我们的目的是本年抽象 MPI(城市 + 高速抽象接纳里程)作念到 100 公里接纳一次的智力。这个接纳不是安全接纳,不是说你要撞车了才接纳,是用户以为车开得不适应体验、不适意的接纳。到来岁、后年,我们会缓缓晋升至 500 公里、以致 1000 公里以上。渐渐让环球对智驾越来越自信、越来越依赖。
张小珺:要齐全这样的目的,需要储备若干算力和数据?
郎咸一又:要达到 500 公里的抽象 MPI(城市 + 高速抽象接纳里程),瞻望需要 2000 万 Clips(视频片断)的水平。若是 2000 万 Clips 从不到 5% 的老司机去筛选,这里隐含的数据量开云(中国)Kaiyun·体育官方网站-登录入口,要达到 50 亿公里以致上百亿公里的水平。