0
联系电话:4001-158-698EN

公司新闻 行业动态 产品知识

bandao.com半岛(bandao·中国)电子科技-不止 Thor 芯片!英伟达深耕8年,打造智能驾驶量产赋能新范式

【导读】CES 2026上,英伟达发布多款汽车范畴焦点产物与技能,此中开源辅助驾驶模子Alpamayo颇具看点,该模子拥有100亿参数,定名寄意技能高地,也呼应了黄仁勋提出的练习、推理、仿真“三台计较机”技能金字塔观点。英伟达还有提出,计较机财产每一10-15年将迎来一次平台厘革,新一代DRIVE Thor芯片等产物恰是其适应这一趋向的结构。只管汽车营业营收占比不高,但英伟达已经连续投入超8年,且正深度贴合中国客户需求,提供适配行业成长的技能与产物撑持。

为汽车行业提供全栈解决方案

一个优异的智能驾驶产物,毕竟该具有甚么样的焦点特征?于英伟达看来,共有四年夜特色:第一是机能,既依靠SoC的算力基础,也离不开算法层面的深度优化;第二是体系不变性,跟着海内智能驾驶量产范围扩展,体系的靠得住性与安全性成为焦点竞争力;第三是易用性,降低开发者的上手门坎,实现车端与云端 AI 芯片的高效开发,是行业的配合诉求;第四是高效撑持,快速相应客户需求,为项目落地提供全周期技能办事,是客户最为存眷的要点。

黄仁勋重复夸大的英伟达焦点支柱是三台计较机:用在练习的DGX、用在仿真的OVX及用在车载推理的AGX。这组成了从数据练习、仿真验证到量产部署的完备闭环。而英伟达的解决方案也能够分为三个层面:SoC芯片、平台及软件。

第一,SoC芯片方面,英伟达的车载计较芯片履历了四代成长:2018年的1TOPS的Parker,到2020年量产在小鹏P7等车型的30TOPS的Xavier,再到2022年254 TOPS的Orin,以和可以到达最高2000TOPS(NVFP4)的Thor。

权衡芯片机能不克不及只看算力数值,内存带宽一样是要害指标。芯片机能犹如木桶效应,GPU、CPU与内存带宽任一环节成为短板,城市制约总体机能阐扬。以Thor为例,其内存带宽高达273GB/s,处在行业领先程度。采用NVFP4及谋利采样,对于内存带宽的需求还有可以进一步削减,从而使机能有更好的阐扬。此外,英伟达于芯片设计中融入了诸多立异架构,除了了焦点的GPU计较单位,还有集成为了多种专用加快引擎,确保计较资源的高效使用。于专利结构上,针对于车载GPU,英伟达拥有700余项专利技能。

第二,平台方面,英伟达严酷遵照ASPICE及ISO 26262流程,同时得到了产物级的TÜV的ASIL-D功效安全认证。值患上留意的是,行业内部门厂商传播鼓吹的 “安全认证”,需区别是产物认证、架构认证还有是流程认证,此中产物功效安全认证的尺度最为严苛,而英伟达是业内少数完玉成流程认证的企业。

英伟达还有界说了像Hyperion如许的参考架构,当前 Hyperion 已经成长至第四代,也就是Hyperion 10。该平台于设计之初,就对于传感器配置、体系架构与软件举行了功效安全分化,明确了撑持L4 级主动驾驶所需的算力配置,Hyperion 10搭载两块基在 NVIDIA Blackwell 架构的 NVIDIA DRIVE AGX Thor 体系级芯片,可提供跨越 2000 TFLOPS FP4 精度 (或者 1000 TOPS INT8) 的及时算力。同时,英伟达为每个软硬件模块都设定了明确的功效安全方针,形成为了完备的安全需求矩阵。

第三,软件方面,英伟达提供两种可量产的OS选项:QNX及基在Linux的DriveOS。于中国市场,很多企业偏向在Linux,重要因其生态及开发便当性。为此,英伟达将DriveOS QNX中很多客户器重的功效,如内存ECC校验、诊断功效迁徙到了Linux版本中,从而于连结开发矫捷性的同时,加强了体系的靠得住性及诊断能力,更年夜幅缩减了从芯片到量产的时间。

除了此以外,于方才已往的CES上,英伟达发布的Alpamayo年夜模子,这是一款交融推理能力的开源VLA年夜模子,基在Transformer架构打造。英伟达认为,纯真的端到端模子缺少可注释性,而融入推理能力的Alpamayo模子,可以或许让智能驾驶决议计划更具逻辑性与靠得住性。

针对于中国市场的立异

中国团队慎密共同当地市场的快速需求,英伟达驱动了很多立异产物。

起首,第一个例子是卫星架构下的雷达数据处置惩罚优化。传统毫米波雷达的数据处置惩罚由雷达模组内置芯片完成,仅向车载SoC传输方针检测成果。跟着车载SoC算力的晋升,车企提出 “将雷达原始数据传输至SoC举行处置惩罚” 的需求,这一方案可节省雷达模组的硬件成本,并晋升算法的矫捷性。针对于这一需求,英伟达对于NvSIPL SDK举行了定制化开发,可撑持雷达及激光雷达。同时,把新增雷达原始数据处置惩罚模块部署到SoC的专用加快器(PVA)上,既防止了占用GPU资源,又实现了算力的高效使用。

接着,第二个例子是TensorRT Edge-LLM 的车端适配。2023年英伟达发布了面向云端年夜模子推理的TensorRT LLM SDK,一些车企随即提出将其移植到车端平台的需求。2024 年,英伟达中国团队仅用两周时间,就完成为了TensorRT LLM于Orin平台的开端适配。但于后续优化中发明,云端与车真个技能需求存于显著差异:云端存眷高吞吐量,而车端受限在传感器数据输入范围,对于低延迟、低内存占用要求更高。

为此,团队推出专为车端设计的TensorRT Edge-LLM SDK,并与海内年夜模子团队睁开互助,完成模子适配与优化。今朝,该SDK已经撑持英伟达全系列嵌入式计较平台,包括车真个Orin与Thor系列、嵌入式的Jetson 系列,以和及联发科互助开发的C-X1/ C-Y1系列。相较在业内其他推理框架,TensorRT Edge-LLM具有三年夜上风:一是撑持C++原生开发,更切合车载场景的量产需求;二是深度适配英伟达GPU架构,可充实阐扬硬件算力;三是机能上风显著,官方数据显示,其推理效率相较在业界其他年夜模子推理框架晋升两倍以上。今朝,英伟达正于鞭策该 SDK的功效安全认证。

末了,第三个例子是Orin芯片的机能迭代。Orin芯片作为一款发布三年半的产物,经由过程TensorRT的版本迭代,Transformer的机能可以晋升30-50%;同时基在最新的TensorRT Edge -LLM SDK,Orin同时可以很好的撑持7B的年夜模子,并取患上相称好的机能。

从底层的芯片硬件,到中间层的DriveOS与SDK东西链,再到上层的感知、规控算法与 Alpamayo年夜模子,英伟达已经构建起全栈式的智能驾驶解决方案。

持久践行开源模子及东西链技能线路

云端协同也是英伟达的一个发力点。于数据中央端,英伟达重要包括两个开源模子平台:一是世界基础模子(WFM)Cosmos,二是CES上方才发布的Alpamayo。

开源模子与东西链并不是英伟达的战略转型,而是持久践行的技能线路,焦点方针是经由过程技能普惠,鞭策行业成长。

起首,于Cosmos方面,体系焦点组成包括三方面:一是模子层,涵盖感知、决议计划、推理等全链路模子;二是东西层,包括数据标注、数据洗濯、模子练习等开源东西;三是数据层,提供富厚的练习数据集。此中,东西层的两款东西深受海内企业青睐:一款是用在练习历程的主动化数据标注东西,可年夜幅晋升标注效率;另外一款是数据检索东西,可以或许快速定位高质量的练习数据。针对于中国市场,英伟达将原有的英文练习剧本,优化为撑持中文的开源版本,进一步降低了开发门坎。

当前智能驾驶行业面对着一个焦点瓶颈:跟着主动驾驶等级的晋升,长尾场景数据收罗成本呈指数级增加,传统“路采-练习-验证”模式已经难以为继。这也是近半年来,海内主动驾驶技能冲破放缓的主要缘故原由。为此,英伟达提出了天生式AI驱动的解决方案,经由过程Cosmos、Issac等天生式模子,合成高质量的长尾场景数据,以算力换取数据,破解行业痛点。

天生式模子分为三年夜类:一是纯天生模子,输入一段真实路况视频,便可猜测后续的场景变化,部门车企已经将其运用在仿真测试;二是前提天生模子,经由过程输入文本指令,天生特定场景的数据,可精准笼罩极度气候、繁杂路况等长尾场景;三是气势派头迁徙模子,可以或许将2D 仿真场景转化为传神的3D数据,晋升仿真测试的真实性。区分在行业内其他方案,英伟达的天生式模子焦点上风于在工程化量产能力,模子天生的数据具有时序一致性与场景合理性,彻底满意主动驾驶的练习与测试需求。

1769564461930654.png

其次,于Alpamayo方面,该模子的焦点立异于在因果推理数据集的构建,英伟达初次提出了参考公式化的数据集标注要领,经由过程“感知-推理-决议计划”的全链路标注,让模子可以或许进修到决议计划的逻辑,而非简朴的图象与成果的映照瓜葛。

以施工路面场景为例,传统感知模子仅能辨认 “施工路面”这一方针,而Alpamayo模子则会举行多步推理:起首辨认 “视野遮挡” 这一要害特性,再联合车辆当前的速率、间隔等信息,终极输出“减速慢行”的决议计划指令。这类推理式的决议计划逻辑,让模子具有更强的泛化能力,即便碰到从未练习过的施工厂景,依然可以或许做出准确决议计划。“数据集构建、模子练习、仿真强化”的全链路方案,是Alpamayo模子实现高泛化性的焦点缘故原由。

此外,英伟达已经开放了原始数据集,该数据集涵盖全世界多地域的真实路况,且已经完成脱敏处置惩罚,开发者可直接用在模子练习。

1769564474482738.png

Alpamayo模子的最年夜价值,于在为L4级主动驾驶提供了一条高效的实现路径。其可注释性的决议计划逻辑,解决了传统端到端模子黑箱的行业痛点,今朝已经有多家车企规划将该模子作为主驾体系的焦点算法,搭配冗余的安全体系,实现L4级主动驾驶的量产落地。

1769564483968211.png

开源模子源在与中国客户的互助

很多开源事情是源在英伟达与企业深度互助中辨认到的痛点。有三个典型案例,揭示了英伟达立异技能怎样赋能智能汽车的量产落地。

第一个案例是蔚来主动驾驶数据处置惩罚加快方案。2022年,蔚来于量产车型的数据回传历程中,面对着数据量激增、处置惩罚效率低下的难题。英伟达团队针对于这一痛点,开发了一套主动化的数据筛选与预处置惩罚方案,终极实现数据处置惩罚吞吐量晋升6倍。这一方案看似与芯片发卖无直接联系关系,但英伟达始终秉持“解决行业痛点”的理念,经由过程技能赋能降低车企的研发成本,才能鞭策整个行业的成长,这也是英伟达区分在其他芯片厂商的焦点竞争力。今朝,该方案已经进入开源流程,将来将面向全行业开放。

第二个案例是英伟达闭环仿真平台NuRec的本土化落地。海内头部车企的仿真测试系统中,均能看到该平台的身影。该平台的焦点功效是,输入一段路采数据,便可天生多样化的场景变体,例如调解车辆位置、行人举动、气候状态等,帮忙车企快速完成海量场景的测实验证。某车企的实践数据显示,运用该平台后,仿真测试效率最高可晋升35倍,测试成本至多可降低到50分之一,辅助驾驶体系的研发周期从“月级” 缩短至“小时级”。

第三个案例是端到端练习的存储优化方案。跟着端到端模子的鼓起,车企的练习数据从“单帧图片”转向“持续视频流”,存储成本激增300%~1000%,成为制约技能落地的新瓶颈。英伟达团队针对于这一问题,开发了边解码边练习的流式处置惩罚方案,无需将视频数据完备存储,便可直接用在模子练习。该方案仅增长数百分比的GPU开消,却能帮忙车企节省90%的热存储成本,按单车企的练习范围计较,每一年可节省上亿元的硬件投入。今朝,该方案已经于多家车企落地,并将连续迭代优化。

这三个案例的共性于在,英伟达解决的都是车企量产历程中 “真问题”。这些问题看似与芯片算力无关,却直接决议了技能可否从试验室走向市场。

总结

从芯片硬件的机能迭代到软件生态的定制优化,从开源模子的技能普惠到量产场景的痛点破解,英伟达以全栈结构及持久主义,构建起智能驾驶范畴的焦点竞争力。Alpamayo模子的因果推理立异、天生式AI的数据解决方案,以和针对于中国市场的本土化适配,不仅彰显了技能硬实力,更表现了与行业共生的成长理念。跟着开源生态的连续完美及全栈方案的不停迭代,英伟达有望进一步打破智能驾驶量产瓶颈。

3-958x200_20251021044704_586.png

-bandao.com半岛(bandao·中国)电子科技
1210
在线客服
在线客服

Maggie

微信咨询

黎小姐