资深智驾专家解读：端到端自动驾驶-韭研公社

登录注册

资深智驾专家解读：端到端自动驾驶

轻点一支烟

奉旨割肉的剁手专业户

2024-05-05 09:21:15

讨论涵盖了端到端自动驾驶技术的多个方面，包括技术原理、发展现状、面临的挑战以及未来发展趋势。会议首先介绍了端到端自动驾驶的基本概念和重要性，然后详细讲述了自动驾驶的传统算法框架及其存在的局限性。接下来，重点讨论了一种基于Transformer的端到端学习方法，这种方法能够通过共享优化目标实现整体优化，从而提高自动驾驶系统的性能。此外，还提到了端到端学习在实际应用中的成功案例，证实了它在提升系统效率和安全性方面的潜力。会议深入探讨了端到端自动驾驶技术所面临的挑战，包括技术转化、算法性能提升、数据收集与处理等方面的问题，并提出了相应的解决方案或建议。这包括如何将理论上的算法应用于实际汽车、优化算法以适应有限的计算资源、以及如何应对供应链和组织结构变革所带来的挑战。讨论也关注了国内外自动驾驶技术的发展状况，比较了不同的技术和方法，并分析了它们的优缺点。其中包括了数据驱动的决策算法的重要性、端到端学习的一段式和两段式方法的应用前景，以及市场和技术因素对未来自动驾驶技术发展的影响。此外，会议还涉及到数据安全、大规模数据采集与处理、以及智能汽车研发中的团队规模和人员配置等问题。通过这些讨论，参与者能够全面了解端到端自动驾驶技术的现状、发展方向以及所需要解决的关键问题，为该领域的研究和实践提供了重要的指导和启示。

问答

问：端到端自动驾驶是什么，它与传统自动驾驶算法有何区别？

答：端到端自动驾驶是一种新型的自动驾驶算法，它摒弃了传统自动驾驶算法中各模块独立优化的目标设定，而是主张所有模块共享一个优化目标，即全局最优解，以期实现最佳的控制指令。例如，UDAD算法通过一个transformer架构将感知到规划的所有模块串联起来，每个模块共享规划路径误差率这个单一优化目标，从而在性能上达到行业最佳水平。

问：端到端自动驾驶算法如何实现理论到实际应用的转化？

答：要将端到端自动驾驶算法真正落地到实车上并实现工程化，关键在于提高算法性能上限和解决从理论到实践的转化问题。首先，端到端算法本身具有更好的表现力，其数据驱动的方式使得它能应对更多复杂场景，但如何获取和快速标注训练数据成为提高性能上限的关键。其次，在实现算法落地过程中，需要考虑硬件算力的支持，特别是如何将大规模参数的端到端算法压缩到芯片上以适应现有的芯片算力限制，并找到合适的GPU支持大规模训练数据的需求。

问：端到端自动驾驶技术的关键因素有哪些？端到端自动驾驶技术对行业有何影响？

答：端到端自动驾驶技术的关键因素主要包括三个方面。首先，数据工程方面需要大量高质量的数据，涵盖全面且结构化的数据体系，以及丰富的数据处理经验。其次，需要具备高效的端侧算力芯片，如A100等，并能在大规模并行训练中运用到数百甚至上千张卡。最后，云端算力的能力也是关键，以支持海量数据的训练和计算需求。端到端自动驾驶技术具备颠覆性，改变了原有技术架构，对算法公司和车企产生了巨大影响。传统算法体系仅涉及感知算法和一些融合算法，而端到端算法将整个体系用神经网络串联起来，使得规则算法部门大幅收缩，大部分资源和人员投入都集中在模型训练上，这对企业的资金支持和商业模式提出了极高要求。

问：端到端自动驾驶技术对数据处理有何影响？端到端自动驾驶技术对商业模式有何影响？

答：端到端自动驾驶技术要求重新积累数据，并按照其技术路径和算法要求进行深度标注，增加了对真实轨迹、行为意图、目标车信息等多维度数据的需求。同时，需要搭建一套自动化数据标注体系，以应对数据集时序一致性高的要求，这一过程需要前沿技术如图像描述算法、场景重建技术和世界模型技术的支持，对技术团队投入较大。当前的自动驾驶算法商业模式主要是提供白盒或黑盒算法，收取开发费或license。而端到端自动驾驶技术处于重投入阶段，投入产出难以直接衡量，且量产效果有限，难以替代现有量产算法，商业模式尚不清晰。不过，从硬件成本和纯视觉方案的角度看，端到端算法具有成本优势，具备推广可能性。然而，要实现从当前投入阶段到最终量产阶段的过渡，仍需商业模式的转变，并面临诸多不可预测性。

问：两段式和一段式端到端算法在实际应用中是如何发展的？政策层面对于端到端算法面临的挑战及其解决方案是什么？

答：在自动驾驶领域，从感知端到DPC端再到统一端到端（UIAD）的形式，其实是一个逐步优化的过程。目前来看，两段式端到端算法更具经济性和可操作性，因为它能够复用感知数据，并且DPC端到端的神经网络体量较小，占用算力可控。同时，通过在DPC环节增加规则算法，可以确保性能并加速量产。然而，最终状态会从两段式走向一段式，但受到技术限制以及政策挑战，如数据合规问题的影响，目前仍处于过渡阶段。端到端算法面临的主要政策挑战是数据合规问题，包括感知数据的匿名化处理、地理位置信息的迁转等要求。随着端到端算法普及，意味着整个数据合规政策体系需要达到较高程度的完善。特斯拉作为典型案例，其在国内推广V12时，必须解决数据合规问题以应对corner case，因此数据合规政策完整性至关重要。此外，针对特斯拉在海外取得的端到端算法表现，国内厂商如华为、小鹏等也有望在一定时间内追上其步伐，通过优化算法以适应复杂场景，从而与特斯拉在自动驾驶领域展开竞争。

问：特斯拉入华后，如何应对数据合规问题并推动V12在国内的落地？

答：特斯拉进入中国后，首先需要解决其V12在国内的数据合规问题，包括回传感知数据进行匿名化处理等。一旦这些问题得到妥善解决，特斯拉需要经历数据回踩和重新训练的过程。以特斯拉现有的百万量级量产车规模，假设每天每个车收集一定时段的数据，那么它可能需要一个月左右的时间来完整采集数据。特斯拉还需建立数据处理流水线或依赖国内公司提供算力，进行端到端算法的重新训练，这个过程可能也需要数月时间。因此，如果特斯拉成功解决数据合规问题并完成数据采集和训练，大约4到6个月后其V12在国内的表现可能会有所提升。

问：在自动驾驶领域，今年有哪些主要竞争焦点？

答：今年自动驾驶领域的主要竞争焦点分为两个主战场。第一个是城市NOA项目PK，其中华为表现较为突出；第二个是无图方案的竞争，如商汤、大疆、圆融等公司处于梯队中，拥有量产项目和实际效果。

问：端到端算法公司之间有何区别？特斯拉如何解决训练端到端算法时的数据问题？

答：端到端算法公司如华为、蒙丹塔、圆融等，提出了一段式和两段式的算法方案。两段式相比一段式落地速度更快，但最终状态上一段式可能成为终局。各家公司在落地速度和算法复杂度上有差异，目前处于观望态度。特斯拉可能会尝试与智算中心合作，进行算力租赁或寻找具备图像资质的数据处理机构合作，进行数据的特征化处理后在国外进行训练。另外，特斯拉在国内自建超算中心的需求很大，规模可能需要达到数百块卡或服务器，以满足其需求。

问：如何理解汽车数据处理安全要求标准通报中的“符合数据合规”含义？

答：符合数据合规意味着车企通过检测，其车辆在生产过程中严格遵循数据匿名化要求，不包含个人信息或位置等敏感信息。特斯拉车型通过检查是因为其不外传数据，符合数据安全要求。

问：符合数据安全要求的车辆具备何种条件？

答：符合数据安全要求的车辆具备数据回传的先决条件，即具备将数据传回国内数据中心的能力。虽然数据不能出境，但具备这一条件意味着可以尝试开启数据回传功能，但数据具体接收方需在国内。

问：目前自动驾驶算法训练方面的算力供需情况如何？

答：国内主机厂和方案商自建算力中心的情况普遍，但整体算力供需情况可能并不短缺。特斯拉需要的算力规模较大，可能需要数百块卡或服务器，以满足其需求。具体供需情况还需进一步观察和分析。

问：在需求大于供应的情况下，国内有自研倾向的公司在构建算力基础时面临什么挑战？

答：由于美国政策限制，国内公司无法直接购买高性能GPU，只能依靠存货来分蛋糕。尽管车企已建立上千P的算力中心，但剩余公司获取的GPU资源会更加有限。

问：目前数据闭环方面的工具链主要包括哪些模块和能力？大厂如百度、字节跳动和商汤在数据闭环方面的建设中占据何种地位？

答：当前数据闭环主要包含数据底座（数据管理与清洗筛选）、AI闭环（包括增值标注、模型训练、部署和评测，以及上车过程）以及决策规控闭环（将场景数据虚拟化三维化，并与规控算法或决策算法结合进行仿真训练）。未来，有望走向统一的一套体系化的数据闭环系统。大厂因其资金实力和技术积累，更有可能投入资源进行数据闭环系统的构建，尤其是那些具有AI相关业务线的互联网大厂。

问：对于车企或供应商来说，构建端到端数据闭环所需的门槛和技术条件是什么？

答：构建数据闭环需要在组织架构上考虑投入预算，拥有一定的硬件底座（如GPU算力和数据服务器）、AI人才，并具备一定的资金投入。技术条件的限制意味着部分车企可能不具备自研规划、规控资源或无法承担大规模基础设施建设所需的资金投入。

问：国内厂商获取数据的主要方式及数据量如何？

答：国内厂商获取数据的主要方式可能包括试驾车辆的监控、自动驾驶测试、消费者使用行为等，但总体上视频量仍难以达到上亿小时的目标，与特斯拉等公司相比存在较大差距。

问：在数据回传方面，每天一台车能够回传多少corner case数据？

答：如果一辆车每天遇到五个corner case，每个corner case会录制大约30秒的数据，那么每天会有五分钟的数据回传。这样，根据车辆数量乘以每天的数据回传量，就可以计算出每天或每月能够回传的数据体量。

问：在回传的数据中，如何筛选和补足高质量的数据？

答：在数据系统中，会进行数据筛选，去除重复、错误或无用的数据。此外，还会通过设定比例系数来统计每月或每年能够积累的数据体量。然而，这个数字与端到端算法所需的数据量仍存在较大差距，因此还需要通过数据闭环体系，利用场景重建手段去创造更多高质量数据，例如特斯拉通过量产车回传的数据重构场景，模拟目标物行驶路线等信息来弥补数据不足。

问：在自动驾驶迭代过程中，不同算力水平的自动驾驶系统可能会如何应用？

答：目前自动驾驶系统的迭代路线是从基础L2到高速NA再到城区NV，随着算力逐渐提高，未来城区自动驾驶可能会更多地采用端到端技术。而在低算力平台上，比如一些低配或中配车型，仍会采用传统感知决策规控模型。这主要取决于车企针对不同价位段和消费群体推出的车型配置策略。

问：传统感知决策研发团队与端到端研发团队的人员规模大约是多少？

答：对于传统感知融合、决策规控分模块研发团队，通常需要大约200人左右。而针对端到端研发，由于模型框架统一后，需要设计规则的人数会减少，一个50人的团队基本能够满足需求。特斯拉等公司的研发团队中，核心团队规模相对较小，更多人员会投入道路采集和数据处理等低技术含量的工作。

问：大厂为何会配备大量研发人员？

答：大厂配备大量研发人员是因为它们要同时处理多个量产项目，比如接洽多个供应商。这些项目需要乘以四五倍的人员投入，包括部分无法复用的量产调试、标定测试等岗位.

作者利益披露：转载，不作为证券推荐或投资建议，旨在提供更多信息，作者不保证其内容准确性。

声明：文章观点来自网友，仅为作者个人研究意见，不代表韭研公社观点及立场，站内所有文章均不构成投资建议，请投资者注意风险，独立审慎决策。

宜通世纪

路畅科技

工分