瑞芯微车联网芯片通过提升算力、优化架构、改进算法等方式来提升在大模型技术方面的性能,具体如下:
提升硬件算力
- 采用先进制程:如即将在 2026 年推出的 RK3688M,采用 4nm 制程,相比之前的制程工艺,在性能和功耗上有更大优势,能为大模型的运行提供更强大的硬件基础。
- 提高 NPU 算力:瑞芯微车联网芯片不断提升 NPU 算力,如 RK3588M 的 NPU 算力为 6TOPS,RV1126B 的 NPU 算力为 3TOPS,而 RK3688 的 NPU 算力更是高达 16TOPS 甚至更高,强大的 NPU 算力可以更好地支持大模型的推理计算。
- 优化 CPU 和 GPU 架构:RK3588 采用 8 核 big.LITTLE 架构(4×A76@2.4GHz+4×A55@1.8GHz),GPU 为 Mali - G610 MC4 + 2D 加速引擎,这种架构设计使得算力和能效能够动态平衡,并且具备较强的图形处理能力,可辅助 NPU 更好地运行大模型。
优化架构设计
- 多芯片协同:瑞芯微计划推出协处理芯片,与现有的高性能 AIoT SoC 芯片平台协同工作,如即将推出的协处理芯片将与 RK3688 形成高低搭配、协同推进的产品策略,为边端侧设备提供更强劲的 AI 算力支持,满足大模型运行需求。
- 专用硬件引擎:RV1126B 集成专用 AI - ISP 硬件,运行 AI - ISP 时无需占用通用的 NPU 资源,较传统 NPU 方案更节省带宽与功耗,能够更高效地处理视觉数据,为大模型在车载视觉场景的应用提供支持。
改进算法与软件
- 模型优化技术:针对汽车电子设备资源有限的特点,瑞芯微致力于对大模型进行小型化和轻量化处理,通过模型压缩、量化等技术,在不影响模型性能的前提下,减少模型的存储空间和计算量,使其更适合在车载芯片上运行。
- 支持混合精度计算:如 RV1126B 支持权重稀疏化、W4A16/W8A16 混合精度量化及 Transformer 优化技术,RK3588M 支持 6TOPS 混合精度计算,这种混合精度计算方式可以在保证计算精度的同时,提高计算效率,降低功耗,有利于大模型的运行。













.eb68a87.png)
.8d1291d.png)
.3808537.png)
.2fc0a9f.png)