当前位置: 代码迷 >> 综合 >> NVIDIA Jetson TX2 System-on-Module中文简介
  详细解决方案

NVIDIA Jetson TX2 System-on-Module中文简介

热度:69   发布时间:2023-11-21 08:05:00.0

配置:
Pascal GPU + ARMv8 + 8GB LPDDR4 + 32GB eMMC + WLAN/BT

简介:
NVIDIA Jetson TX2系统对模块上的系统(SOM)重新定义了可能性;性能、电源效率、集成的深度学习能力和丰富的I/O组合消除了新一代产品的障碍。JetsonTX2是许多应用的理想选择,包括(但不限于):智能视频分析(IVA)、无人机、机器人、游戏设备、虚拟现实(VR)、增强现实(AR)和便携式医疗设备。优越的性能,稳健的设计和降低系统集成的复杂性,使更先进的产品更快地进入市场。

Jetson TX2集成了:

  1. 256核心NVIDIA PASCAL GPU:
    完全支持所有现代图形API,统一的着色器和GPU计算能力。GPU支持所有与离散NVIDIA GPU相同的特性,包括广泛的计算API和库(包括CUDA)。在嵌入式用例中为最佳性能进行了高度优化。
  2. ARMv 8(64位)多处理器CPU复合体.由NVIDIA设计的高性能相干互连结构连接的两个CPU集群;使两个CPU集群能够在真正的异构多处理(HMP)环境中同时运行。丹佛2(双核)CPU集群是为更高的单线程性能而优化的;ARM Cortex-A57 MPCore(Quad-Core)CPU集群更适合多线程应用程序和较轻的负载。
  3. 高级高清视频编码器。在60 fps时录制4K超高清视频。支持H.265和H.264 BP/MP/HP/MVC、VP 9和VP 8编码。
  4. 高级高清视频解码器。以高达12位像素的60fps播放4K超高清视频。支持H.265、H.264、。
    VP9、VP8 VC-1、MPEG-2和MPEG-4视频标准。
  5. 显示控制子系统。两个多模式(EDP/DP/HDMI)输出和多达8通道的MIPI-DSI输出。多行像素。
    存储允许更高效的内存缩放操作和像素提取。还提供了硬件显示表面旋转,用于。
    减少移动应用中的带宽。
  6. 128位内存控制器。128位动态随机存取存储器接口,提供高带宽的动态随机存取存储器支持。
    模块上集成了 8 GB LPDDR4和32 GB eMMC内存。
  7. 1.4Gpix/s高级图像信号处理:硬件加速静止图像和视频捕获路径,具有先进的ISP。
  8. 音频处理引擎。音频子系统实现了对多个接口上的多声道音频的完全硬件支持。

一、物理描述
Jetson TX2 SOM是一款高性能、小巧的器件。它从机械上简化了模块化系统设计。
将集成组件与外部机械力隔离,标准化热和机械接口,以及。
在单个板对板连接器上暴露了一组全面的系统和外围设备接口。
Jetson TX2模块的核心集成组件包括:
?Tegra X2(Parker系列SoC)。
-NVIDIA Pascal GPU。
-ARMv8(64位)HMP CPU复合体。
–NVIDIA Denver 2双核CPU。
–ARM Cortex-A57四核CPU。
?8 GB LPDDR4内存。
?32 GB eMMC5.1存储。
?IEEE 802.11a/b/g/n/ac双频2x2无线局域网和蓝牙4.1组合芯片。
?千兆以太网。
?PMIC、调节器、电源和电压监控器。
?热转印板一次热界面。
?400针板到板连接器(提供高速和低速行业标准I/O)。
?无线局域网和BT天线连接器。
?温度传感器。
?板ID EEPROM
在这里插入图片描述
在这里插入图片描述

  1. 连接。
    集成在Jetson TX2模块上的WLAN/蓝牙支持:
    ?无线局域网就绪:
    -2x2 MIMO。
    -符合802.11ac(向后兼容传统802.11b/g/a/n设备)。

?蓝牙就绪:
-蓝牙4.1就绪(可以连接到支持蓝牙4.1的设备)。
-HIDP。
-Audio-A2DP(高级音频分发配置文件)。
-RFKILL

  1. WLAN/BT天线接头。
    模块上有用于WLAN/BT的凸形I-PEX天线连接器。这些产品支持具有以下功能的天线。
    特点:
    ?凹式i-pex连接器。
    ?2.4千兆赫和5千兆赫频段。
    ?50Ω阻抗

  2. 热特性。
    TX2模块的设计从功能和散热两个角度来看都是模块化的。
    虽然它集成了几个单独的组件,但主要的Jetson TX2模块热接口是通过一个热接口。
    覆盖顶部的传送板(TTP)。TTP简化了热设计,并与系统级热集成。
    解决方案。有关热评估和设计的完整详细信息,请参阅Jetson TX2模块热设计指南。
    使用Jetson TX2模块进行处理。

二、功能描述
Jetson TX2 SOM可用于需要不同性能指标的各种应用中。容纳。
这些变化的条件、频率和电压由Tegra电源和热管理软件主动管理。
并受到工作量的影响。

1. Pascal GPU
NVIDIA采用新的Pascal图形处理器架构,在性能和能效方面进行了重大改进。
Jetson TX2集成了这些相同的GPU架构增强功能,以进一步提高性能并降低功耗。
计算密集型工作负载的消耗。之前的(Maxwell)GPU架构引入了一种全新的设计。
对于流式多处理器(SM),Pascal GPU体系结构继续改进这种SM设计,以下增强功能:
?简化的数据路径。
?新的SM调度器架构。
?在调度和重叠加载/存储指令方面的改进。
?新算术运算。
?改进了对大地址空间和页面出错功能的支持

图形处理集群(GPC)是用于计算、光栅化、着色和纹理的专用硬件块;大多数GPU核心图形功能的大部分都是在GPC内部执行的。它由多个SM单元和一个光栅引擎组成。
SM单元并行地创建、管理、调度和执行来自多个线程的指令。光栅运算符(ROP)继续与二级缓存片和内存控制器保持一致。SM几何和像素处理性能,使其高度适合呈现高级用户界面和复杂的游戏应用程序;
Pascal GPU可以在功率有限的设备上实现这一性能。
每个SM被划分为四个独立的处理块(称为SMP),每个SMP包含其自己的指令、缓冲器、调度器和32个CUDA内核。在每个SMP内部,CUDA内核执行像素/顶点/几何体着色和。
物理/计算计算。纹理单元执行纹理过滤,加载/存储单元读取数据并将其保存到存储器。特殊功能单元(SFU)处理超越和图形内插指令。最后,多态引擎处理顶点提取、细分、视口变换、属性设置和流输出。

特点:
?端到端无损压缩。
?切片缓存。
?OpenGL 4.5、OpenGL ES 3.2和Vulkan1.0。
?支持?自适应可伸缩纹理压缩(ATSC)LDR配置文件。
?DirectX12兼容。
?CUDA支持
?迭代混合、ROP OpenGL-ES混合模式。
?来自3D类的2D点阵避免了频道切换。
?2D颜色压缩。
?常量色彩呈现SM绕过。
?支持彩色和Z压缩的2x、4x、8x MSAA。
?非2次方和3D纹理,fp16纹理过滤。
?fp16着色器支持。
?几何体和顶点属性实例化。
?并行像素处理。
?Early-z Reject:快速拒绝遮挡像素在保存的同时对像素着色器和纹理性能起到倍增的作用。
功率和带宽。
?视频保护区。
?节能:多级时钟门控,实现功率的线性调整

2. CPU
CPU复合体由两个CPU集群(总共6个处理器核心)组成,采用一致的多处理器配置MCPU集群:Denver 2(双核)处理器;BCPU集群:ARM Cortex-A57 MPCore(四核)处理器。Denver 2和Cortex-A57 CPU群集支持执行64位Aarch64代码和32位Aarch32代码的ARMv8,包括传统的ARMv7应用程序。

这两个CPU群集通过NVIDIA设计的高性能一致互连结构连接,从而实现同时运行两个CPU群集(如果需要,所有6个核心),以实现真正的异构多处理(HMP)环境。一致性机制允许根据任务的性能需要在CPU核心,没有手动缓存刷新的开销。Denver 2处理器提供了显著更高的单线程性能;通过NVIDIA的动态代码优化实现,这会导致更多无序操作以及相关联的未完成存储器读取。Cortex-A57更适合多线程应用和较轻的负载。

两个CPU群集都通过AXI接口连接到MSelect FIFO,以分离I/O流量。MSelect允许AXI主机基于事务地址将业务发送到外围总线的设备。AXI/Xbar网桥可实现早期响应,写入传输和完全硬件风险解决方案,以实现MMIO的最大事务吞吐量。

3. 内存控制器
内存控制器(MC)可最大限度地提高内存利用率,同时为关键CPU请求提供最低延迟访问。仲裁器用于确定请求的优先级,优化内存访问效率和利用率,并将系统功耗降至最低消费。MC为所有内部设备提供对主存储器的访问。它为其客户端通过标准化接口,允许客户端忽略内存层次结构的细节。它优化了对共享的访问,内存资源,平衡延迟和效率,以提供最佳系统性能,基于可编程参数。从结构上讲,内存子系统(MSS)由四个主要组件组成:
MSS主干:将来自客户端的请求路由到MC集线器,并将来自MC集线器的响应路由到客户端。
SMMUMC集线器:接收客户端请求,执行?转换,执行各种安全检查,并发送请求。
到四个MC频道。
MC通道:行排序器/仲裁器和动态随机存取存储器控制器。
DRAMIO:通道到垫结构、DRAMI/O垫和PLL。

MC能够在非常多样化的请求组合中保持高利用率。例如,MC的带宽是优先的。(BW)所有多媒体块的延迟过高(多媒体块的架构已设计为预取和流水线传输其操作以提高延迟容忍度);这使MC能够通过合并、重新排序和对请求进行分组以最小化内存功耗。DRAM还具有省电模式,用于在不使用或不使用DRAM时,在特定类型的使用期间。

4. 图像信号处理器(ISP)
ISP从VI或CSI块中提取原始拜耳格式的数据,并将其处理为YUV输出。高级图像处理用于将输入转换为YUV数据,并消除高百万像素CMOS传感器、相机镜头和颜色空间转换。
特点:
?CSI虚拟通道(VC)支持每个CSI x4模块四条VC。
来宾操作系统虚拟化的?SMMU ID支持。
?本地音调映射1。
?自动曝光的?拜耳直方图统计。
?自动白平衡和自动曝光的?拜耳平均图。
?用于自动对焦的?清晰度贴图

5. 显示控制器
显示控制器复合体包含两个串行输出资源(SOR),它从显示器的输出中收集像素、流水线,将它们格式化/编码成所需的格式,然后流到各种输出设备。SOR由以下几个部分组成:
可用于与不同显示设备(如HDMI或DP)接口的各个资源,SOR只能驱动一个;任何给定时间的单个设备。
除SOR外,还提供两个MIPI-DSI接口,最多可支持2 x 4通道模式。

6. 高清(HD)音视频子系统
HD音视频子系统使用一组功能块从以下位置卸载音频和视频处理活动CPU子系统,从而实现快速、完全并发、高效的操作。
该子系统由以下部分组成:
?多制式视频解码器。
?多标准视频编码器。
?JPG处理块。
?视频图像合成器(VIC)。
?音频处理引擎(APE)。

  相关解决方案