4、编译 Samples " />
当前位置: 代码迷 >> CUDA >> 4、编译 Samples 
  详细解决方案

4、编译 Samples 

热度:681   发布时间:2016-04-29 10:44:48.0
Ubuntu-12.04 安装 CUDA-5.5

1、CUDA-5.5的新特性

  • —— 动态并行(Dynamic Parallelism):GPU 加速新算法

GPU 线程可以动态地衍生新线程,从而更好地适应数据流。

通过最大程度地简化与 GPU 的往来通信,动态并行技术可以大大简化并行编程,

让更多流行算法支持 GPU 加速,比如自适应网格加密、计算流体动力学等等。

  • —— GPU-Callable 库:支持第三方生态系统

新的 CUDA BLAS 库可以让开发人员为他们自己的 PU-Callable 库使用动态并行,

比如设计插件API、让其他人扩展其内核的功能性,部署 GPU Callback、自定义第三方 GPU-Callable 库的功能性。

对象链接(object linking)可将多个 CUDA 源文件编译成不同的对象文件,然后链接到更大的应用和库中,从而更简单、更高效地开发大型 GPU 应用。

  • —— GPUDirect 支持 RDMA (远程直接内存访问):消除系统内存瓶颈

GPUDirect 技术建立了 GPU 与其它 PCI-E 设备的直接通信,并支持网卡与 GPU 之间的 RDMA,还能大幅降低集群中GPU 节点间的 MPISendRecv 延迟、改进整体应用性能。

  • —— NVIDIA Nsight Eclipse Edition:快速简单地生成 GPU 代码

Linux、Mac OS X 平台上,NVIDIA Nsight Eclipse Edition 可以让开发人员在熟悉的 Eclipse IDE 环境内开发、调试和编译 GPU 应用,并自带 CUDA 编辑器和 CUDA 示例,可以更快地生成 CUDA 代码,还整合了专家级的分析系统,提供自动性能分析,以及修复代码中性能瓶颈的向导,还有语法高亮区分 GPU 代码和 CPU 代码。

CUDA 5 操作系统支持包括:Windows XP 台式机、Windows Vista/7/8 台式机和笔记本、Ubuntu 11.04/11.10、Fedora 16、Red Hat Enterprise Linux 5.x/6.x(后者仅限64位)、OpenSUSE 12.1(64位)、SUSE Server 11 SP1/SP2、Mac OS X。


2、准备工作

CUDA-5.5 安装包下载地址:http://developer.nvidia.com/cuda/cuda-downloads



我的系统是ubuntu12.04 32位的,所以选择下载Ubuntu 12.04 下面 32 位的 RUN 就可以了,600M+


检查电脑是否有支持 CUDA 的 GPU

lspci | grep -i nvidia
[email protected]:~$ lspci | grep -i nvidia01:00.0 VGA compatible controller: NVIDIA Corporation G98M [GeForce G 103M] (rev a1)
我的笔记本是 GeForce G 103M 型号的 GPU

查看自己 GPU 型号是否支持 CUDA 可以参看官网文档:

官网文档:http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/index.html


3、安装过程

安装build-essential安装包,以确保cuda及显卡驱动所需的gcc的安装

apt-get install build-essential

退出图形界面,进入控制台:

/etc/init.d/lightdm stop
按【Ctrl】+【alt】+【F1】进入控制台界面,运行如下命令:

sudo sh cuda_5.5.22_linux_32.run
在此过程中,一开始会出来一个文档,比较长,可以通过按下按键【q】退出文档,然后输入【accept】就可以安装灵,一直按确认,默认安装即可,中间会选择驱动文件目录等。


设置环境变量:

在 /etc/profile 下添加如下语句

export PATH=$PATH:/usr/local/cuda-5.5/binexport LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-5.5/lib
source /etc/profile

通过运行如上命令,可以生效 PATH。


退出控制台:

启动 lightdm 服务

service lightdm start

4、编译 Samples 


直接运行 make 就可以编译 samples 里面的程序了。


随机找了一个例子运行如下:








  相关解决方案