什么是cpu?
中央处理器(cpu),是电子计算机的主要设备之一,电脑中的核心配件。其功能主要是解释计算机指令以及处理计算机软件中的数据。cpu是计算机中负责读取指令,对指令译码并执行指令的核心部件。中央处理器主要包括两个部分,即控制器、运算器,其中还包括高速及实现它们缓冲处理器之间联系的数据、控制的总线。电子计算机三大核心部件就是cpu、内部存储器、输入/输出设备。中央处理器的功效主要为处理指令、执行操作、控制时间、处理数据。在计算机体系结构中,cpu 是对计算机的所有硬件资源(如存储器、输入输出单元) 进行控制调配、执行通用运算的核心硬件单元。cpu 是计算机的运算和控制核心。计算机系统中所有软件层的操作,最终都将通过指令集映射为cpu的操作。
什么是gpu?
图形处理器(英语:graphics processing unit,缩写:gpu),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。
gpu使显卡减少了对cpu的依赖,并进行部分原本cpu的工作,尤其是在3d图形处理时gpu所采用的核心技术有硬件t&l(几何转换和光照处理)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬件t&l技术可以说是gpu的标志。gpu的生产商主要有nvidia和ati。
gpu的构成相对简单,有数量众多的计算单元和超长的流水线,特别适合处理大量的类型统一的数据。但gpu无法单独工作,必须由cpu进行控制调用才能工作。cpu可单独作用,处理复杂的逻辑运算和不同的数据类型,但当需要大量的处理类型统一的数据时,则可调用gpu进行并行计算。
什么是tpu?
tpu(tensor processing unit)即张量处理单元,是一款为机器学习而定制的芯片,经过了专门深度机器学习方面的训练,它有更高效能(每瓦计算能力)。
因为它能加速其第二代人工智能系统tensorflow的运行,而且效率也大大超过gpu――google的深层神经网络就是由tensorflow引擎驱动的。tpu是专为机器学习量身定做的,执行每个操作所需的晶体管数量更少,自然效率更高。
tpu与同期的cpu和gpu相比,可以提供15-30倍的性能提升,以及30-80倍的效率(性能/瓦特)提升。
tpu每瓦能为机器学习提供比所有商用gpu和fpga更高的量级指令,这基本相当于7年后的科技水平。tpu是为机器学习应用特别开发,以使芯片在计算精度降低的情况下更耐用,这意味每一个操作只需要更少的晶体管,用更多精密且大功率的机器学习模型,并快速应用这些模型,因此用户便能得到更正确的结果。
什么是npu?
嵌入式神经网络处理器(npu)采用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体数据。
npu处理器专门为物联网人工智能而设计,用于加速神经网络的运算,解决传统芯片在神经网络运算时效率低下的问题。
在gx8010中,cpu和mcu各有一个npu,mcu中的npu相对较小,习惯上称为snpu。
npu处理器包括了乘加、激活函数、二维数据运算、解压缩等模块。
乘加模块用于计算矩阵乘加、卷积、点乘等功能,npu内部有64个mac,snpu有32个。
激活函数模块采用最高12阶参数拟合的方式实现神经网络中的激活函数,npu内部有6个mac,snpu有3个。
二维数据运算模块用于实现对一个平面的运算,如降采样、平面数据拷贝等,npu内部有1个mac,snpu有1个。
解压缩模块用于对权重数据的解压。为了解决物联网设备中内存带宽小的特点,在npu编译器中会对神经网络中的权重进行压缩,在几乎不影响精度的情况下,可以实现6-10倍的压缩效果。
附:
apu -- accelerated processing unit, 加速处理器,amd公司推出加速图像处理芯片产品。
bpu -- brain processing unit, 地平线公司主导的嵌入式处理器架构。
cpu -- central processing unit 中央处理器, 目前pc core的主流产品。
dpu -- deep learning processing unit, 深度学习处理器,最早由国内深鉴科技提出;另说有dataflow processing unit 数据流处理器, wave computing 公司提出的ai架构;data storage processing unit,深圳大普微的智能固态硬盘处理器。
fpu -- floating processing unit 浮点计算单元,通用处理器中的浮点运算模块。
gpu -- graphics processing unit, 图形处理器,采用多线程simd架构,为图形处理而生。
hpu -- holographics processing unit 全息图像处理器, 微软出品的全息计算芯片与设备。
ipu -- intelligence processing unit, deep mind投资的graphcore公司出品的ai处理器产品。
mpu/mcu -- microprocessor/micro controller unit, 微处理器/微控制器,一般用于低计算应用的risc计算机体系架构产品,如arm-m系列处理器。
npu -- neural network processing unit,神经网络处理器,是基于神经网络算法与加速的新型处理器总称,如中科院计算所/寒武纪公司出品的diannao系列。
rpu -- radio processing unit, 无线电处理器, imagination technologies 公司推出的集合集wifi/蓝牙/fm/处理器为单片的处理器。
tpu -- tensor processing unit 张量处理器, google 公司推出的加速人工智能算法的专用处理器。目前一代tpu面向inference,二代面向训练。
vpu -- vector processing unit 矢量处理器,intel收购的movidius公司推出的图像处理与人工智能的专用芯片的加速计算核心。
wpu -- wearable processing unit, 可穿戴处理器,ineda systems公司推出的可穿戴片上系统产品,包含gpu/mips cpu等ip。
xpu -- 百度与xilinx公司在2017年hotchips大会上发布的fpga智能云加速,含256核。
zpu -- zylin processing unit, 由挪威zylin 公司推出的一款32位开源处理器。