嵌入式AI部署常用硬件平台

原创

已于 2023-09-04 09:27:59 修改 · 3.3k 阅读

标签

#人工智能

收录于

于 2023-08-31 17:57:10 首次发布

前言：

CUDA与NPU都是并行计算模块，可加速模型推理速度。 FLOPS (floating point operations per second)指硬件设备每秒浮点运算次数，用于衡量硬件计算性能。

算力常用单位：

FLOPS: FLOPS是每秒浮点数运算次数，一般见于GPU；

TOPS：通常是指八位定点数运算的次数，一般见于FPGA和ASIC；

1TFLOPS与1TOPS，前者代表是每秒执行1万亿次浮点运算次数，后者代表每秒执行1万亿次运算次数，区别FL即float浮点，大多数NPU都是定点运算，故通TOPS来标称算力。

五个因素影响深度学习模型推理效率：

①数据吞吐量，指运算设备在单位时间内传输的数据量。

②功耗，单位功率内数据吞吐量，数据的计算需要在给定功耗限制下完成。

③时延，指硬件启动后到执行推理的时间，降低延迟对推理加速至关重要。

④推理准确性，在边缘设备的推理结果要与训练时一致。

⑤内存，神经网络推理所需内存主要由算法本身决定，在实际应用时，一个平台可能会部署多个算法，而设备内存大小有限，减小内存对算法应用至关重要。

1、Jetson TX2

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

灯下随笔

关注关注

20
点赞
踩
45

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

RK3588平台开发系列讲解（嵌入式AI篇）嵌入式AI模型的部署

内核笔记

11-23

3004

📢 本篇将给大家介绍嵌入式AI模型的部署。

参与评论您还未登录，请先登录后发表或查看评论

嵌入式Linux AI模型私有化部署完整技术方案

最新发布

huanghm88的专栏

04-29

本文提出了一套完整的嵌入式Linux AI模型私有化部署技术方案。该方案采用分层架构设计，包括应用层、业务编排层、推理引擎层、模型优化层和硬件加速层。针对嵌入式设备的资源限制，推荐了TinyLlama 1.1B、Qwen2.5-1.5B等轻量级开源模型，并详细介绍了模型获取与格式转换方法。技术选型遵循算力感知、量化优先和内存优化原则，支持4-bit/8-bit量化以显著降低内存占用。方案还提供了多模型串联推理、本地训练调参等功能，最终以APP形式交付，满足嵌入式Linux环境下的AI应用开发需求。

关于嵌入式四大平台

r2019j的博客

11-22

1676

关于嵌入式，你到了什么段位了？ b站有位海事大学的吴老师的视频很有意思，听了之后找时间手打字幕整理了下更清晰。附带一些名词的解释。单片机：最小F51 3X3mm，用在光模块里。 Arduino Micro板子便宜低功耗，静态待机电流控制在10nA以下开发有一个集成开发环境即可，并且有大量的例程和资源可调用。接口I2C、SPI接一些传感器，屏幕。 AD读一些模拟量，电位器(电位器是具有三个引出端、阻值可按某种变化规律调节的电阻元件。电位器通常由电阻体和可移动的电刷组成。当电刷沿电阻体移动时，在

【嵌入式】AI落地部署技能

liudongdong_jlu

12-16

1742

嵌入式AI部署技能

嵌入式平台

xindongpai的博客

05-18

718

嵌入式平台 FPGA GPU CPU ARM 跨平台 ZYNQ

盘点那些常见的嵌入式开发平台(1):微控制器类（MCU）

byte轻骑兵的技术小窝

11-20

8886

嵌入式开发平台是专为非通用设备设计的特殊计算环境，旨在满足智能手机、家用电器、汽车控制系统等多样化设备的需求。这些平台通常集成了硬件、软件及开发工具，提供高效、可靠且定制化的解决方案。开发者可以利用这些平台快速构建、调试和优化嵌入式应用程序，以满足设备的特定功能和性能要求。嵌入式开发平台不仅降低了开发难度和成本，还提高了开发效率和产品质量，是推动物联网、智能制造等领域发展的重要力量。

嵌入式AI技术的研究与应用

sinat_41942180的博客

02-19

3603

本研究旨在深入探讨嵌入式AI技术在边缘计算和物联网应用中的演进和实际应用。通过对硬件平台、模型优化、实时性与效率、安全性和隐私等关键方面进行详尽分析，旨在全面理解嵌入式AI技术的发展趋势，并为其在不同领域的进一步应用提供深刻见解。首先，在硬件平台方面，将关注嵌入式AI在各类边缘设备上的部署，探究专用硬件（如GPUFPGA）在提高计算性能和能效方面的作用。通过对硬件架构的研究，揭示如何更好地利用有限资源，使嵌入式AI系统在边缘环境中更为高效地运行。

【软件系统架构】系列四：AI 模型在嵌入式设备部署指南

moton2017的博客

07-04

3506

AI 模型在嵌入式设备部署指南系统性解析，涵盖平台选型、模型压缩、框架工具链、部署流程、典型案例与性能优化等内容，适用于开发边缘智能终端、物联网设备、智能硬件等嵌入式 AI 产品。

打破硬件壁垒：TVM 助力 AI技术跨平台部署

程序边界

01-12

4800

TVM（Tensor Virtual Machine, 张量虚拟机）是一种开源的模型编译框架，旨在将机器学习模型自动编译成可供下层硬件执行的机器语言，从而利用多种类型的算力。其工作原理是，先将深度学习模型进行优化推理、内存管理与线程调度，再借用LLVM框架将模型部署在CPU、GPU、FPGA、ARM等硬件设备上。本书全面解析TVM的主要功能，帮助读者理解TVM工作原理，以及使用 TVM对深度学习与机器学习进行优化与部署。

嵌入式 AI 硬件与软件生态介绍

2401_85199775的博客

03-11

716

嵌入式 AI 硬件与软件生态

100篇带你入门——嵌入式系统开发平台

Forver的博客

06-03

3108

嵌入式系统开发是一项关键的技术领域，涵盖了从传统家用电器到现代智能手机、智能车辆等各种应用的广泛范围。在这个领域中，选择适合的开发平台对于项目的成功至关重要。本文将介绍几个常用的嵌入式系统开发平台，并进行比较分析，以帮助开发人员更好地选择适合自己项目需求的平台。

【嵌入式开发必备知识汇总】：嵌入式概念、平台、iic协议介绍

深耕嵌入式领用多年，致力于分享嵌入式领域技术!

04-18

926

【嵌入式开发必备知识汇总】：嵌入式概念、平台、iic协议介绍

嵌入式MCU平台汇总

TENET123的博客

06-30

4647

嵌入式MCU平台可以归类为以下几类：单片机、DSP、ARM（如Cortex-M系列）、超低功耗MCU（如MSP430、RL78）、物联网MCU（如ESP8266、ESP32）、高性能嵌入式处理器（如STM32、NXP Kinetis、Renesas RX）、开源架构MCU（如RISC-V）和可编程逻辑器件（如FPGA）

自动驾驶（七十四）---------硬件平台介绍

热门推荐

zhouyy858

10-16

1万+

在整个自动驾驶中，我们之前讨论了很多软件算法，很少涉及到硬件领域，今天结合我接触的一些硬件知识做一个总结，整理硬件在整个自动驾驶中的作用和市面上常见的几种硬件。 1. 软硬件架构软硬件架构也是三部分组成：硬件平台，操作系统，软件算法。 硬件平台具体是指计算平台，目前主流的自动驾驶芯片解决方案主要包括GPU、FPGA、DSP和ASIC四种。其作用主要包含三个方面：提供传感器数据的接口，把传感器的数据导入计算平台。分析传感器传入的数据，结合车辆自...

【小黑嵌入式系统第三课】嵌入式系统硬件平台（一）——概述、总线、存储设备（RAM&ROM&FLASH)

Goforyouqp的博客

10-18

5338

嵌入式系统的硬件除了核心部件——嵌入式处理器，还包括存储器系统外围接口部件以及连接各种设备的总线系统。其中，存储器是嵌入式系统存放数据和程序的功能部件；而外围设备决定了应用于不同领域的嵌入式系统的独特功能。嵌入式系统的硬件是以嵌入式处理器为中心，由存储器、I/O单元电路、通信模块、其它外部设备等必要的辅助接口组成。在实际应用中，嵌入式系统硬件配置非常精简，除了微处理器和基本的外围电路以外，其余的电路可以根据需要和成本进行裁剪、定制。通常，嵌入式系统还包括人机交互界面，用于系统与人的交互。

嵌入式系统的硬件平台和接口

T19900的博客

11-16

642

第三天的内容是关于嵌入式系统的硬件平台和接口。

嵌入式系统硬件概述

timerring的博客

12-02

5083

英国先进RISC机器公司（Advanced RISC Machines，简称ARM公司）是专门从事基于RISC技术芯片设计开发的公司，作为知识产权（Intelligence Property，IP）供应商，本身不直接从事芯片生产，它只是提供一些高性能、低功耗、低成本和高可靠性的RISC处理器核、外围部件和系统级芯片应用解决、设计方案;

GPU(国内外发展，概念参数（CUDA,Tensor Core等），类别，如何选型，NPU,TPU)

weixin_48878618的博客

10-06

7013

从目前的市场看，人工智能（大模型）发展的快慢主要取决于算力，其次是算法。而算力又受限于GPU。

嵌入式操作系统的整体架构

weixin_55953651的博客

10-10

2238

微内核结构是目前的主流结构之一,又称为客户/服务器(C/S)结构,在这种体系结构中,微内核仅提供任务调度、任务间通信、底层网络通信、中断处理接口和实时时钟等几种基本服务,且内核非常小,任务在独立的地址空间运行,速度极快;因此,作为嵌入式系统的最基本软件的操作系统,需要尽可能减少安全漏洞和不可靠的隐患,通过系统监控进程监视各进程的运行状况,在遇到异常情况时采取措施对其进行修复,实施有利于系统稳定可靠的方法将问题解决,从而从嵌入式系统的底层增强可靠性。在层与层之间定义良好的接口,上下层通过结构进行交互和通信;

盘点那些常见的嵌入式开发平台(4):单片机类

byte轻骑兵的技术小窝

02-28

9999

单片机类嵌入式开发平台种类繁多，各具特点。在选择时，开发者需要根据具体的应用场景、性能需求、开发难度以及成本等因素进行综合考虑。同时，了解各种开发平台的开发环境、编程语言、外设接口以及生态系统等信息也至关重要。