高通刚刚发了一份《通过NPU和异构计算开启端侧AI》的报告
手机AI负载有哪些:照片/视频拍摄、图像生成/编辑、代码生成、录音转录/摘要、文本(电子邮件、文档等)创作/摘要、语音识别、游戏和视频的超级分辨率、视频通话的音频/视频处理、视频通话的实时翻译,以及最重要的always on的AI助手,例如手机可以根据用户的对话内容自动建议与同事的会议。
为什么需要NPU:通用 CPU 和 GPU,难以满足这些 AI用例严苛且多样化的计算需求。AI用例在不断演进,功能完全固定的硬件不行。因此,支持处理多样性的异构计算架构能够发挥每个处理器的优势,例如以AI为中心定制设计的 NPU,以及 CPU 和 GPU,每个处理器承担不同的任务:CPU 擅长顺序控制和即时性、GPU适合并行数据流处理、NPU擅长标量、向量和张量数学运算,可用于核心AI工作负载。比如我们在 2023 骁龙峰会上,高通在搭载第三代骁龙8移动平台的手机上演示了语音控制的 AI个人助手,这一用例的工作负载分配方式:
此外,高通AI软件栈全面支持主流Al框架(如TensorFlow、PvTorch、ONNX和 Keras)