您所在的位置:首页 - 教育 - 正文教育

寻找端侧大脑岩芯数智要让每台设备拥有智能

admin admin 08-09 【教育】 400人已围观

摘要IT时报记者孙妍今年被认为是端侧AI元年,AI手机、AIPC、AI机器人不断涌现。在2024世界人工智能大会(WAIC)上,一个像人一样有着高情商的多模态机器人引人注目,“我看到了一位打扮时尚的小姐姐,她好像在参加一场名叫WAIC的大型展会。”接着走了四步就作了一首以枫叶为主题的诗,简直是“四步成诗”的大诗人。它是来自岩芯数智RockAI,搭载树莓派5代芯片的“小智”,在极低算力设备上实现了多模态能力,即便断网也能继续执行任务。如何在手机、电脑、机器人等设备上,让端侧AI“大脑”驱动最低算力,实

IT时报记者孙妍

今年被认为是端侧AI元年,AI手机、AIPC、AI机器人不断涌现。

在2024世界人工智能大会(WAIC)上,一个像人一样有着高情商的多模态机器人引人注目,“我看到了一位打扮时尚的小姐姐,她好像在参加一场名叫WAIC的大型展会。”接着走了四步就作了一首以枫叶为主题的诗,简直是“四步成诗”的大诗人。它是来自岩芯数智RockAI,搭载树莓派5代芯片的“小智”,在极低算力设备上实现了多模态能力,即便断网也能继续执行任务。

如何在手机、电脑、机器人等设备上,让端侧AI“大脑”驱动最低算力,实现像人一样阅读、交流,并不断自主学习和成长?岩芯数智RockAI给出了一个答案,今年初,岩芯数智RockAI发布了Yan1.0云端大模型,而“小智”的大脑已经进化到Yan1.2大模型,具备了语音和视觉处理能力,能准确理解用户的模糊指令和意图,并据此控制其机械躯体完成各类复杂任务。

端侧AI告别“一次性”

端侧AI指在终端设备上直接运行和处理人工智能算法的技术,可以直接利用设备的计算能力处理数据,不需要将数据发到云端或服务器进行处理,无论网络环境如何都能及时响应,降低云端算力的成本,也能更好保障数据安全。

如何把大模型“蒸馏”后塞进PC或手机?传统轻量化部署往往以性能损失为代价,AIPC就是将大模型通过量化压缩部署到个人电脑,70亿参数的大模型还需额外定制PC芯片提供算力。而此前在微型电脑主板树莓派5上打出“1.89tokens每秒速度运行、支持8K上下文窗口”战绩的Llama38B,同样止步于“有损压缩”。压缩后的模型不仅性能大打折扣,还会失去再训练、再学习的能力,成为无法定时更新底层知识的“一次性AI”。

Yan1.2大模型已无损跑通树莓派,原生无损地以超6tokens/s的速度运行于树莓派上,并在这个体积仅有信用卡大小的芯片上实现多模态能力,不仅能“听说读”,还可识别模糊指令,进行学习、创作及互动。关键是树莓派的算力只有普通电脑的八分之一,可用于物联网、工业自动化、智能家居等场景,搭载在门禁、机器人等终端上,而且大部分时间没有联网。

而是手机、PC、机器人等搭载主流消费级CPU的端侧设备上,能实现每秒超20tokens原生无损地输出,这主要得益于对大模型基础架构的“破坏式”创新。

今年1月,岩芯数智RockAI发布国内首个非Transformer的Yan架构大模型时,行业内仍有质疑的声音。但半年过后,行业开始发现,Transformer的确不是大模型的最终答案。Yan架构大模型通过替换Attention机制,将计算复杂度将为线性,大幅降低算力需求,用百亿级参数达成千亿参数大模型的性能效果。

而在算法侧,RockAI采用了基于仿生神经元驱动的选择算法,实现了类脑分区激活的工作机制(比如开车和写字会激活人脑不同的区域),使大模型可以根据学习的类型和知识的范围分区激活,大幅减少了数据训练量。

让每个设备都拥有主动学习的“AI大脑”

历经了卷参数、卷市场的阶段,大模型当下正集中于一个“卷智能”的时代,因此,让大模型无损跑通更多低算力设备只是第一步,接下来就要思考如何提高端侧大模型的知识密度、智能密度。RockAICEO刘凡平表示,在实现通用人工智能的同时,应将AI与每个人独特的地方结合在一起,模型具备自主学习能力,让每个设备都拥有个性化的智能。

以往,大模型的开发是通过预训练和后期的微调对齐,在通用场景使用绰绰有余,但换一个没有经过预训练的工作场景,Transformer大模型往往要先经过1-2个月去把原有数据清掉后,再进行重新训练并投入使用,无论从算力、时间还是经济成本,对企业而言都“难以接受”。

如何让大模型像人一样实时学习?RockAI团队展示了“同步学习”机制的实验室示例,据展台工作人员介绍,该机制已处于实验室最后验证阶段,试图能更低代价更新神经网络,实现对现有知识体系的快速更新,辅以模型分区激活降低功耗、实现部分更新,使大模型像人类学习一样建立自己的知识体系,在推理同时进行之时更新与学习,实现边跑边进化,无需像云端大模型一样“返厂”更新或预训练。

“我们认为大模型未来的市场是不是toC,也不是toB,寻找端侧大脑岩芯数智要让每台设备拥有智能而是toD,也就是设备端”RockAI展台工作人员对《IT时报》记者表示,下一步,RockAI计划基于Yan模型打造通用人工智能操作系统,也就是1.0时提出的全模态实时人机交互系统,并以此搭建诸如群体智能等多样交互的人工智能生态。

“让每一台设备都拥有自己的智能,让每个人都能拥有专属的个性化人工智能服务。”刘凡平表示。

Tags: 寻找端侧大脑岩芯数智要让每台设备拥有智能

icp沪ICP备2023034384号-20 icp粤公网安备 44030902003287号
取消
微信二维码
支付宝二维码

目录[+]