端侧AI引领人机交互革新,市场规模预计CAGR高达58%
AI导读:
东吴证券研究报告称,端侧AI正革新人机交互,模型快速升级,行业巨头引领发展。预计端侧AI市场规模2023-2028年CAGR高达58%,2028年将突破1.9万亿元。硬件变革核心在内存,苹果发力内存创新应对瓶颈。多模态UI交互界面革命带来新机遇。
3月3日,东吴证券发表研究报告指出,端侧AI正引领人机交互革新,模型升级迅速,行业巨头引领发展潮流。AI自主化能力正从“以指令为中心”向“以意图为中心”持续进化。LLM(大型语言模型)正全方位改造终端设备,其中Agent对于解答开放式问题至关重要,这背后得益于大模型对复杂输入的理解、规划推理及工具使用的强大能力。据头豹预测,端侧AI市场规模在2023至2028年间预计将以58%的CAGR(复合年均增长率)高速增长,至2028年将突破1.9万亿元大关。在具体小模型性能方面,参数量对模型性能有着巨大影响,但受限于硬件条件,小模型的技术创新更为积极,旨在提升有限参数量下的性能,量化、剪枝、蒸馏成为主流的模型压缩方式,不同数据集、压缩精度、量化混合方式将导致小模型呈现多样化发展。
硬件变革的核心在于内存升级,苹果正积极发力内存创新以应对内存瓶颈。相较于云端模型,硬件是端侧模型发展的重要制约因素,亟需升级以弥补短板。对比各大厂商硬件,苹果在内存、电池、散热方面拥有巨大提升空间。内存及其操作带来的能耗问题成为当前最紧迫的短板,预计将成为硬件变革的核心方向。例如,半精度的7B模型仅参数加载就占用超过14GB的DRAM,且DRAM的耗能远高于SRAM和计算。同时,iOS和安卓在内存利用效率上存在巨大差异,安卓需在OS层提供统一的AI基础模型,而iOS则需在模型压缩之外,提高硬件内存以克服瓶颈。苹果不仅在内存容量上寻求突破,还在内存结构、耗能、传输速度等方面进行创新,如与三星合作开发独立封装形式,推进全新的WMCM封装方式,以提高芯片组合的灵活性和集成度。
多模态UI交互界面的革命为Agent带来了历史性机遇。根据交互模式,任务执行方法可分为基于API和基于用户界面(UI)的方法。API交互的泛用性较弱,而UI界面方式在Transformer架构下较好地克服了任务和UI元素之间的隐含关系,显著提升了GUIAgent的可行性,有望成为主流交互方式。当前,苹果和谷歌均在UI交互模型上发力,苹果的Ferret-UI和谷歌的ScreenAI模型均采用读屏AI视觉语言模型,通过统一编码方式理解屏幕信息。从谷歌UI模型来看,模型参数的提升对性能有着较大影响,同时5B模型在性能提升上尚未达到饱和,因此继续提升模型性能显得尤为重要。
(文章来源:财中社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。