丁丁打折网 - 网友优惠券分享网站，有688999个用户

当前的位置: 首页 > 文章列表 > 手机平板 > 微软新技术让大模型在手机上运行快5倍更高效更低耗

— 微软新技术让大模型在手机上运行快5倍更高效更低耗 —

更新时间：2024-08-10 10:10:02　编辑：丁丁小编

【太平洋科技快讯】近日，微软亚洲研究院发布了一项名为T-MAC的新技术，旨在优化大型模型在端侧设备上的部署。这项技术凭借其高性价比，使得仅凭CPU就能实现模型的快速运行，同时大幅降低资源消耗。

T-MAC技术亮点：手机运行大模型提速4-5倍

T-MAC技术使手机、PC、树莓派等端侧设备运行大型语言模型成为可能，解决了存储和计算两大难题。

通过基于查找表(LUT)的计算范式，T-MAC技术避免了传统方法中的反量化操作，提高了推理性能，降低了乘法和加法操作的数量。

在最新高通Snapdragon X Elite芯片组的Surface AI PC上，T-MAC技术的表现超越NPU，实现了高效的模型部署。

T-MAC技术核心创新：以比特为核心的计算

T-MAC技术采用查找表(LUT)代替传统的乘累加(MAC)计算，降低了CPU上的功耗，提高了计算效率。

以比特为核心的计算方式，简化了数据结构，实现了不同精度模型的快速部署。

T-MAC技术的计算性能随着比特数的降低而线性提高，这在基于反量化的GPU和NPU中是难以实现的。

T-MAC技术优化算子实现，提升端侧设备性能

研究员们针对T-MAC技术设计了高效的数据结构和计算流程，以提升端侧设备的计算性能。

通过优化矩阵分块、权重布局和寄存器重排等方法，T-MAC技术在多种CPU平台上实现了显著的性能提升。

实验结果表明，T-MAC技术在4比特算子上相较于现有方法获得了显著加速。

微软亚洲研究院已将T-MAC技术开源，相关论文已在arXiv公开。这一创新技术的推出，有望为端侧设备运行大型模型提供更多可能性，推动行业的发展。

本文转载于：https://www.sohu.com/a/799751695_223764 如有侵犯，请联系dddazheyh@163.com删除

前一篇：全球首个通过中国法考的AI模型法观诞生 8月10日将开启公测

后一篇：华为Mate70系列延迟发布或因HarmonyOS NEXT适配推后

热门文章榜

热门优惠券

更多

Debenhams UKExtra 15% Off Selected Brands
Debenhams UKExtra 15% Off Selected Brands
立即领取
Serenata FlowersFlash Sale | Get 16% Off The Joyful Wishes Bouquet – was £34.99, now £29.39
Serenata FlowersFlash Sale | Get 16% Off The Joyful Wishes Bouquet – was £34.99, now £29.39
立即领取
京东商城英氏官方旗舰店满20减13
京东商城英氏官方旗舰店满20减13
立即领取
京东商城沐林旗舰店满29减23
京东商城沐林旗舰店满29减23
立即领取
京东商城六神京东自营旗舰店满35减12
京东商城六神京东自营旗舰店满35减12
立即领取

最新分享

更多

一加13首销半小时即破10万台！高配版本占比80%
2024-11-01 17:05:01
立即阅读
顶级国产屏！「全能旗舰」一加13实在太香了
2024-11-01 16:15:02
立即阅读
两大影像旗舰同台竞技：OPPO Find X8 Pro和vivo X200 Pro怎么选？
2024-11-01 16:10:01
立即阅读
iQOO 13战报出炉！首日销量破iQOO新机纪录
2024-11-01 16:05:02
立即阅读
双11想换护眼显示器？千元档首选华为MateView SE
2024-11-01 15:05:04
立即阅读
AI商务笔记本新标杆：dynabook TECRA A40-M
2024-11-01 13:05:02
立即阅读
从龙之信条2到黑神话，为什么如今的大型单机越来越吃内存CPU？
2024-11-01 12:15:02
立即阅读
探秘科沃斯擦窗宝：轻松搞定“高空”难题！
2024-11-01 12:10:02
立即阅读
科沃斯T50 PRO扫地机器人：智启未来，清扫无界，让家焕然一新
2024-11-01 12:05:06
立即阅读
一加13「超Pro」性能体验：全面流畅才是检验性能的标准
2024-11-01 11:10:05
立即阅读