清华系创业无问芯穹发布端侧开源模型

讯知在线 • 2024年12月18日下午2:15 • 综合 • 0 views

清华系初创无问芯穹发布端侧开源模型

导语

12 月 16 日，上海无问芯穹智能科技有限公司隆重推出其端侧全模态理解开源模型 Megrez-3B-Omni。这款模型专为手机、平板等端侧设备量身打造，在降低计算复杂性和提升效率方面取得了突破性的进展。

Megrez-3B-Omni：端侧全模态理解利器

Megrez-3B-Omni 是一款 30 亿参数的端侧模型，具备图片、音频、文本三种模态数据处理能力。模型尺寸经过精心设计，使其能够在资源受限的端侧设备上快速部署和高效运行。

文本理解：压缩大模型，提升效率

在文本理解方面，Megrez-3B-Omni 将前代 14B 大模型压缩至 3B 规模。通过此项优化，模型的计算成本大幅降低，计算效率明显提升。模型支持对文本的摘要、问答、翻译等多项文本处理任务。

语音理解：支持中英文，对话自如

语音理解方面，Megrez-3B-Omni 支持中英文语音输入，能够处理复杂的多轮对话场景。用户可以对输入的图片或文字进行语音提问，模型能够流畅地理解并回复，实现不同模态之间的自由切换。

图像理解：场景理解与 OCR

图像理解方面，Megrez-3B-Omni 擅长场景理解和 OCR（光学字符识别）任务。模型能够准确识别并提取图像中的文本信息，为端侧图像处理提供强大的支持。

配套开源：纯语言模型 Megrez-3B-Instruct

除 Megrez-3B-Omni 外，无问芯穹还同步开源了纯语言版本模型 Megrez-3B-Instruct。这是一款单模态模型，最大推理速度领先同精度模型 300%。模型具备强大的 AI 搜索功能，能够快速准确地从海量文本数据中检索信息。

清华渊源，技术先行

无问芯穹由清华大学电子工程系教授、系主任汪玉发起，其带领的 NICS-EFC 实验室早在 2008 年便投入到面向智能场景的软硬件联合优化技术路线的研究。联合创始人、首席科学家戴国浩毕业于清华大学电子工程系 NICS-EFC 实验室，现任上海交通大学长聘教轨副教授。联合创始人兼 CEO 夏立雪是汪玉的博士生。

市场定位：端侧智能赋能

无问芯穹表示，相较于云端大模型，端侧模型面临着资源有限、低功耗、低延时的挑战。Megrez-3B-Omni 的推出，旨在为端侧设备提供强大的 AI 能力，赋能各类智能应用。

软硬一体，性能提升

为了进一步提升模型性能，无问芯穹采用软硬件协同优化策略，使模型各参数与主流硬件高度适配。该模型支持 CPU、GPU 和 NPU 同时推理，通过跨越软硬件层次的系统优化，额外带来最高 70% 的性能提升。

未来愿景：端侧 AI 赋能无限可能

无问芯穹指出，未来他们将持续迭代 Megrez-3B-Omni 模型，使其在准确性和效率方面达到新的高度。通过提供简单易用的语音指令，用户将能够轻松完成端设备的设置或应用操作。面向端侧智能化的广阔前景，无问芯穹将继续耕耘，为 AI 技术在端侧设备的普及与应用做出不懈努力。

原创文章，作者：讯知在线，如若转载，请注明出处：http://web.xzxci.cn/2024/12/18/38435.shtml