语言 EN

大模型放到离用户最近的地方

做高效的端侧智能
高效手机
高效AIPC
高效智能座舱
高效具身机器人
高效可穿戴设备

旗舰端侧大模型系列 大模型科学化结晶

了解更多

全球领先的轻量高性能大模型,可有效运行在日常生活中主流消费电子和各类终端上,覆盖不同的芯片和系统平台。 MiniCPM系列端侧模型,拥有极致的算力和内存使用效率,参数量更小、推理速度更快、性能越级比肩、部署高度灵活和简洁。 「模型制程」也在持续提升中,大模型科学化不断向更深更远的无人区探索,不断地惊喜收获。

极致以小搏大 + 极致高效低成本旗舰基座模型 MiniCPM
4B2.4B1.2B、极速版
越级超越 全球标杆之作
4B 2.4B 1.2B、极速版
githubhuggingface
以小博大 强得不像端侧模型!ChatGPT 级基础性能
超 GPT 3.5,Qwen2-7B,GLM4-9B

新架构,知识密度新高
见证知识密度每8个月翻一番

轻!快!端侧友好
量化后仅 2GB 内存
全面开挂 全,瑞士军刀;强,刀刀锋利超 Kimi!「无限」长文本
32,128,256,512K…上下文无限拓展

GPT-4o 级 Function Calling
超越 GPT-3.5,GLM4-9B,近 GPT-4o

超强 RAG 外挂三件套
中文检索第一,生成超 Llama3-8B
了解更多
查看各个版本的功能详情
视频、多图、单图,全面超越 GPT-4V旗舰多模态模型 MiniCPM-V
8B实时视频8B2.8B
最强端侧多模态通用能力
8B实时视频 8B 2.8B
githubhuggingface
最强端侧多模态多项能力综合性能实时视频理解、多图、单图取得 20B 以下模型 3 SOTA 开启端侧全面对标 GPT-4V 新时代3 项重磅功能,首次上端实时视频理解 多图联合理解 多图 ICL 视觉类比学习轻!快!端侧友好!量化后端侧内存仅 6 GB 端侧推理速度高达 18 tokens/s,快 33% 支持 llama.cpp、ollama、vllm 推理其他180 万像素高清 OCR,超越 GPT-4o、GPT-4V 和 Gemini 1.5 Pro 等 极致高效,最高多模态像素密度,两倍于 GPT-4o 的单 token 编码像素密度自研 RLHF-V 高效对齐技术,极低幻觉 可信多模态行为,优于 GPT-4o 和 GPT-4V了解更多
查看各个版本的功能详情
查看各个版本的功能对比

全球合作伙伴

amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
amd
AI+法律=高质量法治和高水平司法全国首个接入法院 办案流程的大模型了解更多每份案件后面,都是一份沉甸甸的期待。如何让正义,更快来到人们身边?同时让从业人员从繁琐流程中获得解脱? 高效,是大模型的强项,也是我们的强项!我们的大模型,围绕“公正与效率”主题,实现全流程AI赋能,已在法院专网完成部署并服务专业司法场景。 法律行业权威知识库深度合作,赋予我们更强的专业性。我们致力于通过提供高效可落地的大模型解决方案,以及自主可控的大模型能力,为法律业务赋能增效。
全球前沿Agent技术迈向IoA 智能互联时代了解更多互联网将全世界所有信息带到用户面前,物联网让所有设备相互连接共享信息。 在未来,通过大模型驱动的Agent平台,可以在更多用户、信息和设备之间建立连接,创造全新智能应用场景,进一步解放生产力,加速迈向“Internet of Agents”新时代。 我们已创建了 ChatDev、 X-Agent、AgentVerse 等多个单体智能、群体智能、智能协作方面的Agent明星项目。
技术Blog

双榜首!登顶Hugging Face和GitHub趋势榜Top1MiniCPM-Llama3-V 2.5: 8B 参数,8G 显存,4070 轻松推理,手机端 6-8 tokens/s 高效运行。 当前 MiniCPM-V 系列下载总量已超 13 万,GitHub 星标 3k+。
感谢社区厚爱,面壁小钢炮 MiniCPM 免费商用感谢全球开源社区的朋友们,一路厚爱与支持! 作为开源社区的贡献者和受益者, 面壁智能, OpenBMB&清华 NLP 实验室 认真讨论决定: 将面壁「小钢炮」 MiniCPM 免费商用。
多图、视频首上端!3 SOTA 面壁小钢炮,创 GPT-4V 端侧全面对标新时代!再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新! 仅 8B 参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态能力拉升至全面对标 GPT-4V 水平。 更有多项功能首次上「端」:小钢炮一口气将实时视频理解、多图联合理解、多图 ICL 等能力首次搬上端侧多模态模型,更接近充斥着复杂、模糊、连续实时视觉信息的多模态真实世界,更能充分发挥端侧 AI 传感器富集、贴近用户的优势。
星标破万!小钢炮2.6登顶GitHub,Hugging Face TOP3, 燃爆开源社区!想到了直升机,没想到的是火箭! MiniCPM-V 2.6 一经发布,火箭登顶全球著名开源社区 GitHub 与 HuggingFace 趋势榜 Top 3。 至此,面壁小钢炮 MiniCPM-V系列,GitHub 星标破万! 小钢炮MiniCPM系列自今年2月1日面世以来,累计下载量已超百万!
双登顶!面壁小钢炮3.0 GitHub Top 1,Hugging Face Top 3面壁小钢炮 MiniCPM 3.0 持续引领端侧 ChatGPT 时代!
端侧 ChatGPT 时刻到来!面壁小钢炮 3.0 重磅发布面壁发布小钢炮3.0
WAIC 2024,面壁打开大模型新定律、新架构、新生态!面壁智能联合创始人、首席科学家刘知远在WAIC 2024 “模型即服务(Mass)加速大模型应用落地”论坛进行了《大模型时代的摩尔定律,迈入更高效的大模型时代》主题演讲,并首次对外介绍
面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!面壁发布领先的开源大模型「Eurux-8x22B 」。 相比口碑之作 Llama3-70B,发布时间更早,综合性能相当,尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。 激活参数仅 39B,支持 64k 上下文,相比 Llama3 速度更快、可处理更长文本。
高效大模型 就是面壁智能高效,源于对大模型科学化的不懈追求以知识密度为核心的「面壁定律」,指引我们进行更高效的大模型科学化探索。在ScalingLaw之外,探索出前瞻、独特的大模型方法论。 围绕提升大模型知识密度这一本质,面壁通过数据、模型的架构以及相关成长算法方面的探索,做到同等参数、性能更强,持续提升大模型制程,将更小更强更高效的模型放到端侧,放到离用户最近的地方!
面壁定律摩尔定律
大模型的知识密度不断提升平均每8个月提升一倍随数据-算力-算法协同发展,模型知识密度持续增强,2020年GPT-3 175B能力到2024年MiniCPM 2.4B模型即可达到,知识密度提高约86倍!
新闻动态

A G I  F O R  L I V E S   智 周 万 物