“端侧 ChatGPT 时间到来”,面壁智能推出小钢炮开源 MiniCPM3
时间:2025-05-25 13:34:26 来源:锐评时讯 作者:男性 阅读:623次
MiniCPM3-4B 是 MiniCPM 系列的第三代产品,全体功能超过了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,比美多款 70 亿~90 亿参数的 AI 模型。
比较 MiniCPM1.0 / MiniCPM2.0,MiniCPM3-4B 具有更强壮、更多用处的技术集,可用于更广泛的用处。MiniCPM3-4B 支撑函数调用和代码解说器。
下面是 3 个版别的模型结构(1->2->3)的差异:
词表巨细:123K->73K->73K。
模型层数:40->52->62。
躲藏层节点:2304->1536->2560。
最大长度:4k->4K->32k。
体系提示词:不支撑-> 不支撑-> 支撑。
东西调用和代码解说器:不支撑-> 不支撑-> 支撑。
MiniCPM3-4B 有一个 32k 上下文窗口。MiniCPM3-4B 凭借 LLMxMapReduce,不需要占用太高的内存,能够处理理论上的无限上下文。
面壁智能还发布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,针对 RAG 场景还发布了微调版 MiniCPM3-RAG-LoRA 模型。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等方式),用于传递更多信息,节约甄选时刻,成果仅供参考,IT之家一切文章均包括本声明。
内容来源:https://sonybravia.xyz/app-1/lịch afc,http://chatbotjud-teste.saude.mg.gov.br/app-1/lucky-777-bet-paga-mesmo
(责任编辑:社会)