三门峡塑料管材设备厂家 用编程大模型登顶开源一后,智谱GLM团队被拷问了3小时

金磊 发自 凹非寺三门峡塑料管材设备厂家
量子位 | 公众号 QbitAI
真是越到年底,越是神仙打架。
这不,智谱又又又发了新模型——GLM-4.7。
然后一举在代码竞技场WebDev榜单上越GPT-5.2,拿下开源大模型一!
现在网友们也正在拿它疯狂实测中,体验完几乎都是清一的“Amazing”。
直接来感受一下网友拿着GLM-4.7和Gemini 3同时做的桌版溜溜球游戏,让网友直呼:
GLM-4.7完胜!
地址:https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw
那么,为什么GLM-4.7这次会在编程果上有这么大的进步?
就在今天早些时候,智谱还特意在Reddit上举办了一场AMA(Ask Me Anything)活动,关于背后的一切,都已经回答得清晰明了。
关于GLM-4.7,智谱回答一切
这场对话不仅揭示了GLM-4.7如何通过后训练实现能飞跃,还次深度曝光了自研的强化学习框架——Slime。
我们整理了这场AMA的核心精华,看看这个被称为“Claude Code佳平替”的国产模型,究竟是怎么炼成的。
模型能与优化
先就是大家为关心的,为什么GLM-4.7会在体感上有如此明显的进步。
智谱团队在AMA中明确表示,GLM-4.7的改进主要集中在后训练阶段。
在SFT(监督微调)和RL(强化学习)阶段,团队采用了更精细的发布配方(Release Recipe)。通过对不同域数据集的对齐,模型不仅在基准测试上跑分更高,在实际部署中的稳定也大幅提升。
而针对社区关于“为何不出更大参数量模型”的疑问,智谱团队直言:
训练成本和部署成本是设计的核心锚点。
GLM-4.7在设计之初就考虑了硬件限制。团队目标是让模型在消费级显卡上也能跑出Air版本的灵活,同时保持接近30B甚至更高规模的逻辑能力。这种在有限参数下压榨致能的思路,正是为了让AI真正落地。
除此之外,智谱分享了他们建立的一套复杂的预训练数据流程:
多源采集: 涵盖从高质量论文到小说等各类文本。致清理: 包含去重、质量过滤和敏感词筛查。对齐策略: 关注SFT和RL阶段,让写作风格不再像机器人,而是更加生动细致。模型应用场景与功能
如果说以前的GLM是个有些死板的理科生,那么4.7版本则是完成了一次情商逆袭。
在AMA中,开发者问得多的就是编程。智谱团队坦言,他们针对Claude Code做了大量的优化和适配工作。
目前,GLM-4.7在多语言编码方面表现出,不仅支持Python、JS,在一些相对冷门的语言和复杂的逻辑架构上也展现了强的理解力。
团队认为三门峡塑料管材设备厂家,智能体框架对能的影响占比高达30%,因此GLM-4.7在系统提示词、工具调用层级上做了深度打磨。
为了让模型更像人,团队从大量小说和剧本中汲取养分。
现在的GLM-4.7在创意写作时,细节描写更加丰富,不再只会说“在一个阳光明媚的下午”这种套话。在角扮演任务中,它能更好地维持人设,减少出戏的频率。
除此之外,GLM-4.7还引入了一个非常硬核的功能:交错思考(Interleaved Thinking)。
在执行动作或调用工具之前,模型会先进行一段隐思考。这种类似OpenAI o1的思维链机制,让它在处理复杂的多模态任务(如看图写代码、图表分析)时,减少了鲁莽操作的概率,提高了准确度。
根据目前的统计数据,中国足球在海外的U15-U22球员已经达到百人规模,如果久尔杰维奇真的想要打造以海归球员为主的球队,完全有这个条件。但他仍然坚持在国内选择球员,在近的这次集训中,只有姜轶祥一名海归球员回归,可见久尔杰维奇并没有给予海归球员对的信任。而从浮岛敏,久尔杰维奇,安东尼奥三位外教不约而同的选择以本土青训球员为主的选材方式可以看出,本土青训才是中国足球复兴的根基,海归球员只是辅助,目前仍不是球队的骨干力量。
电话:0316--3233399阿贝在赛场上的出表现完全对得起外界对他的赞誉。作为一名擅长直接突破、一对一攻坚的边锋,他已越级代表利物浦U18梯队出战5场,参与4粒进球,还曾获得U21梯队的出场机会。此外,他还破格入选过英格兰青年国家队,表现远同龄球员水准。
目前,俱乐部国内球员已全部在中国篮协注册成功,塑料挤出机半数球员拥有中国男子篮球职业联赛(CBA)履历。俱乐部还引进了毕业于贵州大学的贵州本土球员胡匹夫,并与多名优秀外援完成了签约。
上一场砍下全场高的33分的韩国队核心得分手李贤重前两节表现一般,但他的队友李政玹手感火热,半场得16分,三分球4投4中。中国队在外线则是12投1中。
本场比赛,中国男篮上半场仅得到29分,落后多时达到了32分,全场三分球28投仅有5中。防守端,对方球员李贤重仍然得到了20分,韩国男篮全场23次远投出手投进了11个,其中李政玹7投6中,得到了全场高的24分。
技术方法与工具
智谱之所以在海外社区受欢迎,与其积拥抱开源的态度密不可分。
这次AMA让人惊喜的莫过于Slime框架的公开。
为了解决大模型强化学习率低、稳定差的问题,智谱研发并开源了Slime。
这个框架为大规模强化学习设计,支持多种对齐算法。它的名字寓意着“灵活且具有强适应”,能够帮助开发者更容易地复现GLM级别的对齐果。
智谱表示,他们从开源生态中获益良多,因此也乐于回馈。
他们详细描述了从数据收集、清理到质量过滤的完整流水线。这种透明度在目前的国产大模型厂商中并不多见,也赢得了LocalLLaMA社区的一致尊重。
在 Reddit 上,智谱团队展现了其接地气的一面。
有用户问:“你们训练时遇到意外的挑战是什么?”
团队回答:“大的挑战其实是发布配方。就像厨师手里有好的食材(数据),但怎么掌握火候(RL参数)让它在出锅时,往往需要无数次的推倒重来。”
还有人调侃:“GLM-4.7是不是吃了什么灵丹妙药?”
团队则幽默回应:“主要是我们学会了如何让它在行动之前多想一想。”
实测GLM-4.7在了解完GLM-4.7背后的“奇技淫巧”之后,我们还是老规矩,一波实测走起~
先值得注意的是,现在在z.ai上搞开发,好是点开“全栈开发”的按钮:
然后我们先做一个植物大战僵尸来小试牛刀,Prompt如下:
请基于当前目录准备的素材(下载 https://z-cdn.chatglm.cn/temp/Grazy Dave.mp3 当作游戏音乐, 下载 https://z-cdn.chatglm.cn/temp/pvc-images.zip 目录下的各类植物与僵尸静态/GIF图片、Pea.png/PeaSnow.png豆子素材、Shop.png/Card.png界面素材及Sun.gif),做一个《植物大战僵尸》游戏。
可以看到,同样是经典的测试游戏,这次在体感上是“声俱全”的那种(体验链接放下面了):
https://chat.z.ai/c/5415b1d8-ac01-4bc6-a24a-8e815c8fa361除了游戏之外,GLM-4.7另一个体感上的跃迁,便是做PPT了,这个demo的Prompt其简单:
做一个介绍巴黎的PPT。
可以看到,PPT的果已经达到了直接商用的程度:
除此之外,做海报也是GLM-4.7的一。
例如设计一张宣传运动鞋的海报,对比GLM-4.6和GLM-4.7,果的差距就一目了然了:
从种种果来看,也就不难理解为什么这次GLM-4.7会在X上被刷屏了。
承诺上市后持续开源在这次AMA中,除了技术硬核细节,围观群众关心的莫过于智谱要上市的事情了。
毕竟近关于智谱拟赴港IPO的消息引发了圈内不小的关注。
Reddit上有资深老哥犀利发问:“一旦公司上市,你们是否会缩减开源投入?”
智谱团队给出了一个非常坚定的定心丸:“开源是我们的核心基因,无论资本路径如何变化,我们承诺上市后将持续开源。”
团队解释道,智谱深知其成长离不开开源生态的滋养。持续开源不仅是回馈,更是保持技术先、建立开发者标准的优路径。这种“即便敲钟,也要开卷”的姿态,确实让不少海外开发者直呼“Respect”。
通过交错思考提升智力上限,通过Slime框架规范训练流程,智谱正在用硬核的方式证明:国产模型不仅能跑分,更能实战。
并且从用户们的反馈来看,GLM-4.7以及智谱长期以来的工作也是被给予了高度的认可。
例如有网友从价格角度评价说:
GLM 4.7的1年订阅(接近Opus 4.5级别)= Codex/Claude Code的1个月Max Plan。
我现在就立马订一年的。
包括估值40亿美元的Fireworks也在Day0支持GLM 4.7,嗯,美国人也是有更好的模型选择了。
除此之外,在AMA的中,智谱团队说了一句让人期待的话:“我们会为了AGI在明年做更多的贡献。”
在此基础之上,智谱席科学家唐杰在GLM-4.7发布之际发表了他对于大模型发展的一些观点。
原链接:https://weibo.com/2126427211/QjIYhCmfq
在IPO的灯光亮起之前,智谱选择先点亮开发者的屏幕。这种长期主义的浪漫,或许正是大模型时代稀缺的底。
— 完 —
量子位 QbitAI · 头条号
关注我们三门峡塑料管材设备厂家,一时间获知前沿科技动态
