• 请不要在回答技术问题时复制粘贴 AI 生成的内容
aohan0905
V2EX  ›  程序员

Kimi K2.7 Code 发布了,有人已经替换 Claude Code / Codex 了吗?

  •  
  •   aohan0905 · 16h 43m ago · 2601 views

    刚刚看到 Kimi 发布了 K2.7 Code 。

    官方给的数据:

    • Kimi Code Bench v2 +21.8%
    • Program Bench +11.0%
    • MLS Bench Lite +31.5%
    • 推理 Token 消耗降低 30%

    有没有已经体验过的大佬说说感受?

    31 replies    2026-06-13 15:53:30 +08:00
    cuebyte
        1
    cuebyte  
       16h 39m ago
    Kimi 的思考一直是一个痛点,会在同一个地方反复思考多次,浪费 tokens ,降低输出质量。
    不知道这一版有多大进步。
    yuhaofe
        2
    yuhaofe  
       16h 36m ago
    @cuebyte 降 30%说的就是这点,不过没实测,蹲个测评
    feelapi
        3
    feelapi  
       16h 31m ago
    aohan0905
        4
    aohan0905  
    OP
       16h 28m ago
    @feelapi 我也发现了, 不到十分钟, 199 档 5h 花了 15%, 是 coding plan 额度降了吗?
    kneo
        5
    kneo  
       16h 24m ago via Android
    @cuebyte 这不和 deepseek 一样吗?
    qian33
        6
    qian33  
       16h 18m ago
    @aohan0905 意思是 coding plan 不耐用了吗 🤣
    aohan0905
        7
    aohan0905  
    OP
       16h 14m ago
    @qian33 至少体感是的, 我没准确看时间, 写了个计划, 开了 goal, 然后看下面 hud active 7m 的时候, 消耗了 20% 左右
    herozzm
        8
    herozzm  
       16h 14m ago   ❤️ 3
    不要相信国产,试都不用试,这点时间可以干点别的
    aohan0905
        9
    aohan0905  
    OP
       16h 12m ago
    @qian33 我重新确定了下, 看控制台是这样, 然后 5h 额度花了接近 25%?
    ```
    ● ✓ Goal complete.
    Worked 1 turn over 11m00s, using 4.4M tokens.
    ```
    Alwaysonline
        10
    Alwaysonline  
       16h 6m ago
    Kimi 有买 199 元的套餐,唯一的好处就是用来写前端页面,比 Codex 要漂亮些。
    python35
        11
    python35  
       16h 2m ago   ❤️ 1
    我曾经试过写一个在家里 openwrt 上的 captive portal 系统做黑白名单、基于页面的授权码、对接 radius 系统、防火墙放行等功能, 基于 cc 的 glm5.1 和 deepseek v4 pro 都没写成功,最后是 codex 写成功了,可以正常使用, 至此投入 o 家的怀抱,开了 5x pro, 国产的确实还有差距; 如果你们有 openwrt 也可以试试写写看
    qian33
        12
    qian33  
       15h 16m ago
    @aohan0905 那消耗过大了 感觉 199 套餐也要不够用了
    ebushicao
        13
    ebushicao  
       15h 12m ago   ❤️ 1
    我打开 kimi 官网,还没看到 kimi-k2.7 ,倒是弹出一个 kimi 信用卡... 就不能先把模型能力搞上去吗...
    JasonYip
        14
    JasonYip  
       14h 57m ago via Android
    @python35 国模需要有一个详细的 spec 能够执行的比较好,如果想省钱可以 chatbox 和 gpt 聊清楚然后生成详细的 spec ,让国模去做,其实效果还可以
    Ericcccccccc
        15
    Ericcccccccc  
       14h 38m ago   ❤️ 2
    gpt 5.5 的好用我只能说是有目共睹,这种不是跑分啥的可以植入的印象
    wengjin456123
        16
    wengjin456123  
       8h 28m ago via iPhone   ❤️ 1
    我感觉挺好用的,199 套餐也够用,比我的 codex plus 量大的多,2.7 code 明显好用一些,工具调用 skill 调用也很积极,思考也没 2.6 那样很久很久
    ilikexff
        17
    ilikexff  
       8h 9m ago
    虽然相信国产,但是实力真的是硬伤,每一个过程模型出来的时候,口号都喊的牛逼哄哄的,不是碾压这个就是吊打那个,各种所谓的专业测评成绩粉漂亮,但是当你真实的使用的时候发现,还是依托💩
    billzhuang
        18
    billzhuang  
       8h 9m ago   ❤️ 1
    @ilikexff 你这叫啥相信
    Absofknglutely
        19
    Absofknglutely  
       7h 59m ago
    你这叫啥相信
    win8en
        20
    win8en  
       7h 51m ago via Android   ❤️ 1
    @ilikexff 这个里面没有小粉红,不要怕 大胆点,没必要带前面那一句😂
    maolon
        21
    maolon  
       7h 39m ago
    我更好奇是 composer 2.5 强还是 2.7 code 强,
    要是 2.7 code 还比不过 composer 2.5 这个 k2.5 的继续训练版本就搞笑了
    iorilu
        22
    iorilu  
       7h 30m ago
    跑分是跑分, 实际干活另一回事
    XProxyAi
        23
    XProxyAi  
       7h 23m ago
    除了 SOTA 别的不建议用,浪费钱的同时 还在浪费生命
    ebushicao
        24
    ebushicao  
       5h 46m ago
    刚看到 opencode go 订阅能用 Kimi K2.7 Code 就直接开始测试了,结果上来就拉了个大的。
    在一个刚初始化的 pnpm workspace 下,默认有一个 packages 目录。我的提示词是“使用 pnpm create vite 选择 react-ts 模板创建一个 web 项目,web 项目直接放在根目录 web 文件夹,移除 packages”,deepseek-v4-flash 都能正确完成的事,直接给我把 pnpm-workspace.yaml 删了,还问我要不要删除根目录的 package.json 和 node_modules 。

    再结合我一打开 kimi 官网给我弹什么 AI 信用卡,我觉得 kimi 拉完了。
    Blutbad
        25
    Blutbad  
       5h 0m ago
    目前下来我觉得还行,给我做报告用的 html 页面比 2.6 快多了。2.6 经常深度思考开始套娃,一个跳转都能把页面干崩溃了,还修不好
    aohan0905
        26
    aohan0905  
    OP
       4h 59m ago via iPhone
    @Blutbad 认同,2.7 感觉要比 2.6 体感上好不少
    mashimaroinfo1
        27
    mashimaroinfo1  
       4h 57m ago
    @JasonYip 一样, 早试过了。

    一线模型强思考下写的 spec, 国模无法遵守。

    核心问题是国模的理解水平极差。在这个前提下, 你编程多强, 数学多好, 都没有意义。因为无法根据用户指令发挥出来。这根本就是一个语文问题。
    photolife
        28
    photolife  
       40 mins ago
    不知怎么回想起各种红旗 linux 时代
    youngxhui
        29
    youngxhui  
       34 mins ago via iPhone
    2.7 比 2.6 感觉快了很多。价格上我看官网输入输出和 2.6 是一样的,缓存价格反而提升了
    SiWXie
        30
    SiWXie  
       28 mins ago via iPhone
    用的 199 套餐➕Claude Code ,一个任务 10%额度没了,它一直在跑,不停的跑
    hackroad
        31
    hackroad  
       27 mins ago
    有好的不用,为什么用这种垃圾。。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3132 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 108ms · UTC 08:21 · PVG 16:21 · LAX 01:21 · JFK 04:21
    ♥ Do have faith in what you're doing.