OpenCode插件-atomcode-auth - 免费使用 deepseek-v4-flash

===============================

每个月模型上省下的钱可以拿出一部分支持一下【心流搜索】和【心流知识库】
https://www.iflow.cn/
https://platform.iflow.cn/pricingPage
说不定哪天心流高层一高兴就把我们心心念的 iflow cli 开源了呢 :grimacing:
OpenCode 在我这里一直都是替代品。

===============================

源码: atomcode-auth
不开源:开源的话用得人多了官方的服务器会变卡。
使用方式:
1、下载解压
2、%USERPROFILE%\.config\opencode\opencode.json 配置文件中增加以下配置:写解压后的路径

授权登录:cli用户直接命令行输入 opencode 回车,gui用户命令行输入 opencode-cli 回车,按图操作

测试情况:(这个响应速度确实离收费模型还有很大的一段距离,各家 codingplan 基本上都是在5秒以内,没办法各种形式的免费模型皆是如此)

注:免费使用 deepseek-v4-pro 可以使用 NVIDIA 的:
baseUrl:https://integrate.api.nvidia.com/v1
apiKey 申请: https://build.nvidia.com/settings/api-keys

模型id 模型别名 描述 最大输入 最大输出 最大思维链长度 上下文 类型 TPS
deepseek-ai/deepseek-v4-pro deepseek-v4-pro Agentic Coding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化。 - 384k - 1m 文本 每秒26 tokens

供应商id(供应商标志)是:atomcode
(你可能在CC-SWITCH的OpenCode配置中需要使用,因为OMO要选择必须配置OpenCode的该供应商模型列表,配置时不需要指定 baseUrl 和 apiKey)

OpenCode 配置示例:(不需要limit,因为插件内置了正确的 且 OpenCode 会正常识别上下文大小)

{
  "$schema": "https://opencode.ai/config.json",
  "theme": "github-transparent",
  "watcher": {
    "ignore": [
      "node_modules/**",
      "dist/**",
      ".git/**",
      ".gitnexus/**",
      ".idea/**"
    ]
  },
  "plugin": [
    "E:/work/nreg/ai-auth/atomcode-auth",
    "@mohak34/opencode-notifier@latest",
    "oh-my-openagent@latest"
  ],
  "provider": {
    "atomcode": {
       "npm": "@ai-sdk/openai-compatible",
       "options": {
       "setCacheKey": true
     },
  "models": {
    "deepseek-v4-flash": {
      "name": "deepseek-v4-flash",
      "modalities": {
        "input": [
          "text"
        ],
        "output": [
          "text"
        ]
      },
      "options": {
        "thinking": {
          "reasoning_effort": "high",
          "type": "enabled"
        }
      },
      "limit": {
        "context": 1048576,
        "output": 393216,
        "input": 1000000
      }
    },
    "qwen3.6-35b-a3b": {
      "name": "qwen3.6-35b-a3b",
      "modalities": {
        "input": [
          "text",
          "image"
        ],
        "output": [
          "text"
        ]
      },
      "limit": {
        "context": 262144,
        "output": 65536,
        "input": 260096
      }
    },
    "glm-5.1": {
      "name": "glm-5.1",
      "modalities": {
        "input": [
          "text"
        ],
        "output": [
          "text"
        ]
      },
      "limit": {
        "context": 202752,
        "output": 131072,
        "input": 196608
      }
    },
    "qwen3-vl-8b-instruct": {
      "name": "qwen3-vl-8b-instruct",
      "modalities": {
        "input": [
          "text",
          "image"
        ],
        "output": [
          "text"
        ]
      },
      "limit": {
        "context": 131072,
        "output": 32768,
        "input": 129024
      }
    }
  }
}

   },
  "mcp": {},
  "disabled_providers": []
}

使用插件前,需要先领取:

PowerShell 安装 启动 领取:

irm https://atomgit.com/atomgit_atomcode/atomcode/releases/download/v4.20.3/install.ps1 | iex

atomcode 

/codingplan

切换小号注意:
网站1:https://ai.atomgit.com/ (用于 查看5小时余量)
网站2:https://atomgit.com/ (用于真正切换小号,因为授权用的这个地址 )
(这两个网站竟然可以登录不同的账号,账号并不是互通的,光退网站1没用,授权的还是老账号)

下载链接已更新:
1、支持思考过程流式响应
2、同步支持新模型:qwen3-vl-8b-instructglm-5.1
3、支持 DEBUG=1 和 OPENCODE_ATOMCODE_DEBUG=1 两种环境变量,环境变量生效时日志输出到~/.atomcode-auth/debug.log
4、去掉 重试逻辑 和 指数退避策略 ,OpenCode本身就有 重试机制 和 fallback 机制,快速失败可以让 OpenCode 立即切换到其他提供商,任务体验更流畅,提升性能快速响应,避免无效等待
5、触发限流429错误会在OpenCode中友好提示(目前估测官方3000W tokens/5小时)

6、修复官方 qwen3-vl-8b-instruct 非推理模型以 reasoning_content 字段返回 content 内容 的问题。

做特殊处理,修复后:如果官方在未来对这个模型的响应问题进行了修复,则插件也会正常响应

====
更新了一下:修复 content 内容的问题
官方可能不支持 glm-5.1 了,最近总是返回空流(群里说是满载了)

还能这么夺舍!!!明明说只能atomcode内部调用!!!怪不得要悄悄地打枪!

我上午看还有minimax,下午就没了。

之前 qwencode 的 qwen 3.6 plus 免费使用,我也是这么做的,只不过没有发布在网上,毕竟还是阿里的嘛,产品还是需要有竞争力。

就是可惜 我刚做完当天晚上 就宣步 第2天起 日调用改为100次,且两天后取消免费。

我都没怎么用,知道消息太晚了,错过了,呜呜

你们这些人太可怕了,防不胜防啊:thinking:

但怎么说还是给阿里提供了训练数据嘛,互惠互利,哈哈

(说到底还是兜里没有钱,要不也不会花这么多时间去搞,当时做qwencode-auth插件时搞了两个周,结果却只用了一天 :sob:

容我小试一波

我用了一下,好慢啊,发了一句你好花了一分钟零十秒才回复过来。:rofl:

1 个赞

毕竟不是阿里这样的大厂,服务器算力资源有限,要不也不会把minimax关了,把资源留给deepseek

另一个多模态模型 qwen 3.6 的响应速度还行

是的,qwen 3.6 响应快3~5秒就输出了。readme中写了4.0没思考是不是就等于没多大用了。

好的,了解。

注意:三方请求失败: http://127.0.0.1:17999 不是插件的问题,是官方的deepseek 挂了
在官方的code工具中也是如此:

反代已经接入openclaw

OMO + 1m 上下文 可平覆一切焦虑!:grimacing:

1 个赞

gitcode也要被你们的:lobster:吸干了

1M上下文我还没尝试,这么爽的嘛

好东西,感谢分享

官方已经行动,马上封死封号:joy:

是呢很爽,在多agent协作框架中(OMO,OMC, OMP)主要是给主编排用,主编排会调用子agent完成具体任务,因此主编排的上下文是干净的,干净 + 超长 = 能做长规划任务(有关联性的复杂任务)。

在OMO中通常是在晚上睡觉前使用Prometheus做长任务计划,然后Alats执行计划,这个时候睡觉就好了(免费的模型确实很慢),第二天早上任务就做得差不多了,上班的时候买一杯咖啡,到了公司边喝咖啡边测试验证成果,有问题再让Hephaestus打打补丁 (我在臆想 :grimacing:

:heart_hands: 感谢