
【译】我是如何经济实惠地进行AI编程
我的浏览器设置:免费的AI自助餐
首先,我打开一个浏览器,里面加载了指向各种强大AI模型免费套餐的标签页。当你可以免费获得多种模型时,为什么只坚持一种呢?我典型的内容包括:
- 至少2-3个智谱AI的GLM 4.5的标签页 - 网页上免费,感觉和Claude 4一样好,甚至更好!真的。
- 1或2个Kimi K2的标签页…这是另一个类似Claude或Opus的模型,在网站上免费使用。
- 在chat.qwen.ai上的Qwen3 Coder和其他新模型。
- 2个在kimi.com上的Kimi K2的标签页。在GLM似乎可能做得更好之前,这个模型一天内多次修复了棘手的错误。
- 至少一个OpenAI Playground的标签页。如果你将账户的数据设置允许OpenAI使用你的数据进行模型训练,你就可以获得免费的token在GPT-4.5、o3和其他模型上使用。
- 至少一个,但更像是三个谷歌Gemini AI Studio的标签页(Gemini 2.5 Pro/Flash在这里通常是免费且无限制的)。
- 另外,试试谷歌Gemini 2.5 Pro(不同于AI Studio,有更好的图像生成和深度研究;我总是有几个这个的标签页,以及AI Studio的几个标签页)。
- 几个Poe.com的标签页,通常设置为Claude 4或o4-mini,以利用其高级模型的免费每日积分。
- 几个OpenRouter的标签页,设置为多种模型,一些是免费的,一些不是。
- 至少一个ChatGPT的标签页(免费版仍然有用)。
- 至少一个Perplexity AI的标签页,特别适合研究密集型问题。
- 至少一个Deepseek的标签页(v3和r1在他们的网页界面上是免费的,但要注意上下文限制)。
- 一个Grok.com的标签页。很好,免费且似乎无限,用于一般用途和深度研究/图像编辑。我主要使用深度研究功能,类似于perplexity。
- Phind是另一个免费的,它试图向你展示流程图/图表视觉效果。
- Imarena.ai提供免费访问Claude Opus 4和Sonnet 4等。免费的Opus 4非常好。
- Claude.ai - 免费但有时限制太多,很烦人,所以我使用其他网站/方式访问Claude,如Cody扩展、Copilot等。
一个更智能、更便宜的工作流程:专注上下文
当你在网络聊天中使用AI时(像AI Studio、ChatGPT、Openrouter这样的聊天界面,而不是通过IDE或AI 智能体框架),它们在解决问题和提出解决方案方面几乎总是比像Cline、Trae、Copilot这样的AI 智能体更好。不总是,但通常是。
当你使用像Cursor、Cline、Roo Code这样的工具来做所有事情时,它们会向AI发送大量关于如何使用它们的工具、如何使用或激活MCP服务器、编辑文件等的文本,这会过多地“降低其智能”。它会变得困惑。人们最终为最昂贵的模型付费来做所有事情,但即使这样也不足以克服AI因获得大量与你的问题无关的不需要信息而产生的智能化水平降低的影响。
所以当这种情况发生时,我使用我的工具来生成正确的上下文来解决我的问题。然后我把它粘贴到众多AI网络聊天中的一个(有时不止一个,因为它们有时会给出不同的答案),然后就问它问题或要求它进行代码审查,试图找出为什么x会发生而y会发生…等等,然后当它找出一个解决方案时…我让它为Cline或另一个AI 智能体类型的东西写一个提示词来做编辑。GPT 4.1可以很好地处理这个问题,而且我是无限使用的。没有理由浪费Claude的积分来编辑文件。没有理由给Claude发送一堆它不需要的废话让它变笨。我可以使用Claude来计划任何事情或修复真正困难的问题,很便宜,使用Openrouter网络聊天,然后把它粘贴回Cline让它运行。
这样做一段时间后,你真的会感觉到哪种模型擅长哪种类型的任务。
AI代码准备如何提供帮助(示例提示词结构):
你能帮我弄清楚为什么我的程序会做x而不是y吗?
然后,AI Code Prep GUI(适用于Windows、Mac、Linux和web)介入。它会递归地扫描你的项目文件夹(子文件夹、子子文件夹,应有尽有)并抓取代码,为AI很好地格式化,像这样:
AI Code Prep生成的上下文块看起来像这样:
你能帮我弄清楚为什么我的程序会做x而不是y吗?
fileName.js:
文件的内容...
nextFile.py:
import example ...etc
你能帮我弄清楚为什么我的程序会做x而不是y吗?
如果你启用了该选项,它会写两次,这有助于AI更好地专注于你的问题/提示词。你可以选择让它在顶部、底部或两者都有。OpenAI声称这有帮助,我还没有真正测试过这是否属实,但看起来合乎逻辑。
在Windows上,你只需在项目文件夹(或文件夹本身)内的某处右键单击,然后从上下文菜单中选择“AI Code Prep GUI”(请查看网站上的屏幕截图)。一个GUI窗口会弹出,通常预先选择了正确的代码文件。它会智能地跳过你可能不需要的东西,比如node_modules等。如果它的猜测不完美,你可以轻松地勾选或取消勾选文件。
当你的项目很大并且突破了AI的上下文限制时,这非常有用。你可以手动策划AI需要看到的确切内容。
像Cline、Github Copilot、Cursor、Windsurf等许多编码AI 智能体的问题在于,它们通常发送的上下文要么太多,要么太少。这就是为什么它们有时会显得愚蠢或无效。有时,你只需要自己动手,使用像我这样的工具自己选择文件,但它有助于自动选择代码文件,同时跳过你可能不需要的东西(但仍然可以选择通过复选框添加你想要的内容),然后将该策划的上下文转储到几个AI中(特别是免费的Web AI!)。
当然,还有其他上下文生成工具,但许多是仅限命令行的,或者需要一个公开的GitHub仓库链接。如果你的代码是私有的怎么办?如果你想让它保持在本地怎么办?如果你更喜欢GUI上的复选框怎么办?对于这样的事情,GUI很有意义。
模型策略:为任务选择合适的“大脑”
由于许多优秀的大语言模型都可以通过Web界面免费使用(例如AI Studio中的Gemini、Grok、Deepseek),我优先考虑这些。Poe.com还为像Claude和新的o4系列这样的顶级模型提供免费的每日积分。
Gemini 2.5 Pro(通过AI Studio)非常适合调试、规划,并且现在在很多事情上都是最棒的。对于非常棘手的问题,我可能会尝试新的o4-mini(可通过OpenRouter或Poe获得)。它出人意料地为我解决了一个长期存在的错误,尽管我仍在探索它的最佳用例。通过API,它比像Claude 3.5/3.7/4这样的顶级模型要便宜得多。
我通常会在某个时候尝试Claude 3.7或4,通过Poe或API(OpenRouter使这变得容易),或者github Copilot聊天(如果你不付费,你可以从中获得一些免费使用),但它对于频繁使用来说更昂贵。把Claude 3.7和4想象成“火力全开”的Claude——才华横溢,有时很冗长,也许有点像Hunter S. Thompson那样“疯狂”。输出很棒,但你可能需要一个更冷静的模型,比如Claude 3.5来完善它或进行实际的编码。
Gemini 2.5 Pro(通过AI Studio)非常适合调试、规划,并且现在在很多事情上都是最棒的。新的Gemini 2.5 Pro模型在编码任务上表现出更好的性能。对于非常棘手的问题,我可能会尝试新的o4-mini(可通过OpenRouter或Poe获得)。它出人意料地为我解决了一个长期存在的错误,尽管我仍在探索它的最佳用例。通过API,它比像Claude 3.5/3.7这样的顶级模型要便宜得多。
对于真正困难的问题,可以尝试使用OpenAI的o3或GLM 4.5,Qwen3 Coder 480b。如果你设置你的账户允许分享你的数据以帮助训练模型,你可以获得大量的免费每日Token。进入OpenAI Playground页面,点击右上角的设置图标,然后在左侧边栏点击数据控制,接着在显示的页面上点击共享,将“与OpenAI共享输入和输出”的设置改为启用,这将给你:
- 每天跨gpt-5、gpt-4.1、gpt-4o、o1和o3,最多可获得25万个Token
- 每天跨gpt-4.1-mini、gpt-4.1-nano、gpt-4o-mini、o1-mini、o3-mini、o4-mini和codex-mini-latest,最多可获得250万个Token
这真的很棒,o3和GPT 4.5看起来超级天才!有时在OpenAI Playground中,我把它设置为并排使用o3和o4-mini,来比较它们。这有助于我了解哪种模型最适合哪种类型的问题。
Claude 4和3.7总是一个很好的选择,可以快速解决难题,只是更难便宜或免费地使用它。但它通常是所有模型中最好的。当你真的需要快速解决问题时,就用它。Poe为所有模型提供免费Token,每天都有。OpenRouter有所有付费和/或免费的模型。Claude 3.7是打了鸡血的Claude——才华横溢,有时很冗长,也许有点像Hunter S. Thompson那样“疯狂”。输出很棒,但你可能需要一个更冷静的模型,比如Claude 3.5 / 4来完善它或进行实际的编码。
混合方法:高级规划+预算执行
经过对各种模型的大量测试,我开发了一种混合策略,可以最大化质量和成本效益。关键的见解是,不同的模型在开发过程的不同部分表现出色。
我的“聪明汁”模型智能理论——模型在特定情况下如何变笨
AI模型通常你发送给它们的文本越少,它们就越聪明。把每个模型想象成对你提出的每个问题或难题都有一固定量的“智能”或“脑力”。当你发送一个简单、专注的提示词时,几乎100%的智能都可用于解决你的问题。但是你的输入越复杂——关于如何使用工具的冗长AI 智能体指令、大量与你特定问题无关的上下文,或者多页代码——那么更多的“脑力”就会被用来处理那些无关的东西。
这就是为什么像Cursor、Cline和其他AI 智能体系统有时会显得效果不佳:如果它们在真正接触到你的问题之前发送了五大页的指令和上下文,模型为你特定问题提供的可用智能就会下降。你发送的“东西”越多,模型的焦点就越被稀释。为了获得最佳结果,保持你的提示词尽可能简洁和有针对性——精心策划上下文,以便模型可以将其全部智能用于最重要的事情上。
当你有难题或错误时,通过使用AI Code Prep将其转储到网络聊天中(如本指南第1页所述),通常会节省时间。它删除了所有在AI 智能体IDE/应用中发送的额外指令和东西。我注意到即使你给AI项目的所有文件,这种方法也更好。与你实际问题无关的AI 智能体指令/东西/膨胀是让AI变得迟钝/耗尽智能资源的内容。
我的工作流程在开始一个新项目时是这样的:
- 计划与头脑风暴:使用更智能/免费的Web模型(Gemini 2.5、o4-mini、Claude 3.7、4、o3等)来确定方法、计划步骤、识别库等。
- 生成AI 智能体提示词****:要求这些智能模型之一:“为我的AI编码AI 智能体Cline写一个足够详细的提示词,以完成以下任务:[描述任务]”。有时,我会复制这个生成的提示词并将其粘贴到另一个擅长重写的免费AI中(如ChatGPT)以进一步完善它。
- 用Cline执行:将分步任务列表粘贴到Cline中,配置为使用像GPT 4.1或Claude 3.5这样稳定高效的模型(如果是非常复杂的任务,则使用Claude 4)。4.1版本经过了良好的指令遵循训练。
- 后备方案:如果GPT 4.1遇到困难,将Cline切换到通过API使用Claude 3.5。这似乎是可靠执行的次优选择。Deepseek v3或R1在遵循指令方面也非常出色。
基本上:使用昂贵/智能的模型(以及优秀的免费Gemini 2.5 Pro)来制定策略和计划。通过将其粘贴到2-3个其他免费模型(Deepseek R1,如果上下文允许,Poe上的Claude)中来验证计划,并询问“这好吗?你能改进它或发现缺陷吗?”。然后,在Cline中使用像GPT 4.1或Claude 3.5这样稳定的主力模型来完成繁重的(编码)工作。
o4-mini似乎特别擅长解决复杂的代码逻辑或找出高级实施策略(如选择框架或库)。我经常会把我的初步想法扔给Gemini 2.5、o4-mini、GPT 4.1、ChatGPT,也许还有o3-mini(试试duck.ai - 通常是免费的),以及Phind来获得一系列想法。如果免费/便宜的选项不能解决问题,就通过API转向更昂贵的模型。
替代Agent和设置
Trae.ai(来自字节跳动,TikTok的制造商)是一个免费的VS Code兼容IDE,提供免费的AI使用,包括Claude 4、Claude 3.7、Claude 3.5和GPT 4.1。他们的AI 智能体不如Cline(老实说,没有一个像Cline那么好!),但它是免费的,可以让你接触到最好的模型。有时,我发现其内置AI 智能体不如Cline强大。然而,由于Trae似乎是VS Code的克隆,你很可能可以在其中安装Cline扩展!然而……它太重载了,无法从中获得任何免费使用,速度太慢。我还是会提一下……但也就那么回事。
所以,你可以有两种设置:
- VS Code + Cline扩展 + Copilot扩展(通过Cline获得廉价API访问的10美元/月订阅,尽管免费套餐可能提供一些基本用途)。
- Trae.ai + Cline扩展(如果Cline能使用Trae的免费模型访问,则可能利用它,或使用你自己的API密钥)。
两者都试试!有时原生的Copilot AI 智能体能解决Cline遇到的问题,反之亦然。我怀疑Cline有时会发送过大的提示词,这可能会影响其在某些任务上的性能,相比之下,集成的Copilot AI 智能体则不会。
Roo Code: Cline的翻版
Roo Code
Roo Code是Cline的克隆,非常相似,但有一些不同的功能值得一试。有时Cline可能更适合你的工作流程,有时Roo Code会。最好两者都试试,看看哪个适合你特定项目或编码风格的需求。
Cline for VS Code是免费的,但请记住,除非你利用Copilot订阅技巧,否则你需要为API调用付费。在Cline中使用VS Code LM API设置,并以每月10美元的Copilot订阅,是目前获得近乎无限访问AI 智能体内强大模型的最具成本效益的方式。
新的CLI工具:Claude Code、Qwen Code、Gemini CLI
关于编码的新CLI工具引起了很多关注,特别是Claude Code、Qwen Code和Gemini CLI。人们对Claude Code的功能赞不绝口,虽然我还没亲自试过。当我试用时,我计划将其设置为使用GLM 4.5(在z.ai网站上有相关指南)。
Claude Code支持子AI 智能体——这些AI 智能体只执行一个任务,不使用额外的工具。这种设置可以模仿本指南中描述的流线型工作流程,将模型的智能集中在单个任务上。子AI 智能体是避免AI 智能体指令“膨胀”并保持效率的聪明方法。
如果你想进行实验,请查看配置这些工具的指南和社区提示。生态系统正在迅速发展,每种工具在不同的工作流程中都有其自身的优势。
TL;DR: 快速入门
- 模型和角色:
- 规划与头脑风暴: GLM 4.5、Kimi K2、最新的Qwen3 Coder和2507’s、Gemini 2.5 Pro (AI Studio)、o4-mini (OpenRouter)、Claude 3.7或4 (Poe),如果你有配置为250k免费每日Token的OpenAI Playground,我建议用o3和GPT 5把它们用完。
- 问题解决与调试: GPT-5 (Playground中的免费Token), GLM-4.5 (它似乎是个天才,大约是Claude 4的水平) Claude 4 (Poe上的免费每日额度)
- 实际编码: 通过Cline使用GPT-4.1;回退到Claude 3.5…或新的模型:Qwen3 Coder, Instruct, 2507, GLM 4.5, Kimi K2。
- 关键工具:
- VS Code
- AI Code Prep GUI – 本地扫描并只整理你需要的文件,节省了大量时间
- Cline (VS Code AI 智能体) 用于分步代码执行
- 用于多角度建议的免费网络聊天:Poe.com, ChatGPT, Grok, Deepseek, Perplexity, OpenAI Playground, AI Studio w/Gemini 2.5 Pro, Openrouter, duck.ai
- 快速工作流程:
- 运行AI Code Prep GUI来打包你(如果已经存在的)项目的相关文件。
- 将该上下文粘贴到你最喜欢的用于规划和调试的网络聊天模型中。
- 让一个模型“为我写一个详细的Cline****提示词来完成这些任务”,然后在(例如ChatGPT中)完善它。
- 复制/粘贴到设置为GPT-4.1的Cline中以生成或修复代码;如果停滞,切换到Claude 3.5。
- 省钱技巧:
- 在OpenAI Playground中启用“共享数据”以获得250k免费的GPT-4.5, o3, (超级天才昂贵模型) & 250万免费Token/天的o4-mini, o3-mini!!
- 每月10美元的GitHub Copilot订阅让你通过Cline获得对Claude模型的速率限制访问
- 在OpenRouter上按需付费使用o4-mini, Claude 3.7, 和其他新模型
一些想法
AI是一个不可思议的力量倍增器,但它不是魔杖。真正的魔力发生在你将你的好奇心、毅力和意愿与这些强大的工具结合起来进行实验时。不要因错误或挫折而气馁——每个挑战都是学习新东西的机会。混合搭配模型,尝试疯狂的想法,不要害怕打破东西然后重建。最好的程序员不是那些从不卡住的人——他们是那些不断前进,利用他们所掌握的每一个工具和技巧的人。拥抱混乱,享受过程,让你的创造力引领道路!