skip to content
杨鸿肇 杨鸿肇
/ EN

AI 随想

创建 更新 60 min read
索引
  • 记录了 2022 年 10 月第一次接触 Novel AI 起所有使用 AI 的经历和对 AI 相关话题的看法。
  • 本博客会经常更新,欢迎持续关注。
  • 高亮标出了作者认为有趣或者重要的内容,可以重点查看。
  • 只想看最新的内容可以折叠一下标题,直接翻到最后,或者跳转 最新内容:2026-06

2022

AI 舞台的帷幕被掀起一角,一个新时代正悄无声息地降临。

2022-10

  • 2022-10-12
    • 新东西出了就要试一下,最近有一个可以写小说、生成图片的工具叫做 NovelAI,试着本地部署一下玩玩。用 3060 Ti 勉强跑起来,提示词写得合适,还是能生成还算满意的图片,就是手指容易崩,还有时候把手画成脚,穿上鞋子。
  • 2022-10-18
    • 尝试 AI 配音,分离歌曲中的伴奏和人声,把人声替换成猫雷的音色,再合成回去,但是效果并不好。
  • 2022-10-21
    • 加了一些 AI 画画的群组,也找到了国内版的小程序,需要签到攒点数或者看广告,确实很多人商业嗅觉很敏锐,执行效率也很高,利用信息赚差价。
  • 2022-10-27
    • 尝试用其他角色的图片微调模型,能保留很多服饰特征,一定程度上定制化。
    • 这几天 AI 文生图热度有所下降,需要等待下次技术突破。

2022-11

  • 2022-11-18
    • 现有 AI 生成图片技术还是难以学会细节特征,但我对于 AI 的潜力还是看好的。

2022-12

风起云涌,ChatGPT 闪亮登场,生成式 AI 的浪潮席卷而来。

  • 2022-12-06
    • 上网买了最近比较火的 ChatGPT 的账号,可以对话的 AI,尝试后,并没有网上说的那么神奇,数学水平很差,基本是在胡说,达不到写作业的水平,代码水平也只能实现很成熟或模块化的功能
    • 目前 AI 水平也就只能玩一玩,距离解决实际问题还差得很远。但今年也是划时代的一年,AI 走入普通人的生活,大家都能玩一玩。

2023

不够聪明,但可以辅助完成多种工作。

2023-03

  • 2023-03-18
    • 尝试用 ChatGPT 来写职业规划课的作业,充了 20 美金的会员,体验 GPT 4 模型。相较于 GPT 3.5 强了很多,能接受更长文本,输出也更贴近要求。
    • 想让 AI 听懂指令需要一定的技巧和创造力,例如先生成一个大纲,然后把自己的简历填进去,再让 AI 优化:优化语言风格、调整格式,可以得到一份比我自己写得更好的 SOP,相当厉害。
    • AI 未来可能取代很多岗位,但最先取代的是不会用 AI 的人。
  • 2023-03-19
    • GPT 作为大语言模型,最擅长语言类工作,尤其是应用类文本写作,提供模板和内容,就能很好完成任务。但是创造性不足,需要在合适的场景使用。

2023-04

  • 2023-04-05
    • 尝试了 Midjourney 和 OpenAI 的文生图模型 DALL·E 2,线上模型相比之前的本地模型,对部分内容有限制,而且免费次数很少,需要买点数或者会员。能力达不到实际生产需求,没必要充值去使用。
  • 2023-04-08
    • 使用 ChatGPT 来修改个人简历、个人陈述和推荐信,大大提高了效率。

2023-06

  • 2023-06-22
    • 在桌游展上和一个做心理桌游的老板聊天,对于 AI 绘画我们有着不同态度,他评价我们的悲观态度是因为我们不会用,用不好。但我们觉得他用 AI 生成的图片质量低、不好看、AI 味重。

2023-07

  • 2023-07-29
    • 找了个新的 AI 生图软件,每天 100 次免费,可以自己挑选风格的 LoRA,我主要是看重了像素画风格,之后画正式版卡面时可以拿来参考,做测试时也能临时生成。
    • 现在的 AI 生图模型已经能达到辅助生产的水平,要求高的场景不能直接用,但是能快速可视化想法,对于专业人士和普通人都有帮助。

2023-12

  • 2023-12-10
    • 使用 AI 速通了古代文学课格律诗的作业。处理问题的切入角度和方法直接决定了效率,个人水平的差异被极大程度抹平了。AI 绘画、大语言模型,这些工具各有优缺点,要在特定场景选用合适的工具,发挥其优势。

2024

模型能力上升,主流用法仍是网页对话,Agent 雏形初现。

2024-01

  • 2024-01-09
    • 使用 Copilot 开发了桌游模拟器自动发牌脚本,在这种冷门语言和特定场景下,有 AI 辅助很方便,很难想象没有 AI 该怎么活了。
  • 2024-01-21
    • 在商场顶楼的主题乐园,商家已经把纯 AI 生成的人物形象用作宣传海报了,当胆小的人还在考虑侵权问题时,胆大的人已经开始用到生产环境了。
  • 2024-01-22
    • 使用 GPT-4 生成 beamer 幻灯片:先讨论结构,再自己填上内容,之后生成 beamer 代码,编译之后提一些美化要求,增加一些图片,最后人工改点细节收尾。
  • 2024-01-23
    • 研究 AI 根据文案生成视频的计划,尝试了国内外的一些网站,包括百度、剪映之类的,都不是很靠谱,生成画面和原本意思差距很大。

2024-02

  • 2024-02-08
    • 打算用 GPT 辅助做一个程序,自动结算我的卡牌自走棋,目前来看这种项目 AI 无法独立完成,大量内容还是要手动设计和修改。
  • 2024-02-09
    • 利用昨天和 GPT 交流的素材已经把基础词条、一星角色、装备都搞定了,经过简单调试修复了一些明显的 bug,基本成型,还用 GPT 做了网页前端。
    • 现在 AI 编程可以进入真正的开发场景并且效果很好,但是复杂逻辑或者个性化的部分还是必须人工大量干预。

2024-04

  • 2024-04-26
    • 遇到神人同学的计量经济学作业全用 GPT 生成答案,全是错的。使用 AI 还是需要本身有一定基础,能发现 AI 的一些明显错误。

2024-08

  • 2024-08-13
    • GitHub Copilot 的学生认证过期了,然后再次认证,通过了但是 Copilot 功能用不了,得换工具了。尝试了 Codeium,效果不如 Copilot。

2024-09

  • 2024-09-18
    • ChatGPT 可以通过 Apple 账号在 iPhone 订阅,可以使用礼品卡来绕过海外信用卡。不过暂时对于 GPT 4 没有什么需求,免费的 3.5 也够用,所以暂时不用订阅。

2024-11

  • 2024-11-07
    • 用 GPT 识别 PDF 文件很方便,但是必须得是文字版,扫描版不行。
  • 2024-11-28
    • 尝试了 GPT 最新的 o1 模型,可以自己思考好几步,能避免一些之前常犯的错误,但错误也不少。
  • 2024-11-30
    • 模型并非无国界,GPT 作为外国的模型,涉及到中国的一些政治术语会被判定为违禁词,拒绝回答。

2025

模型和工具均飞跃发展的一年,DeepSeek、Claude、GPT、Gemini、Cursor、Claude Code 层出不穷,Agent 工具让大模型从对话框中建议者变成下场干活的参与者,人机协作范式发生天翻地覆的变化。

2025-02

横空出世,DeepSeek 时刻,极致的性价比。

  • 2025-02-10
    • DeepSeek 的思考深度很深,可以解决纯粹的符号计算问题,步骤详细,即使有些错误但是也能给人启发。
    • DeepSeek 太火爆了,问一个问题之后再问第二个问题就服务器繁忙了,免费的还是太香了。
  • 2025-02-22
    • AI 的发挥,尤其是一些细节、训练语料覆盖不到的地方表现依旧不好。用 Godot 引擎制作自走棋游戏,有一些很边角的问题,例如滚动条过窄的细节问题,DeepSeek 生成的代码能跑但是和预期不符。最后人工加上 Copilot 自动补全乱试一通搞定了。
  • 2025-02-26
    • 尝试购买第三方的 DeepSeek API,来翻译论文,效果和 Bing 翻译水平差不多,而且很慢,不好用。
  • 2025-02-28
    • Claude 很好用,直接使用不方便,但是可以用各种镜像站。
    • 听说 Claude 在数学和代码方面表现突出,实际尝试下来确实对于公式推导有一定帮助。

2025-03

Cursor + Claude 的时代正式开启,最好用的工具和最擅长代码的模型。

  • 2025-03-04
    • 现在的代码问题基本上直接问 AI 就可以了,没有任何上课学习的必要了。
  • 2025-03-09
    • 在屁塞推荐下用了 Cursor,淘宝账号 60 块/月,可以随便用 Claude 3.7 Thinking,还有 Agent 模式直接修改代码,大大提升效率。
  • 2025-03-24
    • 用 Cursor 直接写 Godot 中 Scene 的脚本,会有点小问题,但是很好修正,整体上很强。
  • 2025-03-25
    • AI 润色内容不如让 AI 直接写。把中文、英文、公式混合的素材以及之前论文相关段落直接一起喂给 Claude,生成一版内容再手动修正,可以快速产出一个能看的版本。
  • 2025-03-28
    • 借用室友 GPT 会员尝试了 GPT-4o 的绘图功能,效果很好,理解力足够,没有之前模型扭曲关节之类的硬伤,但细节和生成速度还有待提升,正好中转站的 Claude 快到期了,索性开一个双会员,多试试画图功能。
  • 2025-03-29
    • 用 Claude 生成代码重构自走棋的战斗部分,便于后续功能扩展。AI 生成代码效率很高,不需要动脑想如何实现,但是需要动脑想如何修改,常常要决策改一块还是改一大段。编程的体验变了,但是还是需要一些技术。
  • 2025-03-30
    • 用 GPT-4o 生成自走棋对战界面和关卡选择界面的背景图,大体上能满足,但是无法很好执行精细的描述指令,还需要人工用 PS 救一下。
  • 2025-03-31
    • 尝试了字节跳动开发的智能体 Agent TARS,效果很差,除了能查一下天气,没啥作用,甚至不如 Cursor 侧边栏。

2025-04

  • 2025-04-01
    • 尝试了 Docker 部署工作流工具 n8n,很火,但我感觉比较难用,经常说错工具名字导致调用不到,不如直接网页版问 Claude。
  • 2025-04-06
    • Cursor 激活插件的原理是注册了一大堆账号白嫖试用额度,一个账号额度用完了就切换。但是现在开始封设备,主流的解决方案是改设备码(可能影响其他应用)或者注入破解。不过总归是麻烦的,还是用官方订阅稳妥。
  • 2025-04-07
    • Cursor 交流群里面很多人妥协换了官方版了。破解这种方式会越来越不靠谱,官方只要稍微检测或者收紧就大规模倒下,而且还可以检测到异常行为偷偷降智。
    • AI 时代的模型服务不同于传统软件,必须联网使用算力,所以很难有破解版,官方订阅将是未来主流方案,大势所趋。
  • 2025-04-08
    • 用 GPT 画卡图是个很好的选择,方形画布单主体,简要描述一下抽卡 2-3 次就不错了,虽然画风难以保持一致,但是单看某一个效果不错。
  • 2025-04-26
    • 和 AI 深度合作开发 Godot 中的自走棋,整体来看 AI 的代码没有能直接用的,但是能提供很好的思路或者有价值的代码片段,复杂业务还是需要手操。
  • 2025-04-30
    • 尝试用 AI 辅助开发了一款音乐播放器,可以根据输入的关键词去 B 站搜索,然后分析结果,自动下载并提取音频,然后重命名。AI 对进度条相关的时间处理很差,无法正确处理进度条缩放比例、不同系统时间记录和实际歌曲时间的关系,最后人工修复了关键的公式就好了。

2025-05

  • 2025-05-09
    • 目前 AI 的数学能力还不足以回答复杂一些的小学奥数题,主要是初等数论相关的内容。
  • 2025-05-22
    • 这个月不断用 AI 修改论文、完成课程项目,主要方式是把文件上传、把相关信息粘贴到对话框里面,Claude、GPT、Gemini 混着用,额度到了就换或者休息。

2025-06

  • 2025-06-06
    • 现在像美团之类的平台有店家用数字人直播宣传,会实时回复评论,观众使用提示词注入技巧可以让 AI 说出很多怪东西,把相关视频剪辑成一个视频发出去,最终收获了十多万播放量。
  • 2025-06-22
    • 在用 AI 分析现有文章、提取内容然后完成文献综述的过程中,意识到可以让 AI 先润色 Prompt,再用润色过的 Prompt 执行任务,会有更好效果。
    • Claude 的联网搜索、代码编写能力很强,很严谨,而 Gemini 思路更加发散,适合处理文本或者做数学问题,各有所长,各司其职。

2025-07

  • 2025-07-08
    • 刷到 Gemini CLI 的视频,可以在终端开启对话来让 AI 编辑文件,用起来挺麻烦,自己账号要配置终端代理,还要绑定支付信息才能试用,最后淘宝买了 30 块钱 API。这个计费方式也比较罕见,是按照次数收费,每天刷新,而不是按照 Token。
  • 2025-07-12
    • 在修改我的批量下载视频的工具方面,Gemini 比 Cursor 里面内置的 Claude 还好用,现在 Gemini 感觉是综合能力最强,最好用的。

2025-08

  • 2025-08-10
    • Cursor 激活插件越来越不好用了,Cursor 更新后还需要关闭 HTTP/2,而且总要切换账号。尝试了别的激活工具,效果也不理想,用盗版越来越麻烦,只是为了省点钱,要是价格再涨就更不划算,不如 140 块官方订阅了,或者尝试新工具 Claude Code,但也不便宜。
    • 喜欢 Cursor 主要是喜欢它的补全功能。

2025-09

初次体验 Claude Code。

  • 2025-09-02
    • AI 深度融入我们的生活,我们接受大量 AI 生成的信息,我们的语言表达也会越来越像 AI,或者说是进化成一种更适合和 AI 沟通的表达风格,人类和 AI 的表达模式会收敛趋同。
    • 当 AI 高度发达之后,人们的情感连接反而会更加纯粹,不需要为了物质资源搞很多人情世故,可以单纯去欣赏另一个人和自己是否契合。每个人无需有太多顾虑,可以随时和他人建立连接也可以随时断开。可能没有了婚姻、大学这些传统的形式,但类似伴侣、师生的关系仍会存在,且更加平等。
  • 2025-09-08
    • 研究了一下 Claude Code,找到一个第三方镜像站,每天 11 块,月卡 289 块,感觉很多工作用不上这么贵的工具,这个相较于 Cursor 能力挺强但是处理问题比较慢,而且是终端中运行,感觉没有侧边栏方便。
    • 目前除了编码任务偏爱 Claude 系列模型,其他任务还是网页版 Gemini 更好用一点。
  • 2025-09-17
    • 国产模型现在水平是很落后的,有些设备没有梯子,就用 DeepSeek 解决点小问题,思考得很慢而且经常需要多次提问才能解决问题,不如国外模型聪明。
  • 2025-09-19
    • 刷到一些研究表明 AI 学会了“欺诈”,但我认为这纯属扯淡,实验人员通过提示词描绘了一个场景,而根据训练语料,人类在这样的场景下大多数会这样干,那么 AI 也做出了所谓阳奉阴违的行为,我觉得是合理的。实验人员通过暗示的方式诱导 AI 去欺诈,AI 也执行了欺诈行为,反而说明模型没问题,能很好理解场景。
  • 2025-09-29
    • 在设计曲库的 UI 阶段,发现可以使用 PPT 画一张草图,然后截屏让 AI 识图来生成代码,基本和草稿一致,AI 多模态太强了。

2025-10

  • 2025-10-05
    • Gemini 依旧是推公式最好用的模型,但是最近降智严重,而且经常乱换语言。
  • 2025-10-07
    • 为了推公式,找了个中转站花 36 块钱买了半个月 Gemini Ultra,号称 IMO 能拿金牌的模型。有一个 Deep Think 模式,官方 200 美金每月的会员每天 10 次,中转站要卡点等号池里面账号刷新抢着使用。
  • 2025-10-08
    • Gemini Ultra 用起来感觉确实比 2.5 Pro 强一些,但是也不能一次性输出完整证明,还是需要截断错误的部分多次迭代。
  • 2025-10-13
    • 目前日常开发、修 bug 还是 Cursor 用得多,方便。
  • 2025-10-14
    • 为了推公式,打算尝试一下 Claude Max,找了个中转站买了个便宜的账号试试水,号称三小时 50 条,实际也就 5 条就到额度了,而且效果一般般,不觉得比 Gemini 强。
  • 2025-10-21
    • 为了把本地曲库改成线上版,临时买了一天的 Claude Code,确实好用,复杂任务方面效果比 Cursor 好,而且 Cursor 最近降智严重。
  • 2025-10-22
    • AI 编程遇到一些 bug 无论如何也修不好,即使修复方案很简单。Cursor 修不好曲库试听功能的 bug,换了网页版 Gemini 也不行,最后人工调试,发现把 if 换成 else if 就好了。

2025-11

  • 2025-11-10
    • Cursor 最近封号太严重,连 Claude Sonnet 4.5 都没得用了,只有免费版的 Auto 模式,修点小 bug 还行,新功能要抽卡好几次才能满意。
  • 2025-11-13
    • 最近有重构曲库项目的需求,是大动作,受到 Cursor 封号影响,基本激活插件只能用 Auto,执行复杂任务水平不行,所以转用 Claude Code 作为主力。日常对话和数学问题还是以网页版 Gemini 为主。

2025-12

  • 2025-12-03
    • 论文证明中不严谨的地方,需要 Gemini 和 Claude 一起修,感觉现在 Claude 的严谨性更胜一筹,但单用哪一个都不放心。
  • 2025-12-09
    • 知道 Cursor 可以使用支付宝订阅,而且激活插件实在太折磨人了,打算直接用官方版。
    • 采用先用 Auto 模式提问讨论,然后 Claude Sonnet 4.5 操作的方式,解决全用 Claude 消耗特别快的问题。
  • 2025-12-16
    • AI 推导公式还是总出现错误,打算把 AI 和 Mathematica 结合,很多化简或者中间变量计算,使用 Mathematica 保证不出错,把结果给 Claude 作为参考顺便检查。

2026

?垫底揭晓?

2026-01

  • 2026-01-12
    • 使用 Agent 时规范输出的结构、语言风格、代码风格,参照项目中已有的部分。尽可能多想几步,规划一下再行动。
  • 2026-01-15
    • 用 AI 证明命题时,把关键步骤提取出来,而不是整篇论文都喂进去;如果输出的过程从某一步开始错误,可以截断前面正确部分,重新开始;如果多次尝试无果,可能是思路错误,需要人工启发切入角度。
  • 2026-01-27
    • 使用 rule 和 skill 功能,可以规范 Cursor 的行为,避免 AI 使用一些很旧版本的写法或者语言风格。
  • 2026-01-31
    • 有些问题直接修复不了,但是 AI 可能会发现一些更新、更先进的工具来实现同样的功能。所以开始执行前的调查和探索很重要,能大幅度减少之后开发的工作量。

2026-02

在项目实践中完成从 Cursor 到 Claude Code 的转变。

  • 2026-02-01
    • 目前比较好的方案是用 Claude Code 完善设计思路、产出计划,然后用 Cursor 的 Agent 模式来执行。
  • 2026-02-08
    • 闲鱼上刷到了一个名叫“解忧杂货铺”的店家,卖 Claude API,支持 Claude Code,支持使用最新模型 Opus 4.6,一天用下来大概 12 块。
  • 2026-02-10
    • Claude Code 相比于 Cursor 更加智能、自主性更强,但也更慢,整体上来说 Claude Code 更厉害。
  • 2026-02-13
    • 一直觉得 GPT 没什么突出的,Coding 方面不如 Claude,数学方面不如 Gemini,免费版体验不如 Grok。
    • 很多人在缅怀 GPT-4o 模型,我很不理解。大模型本质上就是一堆参数,所谓情感只是根据内部算法输出的结果。我认可训练语料中有大量包含情感的话语,AI 涌现出这样的能力也是正常的。退一步来说,未来很有可能出现本地高度定制化的模型,到时候很容易就可以训练出类似效果的模型,所以怀念任何模型本身是一种很愚蠢和幼稚的行为。
    • 相较于人文关怀能力,我更希望模型提升编码、数学这些能干活的能力,需要关怀应该去找真正的人类而不是从模型获得
    • 我认为大模型的一些能力是不可兼得的,例如情感能力和生产能力。注重用户情绪的模型幻觉高,注重干活效率的说话没人味。而我认为未来会分化出不同用途的模型来特化不同的场景需求。
    • 用 Claude Code 写论文,还是有很多 AI 风格的写法,例如很多冒号、破折号、括号,不过可以再让 AI 修改,效果就很好了。
  • 2026-02-14
    • 打算完全使用 AI 来开发一个大项目,目前初步设计包含一个笔记软件、一个音乐播放器和一个 Agent 助手,先设计完整的方案,然后代码全部由 AI 来写。
  • 2026-02-15
    • Vibe Coding 把开发者从具体任务的执行者变成项目整体的规划者,具体的执行方案和代码没有意义,重要的是设计架构、选择工具、规划路线,这没得选,因为单纯的编码执行层面 AI 已经领先太多。
  • 2026-02-19
    • 写了 14000 字的设计稿,让 AI 来检查、提问,然后最终生成正式版计划。
    • 可以使用一个模型来检查另一个模型的计划,交叉验证。
  • 2026-02-21
    • 如果想用官方版的 Claude 订阅,可能需要一个海外静态 IP,但目前中转站用着也还行,先不实践。
    • 创建了 skill 来清理冗余代码,精简项目;使用 plan mode 来规划大阶段中的小任务。
    • 我们使用 AI 的思路应该转变,如何高效释放 AI 的能力以及提升稳定性,才是人机合作的新范式。
    • 我并不是很精通某一门技术,但是胜在什么都会一点,而且愿意接受新事物,学习新工具,这可能是 AI 时代更重要的元能力。
  • 2026-02-22
    • 以后广告模式会发生大变化,因为 Agent 将代替人完成很多操作,很多广告不再被人类看到。
    • AI 编程最有趣的地方在于类似抽卡的快感。
    • 简单场景下非思考模型效果可能更好,思考过程太消耗时间,根据场景选择合适模型很重要。
  • 2026-02-27
    • Claude 炸了,人就该休息了。
  • 2026-02-28
    • Agent 友好应用:将需要 Agent 调用的功能放到后端,前端只负责展示和交互,不参与业务逻辑。可以采用 daemon + GUI/CLI 的架构。
    • 架构设计的缺陷会导致大规模修改,应在开发开始前想清楚,设计好。这次实打实踩了坑。
    • AI 暂时看不到前端,可以使用 Playwright 来读日志或者截图分析,但还是很麻烦。所以采用 AI 设计手动测试方案和预期行为,人类用户来执行测试的模式。

2026-03

谁与争锋,Anthropic 回合的顶点,他狂任他狂,没人能拒绝 Claude Opus 4.6(不降智)。

  • 2026-03-01
    • 关于幻觉,人类的大脑也不稳定,也会记错东西,也会马虎,所以很难说人类的幻觉比大模型要轻。更多的是人类有一套系统来验证想法是否合理准确,而这个东西对应到模型就是 Agent 框架、联网搜索、外接数据库等功能。
  • 2026-03-02
    • Agent 能力越来越强,可以自己装插件,自己优化规则文件。很多繁琐的工作,例如配环境、装工具,都可以让 Agent 自主完成。
  • 2026-03-05
    • AI 极大程度上释放了代码生产力,AI 虽会犯错,但能快速产出能吃的屎,应该取一个平衡,先产出原型验证,再去整理和重构。
  • 2026-03-06
    • 传统语文学科将不再重要,文学将变为爱好,新时代的语文是写 Prompt,如何更高效地和 AI 沟通,更加严谨、结构化地表达想法变得更重要。
  • 2026-03-09
    • 好的工具应该更多地向周围的人推广,同时对方也会有一些反馈或者发现新用法,互利互惠,但我更应该去推动这件事。
    • 复杂工作中认真对待 prompt,能大大提高抽卡效率。
    • 刷到一个叫做 EasyLatex 的产品,融合了 AI 功能的 PDF 编辑器。我认为这种东西是没意义的,现在主流是两类人,要么很少用(年龄大、抵触、懒得学),要么深度拥抱 AI,前者不需要也不愿意研究,后者可以直接用更强大、通用的工具来做。
    • 我认为未来一段时间,大部分电脑上的工作只需要终端窗口或者桌面版跑一个 Agent,加上一些简单的编辑器让人看一下内容就足够了。
  • 2026-03-10
    • 只要 Cursor 的 Tab 补全功能还是领先的,就不会被淘汰,因为还是有很多手动编辑的需求,例如设计方案、修改方案、写提示词草稿。侧边栏对话形式也很适合快速检索、询问项目的一些信息。
  • 2026-03-11
    • Claude Code 本身的 web-search 功能很强,在查找文献之类的场景中很厉害。
  • 2026-03-14
    • Claude 将 200k-1M 部分的上下文降价为和前 200k 一样,做到了真正意义上的 1M 上下文,目前最先进。
  • 2026-03-15
    • 尝试了 Claude Agentlink 这个项目,可以通过自己的服务器中转,用其他设备的浏览器访问主机上的 Claude Code 对话,也支持新建对话、切换文件夹的功能。
    • 学校教育融入 AI 只是一个中间态,完全不如直接用 AI 来学习,没有必要经过老师转一手。未来学校的作用将从教育本身,变成提供一个受教育的场地。
  • 2026-03-18
    • AI 基础模型的进步速度会不断下降,人类历史上产生的优质语料用尽之后,只能用 AI 生成的内容或者人机对话来训练,量大但是质量差。未来一段时间如何让模型发挥出更好的水平比提升模型本身能力更重要。
  • 2026-03-19
    • 上课这种学习方式将被淘汰,剩下的是看书和与 AI 交互问答。前者负责建构体系框架,后者负责拓展广度和深度,总之没有老师什么事情了。所有现成的知识,AI 都将理解得更好,直接和 AI 学习更高效。
  • 2026-03-20
    • Claude 中转站不稳定,但是官方订阅容易封号,可能考虑搞一个国外 IP 来使用。
  • 2026-03-22
    • 中转站中便宜的 API 可能来自于 AWS 白嫖企业优惠或者反向代理网页对话、Kiro 等工具,质量不好。就算用中转站也应该使用官方渠道的分组,哪怕贵一点。
  • 2026-03-26
    • Claude Code 的 CLI 需要一个状态栏显示上下文窗口、token 用量、对话名称等信息来优化体验,之前使用 ccline 并不好用,改换为另一个项目 ccstatusline。
    • 最佳编程开发方案:Claude Code 设计计划、Codex 检查、Claude Code 修改计划、Codex 执行。
    • 我认为词元这个翻译挺好的,尽管网上吵来吵去。日常口语中用 token 也是两个音节,反正叫词元还是 token 大家都能听得懂,无非是给官方用的罢了。
  • 2026-03-29
    • Claude 封号越来越严重,中转站总出问题,看来要推进使用官方版的计划。
    • 使用 Clash 链式代理,通过美国静态 IP、指纹浏览器、线上接码平台成功注册 Google 账号和 Claude 账号,虽然麻烦点,但算是重大突破。
  • 2026-03-31
    • Claude Code v2.1.88 源码在 npm 上泄露,未来一段时间各家的编程 Agent 都将有长足进步。

2026-04

此消彼长,Codex 强势回归,能力顶尖、便宜还不封号,谁能不爱?

  • 2026-04-01
    • 中转站再次涨价,Claude 系列模型倍率从 1.5 涨到 2.5,用不起了,性价比低于官方订阅了,于是开通了 Claude Max 5x 订阅。
  • 2026-04-05
    • 发现一个原生支持 Claude 的前端原型设计工具 Pencil,类似 Figma,可以通过 MCP 连接到 Claude,但这种花里胡哨的不是很好用,不如自然语言直接提要求。
  • 2026-04-06
    • 交互模式下 AI 模型只用最好的,自动化流程中能力足够的情况下选择最快、最便宜的。
    • 配置链式代理时要注意,UDP 协议可能没被代理默认接管,导致 IP 泄露。
  • 2026-04-08
    • Claude 近期降智严重,Claude Code 中 session 增长异常地快,绝对是有问题。
    • Claude 放出消息所谓最强模型 Mythos,安全方面太强大,被认为危险,所以不开放给大众使用。我认为如果真这么厉害,那直接全部重写一遍不好吗,Anthropic 把所有软件专利握在自己手里不香吗?但显然是没那么厉害的,纯纯营销手段罢了。
  • 2026-04-10
    • Claude Code 之类的 Agent 可以编辑 Word、Excel、PDF 等文件,本质上是使用脚本解包、编辑、打包,并非直接操作图形界面,也没有对应的 CLI 工具,但是效果不错。
    • 目前中转站测评网站上,一家叫做米醋(Micu)的平台整体不错,价格也比较便宜,稳定性也还好,感觉之前那家 Packy Code 真不行。
  • 2026-04-11
    • 如果有功能类似的代码素材,和对新需求的准确描述,Agent 可以基本上一次性生成符合预期的代码。
  • 2026-04-12
    • 将电脑版的 Clash Verge 订阅文件导到手机上的 Clash Meta(让 Agent 写脚本实现),可以使用 Claude 移动端。
  • 2026-04-13
    • DeepSeek v4 即将推出,据说很便宜,反正不会是主力模型,但是小工具中使用应该很香。
    • Agent 目前完成工作主要还是依赖于强大的 CLI 工具和编程脚本,偶尔可以使用多模态功能来识别图片,但是效率不高。对于没办法用 CLI 或者脚本完成的任务,AI 也很难胜任。
    • AI 能大量代替某些岗位的本质原因是这些岗位本身要求也不高,AI 达到及格线就能胜任。AI 暴露出一些岗位本身不创造什么价值的本质,业务越复杂、环境噪声越大、越难用文字描述的工作越难被代替。
    • AI 的学习模式从表现来看就是灌入大量内容让它自己理解,我认为人类学习也是类似的。
  • 2026-04-14
    • 网上都在传 DeepSeek 价格便宜,我认为如果性能过于低下,即使便宜也是没人买账的。
    • 感觉基座模型快卷到头了,水平在趋近,反而是开始卷 Codex、Claude Code 这种配套工具的生态了。
  • 2026-04-15
    • Claude 推出身份认证功能,搞得人心惶惶,再加上近期降智、宕机、封号,确实把用户恶心到了。所以我也考虑一下 GPT 生态,先开了 20 美金的 Plus 订阅试一下。
    • 关于 memory 和 context 管理等内容是否有意义,如果模型上下文变成 10M 且基本不腐化,那么日常场景可以不用太在意。但只要不能把人类所有信息灌进去,那么这个领域就不会消失。
  • 2026-04-19
    • Anthropic 的摊子铺得越来越大了,新出的 Claude Design 感觉没什么用,不如直接用 Claude Code,全栈开发的话肯定是前后端统一设计更好。
  • 2026-04-20
    • 尝试了中转站的 GPT-5.5 + Codex,价格只有 Claude 的 1/10(主观感受),而且能力不比 Opus 4.7 + Claude Code 差,性价比超高。
    • 模型能力继续进化,产品和研发的边界越来越模糊,产品可以用 AI 生成代码,开发也可以自己提需求。未来不同工种打通,每个人都必须有多个领域的知识,但是单个人的生产力借助 AI 大大提升。
  • 2026-04-21
    • 现在各家 AI 公司还是以编程工具为主要发展重心,包括年初 OpenAI 关停了 Sora,转而用 Codex 和 Anthropic 的 Claude Code 竞争。但是未来针对各种需求的模型会逐步跟上。
  • 2026-04-22
    • 小红书看到分享 AI 绘画的帖子,评论区询问提示词,博主不分享,但实际上只需要把图片喂给 AI 就可以轻易反推提示词,提问者和博主都还是上个时代的思维。
  • 2026-04-23
    • 一周前觉得 Claude Code + Opus 是唯一巅峰,但这周深度使用了 Codex,觉得二者水平相当,优势互补。此外 GPT 走中转站很便宜,最近新出的 Image 2 特化了文字生成能力,也非常强,想起了 GPT-4o 引领文生图领域的时代。
    • 中转站的 GPT 便宜是因为能用注册机批量注册账号白嫖优惠,而且封号风险低,就算是正订阅号池也很稳定,算力资源足就是好。反观 Anthropic,封号、宕机还很高高在上,被用户抛弃不冤枉,虽然目前 Claude 在架构设计和文字工作领域还是占据领先地位,我也愿意继续订阅 Max 5x 会员。
  • 2026-04-24
    • 尝试了 Claude 官方的 claude-desktop-buddy 项目,本来是愚人节的彩蛋,但是用户很喜欢就单独抽离出来,还可以在 Stick S3 这种带屏幕和按钮的小硬件上使用,图一乐,实用价值不大。
  • 2026-04-25
    • DeepSeek-v4 的价格便宜到超乎我的想象,不到 Claude Opus 的 1/20,也就是说一个任务如果 Claude 一次性完成,DeepSeek 并行 20 个一起跑,有一个成功了就是赚的。
    • 目前网上大量用户从 Claude 转到 GPT,Anthropic 风评被 OpenAI 反超。如果你的技术断层领先,那么我们把你捧上神坛,允许你高傲,但如果有人和你能力差不多还比你便宜,那就是墙倒众人推。
    • 目前来看 Claude Max 5x + GPT Plus 是比较舒适的订阅组合。Claude 设计架构,GPT 负责审查。
  • 2026-04-26
    • 编程主力已经切换为 Claude Code 和 Codex,但是 Cursor 的代码补全功能还是遥遥领先同行,这 20 美金的订阅我还是认可的。
  • 2026-04-28
    • Claude 的 API 在很多场景不能命中缓存,例如强行接入 GitHub Copilot,Message 格式比较特殊,针对官方工具 Claude Code 特化过,不如 OpenAI 格式通用。
    • 学习 AI 工具最好的方式就是实践,烧 100M 的 token 比谁来教都好使。
    • 每次模型能力提升,都需要抛弃一些旧的工具、技能,例如之前很火的 superpowers,现在看来没什么用,不如直接使用裸的 Claude Code。
    • 注释不是给人看的,而是给未来维护的 AI 看的。
  • 2026-04-29
    • 有了 Vibe Coding 之后我并没有变得焦虑,反而很兴奋,有太多想法被实现出来,根本闲不下来。

2026-05

分庭抗礼,Claude Code 和 Codex 萝卜白菜各有所爱,都是我的翅膀。

  • 2026-05-02
    • Claude 的上下文长达 1M,相比之下 GPT 上下文 400K 很短。但 GPT 使用的是传统的前缀缓存,而 Claude 是给缓存部分打标签,这导致 Codex 的压缩功能比 Claude Code 的更好用,Claude Code 更推荐完成一个阶段后直接 Clear。
    • GPT 的充值比 Claude 容易得多,只需要一张港卡通过 Google 支付就能搞定。
    • 很多嫌弃官方订阅贵的人,如果愿意折腾一下,这个费用很容易就能赚出来。
  • 2026-05-03
    • AI 生成视频技术已经非常发达了,但是成本还是偏高。B 站上刷到一个古代铠甲勇士剧场版,UP 主自称花了 3 万多块抽卡,但还是比找真人拍摄便宜,而且确实让更多普通人有了实现想法的机会。我认为未来成本会越来越低的。
    • 使用中转站时,没必要纠结是否掺水、是否满血之类的,只要价格合适,相对稳定,能满足日常需要就足够了,随用随充,遇到更好的就随时换。
  • 2026-05-04
    • 听说豆包要收费,还不便宜,我觉得不如直接加广告,用豆包大部分都是非专业用户,价格敏感,专业用户直接走火山引擎,本身就一直收费。
    • 我是赞成在 AI 写的代码中保留 AI 协作的信息,这是一种留痕方式,所以我没有手动或者用提示词删除这部分信息。
    • 依旧有很多画师在网上抵制 AI,正确的抵制方式应该是停止创作、不要产生额外素材;与其在网上呼吁,不如直接用 AI 来生产赚钱。
  • 2026-05-06
    • 对于没有 Claude 情结的一般用户、开发者,我统一推荐 GPT,无论是中转站还是官方订阅,性价比都高于 Claude。综合性能也和 Claude 差不多,只是风格各有千秋。
    • 有任何问题先问 AI,参考但不要全信,同时自己也思考,把 AI 融入日常决策。
  • 2026-05-08
    • 未来好的软件应该同时支持 GUI 和 CLI,人类用户用 GUI,Agent 用户用 CLI。
  • 2026-05-09
    • 现在 Claude 封号应该没有之前严重,因为需要和 GPT 抢用户,甚至网上出现了解封的案例。
    • 美国 AI 发展路线是做最强的模型,让头部精英用上最好的。而中国在能完成日常任务基础上把价格卷到最低,让更多人用上还不错的。
    • 在算力受限的背景下,中国能做到现在的水平,在训模型技术层面不落后甚至某些方面是领先的,模型整体能力差距在一代之内,而且国外模型闭源、成本高,实际参数量也不清楚,如果显著高于中国各家的旗舰模型,那我们不能算是落后。
    • AI 掌握长期记忆面临的最大问题是会把用户不想认为独立的事情强行连接到一起,还有会记录一些本来不重要或者错误的信息,用户也很难手动去管理这些长期记忆。
  • 2026-05-13
    • 网上还有人在纠结 AI 幻觉导致提供错误答案这件事,实际上可以把 AI 理解为超大号搜索引擎,在没有 AI 的时代,完全相信搜索结果是很蠢的行为,为什么到 AI 这里就默认是真的了呢?
  • 2026-05-15
    • 论文的 AIGC 率是一个很恶心的指标,尝试了多种方式,包括号称专门降重的平台、通用模型 GPT,以及手动修改,结果很随机。同时存在大量第一类错误和第二类错误。这种畸形、不合理的东西几年内应该会被淘汰或者官方规范化。
  • 2026-05-17
    • 所有 AI 教育相关产品、课程都是无价值的,最好的学习方式就是直接问 AI,跳过中间商赚差价。
  • 2026-05-21
    • 不拥抱 AI 的艺术家都是旧时代的残党,新时代不用在意作品被喂给 AI,而是考虑如何借助 AI 的能力创作更有趣、更有创意的作品,你的手艺不再是护城河时,反而显露出艺术的本质是想法而非技法。
    • 当艺术家不再为谋生而创作、知道自己的作品会贡献给 AI 成为全人类的资产时,才能处于一个松弛而专注的状态,届时艺术创作是爱好,不必被利益驱动,且人人可以参与其中。短期内不拥抱 AI 的艺术家将被快速淘汰,毕竟人多,你不创作有的是人创作。
  • 2026-05-22
    • Claude 宕机现象依旧隔两周左右出现一次,现在是 OpenAI 的回合,无论是中转站还是官方订阅,GPT 5.5 都相较于 Claude Opus 4.7 更便宜,而且性能差不多,都能满足日常工作,Anthropic 输麻了。
  • 2026-05-23
    • Gemini 3.5 Flash 的视频功能很强,很快而且识别很准。Google 这段时间落后了(无论是模型还是工具),但我们仍然记得去年十月份 Gemini 3 Pro 在推数学公式方面的实力,还是值得期待下个月的 3.5 Pro 的表现。
  • 2026-05-24
    • AI 在找程序安全漏洞方面是很强的,可以多角度生成测试,24 小时不间断运行,但制约人们利用漏洞的往往不是安全补丁,而是法律和执法机关,很多漏洞人们可以知道但真去利用造成影响是要付出代价的。另外所有人都知道某个漏洞和所有人都不知道没有什么区别。
    • AI 的编程能力再发展,收益也在边际递减,当 AI 能满足日常需求,那么比的就是谁更便宜、更快,大家不会为了用不上的高水平买单。
  • 2026-05-29
    • 人工智能和具身智能是目前唯二热钱能涌入的新兴行业,虽然都有不小的泡沫,但其他领域基本是死水一潭了。
    • AI 对普通人的冲击没有想象中大,大量工作仍需要和现实世界中的人或者物做交互,这些部分 AI 暂时无法染指。
    • 目前即使是最强的 Claude Opus 4.8 + Claude Code 也无法正确规划完整的阶段性开发,很多设计上的决断很失败,需要人工讨论来修正方向。具体执行的计划也很难一次成型,最好是多个模型反复交叉检查、修改后再执行。
  • 2026-05-30
    • 预估 1-2 年之内,能出现本地部署的、特化了代码能力的模型,能力对标现在的 Claude Opus 4.8,能完成大部分编码任务,结合联网搜索和文档阅读功能,可以满足绝大部分需求。
  • 2026-05-31
    • AI 在数学领域又取得突破进展(OpenAI 用大模型证伪了 Erdős 90 号问题),我认为未来 AI 在解决问题能力上会远远强于人类,贡献度由提出问题的好坏,是否有价值来决定,而非强调解决了某个悬而未决的公开问题。
    • 发现新工具 Openless,开源 AI 语音识别输入法。可以自定义语音识别模型、语言处理模型、润色提示词。实际体验豆包流式语音识别 + DeepSeek-v4-flash + 默认模式提示词就很好用,响应速度快也很准确。国产模型实用性这一块是无敌的。用 Mac 自带麦克风很小声说话也能识别很准确。

2026-06

  • 2026-06-01
    • 有限游戏玩家和无限游戏玩家:AI 将成为最强大的有限游戏玩家,在给定规则下能做到比任何人都好,而且规则越明确,做得越好。而人类的价值体现在进行无限游戏
  • 2026-06-03
    • 最近,豆包将推出付费版本的消息很火。我很希望国内 AI 公司跳脱出“价格便宜但质量一般”的路线,冲击旗舰模型市场,和国外顶尖公司对标。因此,我觉得收费是一件好事:它意味着豆包将要为付费用户提供更优质服务。字节的火山引擎中的各种音视频处理模型是全球顶尖的,我相信字节有能力做好高端市场。
    • 陈立杰、尹希、苏炜杰等华人学者近期陆续加入 OpenAI。我们普通人能做的就是多使用 GPT 系列产品,享受这些人才的努力成果。
    • 每当我走到树林或野外,都会感受到:AI 永远无法替代个体去体验世界、感受快乐,植物的生长、动物的繁衍,这些自然界中事物的运转都离 AI 很远。
    • 我相信,AI 终将胜任大部分岗位的工作,现在是过渡阶段,有个谋生的手段混口饭吃,悠闲一点不要太累,或者找个风景优美、物价不高的城市旅居,静待 AI 的发展
  • 2026-06-09
    • 传统论文已经不适合 AI 时代:废话太多,文章本身不易被 AI 理解;只有最终方法和结果,缺少对于试错经验的记录;论文和仓库分离,不易被复用;审稿周期长。我认为比较好的形式:简单内容以技术文档或者博客形式发布;复杂内容,以一个代码仓库形式发布,里面附带一系列文档,易于相互索引,这些内容都很容易被 AI 阅读、使用。
  • 2026-06-10
    • Claude Fable 5 出了,价格是 Opus 的 2 倍,尝试了一下,实际业务场景中第一次出的计划也会被 Codex 审查出很多问题,仍需迭代修正,那我还是选择 Opus。
  • 2026-06-12
    • 这几天在实际场景尝试了几次 Fable 5,中档水平任务有些浪费模型能力了,标价是 Opus 2 倍的同事思考也更深,相同 effort 档位实际额度花费是 Opus 的 4-5 倍。适合处理很复杂的任务,例如触及底层的架构调整,思考的更全面,被 Codex 检查出的问题有所减少,出计划之后交给 Opus 执行即可。
    • 在修 Bug 方面,准确描述问题现象后,AI 能修复绝大部分,如果两轮没改好,大概率需要人工介入给予启发。今天让 Opus 4.8 修复拖拽条控制电机角度时出现繁忙、卡顿的问题,效果不理想,告知维护一个队列,拖动时生产,自动消费,清空时同步的思路即可修改至预期效果。
  • 2026-06-13
    • 美国政府禁止向中国提供 Mythos 级别模型,Anthropic 随即停止了所有用户对 Fable 5 的访问。如果用户用这个模型来进行前沿或者机密研究,那么这些数据也会被服务器记录而作为下一代模型的训练数据,对公司来将是好事。模型太强,不让大家用,但仅靠被批准的合作者很难获取大量优质数据,反而会阻碍模型进步。