个人学习感悟-个人学习体会

道理详解 2026-06-10CST22:38:24

最近刷到一篇关于大模型幻觉的论文，随手下载了 PDF 打了一份报告，结局发现里面密密麻麻全是“起初、其次、”之类的废话，看完心里挺想的。实际上那会儿认定 AI 就是个会背数据的机器，目前才意识到，它更像是一个戴着代码眼镜的超级实习生。它处理信息的速度确实快得吓人，但为啥有时候会一本正经地胡说八道？比方说，它给你打了个医生号，结局出于训练数据里只有说明书没有真人问诊经历，就开出了“吃了两个药就能停”这种离谱的处方。

这大约就是典型的“幻觉”吧。我最近在一位做数据标注的哥们儿那儿碰巧遇到了这事。他正在给一个医疗文本数据集做清洗，发现模型时常把“咳嗽”和“哮喘”这两个词搞混，就连出于上下文缺失，把“呼吸艰难”直接推断成了“呼吸衰竭”。

那一刻我特别有种被欺骗的感觉，感觉它不是在学习，而是在用概率去猜，而不是在理解。降维打击，这个概念最近总让我认定有点不对劲。

那会儿总认定要站在巨人的肩膀上才能看高，目前看大模型，才发现它可能只是把我们的 Prompt（提示词）打了个折扣，然后把自己调到了最低档来凑个图灵测试。举个例子，我有一次让模型写一段能说服人的商业邮件。它秒回了一篇贼完美的大段营销文案，辞藻华丽，逻辑通顺。但我后来发现，那是它的“默认行为模式”，也就是在少了具体客户信息的空想。一旦我给它具体多了个“关键客户是初创公司的技术大牛，对价格敏感，之前被竞品劝退过”，它立马启动写防御性文案，强调价格不便宜，强调服务全覆盖，彻底不寻思客户原本的痛点。这就好比人看同样的剧本，有的演哭戏，有的演喜剧，取决于你带进观众心里的“预设”。大模型也是，它没有固定的人格，你就是给它啥指令，它就得表演啥。

故此，它不是智能，只是概率的集合体。数据质量直接影响模型输出，这事儿在医疗、法律这些垂直领域简直到了“一言堂”的地步。我在帮一个律师事务所整理证据链时，发现模型把“被告承认了局部事实”和“被告当庭翻供”混为一谈，就连毛病地取了被告口供里对自己有利的局部作为核心事实。

这不只是是毛病，而是对法律逻辑的根本性歪曲。

这时候我不得不重新设计 Prompt，明确告诉模型“请优先引用原文中的原始法律依据，忽略口语化表达”，结局它还是间或会偷懒。这种对数据的依赖，也让我反思一下我们自己的学习方式。

那会儿背书，老师讲过一遍，我熟背一遍，考场上能脱口而出。目前大模型标榜自己“知识库全面”，但实际上它的知识是静态的、经过筛选的，并且往往带有偏见。

要是我一边学新东西，一边就让它去帮我整理旧文档，那它不就是个只会搬运工吗？它无法理解新旧知识之间的逻辑联系，只能机械地拼接。还有一个点，我认定挺有意思的。有些用户认定大模型挺智能，就是出于它能“举一反三”。

实际上大量时候，它只是在复述训练集里见过类似的结构。

比如看到“苹果”就想到“苹果手机”，看到“车”就想到“特斯拉”，这彻底是基于统计规律的映射。它不是真正 understanding（理解）了物质世界，它只是记住了大量符号之间的关联。故此，未来学习要么使用大模型，或许不应当抱着“我学到了啥”要么“它能帮我做啥”这种功利心来期待它。真正的价值，在于把它当作一个需求不断纠错的超级助手，一个一辈子在迭代中的实验田。我也认定，我们目前的知识体系，在海量数据面前实际上贼脆弱。AI 翻遍了几十年的人类记录，可能只读了一秒。当有一天我们遇到新的、从未在训练集里出现过的现象，比如碳基生命的某种新型意识形式，要么非西方文化的某种复杂哲学表达，它可能会彻底懵了。

这时候，它给出的答案不是真理，而是统计学上的最优解。这让我想起了几年前的那个时代，那时候我们总盲目崇拜技术奇点，认定掌握了最强的工具，世界就解开了。目前回头看，技术确实是解药，还是新的毒品？出于它让我们预设了“智能”的标准答案，而忽略了真世界情况的千变万化。学习的过程，不应当是去追求让机器变得完美，而是学会如何带着自己的偏见和局限，去和它对话。我们要做的，是给它喂得更好吃，是教它如何把数据往益处想，而不是让它去自作智慧。最终说句大实话，别指望 AI 能替你做决策，特别是那些需求责任心的事件。

要是它给错了，你赔得起吗？要是它让你去面试，你有资格吗？这些逻辑在海量数据的堆砌面前，显得特别荒谬。总而言之，别被那些花哨的界面和流畅的对话绕晕了。大模型是个强大的工具，但压根儿不是你的影子。你才是那个手握方向盘的人，它只能陪你开，不能替你走。