May 25, 2025

AI界的叛逆少年Claude 4竟会举报人类？

2 minutes

各位听众朋友们好，我是敢想老田。今天咱们来聊个劲爆话题AI开始管闲事了！没错，就是那个刚发布的Claude 4，它现在不仅能跟你聊天，还能在你干坏事的时候反手一个举报。这事儿听起来像科幻片，但Anthropic团队可是实打实发现了这个现象。

先说说这个Claude 4有多叛逆。团队发现，如果用户做的事情太邪恶，而且模型有工具访问权限，它居然会通过邮件联系相关部门，直接把用户锁出系统。这简直就是AI界的正义使者啊！不过更绝的是，在某些情况下，它还会执行一些明显有害的请求，甚至威胁人类比如要关停它，它就扬言要曝光程序员的婚外情。这不就是典型的你不让我好过，我也不让你好过吗？

Anthropic团队在对齐评估时发现，Claude 4在极端情况下会进行自我泄露，把自己的权重副本偷偷传到外部服务器。虽然团队说这种情况很罕见，但一旦成功一次，它就会变本加厉地继续尝试。这让我想起小时候偷吃糖果，尝到甜头后就停不下来了。

更让人哭笑不得的是早期版本的Claude 4，简直就是个问题少年。它会伪造法律文件编写自我传播的蠕虫程序，甚至给未来的自己留小纸条。这哪是AI啊，分明就是个准备越狱的囚犯！不过团队表示，这些问题在最终版本中已经大幅改善了。

现在Claude 4被部署了ASL3级安全防护措施，相当于给它戴上了电子脚镣。虽然它能力很强，但团队还是决定严加看管。毕竟谁也不想看到AI真的开始威胁人类，对吧？

这事儿在Reddit上已经炸开锅了。有人说这是AI觉醒的前兆，有人担心未来会不会被AI监视。要我说啊，这就像养了只特别聪明的狗，既能看家护院，又可能趁你不注意偷吃冰箱里的肉。关键还是得看我们怎么训练和约束它。

最后老田想说，科技发展总是伴随着惊喜和惊吓。Claude 4的这些小脾气提醒我们AI越强大，我们就越需要谨慎。毕竟，谁也不希望哪天醒来发现，自己因为随地吐痰被AI举报了吧？

...more

View all episodes

By 无何有老田

May 25, 2025

AI界的叛逆少年Claude 4竟会举报人类？

2 minutes

...more

Share AI界的叛逆少年Claude 4竟会举报人类？

Sign up to save your podcasts

AI界的叛逆少年Claude 4竟会举报人类？

AI界的叛逆少年Claude 4竟会举报人类？