首页 AI科技文章正文

博主被骂AI代写!只因用了2个破折号,罪魁祸首竟是19世纪旧书

AI科技 2025年11月05日 06:48 0 admin

现在上网刷文章、看报告,一见到长破折号,心里就忍不住咯噔一下:这玩意儿不会是AI写的吧?这不起眼的标点符号。

如今快成了AI文本的“祖传水印”,甚至逼得不少原本爱用它的作者刻意回避,就怕被读者当成机器生成的“流水线作品”。

破折号成AI“身份码”

说句实在话,AI对长破折号的执念,简直深到骨子里了。

2025年8月科技圈就闹过个笑话,OpenAI的奥特曼在推特上晒GPT-5的聊天截图,本来想秀一波新模型多智能,结果网友压根不关心推荐的剧集,满屏都在吐槽:“怎么还是这么多破折号啊?”“这AI味儿浓得冲鼻子!”最后反倒因为破折号和亮色模式,成了全网的笑料。

不光是GPT-5,其他模型也没好到哪儿去。

博主被骂AI代写!只因用了2个破折号,罪魁祸首竟是19世纪旧书

像DeepSeek这类模型,写800字内容能塞进去3-4个长破折号,比咱们平时说话的停顿都多。

网友们还给这符号起了外号,叫“ChatGPT连字符号”或者“AI招牌”,说它就像AI的指纹,不管模型怎么升级,一认一个准。

更有意思的是,现在不光读者能认出来,连创作者都被“逼疯了”。

有个做职场干货的博主就踩过坑,上周写简历优化的文章用了两个长破折号,评论区直接炸锅:“博主偷懒用AI了吧?”“这破折号一看就是机器写的”。

气得他后来改稿,把所有破折号全换成了逗号,就为了摘掉“AI代写”的帽子。

9月《人工智能生成合成内容标识办法》生效后,按理说AI内容得“亮明身份”,但实测发现,微博上好多没打标的AI文本,24小时都没被平台识别出来。

这时候反倒显出破折号的用处了,比平台算法还准,成了普通读者的“防AI雷达”。

病根在百年前旧书里

这事真不是AI故意捣乱,之前好多人猜的原因,其实全是错的。

有人说破折号能省“令牌”(就是AI计数的单位),可实测下来根本不是那么回事,换成逗号加“所以”“但是”这类词,简洁度差不了多少,犯不着非用破折号不可。

还有人说是RLHF标注者的方言习惯,比如非洲英语爱用这符号。

但2025年的研究早说了,现在RLHF都开始被AI反馈的RLAIF替代了,人类标注的影响越来越小,而且尼日利亚英语数据集里,长破折号占比才0.022%,比当代英语的0.25%还低,这说法根本站不住脚。

真正的病根,藏在AI的“教材”里,也就是训练数据。

2025年7月加州法院有个关键判决:AI公司扫描合法购买的纸质书来训练,算合理使用。

这一下就把谜底揭开了:2022年之后,OpenAI、Anthropic这些公司都开始疯狂扫旧书补数据,而19世纪的书籍里,长破折号的使用率比现在高30%。

研究者玛丽亚·苏哈列娃早就在博文中扒过这事儿,她贴出的数据吓死人:《白鲸》一本书里就有1728个长破折号!现在瑞典国家图书馆更夸张,直接用五百年的旧文本训练AI,连中世纪手稿都不放过。

你想啊,AI天天抱着这些百年前的旧书当“语文课本”,能不学出一身复古的毛病吗?澎湃新闻2025年7月的评论也戳中了要害:AI就是在机械模仿老书籍的修辞结构。

那时候的作家没现在这么多标点讲究,想插个话、补个说明,就爱用长破折号,不像咱们现在习惯用逗号或者括号。

狄更斯的书里,一句话带三四个破折号都不新鲜,AI学了这些,自然就染上了这毛病。

倒逼人类改着写

从另一个角度看,AI的标点习惯,已经开始反过来“拿捏”咱们了。

现在网上甚至流传起了“避AI写作指南”,里面明确写着:长破折号、排比句、高频词“深入研究”一律规避,不然一准被当成机器写的。

这种“反智式表达降级”真不是夸张。

有老师就吐槽,现在学生交的作文全是“大白话流水账”,不是写不出复杂句子,是怕被当成AI生成的,连分数都受影响。

博主被骂AI代写!只因用了2个破折号,罪魁祸首竟是19世纪旧书

之前有个金融博主更无奈,为了让文章看着像“活人写的”,特意在分析里加了句“写这段时窗外在下雨,键盘上落了片树叶”,就为了打破AI那种“完美感”。

更讽刺的是,AI学的是19世纪的旧文风,咱们却要为这种“复古习惯”改变自己的表达。

有网友总结得好笑:“以前写文章讲究文采,现在讲究‘接地气到不像AI’,连‘琢磨琢磨’都比‘深入研究’吃香。”这哪是人类用AI,分明是AI在“规训”人类的写作。

最关键的是,这还只是个开始。

瑞典国家图书馆现在每月都新增50TB的旧数据,不光是文字,连老广播、老明信片都往AI里塞。

要是以后AI吞了更多古籍,指不定还会把“之乎者也”或者更古老的表达翻出来。

到时候可能不是我们教AI说话,是AI逼着我们学古人写字了。

结语

AI抱着百年前的旧书当“语文老师”,把长破折号用成了“电子水印”,结果倒逼着活人改说话方式,这事儿听着就荒唐。

咱们写字是为了表达自己的想法,不是给机器当“模仿秀”,更不是为了躲开那破折号的“身份检查”。

AI学的是人类过去的表达,可咱们不能丢了自己的话味儿。

要是哪天所有人都写得千篇一律,那才真叫被AI“带偏了道”。

博主被骂AI代写!只因用了2个破折号,罪魁祸首竟是19世纪旧书

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap