AI如何"举一反三"？仅靠自己是不够的-中联科创

作者：中联科创特约嘉宾尹智

AI如何"举一反三"？仅靠自己是不够的 ——

附图得到的这篇得到头条文章，提出了一个很有意思的话题。 ChatGPT能不能用自己生成的数据训练自己？换句话说，它能不能够举一反三扩大自己的知识量和经验？先说我的看法 —— 不能，至少没有标注过的生成数据不能。

我前面有几篇文章谈过，我们通过反馈来学习，通过感知来获得反馈。比如，如果感知的途径只有文字，而且没有人类或者其他注解的书来反馈，告诉读者这本书上说的是对还是不对，读者是得不到新的知识和经验的，因为没有可对照的"基线事实"，ground truth ；而读者如果可以通过已有知识和逻辑判定这篇东西是对还是不对，说明这篇东西的信息其实读之前就已经被读者掌握了。事实上深度学习，强化学习的基本条件，就是要有ground truth，AI才知道自己的输出和真实有多少差距，否则人工神经网络都不知道往哪个方向去调整参数。而人类有一个与生俱来的优势，我们是模态的，我们可以通过各种感官来获得自反馈，比如我们的祖先通过触觉视觉，认识到"火"可以发光发热，可以伤人；通过尝味，视觉，身体感觉等独立来发现新的农作物和草药。也这是为什么有的高手可以闭关修炼，自己就练成绝世武功，他们其实是"自监督"或者"自反馈"式的强化学习。但ChatGPT没有"自反馈"的机制，输出是不是正确，符合人的逻辑和规范，它无法通过触觉，嗅觉和味觉，甚至视觉来得知，它只有通过人类或者Ground truth的纠正和提示才能获得反馈 —— 如果用ChatGPT的生成数据来做训练输入，它既然能生成这些内容，就表示它已经吸收了这些数据背后的规范和信息，仅靠自己再整理组合一遍已有数据，又没有反馈机制，相当于冷饭又炒了一遍，没有产生新的营养。

从另一个方面看，这恰恰为GPT这类大模型学习的突破提供了方向:如果现有的文本数据已经快被学完了，那能不能通过其他方式创造"新"数据？ —— 比如人类训练师是不是能作为新数据的贡献者？是不是可以考虑其他模态的数据？比如图形图像，声音相关的数据？比如能不能让一类AI，比如特别擅长某一方面的"领域专家"型AI来做GPT的"训练师"？—— 仅代表尹智个人观点 Ken's personal view only