智慧校园_手机
智慧照明_手机
AI如何"举一反三"?仅靠自己是不够的
发布时间:2023-02-17 16:13:32 TAGS: 无

作者:中联科创特约嘉宾尹智

AI如何"举一反三"?仅靠自己是不够的 —— 

附图得到的这篇得到头条文章,提出了一个很有意思的话题。 ChatGPT能不能用自己生成的数据训练自己?换句话说,它能不能够举一反三扩大自己的知识量和经验?先说我的看法 —— 不能,至少没有标注过的生成数据不能。


我前面有几篇文章谈过,我们通过反馈来学习,通过感知来获得反馈。比如,如果感知的途径只有文字,而且没有人类或者其他注解的书来反馈,告诉读者这本书上说的是对还是不对,读者是得不到新的知识和经验的,因为没有可对照的"基线事实",ground truth ; 而读者如果可以通过已有知识和逻辑判定这篇东西是对还是不对,说明这篇东西的信息其实读之前就已经被读者掌握了。事实上深度学习,强化学习的基本条件,就是要有ground truth,AI才知道自己的输出和真实有多少差距,否则人工神经网络都不知道往哪个方向去调整参数。而人类有一个与生俱来的优势,我们是模态的,我们可以通过各种感官来获得自反馈,比如我们的祖先通过触觉视觉,认识到"火"可以发光发热,可以伤人;通过尝味,视觉,身体感觉等独立来发现新的农作物和草药。也这是为什么有的高手可以闭关修炼,自己就练成绝世武功,他们其实是"自监督"或者"自反馈"式的强化学习。但ChatGPT没有"自反馈"的机制,输出是不是正确,符合人的逻辑和规范, 它无法通过触觉,嗅觉和味觉,甚至视觉来得知,它只有通过人类或者Ground truth的纠正和提示才能获得反馈 —— 如果用ChatGPT的生成数据来做训练输入,它既然能生成这些内容,就表示它已经吸收了这些数据背后的规范和信息,仅靠自己再整理组合一遍已有数据,又没有反馈机制,相当于冷饭又炒了一遍,没有产生新的营养。

从另一个方面看,这恰恰为GPT这类大模型学习的突破提供了方向:如果现有的文本数据已经快被学完了,那能不能通过其他方式创造"新"数据? —— 比如人类训练师是不是能作为新数据的贡献者?是不是可以考虑其他模态的数据?比如图形图像,声音相关的数据?比如能不能让一类AI,比如特别擅长某一方面的"领域专家"型AI来做GPT的"训练师"?—— 仅代表尹智个人观点 Ken's personal view only

阅读( 568)