你有没有想过这样一个问题:如果有一天,我们真的造出了像人类婴儿一样、脑子里一片空白的通用人工智能,我们该怎么教它认识这个世界?是像训练小狗一样,做对了给块饼干,做错了大声呵斥?还是像现在训练大模型一样,把整个互联网的文本一股脑塞给它,让它自己在数据海洋里扑腾?
2022年,国内一支科研团队做了一项听起来有点疯狂、但结果却相当反直觉的实验。他们找来一个名叫OpenNARS的通用人工智能系统——这个系统启动时真的是空空如也,没有任何预置知识,全靠一套内置的逻辑推理能力活着——然后,他们决定像教一个人类孩子一样去教育它。
对,你没听错,不是用海量数据去训练,而是用人类的教学原则去教育。
(一)别把机器当硬盘,它可能需要当学生
首先我们得厘清一个概念。现在我们手机里的各种AI,从写诗作画到生成视频,走的都是训练路线。这就像往一个超级硬盘里疯狂拷贝数据,然后通过算法找出规律。这叫暴力学习,本质上是把知识硬塞进去。
但研究团队认为,真正的通用人工智能需要的不是被填鸭,而是被教育。教育和训练的区别在哪?训练是被动接收,教育是主动建构。训练是给你现成的答案,教育是陪你一起找到问题。训练是把机器当工具,教育是把它当成长中的学生。
实验任务听起来很简单:教那个叫OpenNARS的空白大脑控制一辆虚拟小车,在一个二维空间里自由奔跑,同时要学会躲开所有障碍物,别撞墙。
(二)人类老师傅的绝招,对机器也管用?
为了让这个机器学生学好避障,研究人员没有写复杂的代码去控制它,而是模仿人类老师的四招绝活,看看对机器灵不灵。
第一招,目标要常提醒。人类老师上课得反复强调重点,这叫维持学生的目标激活水平。研究者就试着用不同的频率给机器发送你要避障的指令。有的刚启动时说一次就再也不提了,有的每隔一秒就在它耳边唠叨一次。
第二招,教学得给好示范。就像教孩子写毛笔字,你总得先写个范字。研究者给机器的指令序列,有的全是正确示范,有的故意掺了很多错误指令。
第三招,节奏要慢下来。填鸭式教学效果最差,得给学生留出消化思考的时间。研究者改变了指令输入的间隔,有的像连珠炮一秒一个,有的则慢悠悠地隔四秒才给一个。
第四招,环境反馈要适度。空间太大,学生像无头苍蝇感受不到边界;空间太小,撞得鼻青脸肿只剩挫败感。研究者把小车运动的场地宽度从三个单位一直调整到七个单位。
你猜结果怎么着?实验结果让所有人都有些意外:人类老师的这四招,对那个铁疙瘩学生居然全部有效。当教学目标被持续提醒时,机器表现更好;当示范指令大多正确时,它学得更快;当给它的思考时间足够宽裕时,它内化得越扎实;当活动空间大小适当时,它的避障成功率最高。
(三)教育,或许是宇宙级的通用法则
这个结果意味着什么?它暗示了一个相当迷人的可能性:人机兼容的客观教育规律可能真的存在。教育或许从来不是人类社会的专利,而是所有具备学习潜能的智能系统都适用的通用法则。更有意思的是,这个发现无意中给长期遭受争议的教育学撑了腰。很多人觉得教育学不算硬科学,理论依赖心理学,方法不够严谨。但在这项实验里,教育理论是可以被严格重复验证、甚至可以精准证伪的。既然能在机器身上排除一切生物干扰因素来检验教学原则,教育学为什么不能是一门硬核科学?
当然,教机器在某些方面确实比教人类幼崽轻松。你不用照顾它的情绪,不用担心它走神,也不用考虑个体差异。但这也意味着,真正培养一个通用人工智能,其教育设计可能需要比人类课程更加精密和科学。
未来的教育图景或许是这样的:人类教师负责点燃孩子眼里的光,负责那些关于情感、价值和创造力的部分;而AI则成为最耐心的助教,负责知识传递和精准反馈。而反过来,我们人类几千年积累下来的教育智慧,也会成为点亮机器心智的那盏灯。
如果教育机器都需要遵循人类的教学原则,那是不是恰恰说明,教育的本质从来不是简单的知识灌输,而是对智能本身的温柔培育?无论这颗大脑是血肉组成,还是硅基构造。
参考文献:
[1] 刘凯,贾敏,黄英辉,等.像教育人一样教育机器——人类教学原则能用于通用人工智能系统吗?[J].开放教育研究,2022,28(2):11-21.