□ 黄全愈
二、AI教育能发现和发明知识吗?
“科学知识是发明的还是发现的?”我与美国一位著名的物理学家有过探讨(创造与发明同义,但为了与“发现”更“对仗”,特用“发明”)。
这位著名的物理学家说:“自然科学研究客观规律和现象,只能是发现。牛顿没有发明万有引力,只是发现和描述了这一定律,其运行与是否被牛顿发现无关。人文科学属于主观认识的范畴,发明和想象空间无限……”
科学知识不是用来发明规律的,是用来发现规律的。水的分子式是H_2O,人类出现前已存在,不是人类发明的,是人类发现的。
“一杯水能给你家提供一年的电力”是科学家“发现”的新科学知识。美国劳伦斯利弗莫尔国家实验室宣布:首次在核聚变反应中实现能量的净收益(产出能量比输入多)。尽管仅一秒钟,但据说,还要30年人类才能“发现”能用于商用发电的核聚变知识。
我们常说“攻克科学难关”,其实,要“攻克”的是发现新的科学知识和新的科学规律,而不是发明科学知识去“攻克难关”。
那么,人文科学的知识可以“发明”吗?
DIKW体系为数据(Data)、资讯(Information)、知识(Knowledge)及智慧(Wisdom)。每一层赋予下一层某些特质。其中,知识讲如何使用,智慧讲何时使用。
显然,“何时使用”——从被“发明”(而非被“发现”)的角度看,DIKW体系更适用于人文科学(社会科学)知识,因为它们往往既不唯一又唯一、既有确定性又有不确定性、既可发现又可发明、既可很常规也可很反常……
我曾参与迈阿密大学汉语教学的管理工作。某天,一位后来去读博的犹太裔学生抱怨:“为找一个汉字,我连夜翻遍三本课本均无果。”
我问:“为啥不翻字典?”
他摇了摇头,苦笑道:“堪比翻天书。”
调查300多名学习中文的学生发现,只有两人(一个是奇才,另一个曾在日本待过两年)用汉语字典,占比不到0.7%。在俄亥俄州立大学的23名汉语专业的研究生中,大多数是在学习汉语两年后才翻字典。
为啥汉语字典在初学者中起不到工具作用?
华人习得汉语:音-义-形。孩子先知道“xuéxiào”的读音;然后理解“上学的地方”的定义;上学才学写“学校”二字。
外国人习得汉语:音-形-义。孩子先学拼音“xuéxiào”和汉字“学校”,然后是其义。
“形”不仅是外国人的难关,华人也狼狈不堪。我曾请三位姓“尹”的华人,通过“形”查自己的姓,因不知“尹”字属“乙”字部,姓“尹”者均望“典”兴叹。查“形”,须熟知201个偏旁部首。这是初学者没有“工具书”的第一个原因。
在笔画的困扰方面,外国学生眼里“口”既可以是一画,也可以是两画,甚至可以是三画或四画。然而,通过“形”查字典,共分六个步骤,其中部首又与笔画环环相扣,一错全错。这是初学者没有“工具书”的第二个原因。
即便历尽艰辛查到欲找的汉字,又会遇到另一难题:英语单词之间有间距,但中文是紧紧相连的,学生必须进行词的分切——该字应跟左边或右边甚至左右两边构成词?这是初学者没有“工具书”的第三个原因。
能不能有一种查询系统,让中文基础为零的“小白”也能便捷地使用汉语字典?
我设计了突破此瓶颈的“断笔码”查字法,让只会26个字母的外国人也能像查英语词典一样,在三分钟内学会使用汉语字典。
历时四年,在没有AI算法和算力的助力的情况下,我每天凌晨两点多睡觉,儿子负责编辑英文,妻子负责电脑汇编。经过共同努力,极具创造性,能快、易、准查寻汉语的字、词的“断笔码”词典,分别由商务印书馆和美国McGraw-Hill出版公司在中国和美国出版两个版本(《商务馆学汉语字典》和《McGraw-Hill’s Chinese Dictionary》)。
可见,人文科学的知识是可以“发现”(华人与外国人习得汉字的规律),并“发明”(断笔码查字法)的。
但是,AI没有在整个过程中起到任何“发明”的功劳。
我曾问AI:“机器人能发现科学知识吗?”
AI表示,近年来,AI在生命科学领域取得了多项突破性进展。其中,蛋白质的功能预测与设计即成果之一,华盛顿大学Baker教授团队开发的一系列工具,包括AlphaFold和RosettaFold,用于预测蛋白质结构和设计。
虽然AI在蛋白质设计中发挥了巨大作用,但这些工具是由科学家开发的。AI是在人类的指导下进行训练和应用的,而真正的科学洞察力和创造性仍然需要人类的参与。
我反驳道:“人类是主导,不是参与,AI才是工具性地参与。”
AI称我的反驳“很到位”。
即便是现在大放异彩的深度学习,也是识别文字、图像、声音等数据。目前,AIGC的出现标志着AI从第一代进入第二代,AIGC能利用人工智能技术生成各种形式的内容,在搜索技术、数据挖掘、机器翻译、自然语言处理、图像处理、语音识别生成等领域都取得了很多成果。问题是,目前没有人类给AI植入目标性指令,AI也难以发现汉语字典对初学者没有起到工具书功效的问题。退一万步说,即使能发现也不能用“发明”(对人文学科来说,更致命的是“创造”)“断笔码”的方法去解决此实际问题。就像AI对我的表白:人类是主导,AI才是工具性地参与。没有人的主导,再强大的工具也仅是为目的服务之工具。
(未完待续)