众所周知,AI被认为是人类通向未来的钥匙、第三次工业技术革命,全球都在卷AI技术,而AI技术中当前正火热的要属,如大名鼎鼎的。国内也有非常多正在不断迭代和进步的AI大语言模型。
问题来了:
市面上存在一些,让各家AI大模型去PK,由人类评委来盲评打分,看哪个AI大模型“更灵性”“更像人”,比如加州大学等创立的IMSYS等。
但在小寒看来,
3天后的、也是全球评委人数最多(高达1亿)的AI竞技场——
听起来很“高大上”,但对于在座的玩家来说,一点都不复杂,甚至很好玩:
1、首期竞赛,逆水寒携手网易伏羲邀请了,化身进入游戏的中。每个NPC由1个AI大模型驱动,包括大名鼎鼎的——
但是,玩家不知道NPC背后的AI模型是哪家,即。
2、这些来自千行百业、具有不同性格的NPC。您觉得哪个AI NPC更灵性、更像真人,就把票投给ta。我们初始设置了一些话题,比如“送我一个能打动我的礼物”“太阳早上近还是中午近”等等。
但中国话讲究一个“话里有话”。如果您觉得上面这些话题不够深度,还可以,比如小寒就想问:
“跳多高才能跳过?”
“过年的福字要倒贴,为何不直接生产倒过来的福字?”
“但丁是意大利人,但丁真是中国人?”
“八个瑞士……”(好了小寒你不要再问了)
请尽情用您毕生所学的中文考验这些AI,
是的,简单说,
看起来挺好玩,但回过头来说,也很有意义:
完全盲评,评委数量特别庞大,结果精确有意义。该功能基于网易伏羲有灵平台构建,为了避免既当运动员、又当裁判员,网易自研模型暂不参与;
科技以人为本,中国的AI好不好,由中国玩家、消费者说了算,最为公道;
得到1亿逆水寒玩家的反馈后,AI也会知道自己在具体哪些问题上回答得不够好,从而更精确、精准地进行迭代和进化。
当今的全球竞争局面,正是的正面较量,而,目前来到了最关键的时刻。
您每一次参与
人多力量大,中国的AI发展进步,这波就拜托大家了!