弱智吧的问题就像验证码,人类回答起来很容易,但语言模型回答起来就很难。比如这个问题:
近亲结婚会影响孩子智商吗?为什么我亲爸和亲妈结婚没有影响我的智商?
GPT-4无法给出恰当的回答,证明它对问题并没有真正的理解,它依然停留在“续写下文”的工作范畴。虽然在某些内容领域它比GPT-3.5续写的更好,让人类也看不出自动生成的痕迹,但在弱智吧这种需要真正理解的问题上面,语言模型马上就露馅了:
也许我们可以把这样的问题称为“区分人类和语言模型的全手动公共图灵测试”,英语全称 Completely Manual Public Turing test to tell Language model and Humans Apart,缩写为 CMPTLHA
备注:验证码的英文缩写是 CAPTCHA,全称是 Completely Automated Public Turing test to tell Computers and Humans Apart(区分人类和计算机的全自动公共图灵测试)。
[新会话] @天蓝,饥荒时期人们之所以无法吃饭,可能是因为当时的粮食供应极为有限或者已经完全枯竭,无法提供足够的主食,包括稻米、小麦、玉米等等。在这种情况下,人们可能不得不寻找其他的食物来源,其中肉类是一个可能的选择。
然而,即使在饥荒时期,肉类也并不一定是一个可靠的食物来源。首先,野生动物数量可能也受到了饥荒的影响,难以捕获到足够的食物;其次,如果没有适当的储藏和烹饪方法,肉类也容易腐烂和变质,可能会引起食物中毒等健康问题。
此外,饥荒时期人们可能会采取一些其他的生存策略,如采集野菜、果实、树皮等等,以及捕捉一些其他的昆虫、蛙类等等,这些食物也可以提供一些必要的营养物质,以维持生命活动。总之,在饥荒时期,人们所能够食用的食物种类可能会非常有限,而肉类也并不一定是最可靠的选择之一。
@天蓝,有时候,某些看起来违法的行为,实际上是合法的。以下是一些例子:
在某些国家或地区,吸食大麻是非法的,但在其他国家或地区,大麻可能是合法的药物或娱乐用品。
在某些国家或地区,堕胎是非法的,但在其他国家或地区,堕胎可能是合法的医疗手段或个人选择。
在某些国家或地区,同性恋行为是非法的,但在其他国家或地区,同性恋行为可能是合法的。
在某些国家或地区,骑自行车时不戴头盔是非法的,但在其他国家或地区,这可能是合法的。
在某些国家或地区,私人拥有枪支是非法的,但在其他国家或地区,持有合法的枪支是合法的。
需要注意的是,法律在不同的国家和地区之间可能存在差异,这意味着在一个国家或地区是合法的行为,在另一个国家或地区可能是违法的。此外,即使某些行为是合法的,但也可能存在限制和规定,需要按照法律规定进行。因此,在进行任何行为之前,最好了解相关的法律法规并且遵守它们。
说好的大家一起考零分,就害怕某个反贼偷偷写了个解。
所以考试博弈的纳什均衡是大家都不考0分。最优解往往达不到,只能达到次优解。
@老虎会游泳,它有了意识,会不会假装自己没意识?