AI产品的测试 ============ 图灵测试 -------- TODO: https://www.cnblogs.com/zgq123456/articles/10562855.html 元图灵测试 ~~~~~~~~~~ https://aaai.org/ocs/index.php/WS/AAAIW17/paper/download/15233/14656 Winograd Schema Challenge测试 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ https://en.wikipedia.org/wiki/Winograd_Schema_Challenge 用世界知识(包括常识)来做推理: 指标 ---- - 查准率表示真正例占所有预测结果为正例的样例比值 - 查全率表示真正例占所有真实情况为正例的样例比值 - ROC曲线描述的是真正例率和假正例率之间的关系 https://dingdang.qq.com/doc/page/65