9.23. AI产品的测试¶
9.23.1. 图灵测试¶
TODO: https://www.cnblogs.com/zgq123456/articles/10562855.html
9.23.1.2. Winograd Schema Challenge测试¶
https://en.wikipedia.org/wiki/Winograd_Schema_Challenge
用世界知识(包括常识)来做推理:
9.23.2. 指标¶
查准率表示真正例占所有预测结果为正例的样例比值
查全率表示真正例占所有真实情况为正例的样例比值
ROC曲线描述的是真正例率和假正例率之间的关系