9.23. AI产品的测试

9.23.1. 图灵测试

TODO: https://www.cnblogs.com/zgq123456/articles/10562855.html

9.23.1.2. Winograd Schema Challenge测试

https://en.wikipedia.org/wiki/Winograd_Schema_Challenge

用世界知识(包括常识)来做推理:

9.23.2. 指标

  • 查准率表示真正例占所有预测结果为正例的样例比值

  • 查全率表示真正例占所有真实情况为正例的样例比值

  • ROC曲线描述的是真正例率和假正例率之间的关系

https://dingdang.qq.com/doc/page/65