2.5 数据科学家的日常【stanford-cs329p】


### Flow chart
avatar

Challenges

  • 平衡标号质量和数据大小
  • 数据质量
    • 多样性:所有相关的方面都有
    • 没有偏置:不要侧重于某个特点方面
    • 公平性:没有区别对待人或数据
  • 大规模数据管理
    • 存储、处理、版本、安全