- 样本=总体
- 接受不精确
- 相关性有时候比因果更值得追求
因为因果很有可能是变化的,包含主观判断,但是相关性是实时的,事实性的,实用的。
但是不能说这样就放弃了对因果的追求,因为如果有
发现有价值的数据源是一个很有挑战的任务
数据科学家在未来可能很有市场
在数据科学家中,专门解决数据源问题的一类应该很火
如何让普通人成为数据科学家?
需要一个word一样将普通人变为作者的系统
这个系统的一些重要的质量属性包括:
- 一个方便的采集系统
- 将采集以后的数据进行方便的转换的系统
- 对于不用类型的数据,提供独特的视图的系统(比如geo生成热点图,比如两个数据选为xy后自动绘图,比如根据图和函数自动过滤)
凡是过去,皆为序曲