我的位置:首页 > 综合>数据思维

数据思维

时间:2019-05-11 19:11:00 来源:互联网 作者: 神秘的大神 字体:

数据产业核心任务:数据产生价值(可被产品化的商业价值)
三个关键环节:数据业务定义、数据分析与建模、数据业务实施
三个关键词:收入、支出(控制成本)、风险      重要因素:可以量化的参照系
精确定位,有的放矢   更好的决策分析
受众主体:企业、政府
预测不准是常态,但可以提供价值
统计学:回归分析
分类:线性回归、0—1回归(性别)、定序回归(豆瓣电影评分)、计数回归(RFM模型:一定时间内客户到访次数)、生存回归(灯泡使用寿命、应用于市场营销、人力资源)
  • 回归分析要去识别并判断,哪些X变量是同Y真的相关,哪些不是。
  • 有用的X变量同Y的相关关系是正的还是负的。
  • 赋予不同X不同的权重,也就是不同的回归系数,进而可
  • 以知道不同变量之间的相对重要性。
大多数客户是说不清自己的需求的。
要理解数据之于客户的价值,得首先摸清楚客户的盈利模式。
发展产业:互联网和制造业
 
图标展示:直观、精准、匹配
若是竖着的柱子,称为柱状图;若是横着的柱子,称作条形图。
 
机器学习涉及到的模型属于非线性的
分类:朴素贝叶斯分类、决策树、回归树(和决策树区别:使用连续型因变量的数据。应用组合:随机森林与XGBoost)与提升算法、K均值聚类(搜索引擎广告投放)
深度学习——卷积神经网络(CNN)
线性回归的测试集与训练集展现了较高的一致性
 
为什么单身:吸引力和共同爱好
从古至今,很多重要的进步都是游戏激发的。
打麻将的本质,就是每一轮做决策。
 
数据是不是非结构化的,是一个相对的甚至是带有主观色彩的概念。
数据分析经验和数据挖掘能力、使用各种统计分析软件
职场五维评分(不分先后顺序):学历、经验、职业素养、专业技能、软件
 
RFMS模型:
recency:最近一次消费间隔的时间
feequency:最近一段时间购买次数
monetary:某段时间内消费金额
standard  deviation  某段时间内消费金额标准差