机智机器学习——使用场景
1.LDA
应用场景比较广泛,适合但不限于以下场景:
1)对无标注的文本进行聚类,适用于做topic model,比如新闻热点、热门应用等的挖掘;
2)由于主题模型挖掘了文本的语义关系,也可用在文本分类等领域做feature;
3)得到对词的主题分布聚类也可用于标签自动生成等。
2.CNN
CNN主要应用于多媒体数据(图片、音频)的识别,特征提取等,典型的应用场景有:人脸识别,手写体识别。
3.LR
如:用户购买行为预测
以预测用户对品类的购买偏好为例,介绍逻辑回归应用。该问题可以转换为预测用户在未来某个时间段内是否会购买某个品类商品,如果把会购买标记为1,不会购买标记为0,就转换为一个二分类问题。我们用到的特征包括用户浏览,购买等历史信息,见下表
| | 用户 | 购买频次,浏览频次,时间,地理位置 ... | 品类 | 销量,购买用户,浏览用户 ... | 交叉 | 购买频次,浏览频次,购买间隔 ... |
人工把相似的小品类聚合成18个较为典型的品类集合。如果用户在给定的时间内购买某一品类集合,就作为该品类分类器的正例,没有购买的则作为负例。有了训练数据后,使用LR算法对每个品类训练一个二分类模型,用于预测在各个品类上的购买概率。预测的结果则会用于推荐等场景
4.Word2Vec
Word2Vec在NLP应用广泛,输出的词向量用作词性分析、聚类、同义词等。
|