一、通用推荐系统框架
- 数据收集
ETL MapReduce Spark Flink
- 数据存储
Hive HBase MySQL Redis
持久化存储收集数据
通常按照数据的冷热,结构化和非结构化等特征分布存储
- 算法召回
热门 协同过滤 内容 画像 替补
将海量的数据集,根据特定算法进行初步的筛选
从数十万降低至数百及数千
- 结果排序
LR SVD DNN GBDT
进行精准排序
针对多个目标进行优化
- 结果应用
猜你喜欢 相似推荐 看了又看
根据不同场景给用户展示最终的推荐结果
- 自然属性
- 画像特征:兴趣,行为
-
关系特征:人群属性,关注关系,亲密度
-
静态特征:分类标签
- 动态特征
- 相关性特征
- 上下文特征
今日头条
二、推荐常用算法
- 基于流行度
最热门 最新 最多人点赞 - 基于内容
相同标签 相同关键词 相似主题 - 基于关联规则
看了A的人也看了B - 近邻推荐
协同过滤:基于用户 基于物品 基于模型
三、结果评估指标
*ROC指标*
对于输出值连续的分类器(如概率预测),在某一阈值下真阳性(TP)的概率/假阳性(FP)的概率
四、项目构建 (Concrec)
数据源:Kaggle Anime Recommenations Dataset(动漫数据来源:myanimelist.net)
汇总各方数据源 可视化检视数据 对数据进行清洗和转换
根据多种策略对候选集进行初步的召回
针对优化目标进行精准排序
实现特定规则的重排序
组装排序结果,并暴露接口供前端消费
结果展示 & 用户交互
五、Concrec技术选型
编程语言:python
微服务框架:Flask
前端页面:Vue
数据分析:pandas
大数据处理:spark + Flink(spark为主)
机器学习框架:TensorFlow(谷歌研发)
Spark: 分布式大数据处理平台 解决了计算能力和存储能力分布的问题 不同于Hadoop,Spark基于内存计算,速度更快 提供多种编程接口 如SparkSQL,Mllib等
Flink: 流式数据(stream)处理平台 以流为核心,高吞吐,低延迟 良好的容错性
TensorFlow: 机器学习框架 专注于神经网络、深度学习 在分布式训练、模型可视化等方面十分的出色
Original: https://blog.csdn.net/weixin_44105632/article/details/123385870
Author: RockyBlog
Title: 推荐系统基础架构以及项目介绍
相关文章

2022年政府工作报告词频分析
2022年政府工作报告词频分析 a.获取网页文件(捕获异常) b.筛选有用目标 c.写入文件 d.文件预处理:去除无用字符及停用词汇 e.词频统计,建立字典,按词频排序并输出 f.绘制词云 from ...

【电子羊的奇妙冒险】初试深度学习(2)
这一期内容有些杂,有基础知识,也有代码实战。 卷积神经网络 该部分图片及资料来源: http://www.huaxiaozhuan.com/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4...

一个高效且友好的TensorFlow图神经网络(GNN)框架:tf_geometric
tf_geometric 是一个高效且友好的图神经网络库,同时支持TensorFlow 1.x 和 2.x。 受到 usty1s/pytorch_geometric 项目的启发,我们为TensorFl...

Tensorflow 2.0 最新版(2.4.1) 安装教程
Tensorflow 2.4.1 前言 Tensorflow 简介 Anaconda 简介 Anaconda 安装 TensorFlow CPU & GPU Tensorflow 安装 Pyc...

tensorflow 与protobuf版本对应问题
tensorflow 与protobuf版本对应问题 文章目录 tensorflow 与protobuf版本对应问题 * 问题描述 尝试解决 - 卸载 protobuf 重新安装protobuf 问题...

单词发音,为语音识别准备素材
单词发音,为语音识别准备素材 环境 * windows下安装pyttsx3 linux下安装pyttsx3 界面展示 * 图形化界面 输出文档 写作过程 注意事项 完整代码 环境 ࣽ...

基于Matlab App Designer的语音信号分析与处理(三):App的设计
接上文:https://blog.csdn.net/weixin_53877178/article/details/122475951 目录 一、课题的任务 二、内容、步骤和要求 (1)语音信号的采集...
![[代码实现]用Tensorflow实现MMoE](https://www.itcode1024.com/wp-content/themes/begin/prune.php?src=https://www.itcode1024.com/wp-content/themes/begin/img/loading.png&w=280&h=210&a=&zc=1)
[代码实现]用Tensorflow实现MMoE
本文主要介绍tensorflow中mmoe的实现方式。 一.mmoe概念 先简单回忆下mmoe的概念: 二.已有keras版本实现思路分析 class MMoE(Layer): ""...

Tensorflow2.x下的问题小结
A.包导入问题 我们在Tensorflow2.x框架下导入包经常会遇见如下错误: ImportError: cannot import name 'get_config' from 'tensorfl...

Colmap学习二:前端部分(特征点提取、匹配与剔除)
1 Colmap特征提取和描述 colmap一般使用sift-gpu,涉及的知识: 1.1 图像金字塔 :DOG图像金字塔,再找极值 其中由于Euclidean distance 容易受较大值的影响,...

pytorch.tensorboard的零基础使用
1.Tensorboard的介绍: Tensorboard是tensorflow内置的一个可视化工具,它通过将tensorflow程序输出的日志文件的信息可视化使得tensorflow程序的理解、调试...

《剑指Offer》09-用两个栈实现队列
理解题意 这个问题最难的部分是理解它的意思:[En]The most difficult part of this question is to understand what it means: 本...

被迫开始学习Typescript —— class
TS 的 class 看起来和 ES6 的 Class 有点像,基本上差别不大,除了 可以继承(实现)接口、私有成员、只读等之外。 参考:https://typescript.bootcss.com/...

这3款音频文件转文字工具,操作真的很简单
随着网络技术的发展,我们的工作方式也在不断变化。例如以前的音频文件需要我们手写转换,而现在可以借助音频工具来转文字。不仅提高工作效率,而且使用更加方便。不过现在的音频转换工具也五花八门,有时让人很难抉...

TensorFlow2深度学习实战(十七):目标检测算法 Faster R-CNN 实战
前言: 本专栏以理论与实战相结合的方式,左手看论文,右手敲代码,带你一步步吃透深度学习原理和源码,逐一攻克计算机视觉领域中的三大基本任务:图像分类、目标检测、语义分割。 本专栏完整代码将在我的GiuH...