【运行截图请往下看】编程语言:Android、iOS、C#、Asp/Asp.net、Java、Vb、Php、Jsp、C++等
【专业优势】2003年入行计算机软件源码,可以给朋友们提供远程协助运行项目!
开发软件: Eclipse/Idea + mysql【java网站端】 + Pycharm 【算法端】
开发技术: 网站端SSM可升级Springboot + Python + 基于TF-IDF的特征提取技术 + Word2Vec文档转向量技术
原购物网站完整效果图地址: M032大神JSP基于SSM电子产品网上购物系统可升级Springboot--http://www.shuangyulin.com/article/1075.html
TF-IDF自然语言处理领域中计算文档中词或短语的权值的方法,是词频(Term Frequency,TF)和逆转文档频率(Inverse Document Frequency,IDF)的乘积。TF指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被正规化,以防止它偏向长的文件(同一个词语在长文件里可能会比短文件有更高的词频,而不管该词语重要与否)。IDF是一个词语普遍重要性的度量,某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。
TF-IDF算法基于一个这样的假设:若一个词语在目标文档中出现的频率高而在其他文档中出现的频率低,那么这个词语就可以用来区分出目标文档。这个假设需要掌握的有两点:
在本文档出现的频率高;
在其他文档出现的频率低。因此,TF-IDF算法的计算可以分为词频(Term Frequency,TF)和逆转文档频率(Inverse Document Frequency,IDF)两部分,由TF和IDF的乘积来设置文档词语的权重。
物品画像构建步骤:
读取mysql数据库读取每个物品的标签作为物品的候选关键词
利用TF·IDF计算每个物品的标签的tfidf值,选取TOP-N个关键词作为物品画像标签
将物品的分类词直接作为每个物品的画像标签
用户画像构建步骤:
根据用户的购买或评分收藏点赞历史记录,结合物品画像,将有相关物品记录的画像标签作为初始标签反打到用户身上
通过对用户观影标签的次数进行统计,计算用户的每个初始标签的权重值,排序后选取TOP-N作为用户最终的画像标签
解决物品冷启动问题:
利用Word2Vec可以计算物品所有标签词之间的关系程度,可用于计算物品之间的相似度,word2vec是google在2013年开源的一个NLP(Natural Language Processing自然语言处理) 工具,它的特点是将所有的词向量化,这样词与词之间就可以定量的去度量他们之间的关系,挖掘词之间的联系。Doc2Vec是建立在Word2Vec上的,用于直接计算以文档为单位的文档向量,这里我们将一个物品的所有标签词,作为整个文档,这样可以计算出每个物品的向量,通过计算向量之间的距离,来判断用于计算物品之间的相似程度。


照片名称:1基于用户物品画像购物网站商品推荐猜你喜欢模块效果

照片名称:2根据某个商品推荐相似商品效果【不需用户登录】

照片名称:3网站开发java端后台猜你喜欢控制器方法

照片名称:4网站开发java端后台查询相似商品推荐

照片名称:5python算法端创建物品画像提取关键词利用TF-IDF模型计算权重

照片名称:6建立物品画像关键词标签的倒排索引

照片名称:7利用用户相关的物品画像给用户创建关键词权重画像

照片名称:8利用用户的关键词画像和倒排索引表计算推荐的物品

照片名称:9利用Doc2Vec建立文档向量生成相似物品数据

照片名称:10mysql表保存用户画像推荐的物品记录结果

照片名称:11mysql保存利用文档向量推荐的相似物品记录




- 1291基于Springboot+Vue高考院校查询系统设计2021-06-22 00:40:17
- 1287大神基于Vue+SSM+Mysql停车位预约停车场计费系统设计2021-04-29 23:12:28
- 1276大神基于Vue+SSM+Mysql校园二手交易跳蚤市场设计2021-03-25 18:52:48
- 1273大神微信小程序医院预约挂号系统设计后端SSM2021-03-19 20:41:21
- 1271大神基于微信小程序求职招聘系统设计后端SSM2021-02-05 22:51:53
- 1269大神基于Vue+SSM+Mysql图书借阅管理系统设计2021-02-01 19:15:23
- 1257基于微信小程序带后端ssm接口小区物业管理平台设计2020-11-07 19:27:31
- 1255基于Vue+Springboot校园求职招聘系统设计2020-10-31 22:43:31

