协同过滤推荐算法的改进175《软件》杂志欢迎推荐投稿:cosoft@vip.163.com所以通过实时计算和离线计算结合的形式能够得到更准确的结果。在大数据平台下,离线计算部分以hadoop的组件HDFS作为本地源数据的存储载体,通过sparksql和Mlib进行模型构建和函数计算,计算的结果存储到HBase中或者再次存储到HDFS中。在线计算部分通过flume进行数据的收集,将收集到的数据解析后发送到kafka消息队列中,然后启动spark进行流式计算。离线和实时计算结合流程图3所示。图3离线计算与实时计算过程图F数据分类预处理由于用户数据量非常庞大,在对用户数据进行计算时都需要对数据进行预处理,不仅能够减少冗余数据给计算机带来的计算负担,还能够通过初始筛选,提高计算结果的精度。在各类推荐算法中,一般都需要数据清洗,去燥等预处理,而聚类算法是此阶段必不可少的环节之一。同时,互联网使用状况分析-电动折弯机数控滚圆机滚弧机张家港电动液压滚圆机滚弧机聚类分析的结果还可分析数据的稀疏性和关联性[7]。本文中采用C-Means聚类对数据预处理,通过目标函数来计算出样本点和聚类中心的隶属度从而对数据进行自动分类。本文由公司网站滚圆机网站采集转载中国知网资源整理!www.gunyuanj
- [2019-08-06]自适应补偿控制-电动液压弯管机
- [2019-08-06]与能效优化策略-数控滚圆机滚弧
- [2019-08-05]动力响应数值研究-数控滚圆机滚
- [2019-08-05]电抗器的振动研究-数控滚圆机滚
- [2019-08-04]结构温度场解析解-数控滚圆机滚
- [2019-08-04]发电功率平滑控制-数控滚圆机滚
- [2019-08-03]功率控制方法研究-数控滚圆机滚
- [2019-08-03]体积测量方法研究-数控滚圆机滚
- [2019-08-02]沉降控制应用研究-数控滚圆机滚
- [2019-08-02]必要性的初步探究-数控滚圆机滚