Mine算法
方法摘要:用网格判断数据的集中程度,集中程度意味着是否有关联关系
方法具有一般性,即无论数据是怎样分布的,不限于特定的关联函数类型,此判断方法都是有效
MIC
如果变量对x,y存在函数关系,则当样本数增加时,MIC必然趋向于1
如果变量对x,y可以由参数方程c(t)=[x(t),y(t)]所表达的曲线描画,则当样本数增加时,MIC必然趋于1
如果变量对x,y在统计意义下互相独立,则当样本数增加时,MIC趋于0
Apriori算法
挖掘数据集:购物篮数据
.挖掘目标:关联规则
.关联规则:牛奶=>鸡蛋【支持度=2%,置信度=60%】
.支持度:分析中的全部事务的2%同时购买了牛奶和鸡蛋
.置信度:购买了牛奶的筒子有60%也购买了鸡蛋
.最小支持度阈值和最小置信度阈值:由挖掘者或领域专家设定
lift=P(L,R)/(P(L)P(R)) 是一个类似相关系数的指标。
lift=1时表示L和R独立。这个数越大,越表明L和R存在在一个购物篮中不是偶然现象。
23
项集:项(商品)的集合
.k-项集:k个项组成的项集
.频繁项集:满足最小支持度的项集,频繁k-项集一般记为Lk
.强关联规则:满足最小支持度阈值和最小置信度阈值的规则
分享到:
相关推荐
数据结构与算法基础知识总结.pdf数据结构与算法基础知识总结.pdf数据结构与算法基础知识总结.pdf数据结构与算法基础知识总结.pdf数据结构与算法基础知识总结.pdf数据结构与算法基础知识总结.pdf
NULL 博文链接:https://baiweiyll.iteye.com/blog/981260
常用排序算法总结常用排序算法总结常用排序算法总结常用排序算法总结常用排序算法总结常用排序算法总结常用排序算法总结常用排序算法总结常用排序算法总结常用排序算法总结
简单的php面向对象算法类文件,需要的朋友可以下载下来了解,排序可以自定义
算法知识点总结 详细总结了一些求职时常用的算法 并对其中经典的问题给出了博文链接
计算机算法设计和分析课程总结 大三的上半学期,我学习了计算机算法分析和设计这门课程,通过10周的学习让我了解到了计算机编程所需要的算法分析和设计内容。知道了算法在计算机编程中的应用之广泛,也深深领略到了...
对聚类算法的简单总结。聚类分析的算法可以分为划分法(Partitioning Methods)、层次法(Hierarchical Methods)、基于密度的方法(density-based methods)、基于网格的方法(grid-based methods)、基于模型的...
视觉引导类应用总结(含详细旋转中心算法)
算法 算法总结 思维导图
遗传算法的分析总结,从基础理论,专业技术进行讲述。
数据结构与算法课程学习总结报告 (2).pdf数据结构与算法课程学习总结报告 (2).pdf数据结构与算法课程学习总结报告 (2).pdf数据结构与算法课程学习总结报告 (2).pdf数据结构与算法课程学习总结报告 (2).pdf数据结构与...
机器学习实战 - k近邻算法(KNN算法)总结 适合机器学习实战入门新手 K-近邻算法,又称为 KNN 算法,是数据挖掘技术中原理最简单的算法。 KNN 的工作原理:给定一个已知类别标签的数据训练集,输入没有标签的新数据...
2016年新总结的ACM常用算法总结,搜集整理自网络.pdf
三年算法总结,总结三年算法
十三个经典算法研究与总结、目录+索引,十三个经典算法研究与总结、目录+索引
常用数据挖掘算法总结及Python实现.pdf常用数据挖掘算法总结及Python实现.pdf常用数据挖掘算法总结及Python实现.pdf常用数据挖掘算法总结及Python实现.pdf
算法各种算法总结.doc
noip算法总结noip算法总结.pdf
ACM算法总结,自己总结的。很有参考价值的。都来看看
算法个人总结,内包含各种题目的算法,可作为蓝桥杯备赛参考文件