详解数据挖掘BIRCH算法

详解数据挖掘BIRCH算法,第1张

BIRCH采用了一种多阶段聚类技术:数据集合的单遍扫描产生一个基本的好簇,一或多遍的额外扫描可以用来进一步(优化)改进聚类质量。它主要包括两个阶段:

阶段一:BIRCH扫描数据库,建立一棵存放于内存的初始CF树,它可以看作数据的多层压缩,试图保留数据的内在聚类结构。

阶段二:BIRCH采用某个(选定的)聚类算法对CF树的叶节点进行聚类,把稀疏的簇当作离群点删除而把稠密的簇合并为更大的簇。

你可以参考10年的专业目录准备 南京大学软件工程2010年研究生入学 专业目录 ↓ 研究方向:01软件设计与高级开发技术02软件工程技术03计算机网络技术04嵌入式软件技术05信息系统技术初试科目:①101政治②204英语二③302数学二④408计算机学科专业基础综合(数据结构、计算机组成原理、 *** 作系统和计算机网络) 复试:笔试:软件工程,数据库;面试:专业综合复试备注:专业学位,学制2年,不接受单独考试。复试中软件工程占100分,数据库占50分 初试计算机是统考的 ,都是考数据结构、计算机组成原理、 *** 作系统和计算机网络的综合,教材四本书现在已经比较统一了:

数据结构选用严蔚敏主编、清华大学出版社出版的C语言版的《数据结构》,习题建议选用李春葆主编、清华大学出版社出版的《数据结构习题与解析》;计算机组成原理选用唐朔飞主编、高等教育出版社出版的《计算机组成原理》及配套习题; *** 作系统一般选用汤子瀛主编、西安电子科技大学出版社出版的《计算机 *** 作系统》,配套习题可以选用李春葆主编、清华大学出版社出版的《 *** 作系统习题与解析》;计算机网络选用的教材是谢希仁主编、电子工业出版社出版的《计算机网络》(最新版是第5版)及配套习题。 南大软件工程复试参考书:《软件工程:实践者的研究方法》(第五版)梅宏译,机械工业出版社;《数据库管理系统:原理与设计(第3版)》【美】RAGHU RAMAKRISHNAN、JOHANNES GEHRKE著,周立柱、张志强、李超、王煜等译,清华大学出版社。 等9,10月份最后大纲出来后,你再买本解析或者指南什么的,强化复习下,抓紧哦,时间不多了,尤其是你跨专业。 对了 这个计算机考研论坛你可以夺去看看: http://bbs.kuakao.com/forum-305-4.html 有很多资料可用~


欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/sjk/6781688.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-28
下一篇 2023-03-28

发表评论

登录后才能评论

评论列表(0条)

保存