考研论坛

 
查看: 461|回复: 0
打印 上一主题 下一主题

[考研信息] 2020西南财经大学817数据挖掘综合真题(回忆版)

[复制链接]

1

主题

1

帖子

8

积分

新手上路

Rank: 1

精华
0
威望
2
K币
6 元
注册时间
2019-2-25
跳转到指定楼层
楼主
发表于 2019-12-26 09:53 来自手机 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
一、名词解释(5分/个)
OLAP、FP-Growth(频繁模式树)、Z-分数规范化、信息增益、ROC曲线

二、简答题(20分/个)
1.简述(KNN)邻近聚类基本步骤
2.简述三种处理数据噪音的方法
3.简述内部和外部评估聚类质量的方法
4.简述属性分裂的度量及其异同
5.给出12个数字(好像是12个月份的销售数据)
   1)根据等频(深)划分,将这组数字划分成四个箱
   2)这组数字的中位数
   3)这组数字的众数
   4)采用min-max规范法,将16和21规范化到[0,1]区间

三、编程题(25分)
1.计算1—100以内所有偶数之和,并将这些偶数保存到even-list列表中
2.找出1—100内所有素数,输出所有的素数以及素数的个数
3.将even-list列表中既能被3整除又能被4整除的数删除,并计算这些删掉的数的和

指定书籍是《数据挖掘概念与技术》(第三版),编程题、KNN大纲没有要求,但去年的考试也有一个25分的编程题,可能之后编程题也会成为趋势,建议没有学过编程的或者忘得差不多了的同学还是尽早学一下

来自Android客户端

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册 人人连接登陆

    本版积分规则   

    关闭

    您还剩5次免费下载资料的机会哦~

    扫描二维码下载资料

    使用手机端考研帮,进入扫一扫
    在“我”中打开扫一扫,
    扫描二维码下载资料

    关于我们|商务合作|小黑屋|手机版|联系我们|服务条款|隐私保护|帮学堂| 网站地图|院校地图|漏洞提交|考研帮

    GMT+8, 2026-4-4 10:17 , Processed in 0.089262 second(s), Total 12, Slave 13(Usage:6.25M, Links:[2]1,1_1) queries , Redis On.

    Powered by Discuz!

    © 2001-2017 考研 Inc.

    快速回复 返回顶部 返回列表
    × 关闭