天天快看点丨【视频】Python基于SVM和RankGauss的低消费指数构建模型
2023-06-26 16:59:12 来源:个人图书馆-拓端数据
(相关资料图)
相关视频
该项目解决的主要问题是如何通过数据挖掘技术筛选和比对学生消费信息,从而自动识别校园内需要帮助的同学,为高校扶贫提供数据依据。
模型假设与问题分析模型假设三点假设:
没有同学使用自己的账户为他人垫付,每一笔消费均为本人所为。
在全部数据的60天内,认为消费总次数小于80次的为经常点外卖的人,剔除他们,不认为属于低消费人群。
不存在收费错误的情况。
数据清洗剔除时间异常值数据共计260多万条条,从20年9月1日6时一直持续到20年10月30日19时。但其中有“9月31日”的数据,我们将其删除。
为了减少计算量,我们从200万条数据里随机选取20000条进行训练,最终获得两个聚类簇,以及各个簇的最大最小值。考虑到数据选取的随机性,本文将消费金额80作为异常值阈值,删除所有消费金额大于80的数据,保留下约98%的正常数据。
关键词:
相关新闻
- 天天快看点丨【视频】Python基于SVM和RankGauss的低消费指数构建模型
- 金石资源: 金石资源集团股份有限公司独立董事关于第四届董事会第十七次会议相关事项的独立意见
- 安倍遇袭一周年之际 日本计划在奈良市建立慰灵碑 市民曾一致反对
- 【环球速看料】直击华尔街|过度扩张后的收缩 华尔街遭遇金融危机后最大裁员潮
- 法院拍卖房子官网(法院拍卖网房产) 世界今日报
- 斗鱼周二珂直播回放_周二珂回归献首秀背后_全球播资讯
- 当前焦点!“6·18”网络零售额 厦门位居全省第一
- 每日消息!无障碍环境建设法草案三审 鼓励编写、出版盲文版、低视力版教学用书
- 司法部:准予5家外国律师事务所在华设立代表处|看热讯
- 上周全国碳市场碳排放配额总成交量超110万吨 焦点速读
- 雅安到重庆大巴车几个小时-天天热文
- 【天天新要闻】兵团2023中级会计职称报名入口6月26日开通
- 【世界速看料】奥飞数据:深圳福保数据中心为公司目前在深运营的自建数据中心,可用机柜数量约五百个
- 南山控股(002314.SZ):预计全国平均租金仍将维持增长态势
- 摩尔庄园游戏兑换券怎么获得(摩尔庄园游戏)-全球微速讯
- 俄媒曝画面:普里戈任走出俄南部军区总部并乘车离开顿河畔罗斯托夫
- 2023内蒙古包头市青山区消防救援大队招聘政府专职消防员和消防安全检查指导中心工作人员的面试通知
- 猛增!彭博:加拿大5月从中国进口了6000多辆电动汽车_全球快播报
- 中国石油天然气集团有限公司原副总经理徐文荣接受审查调查-环球新动态
- 爬虫工程师简历(爬虫工程师)
- 今日视点:江苏紫金农商银行2023年暑期实习生招聘启事
- 拿出八百万平方米载体空间 上海发力“工厂登高”
- 2023春季江苏南通市教育局直属学校暨部分市属事业单位委托招聘人员拟聘公示(一)-精选
- 每日消息!宋立伟
