Kaggle是一个进行数据发掘和预测竞赛的在线平台,是全球最大的数据科学竞赛平台,其行业地位独一无二,在全球范围认可度都很高。参加Kaggle竞赛不仅能通过实战提升技能,还能通过竞赛经历为简历加分,是国际高中生与大学生申请数据科学和人工智能领域的利器。
本期详解Kaggle竞赛赛事规则、比赛内容等,文末还有Kaggle竞赛备赛书单可领取。
Kaggle竞赛赛事规则详解
1、报名渠道
https://www.kaggle.com/
点击进入官网后,可以使用邮箱注册或页面注册账号。
邮箱注册:点击使用谷歌账号或邮箱进行注册
页面注册:再次进入kaggle页面注册,同意条款,进入到注册时的邮箱中查看 6位验证码并填写。
2、参赛流程
- 登录Kaggle账号——找到你要参加的比赛——点击【Join Competition]——并点击【Accept】即可参赛
- 提交代码,查看排名靠前的代码,可以学习他们设计模型、特征工程的思路,借鉴改进自己的技能。
- 统计数据,用户可以浏览和下载公开的数据集,或者分享自己的数据集供其他用户使用。
3、适合学生
- 对数据科学、数据挖掘、机器学习感兴趣的高中生
- 有一定计算机背景的大学生
4、参赛时间
全年都可以参与,视想要参与的项目决定
5、参赛形式
3-5人组队参赛或/1v1定制,线上进行挑战
6、竞赛模式
getting star(入门级):没有奖金,但有非常多的前辈经验可供学习,如经典的泰坦尼克号生存预测,适合新手熟悉流程。
playground(进阶级):比赛后面通常会标有Kowledge (经验)、Kudos (荣誉)和少量奖金,聚焦特定技术领域,如猫狗分类,允许参赛者自由探索。
Featured(高级):比赛是有赏金的,通常由学术机构发起,侧重前沿技术研究,如大模型对抗攻击
Research(研究级别):Research比赛与高级比赛相比研究类比赛更具实验性,由企业或政府赞助,解决实际商业问题,奖金可达百万美元。在Kaggle中只有Research和Featured类型的比赛会累计积分和奖牌。
7、竞赛规则(不能犯的作弊行为)
- 私下共享代码,不组队
- 私下共享Dataset,不组队
- 一台机器或一个IP登陆多个账号
- 别人帮我提交代码或CSV
- 使用多个账号提交相同预测结果,通过平均得分规避审查盗用他人代码或数据集,如某参赛者将开源项目伪装成个人成果,骗取奖金。
- 多支队伍共享代码或分工攻击不同模型,如通过交叉验证伪造高分。
8、写入申请
Kaggle竞赛获奖后,官方不会颁发奖状,但学生的账号会显示获奖结果,到时候申请可以给学校看学生的主页链接即可。
Kaggle竞赛备赛书籍与课题推荐
1、5月~6月Kaggle竞赛课题推荐
5月:斯坦福大学RNA三维折叠
6月:2025年图像匹配挑战
2、Kaggle竞赛备赛书籍
《Approaching(Almost)AnyMachineLearning Problem》:这本书被誉为解决各类机器学习编码难题的宝典,内含众多实例和代码,旨在帮助读者掌握机器学习的应用,书中还包含了丰富的Kaggle竞赛技巧。
《Introducing Data Science》:这本书涵盖数据科学的所有介绍,包括基础概念和实践应用。结合理论与实践,帮助读者快速上手,使用Python语言进行教学,易于理解和operate。
《Naked Statistics -Stripping the Dread from the
Data》:这本书将复杂的统计概念分解为易于理解的小步骤,通过幽默和讽刺的语言,让读者在轻松的氛围中学习,书中的例子和practice紧密联-系实际,帮助读者在工作中应用统计学知识。
机构Kaggle竞赛辅导班
机构专注于国际竞赛辅导10年,针对Kaggle比赛,机构开设了不同的比赛课题,全年滚动招生,由经验丰富的师资团队指导,学管+助教+顾问共同服务。
授课形式:线上授课,用classin授课,课堂实时互动
授课人数:3~5人班课、1V1定制课程
授课时长:20课时
授课大纲