魔镜竞赛平台说明
      魔镜竞赛平台是炼数成金专业数据分析社区提供的一项服务功能。用于发起各种相关领域的知识和解题竞赛,包括但不限于数据分析竞赛、数据挖掘竞赛、算法和数学竞赛、IT技能竞赛等。目前为测试期,暂时只有官方可以发起竞赛,但任何人都有权加入参与(除非竞赛是私密或定向邀请)。竞赛以群组的形式进行,每一个竞赛群组,都有一个顶置的主题,对竞赛的内容、参与办法、有效时限、评比标准、奖品等给予清晰的说明。大家参加竞赛时请务必注意阅读清楚该项顶置帖子的内容。大家可以在竞赛群组内就竞赛内容展开讨论,热烈的讨论可以增加竞赛的热度得分,热度排名高的竞赛以及热门的讨论帖会自动被推送到竞赛平台首页。期待大家可以在本竞赛平台能收获知识,收获乐趣,收获成功感!
      对于有意在本平台发起属于自己竞赛的朋友,请联系管理员(发站内信给cruiser),只要是有意义,对大家学习发挥知识有帮助的我们都乐于将您的想法和创意整理上线,和朋友们一起分享。对于企业,这也是寻求解决自身不能解决问题的一条捷径。在炼数成金社区聚集了大量的数据分析专业人才,企业可以把单靠自身技术力量无法解决的难题,经过我们整理包装后成为竞赛题上线,相信有很大的机会可以吸引到有兴趣有能力解决该问题的专业人士(当然有一个前提是还要看你们的奖品是否丰厚啦),对于企业来说,这也是一条性价比极高的解决问题的路径。欢迎随时联系我们!

推荐

平面几何超级难题
平面几何超级难题
一道经典的平面几何超级难题,看看想一年能想出来不?
手写数字识别
手写数字识别
背景:
随着信息网络的推广,有大量的数据要输入计算机网络。而且在现代信息社会,方方面面都要与数字打交道。目前手写数字识别主要的应用有以下三个领域。
1. 在邮件分拣中的应用
在邮件的自动分拣中,脱机手写数字识别往往与人工辅助识别等手段相结合,完成邮政编码的阅读,然而在一些大城市的中心邮局每天处理高达几百万件,业务量的急剧上升使得邮件的分拣自动化成为大势所趋。
2. 在财税、金融领域中的应用
金融财务、税务、金融是脱机手写数字识别应用的又一重要领域。随着我国经济的迅速发展,每天等待处理的财务、税务报表、支票、付款单等越来越多,如果能把他们用计算机自动处理,无疑可以节约大量的时间、金钱和劳力,更可以提高效率。
3. 在大规模数据统计中的应用。
手写数字识别在数据统计、行业年检、人口普查等领域都要进行大规模的数据统计,此时就需要输入大量的数据,以前完全要手工输入需要耗费大量的人力和物力,如果能把他们用计算机自动处理,无疑可以节约大量的时间、金钱和劳力,更可以提高效率。
手写数字识别在今后将在更多的领域应用。所以手写数字识别的研究具有很重要的实质意义。

数据介绍:
(数据见讨论区二楼)
本次比赛的数据均取自MNIST数据集。MNIST数据集("Modified National Institute of Standards and Technology") 是一个在机器学习领域已被广泛研究的典型数据集。
数据文件train.csv和test.csv含有手写数字的灰度图像,从0到9,包括0和9.
每幅图像都是高28像素和宽28像素,一共有784像素,每个像素都有一个单一的像素值与它相关的,说明该像素的亮暗情况,数字越高意味着越暗。该像素值是0到255之间的整数,包括0和255。
训练数据集(train.csv)785列。第一列中,被称为“标签”,这是由用户手写的数字,其余的列包含相关的图像的像素值。
训练集合中的每个像素列有像pixelx这样的名称,其中x是0和783之间的整数,包括0和783。要找出pixelx在图像上的位置,我们分解x:x = i* 28+j,其中i和j是0和27之间的整数,包括0和27,那么pixelx位于一个28×28的矩阵第i行第j列(下标从0开始算起)。例如pixel31,分解31:31=1*28+3,那么pixel31位于对应像素矩阵的第二行、第四列,如下:

测试集除开没有手写数字结果这一列之外,其他列与训练集一样。

要求:
1. 用R、C或C++、matlab软件实现,便于我们进行检验。
2. 必须提交文档说明如何调用程序,要给出具体例子演示
3. 要把最终的输出结果写进txt文本,例如1 5 8 4 2 9•••

结果提交方式:
把结果和程序打包发到邮箱1918726047@qq.com,主题写炼数成金数据挖掘竞赛

优胜判断:
在有效时限内完成,经过我们用固定的(对所有参赛者一样的)的测试集进行测试,判断准确率最高者胜。

竞赛时间:
2013/8/26到2013/9/15,,过期尚未有适合的答案提交,本次竞赛将作废

奖品:
优胜者可获得炼数成金魔力积分10分,官方赠送16G U盘一枚作为奖品,能提交有效方法的朋友,视准确率情况,也可获得1-5魔力积分奖励
识别垃圾虫
识别垃圾虫
常有机器人注册程序在论坛上生成垃圾id,专门发垃圾广告,怎样把这些垃圾id从正常id中识别出来,然后在注册的时候就给予封杀?
收集彩票数据
收集彩票数据
收集中彩双色球等历史彩票数据,供进一步分析。可以找网上的现有数据,抓网页或其它任何方式
图像拼接
图像拼接
题目一
碎纸片的拼接复原
背景
破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。

题目描述
对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件给出的中文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达。

题目二
背景:
图像拼接是一个日益流行的研究领域,它已经成为照相绘图学、计算机视觉、图像处理和计算机图像学研究中的热点。图像拼接解决的问题的一般式,通过对齐一系列空间重叠的图像,构成一个无缝的、高清晰的图像,它具有比单个图像更高的分辨率和更大的视野。

题目描述
把两张有重合的图片合成一张图片。

要求:
1. 用R、C或C++、matlab、SAS软件实现,便于我们进行检验,如何用其他软件实现,要需附上该软件的使用说明。
2. 要说明碎片或图片的拼接过程
3 要附上主要代码并附上注释,只提交exe文件无效。
4 只需选其中一题做就可以

结果提交方式:
把结果和程序打包发到邮箱1918726047@qq.com,主题写炼数成金数据挖掘竞赛(图像拼接)

优胜判断:
拼接效果最好者获胜(主要看重合处的链接),相同打分者按时间判断

竞赛时间:
2013年9月24号到2013年10月21号。过期尚未有适合的答案提交,本次竞赛将作废


奖品:
一本有关数据挖掘的学习书籍(价格不超过50元)和10魔力积分,到时获胜者可以协商具体书籍,能提交有效方法的朋友,视获益情况,也可获得1-5魔力积分奖励。
法律申明:
凡是提交了结果的参赛者就是授权给炼数成金使用其结果的一切权利,如放上网供人下载,出版等等,最终解释权归炼数成金所有。
预测汽车耗油量
预测汽车耗油量
背景:
安全、节能、环保已经成为当代汽车发展的三大主题,并且随着石油能源的日趋紧张,降低汽车油耗是目前汽车行业所急需解决的问题之一。同时,随着石油能源不断减少,油价会不断上升,低油耗也是消费者购买汽车时必须考虑的因素之一。这里不考虑影响油耗的人为因素,如平时保养等,只考虑汽车本身的因素如重量对耗油量的影响。

数据描述(数据见讨论区):
该数据集是从卡内基•梅隆大学(Carnegie Mellon University)的StatLib库获取的。
该数据集一共有9列,具体名称和属性为:
1.mpg(city-cycle fuel consumption in miles per gallon):continuous
2. cylinders(汽缸数目): multi-valued discrete
3. displacement(排气量): continuous
4. horsepower(马力): continuous
5. weight(重量): continuous
6. acceleration(加速度): continuous
7. model year(生产年份): multi-valued discrete
8. origin: multi-valued discrete
9. car name(unique for each instance): string

现在我们要利用汽车的"cylinders"、"displacement" 、"horsepower" 、"weight" 、"acceleration"、"model year" 、"origin"、 "car name"这8个属性构建最佳的模型来预测汽车的mpg.。
要求:
1. 用R、C或C++、matlab、SAS软件实现,便于我们进行检验,如何用其他软件实现,必需附上该软件的使用说明。
2. 要提交文档说明构建模型的过程。
3 要附上主要代码并附上注释。

结果提交方式:
把结果和程序打包发到邮箱1918726047@qq.com,主题写炼数成金数据挖掘竞赛

优胜判断:
在有效时限内完成,经过我们用固定的(对所有参赛者一样的)不公开的测试集进行测试,误差最小者获胜。
竞赛时间:
2013年9月2号到2013年9月8号。过期尚未有适合的答案提交,本次竞赛将作废

奖品:
优胜者可获得炼数成金魔力积分10分,能提交有效方法的朋友,视准确率情况,也可获得1-5魔力积分奖励。
探究银行对客户评级
探究银行对客户评级
背景:
对银行等金融机构来说,对客户进行评级是具有重要意义的。对于评级高的客户,银行可以向他们推荐更多的增值服务,提高他们的贷款限额。对于评级低的客户,银行可以降低他们的贷款限额,避免造成烂账。为了让大家了解银行是怎样对客户进行评级的,dataguru竞赛板块在本期举行探究银行对客户评级的因素。如果你想了解更多的话,就赶快来参加吧!

数据来源:
  (confidential source)  
  Submitted by quinlan '@' cs.su.oz.au
  
数据介绍:
本次数据一共有16个变量,分别记为A1到A16,其中A1到A15为自变量,A16为因变量,代表客户的评级。详细信息如下:
A1: b, a.
A2: continuous.
A3: continuous.
A4: u, y, l, t.
A5: g, p, gg.
A6: c, d, cc, i, j, k, m, r, q, w, x, e, aa, ff.
A7: v, h, bb, j, n, z, dd, ff, o.
A8: continuous.
A9: t, f.
A10: t, f.
A11: continuous.
A12: t, f.
A13: g, p, s.
A14: continuous.
A15: continuous.
A16: +,- (class attribute)
注:数据是经过加密处理的,是用字母来代表每个自变量的属性。
对于自变量A16,+代表客户评级高,-代表客户评级低
现在建立模型,利用自变量A1到A15来估计客户的评级。

要求:
1. 用R、C或C++、matlab、SAS软件实现,便于我们进行检验,如何用其他软件实现,要需附上该软件的使用说明。
2. 把测试集的运行结果写进txt文档,每一行只能有一个结果,分别以0,1代表“-”和“+”,要提交文档说明构建模型的过程。
3 要附上主要代码并附上注释,只提交exe文件无效。

结果提交方式:
把结果和程序打包发到邮箱1918726047@qq.com,主题写炼数成金数据挖掘竞赛(探究银行对客户评级的因素),要附上你参赛用的用户名,方便加分

优胜判断:
在有效时限内完成,经过我们用固定的(对所有参赛者一样的)的测试集进行测试,分类最准确的模型获胜。

竞赛时间:
2013年9月30号到2013年10月20号。过期尚未有适合的答案提交,本次竞赛将作废


奖品:
一本有关数据挖掘的学习书籍(价格不超过50元)和10魔力积分,到时获胜者可以协商具体书籍,能提交有效方法的朋友,视获益情况,也可获得1-5魔力积分奖励。
声明:
凡是提交了结果的参赛者就是授权给炼数成金使用其结果的一切权利,如放上网供人下载,出版等等,最终解释权归炼数成金所有。
求无穷级数
求无穷级数
级数很神奇,一些常见的数字加加减减,常能变幻出意想不到的结果

 

GMT+8, 2024-5-1 14:37 , Processed in 0.121155 second(s), 43 queries .