Differences between revisions 4 and 5
Revision 4 as of 2006-06-25 12:30:38
Size: 2883
Editor: amingsc
Comment:
Revision 5 as of 2006-06-25 12:32:00
Size: 2853
Editor: amingsc
Comment:
Deletions are marked like this. Additions are marked like this.
Line 16: Line 16:
== 1.DMLab的数据服务器Dataserver可以为你读取数据集,解析数据集,你只需要一系列简单的图形界面操作就可以实现对数据集的探索和预处理,准备好数据集对象以供算法脚本使用。 == 1.DMLab的数据服务器Dataserver可以为你读取数据集,解析数据集,你只需要一系列简单的图形界面操作就可以实现对数据集的探索和预处理,准备好数据集对象以供算法脚本使用;
Line 18: Line 18:
== 2. 数据集的使用是可重复的,只需要配置一次,然后在算法脚本运行时直接读取就可以了,不需要每次运行算法脚本多重复数据集的配置过程,这大大的提高了算法试验的效率,对于你自己实现的算法进行调试的时候尤其有用; == 2. 数据集的使用是可重复的,只需要配置一次,然后在算法脚本运行时直接读取就可以了,不需要每次运行算法脚本多重复数据集的配置过程,这大大的提高了算法试验的效率,对于你自己实现的算法进行调试的时候尤其有用;
Line 20: Line 20:
== 3. 试验算法跟挖掘算法分离,比如有交叉验证算法CrossValidation,可以对任意一个分类算法进行试验,这样提高了试验过程的灵活性和效率; == 3. 试验算法跟挖掘算法分离,比如有交叉验证算法CrossValidation,可以对任意一个分类算法进行试验,这样提高了试验过程的灵活性和效率;
Line 23: Line 23:
== 1.学习数据挖掘(含机器学习等)课程的学生: DMLab使你可以以最短的代码,最接近书中算法伪代码的方式来实现挖掘算法;==
== 2.教习数据挖掘课程的老师:如果你属于此列,那么使用该系统可以让你的学生更好的完成数据挖掘课程的试验;==
== 3.挖掘算法的研究人员,你是否想对某个不熟悉的算法进行研究,是否想验证一下改进某算法的思想是否正确,这都是最快速、直接的平台;
 1.学习数据挖掘(含机器学习等)课程的学生: DMLab使你可以以最短的代码,最接近书中算法伪代码的方式来实现挖掘算法;
 2.教习数据挖掘课程的老师:如果你属于此列,那么使用该系统可以让你的学生更好的完成数据挖掘课程的试验;
 3.挖掘算法的研究人员,你是否想对某个不熟悉的算法进行研究,是否想验证一下改进某算法的思想是否正确,这都是最快速、直接的平台;

含有基本项目组织元素的 CPUG 项目首页通用模板

TableOfContents ::-- ZoomQuiet [DateTime(2006-06-25T11:15:13Z)]

[:WoodpeckerProjs:啄木鸟项目::]

(!) self:PyDMLab

{o} [:PyDMLabOthers:关联项目]

1. PyDMLab 缘起

  • 因此,决定开发一个集成的试验环境来提高算法试验的效率,说是试验,实际上包含了从算法实现到算法测试、再到算法试验整个过程。

1.1. DMLab的特点:

1.DMLab的数据服务器Dataserver可以为你读取数据集,解析数据集,你只需要一系列简单的图形界面操作就可以实现对数据集的探索和预处理,准备好数据集对象以供算法脚本使用;

2. 数据集的使用是可重复的,只需要配置一次,然后在算法脚本运行时直接读取就可以了,不需要每次运行算法脚本多重复数据集的配置过程,这大大的提高了算法试验的效率,对于你自己实现的算法进行调试的时候尤其有用;

3. 试验算法跟挖掘算法分离,比如有交叉验证算法CrossValidation,可以对任意一个分类算法进行试验,这样提高了试验过程的灵活性和效率;

2. 谁适合用户?

  • 1.学习数据挖掘(含机器学习等)课程的学生: DMLab使你可以以最短的代码,最接近书中算法伪代码的方式来实现挖掘算法; 2.教习数据挖掘课程的老师:如果你属于此列,那么使用该系统可以让你的学生更好的完成数据挖掘课程的试验; 3.挖掘算法的研究人员,你是否想对某个不熟悉的算法进行研究,是否想验证一下改进某算法的思想是否正确,这都是最快速、直接的平台;

3. 使用DMLab需要具有的基础:

你需要最最最基础的Python知识,随便找本讲Python编程的书,你只需要看一个前两章就足够了,因此不要为不懂Python而有任何恐惧心理

3.1. 项目日志

MonthCalendarBRInclude(CPUGnav)

提要Include(^PyDMLab/200.*,'项目简报',4,sort=descending,items=13,titlesonly)

3.2. 目标

构建一个快速实现/测试/试验数据挖掘算法的平台

3.3. 计划

3.4. 成员

3.5. 成果

系统已经初步实现,但是仍然需要进一步完善

4. 反馈

项目讨论 Include(/DisCuss)

PyDMLab (last edited 2009-12-25 07:17:59 by localhost)