Differences between revisions 1 and 5 (spanning 4 versions)
Revision 1 as of 2006-06-25 11:15:13
Size: 1142
Editor: ZoomQuiet
Comment:
Revision 5 as of 2006-06-25 12:32:00
Size: 2853
Editor: amingsc
Comment:
Deletions are marked like this. Additions are marked like this.
Line 6: Line 6:
[[TableOfContents]]
::-- ZoomQuiet [[[DateTime(2006-06-25T11:15:13Z)]]]
[[TableOfContents]] ::-- ZoomQuiet [[[DateTime(2006-06-25T11:15:13Z)]]]
Line 10: Line 10:
||[:WoodpeckerProjs:啄木鸟项目::] || (!) '''self:PyDMLab''' || {o} '''[:PyDMLabOthers:关联项目]''' ||
= PyDMLab 缘起 =
     因此,决定开发一个集成的试验环境来提高算法试验的效率,说是试验,实际上包含了从算法实现到算法测试、再到算法试验整个过程。
Line 11: Line 14:
||[wiki:self/WoodpeckerProjs 啄木鸟项目::]|| (!) '''[wiki:self/PyDMLab PyDMLab]'''|| {o} '''[wiki:self/PyDMLabOthers 关联项目]'''|| ## 一般是由列表中的邮件讨论引发的,所以可以使用 PyCNmail 的InterWiki 链接指向原始邮件 比如说:
== DMLab的特点: ==
1.DMLab的数据服务器Dataserver可以为你读取数据集,解析数据集,你只需要一系列简单的图形界面操作就可以实现对数据集的探索和预处理,准备好数据集对象以供算法脚本使用;
Line 13: Line 18:
2. 数据集的使用是可重复的,只需要配置一次,然后在算法脚本运行时直接读取就可以了,不需要每次运行算法脚本多重复数据集的配置过程,这大大的提高了算法试验的效率,对于你自己实现的算法进行调试的时候尤其有用;
Line 14: Line 20:
= PyDMLab 缘起 =
'''描述项目是如何发起的'''
## 一般是由列表中的邮件讨论引发的,所以可以使用 PyCNmail 的InterWiki 链接指向原始邮件 比如说:
 * '''[wiki:PyCNmail/2005-November/018404.html PythonGO开发计划]'''
3. 试验算法跟挖掘算法分离,比如有交叉验证算法CrossValidation,可以对任意一个分类算法进行试验,这样提高了试验过程的灵活性和效率;

= 谁适合用户? =
 1.学习数据挖掘(含机器学习等)课程的学生: DMLab使你可以以最短的代码,最接近书中算法伪代码的方式来实现挖掘算法;
 2.教习数据挖掘课程的老师:如果你属于此列,那么使用该系统可以让你的学生更好的完成数据挖掘课程的试验;
 3.挖掘算法的研究人员,你是否想对某个不熟悉的算法进行研究,是否想验证一下改进某算法的思想是否正确,这都是最快速、直接的平台;

= 使用DMLab需要具有的基础: =

你需要最最最基础的Python知识,随便找本讲Python编程的书,你只需要看一个前两章就足够了,因此不要为不懂Python而有任何恐惧心理
Line 20: Line 32:
||<^>[[MonthCalendar]][[BR]][[Include(CPUGnav)]]||<^>'''提要'''[[Include(^PyDMLab/200.*,'项目简报',4,sort=descending,items=13,titlesonly)]]||
||<style="VERTICAL-ALIGN: top">[[MonthCalendar]][[BR]][[Include(CPUGnav)]]||<style="VERTICAL-ALIGN: top">'''提要'''[[Include(^PyDMLab/200.*,'项目简报',4,sort=descending,items=13,titlesonly)]] ||
Line 23: Line 34:
构建一个快速实现/测试/试验数据挖掘算法的平台
Line 25: Line 37:
Line 27: Line 38:
Line 29: Line 39:
系统已经初步实现,但是仍然需要进一步完善
Line 31: Line 42:
'''项目讨论'''
[[Include(/DisCuss)]]
'''项目讨论''' [[Include(/DisCuss)]]

含有基本项目组织元素的 CPUG 项目首页通用模板

TableOfContents ::-- ZoomQuiet [DateTime(2006-06-25T11:15:13Z)]

[:WoodpeckerProjs:啄木鸟项目::]

(!) self:PyDMLab

{o} [:PyDMLabOthers:关联项目]

1. PyDMLab 缘起

  • 因此,决定开发一个集成的试验环境来提高算法试验的效率,说是试验,实际上包含了从算法实现到算法测试、再到算法试验整个过程。

1.1. DMLab的特点:

1.DMLab的数据服务器Dataserver可以为你读取数据集,解析数据集,你只需要一系列简单的图形界面操作就可以实现对数据集的探索和预处理,准备好数据集对象以供算法脚本使用;

2. 数据集的使用是可重复的,只需要配置一次,然后在算法脚本运行时直接读取就可以了,不需要每次运行算法脚本多重复数据集的配置过程,这大大的提高了算法试验的效率,对于你自己实现的算法进行调试的时候尤其有用;

3. 试验算法跟挖掘算法分离,比如有交叉验证算法CrossValidation,可以对任意一个分类算法进行试验,这样提高了试验过程的灵活性和效率;

2. 谁适合用户?

  • 1.学习数据挖掘(含机器学习等)课程的学生: DMLab使你可以以最短的代码,最接近书中算法伪代码的方式来实现挖掘算法; 2.教习数据挖掘课程的老师:如果你属于此列,那么使用该系统可以让你的学生更好的完成数据挖掘课程的试验; 3.挖掘算法的研究人员,你是否想对某个不熟悉的算法进行研究,是否想验证一下改进某算法的思想是否正确,这都是最快速、直接的平台;

3. 使用DMLab需要具有的基础:

你需要最最最基础的Python知识,随便找本讲Python编程的书,你只需要看一个前两章就足够了,因此不要为不懂Python而有任何恐惧心理

3.1. 项目日志

MonthCalendarBRInclude(CPUGnav)

提要Include(^PyDMLab/200.*,'项目简报',4,sort=descending,items=13,titlesonly)

3.2. 目标

构建一个快速实现/测试/试验数据挖掘算法的平台

3.3. 计划

3.4. 成员

3.5. 成果

系统已经初步实现,但是仍然需要进一步完善

4. 反馈

项目讨论 Include(/DisCuss)

PyDMLab (last edited 2009-12-25 07:17:59 by localhost)