使用clojure进行大规模数据挖掘

时间:2012-06-19 14:37:50

标签: clojure data-mining

我正在寻找

的好参考

使用Clojure进行大规模数据挖掘

我知道许多优秀的编程书籍(编程Clojure,欢乐的Clojure,......),以及许多优秀的数据挖掘教科书(挖掘海量数据集,管理千兆字节......)。但是我不知道有任何专门针对

的参考文献

使用Clojure进行大规模数据挖掘

“with clojure”部分对我来说非常重要,原因如下:

* most theoretical analysis uses big-Oh running time, which ignores constants
* constants matter, if it ends up being a matter of 1 second vs 1 hour (for things that need to be real time)
* or 1 hour vs 1 week (for batch jobs)

特别是,我认为JVM,Clojure数据结构之间存在很多相互作用,数据是存储在内存中还是懒惰地从磁盘读取 - 可以使“相同”算法的运行时间大不相同“ “不同的实施。

因此,我的问题(以上所有内容都是为了避免被“Check Google”关闭):

使用Clojure进行海量数据挖掘的好资源是什么?

谢谢!

2 个答案:

答案 0 :(得分:13)

我认为没有人写过一篇很好的综合参考资料。但是在这个领域肯定有很多工作要做(包括我自己的公司!)

一些有趣的跟进链接:

答案 1 :(得分:1)

2013年5月出版了一本精彩的书: Clojure数据分析手册。我可能会买它。

http://www.amazon.co.uk/Clojure-Data-Analysis-Cookbook-ebook/dp/B00BECVV9C/ref=sr_1_1?s=books&ie=UTF8&qid=1360697819&sr=1-1

  

详细信息

     

数据无处不在,能够获得越来越重要   我们可以采取行动的见解。使用Clojure进行数据分析和   收藏,这本书将告诉你如何获得新的见解和   来自您的数据的视角与实用的基本集合,   结构化食谱。

     

“Clojure数据分析手册”介绍了每个阶段的食谱   数据分析过程。是否从网页上抓取数据,   本书具有执行数据挖掘或为Web创建图形的功能   适合手头的任务。

     

您将学习如何获取数据,清理数据并将其转换为数据   有用的图表,然后可以分析和发布到   互联网。覆盖范围包括处理数据等高级主题   同时,应用贝叶斯等强大的统计技术   建模,甚至数据挖掘算法,如K均值聚类,   神经网络和关联规则。

     

方法

     

完整的实用技巧,“Clojure数据分析手册”将有所帮助   您可以通过一系列一步一步的真实来充分利用您的数据   世界食谱涵盖数据分析的各个方面。

     

本书适用于谁

     

以前使用Clojure和数据分析技术的经验   工作流程将是有益的,但不是必需的。