欢迎大家赞助一杯啤酒🍺 我们准备了下酒菜:Formal mathematics/Isabelle/ML, Formal verification/Coq/ACL2, C++/F#/Lisp
D3
来自开放百科 - 灰狐
(版本间的差异)
小 (→组成) |
小 (→数据挖掘) |
||
第49行: | 第49行: | ||
*通过[[scrapy]]等工具爬取更多数据 | *通过[[scrapy]]等工具爬取更多数据 | ||
− | == | + | ==搜索引擎== |
− | [[ | + | 信息检索 |
+ | [[Apache Lucene]]、[[Apache Solr]]和[[Elasticsearch]]是我们在信息检索领域的工具集和兴趣所在。 | ||
− | D3 Weka 为数据挖掘提供一个更好用的机器学习软件包,而不总是[[SPSS]]。 | + | 数据挖掘 |
− | + | *[[Weka]]: [[Machine learning]] software to solve [[data mining]] problems | |
− | [[Pentaho]] | + | *D3 Weka 为数据挖掘提供一个更好用的机器学习软件包,而不总是[[SPSS]]。 |
+ | *[[Pentaho]] | ||
==领域== | ==领域== |
2017年7月19日 (三) 04:30的版本
D3
目录 |
含义
D3:Big Data, Deep Learning, IDE // 取其中的三个D
D3也表示以Data为中心的软件架构和开发模式。
愿景
普适的大数据和人工智能,AI on every device everywhere.
路线图
路线一:
- 以Hortonworks为大数据基石
- 基于Deeplearning4j、H2O、Scala和Apache Spark构建JVM生态的D3解决方案:Deep learning on HDP
- 以数据为中心的编程Clojure和分析平台Metabase,Clojure is about Data, Scala is about Types, Java is about Objects.
- Yahoo CaffeOnSpark
- 通过Apache Bigtop分发D3
路线二:
- HPCC是Hadoop外的另一种选择。
- 整合TensorFlow, MXNet, PaddlePaddle等深度学习框架和机器学习库。
- C++语言核心驱动大数据和人工智能基础设施。
- 支持Python等尽可能多的外部接口语言。
路线三:
- Anaconda D3 Anaconda Platform (DAP) + PyData + Keras conda install -c omnia keras=0.3.2
路线四:D3.NET
D3.NET
基于.NET的大数据和机器学习解决方案。
组成
基础设施
业务框架
- 网络爬虫、搜索引擎、自然语言处理提供的数据收集和数据挖掘服务。用elasticsearch驱动这一业务,它与Apache Hadoop有深度整合 提供Python客户端 DSL 且有丰富的开源项目和商业模式。
- 将大数据和人工智能服务更好的支持业务发展,通过业务框架提供这一支撑。
- Mars微信官方的跨平台跨业务的终端基础组件可作为基础参考。WeUI 为微信 Web 服务量身设计。
工具
数据
搜索引擎
信息检索 Apache Lucene、Apache Solr和Elasticsearch是我们在信息检索领域的工具集和兴趣所在。
数据挖掘
- Weka: Machine learning software to solve data mining problems
- D3 Weka 为数据挖掘提供一个更好用的机器学习软件包,而不总是SPSS。
- Pentaho
领域
运营
- IPython Jupyter
- Apache Ambari Operational Best Practices Workshop
- Hue
- Apache Zeppelin
- Apache NiFi
- Apache Metron
- H2O Flow
- Kettle
- Apache Kylin OLAP on Hadoop
- 基于Eclipse的各种分析和运营工具:XMind
图集
链接
分享您的观点