D3

2017年7月26日 (三) 04:21的版本

D3

含义

D3：Big Data, Deep Learning, IDE // 取其中的三个D

D3也表示以Data为中心的软件架构和开发模式。

愿景

普适的大数据和人工智能，AI on every device everywhere.

路线图

路线一：

以Hortonworks为大数据基石
基于Deeplearning4j、H2O、Scala和Apache Spark构建JVM生态的D3解决方案：Deep learning on HDP
以数据为中心的编程Clojure和分析平台Metabase，Clojure is about Data, Scala is about Types, Java is about Objects.
Yahoo CaffeOnSpark
通过Apache Bigtop分发D3

路线二：

HPCC是Hadoop外的另一种选择。
整合TensorFlow, MXNet, PaddlePaddle等深度学习框架和机器学习库。
C++语言核心驱动大数据和人工智能基础设施。
支持Python等尽可能多的外部接口语言。

路线三：

Anaconda D3 Anaconda Platform (DAP) + PyData + Keras conda install -c omnia keras=0.3.2

路线四：D3.NET

D3.NET

基于.NET的大数据和机器学习解决方案。

组成

基础设施

业务框架

网络爬虫、搜索引擎、自然语言处理提供的数据收集和数据挖掘服务。用elasticsearch驱动这一业务，它与Apache Hadoop有深度整合提供Python客户端 DSL 且有丰富的开源项目和商业模式。
将大数据和人工智能服务更好的支持业务发展，通过业务框架提供这一支撑。
Mars微信官方的跨平台跨业务的终端基础组件可作为基础参考。WeUI 为微信 Web 服务量身设计。

工具

Jupyter is the new front end for data science and AI.
打造成类似MATLAB 机器学习和神经网络平台，基于Octave构建。
D3 weka 数据挖掘工具包

数据

开放数据
通过scrapy等工具爬取更多数据

搜索引擎

信息检索

Apache Lucene、Apache Solr和Elasticsearch是我们在信息检索领域的工具集和兴趣所在。

数据挖掘

Weka: Machine learning software to solve data mining problems
D3 Weka 为数据挖掘提供一个更好用的机器学习软件包，而不总是SPSS。
Pentaho

实践

PyPI数据分析和治理

领域

电商零售业
爬虫和搜索解决方案 Search as a Service
自然语言处理 // 让D3更好的理解Web
计算广告
金融服务
计算机视觉：Caffe2、DeepVC
自动驾驶汽车
区块链数据库和区块链数据市场

>>>更多行业解决方案

运营

IPython Jupyter
Apache Ambari Operational Best Practices Workshop
Hue
Apache Zeppelin
Apache NiFi
Apache Metron
H2O Flow
Kettle
Apache Kylin OLAP on Hadoop
基于Eclipse的各种分析和运营工具：XMind

图集

链接

GrowingIO 技术栈是 Scala, Play, Spark, Kafka, HBase, ElasticSearch

@@ 第58行： / 第58行： @@
 *D3 Weka 为数据挖掘提供一个更好用的机器学习软件包，而不总是[[SPSS]]。
 *[[Pentaho]]
+==实践==
+*[[PyPI]]数据分析和治理
 ==领域==

D3

2017年7月26日 (三) 04:21的版本

目录

含义

愿景

路线图

D3.NET

组成

数据

搜索引擎

实践

领域

运营

图集

链接

个人工具

名字空间

变换

查看

操作

搜索

导航

工具箱