Machine learning on Hadoop

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索
(链接)
(简介)
 
(未显示1个用户的23个中间版本)
第1行: 第1行:
[[Deep learning]] on [[Hortonworks]] Data Platform (HDP)
+
[[Machine learning]] & [[Deep learning]] on [[Apache Hadoop]]
  
在 HDP 上开发、部署、运营深度学习软件基础设施,覆盖 Deep learning on hadoop, Deep learning on spark 等领域。
+
==简介==
 +
这里主要在[[Hortonworks]]  (HDP & HDF & HCP) 上进行机器学习和深度学习。
 +
 
 +
在 HDP 上开发、部署、运营机器学习 & 深度学习软件基础设施,覆盖 Deep learning on hadoop, Deep learning on spark 等领域。
 +
 
 +
==好处==
 +
在HDP(Hadoop)上进行深度学习主要有以下好处:
 +
* 深度学习直接在Hadoop集群上执行,可以避免数据在Hadoop集群和单独的深度学习集群之间移动;
 +
* 同Hadoop数据处理和Spark机器学习管道一样,深度学习也可以定义为[[Apache Oozie]]工作流中的一个步骤;
 +
* YARN可以与深度学习很好地协同,深度学习的多个实验可以在单个集群上同时进行。与传统方法相比,这使得深度学习极其高效。
  
 
==指南==
 
==指南==
 +
*[https://zh.hortonworks.com/solutions/advertising/ Hadoop is Transforming Advertising]
 +
 +
==项目==
 +
*[[BigDL]]
 +
*[[Apache SINGA]]
 +
*[[deeplearning4j]]
 +
*[[H2O]] [https://h2o-release.s3.amazonaws.com/h2o/rel-ueno/6/docs-website/h2o-docs/hadoop.html H2O on Hadoop]
 +
*[[Keras]]
 +
*雅虎[https://github.com/yahoo/CaffeOnSpark CaffeOnSpark]将深度学习带入Hadoop和Spark集群,[http://www.infoq.com/cn/news/2015/10/Hadoop-Caffe-Spark 雅虎如何在Hadoop集群上实现大规模分布式深度学习]。
 +
*[[DMP on HDP]]
 +
*[[OpenAds]]和[[灰狐推荐]]
  
 
==文档==
 
==文档==
 +
*[http://docs.huihoo.com/hortonworks/deep-learning-with-hortonworks-and-apache-spark.pdf Deep Learning on HDP]
 +
*[http://docs.huihoo.com/hortonworks/machine-learning-using-apache-spark.pptx Machine Learning with Apache Spark]
 +
*[http://docs.huihoo.com/hortonworks/nlp-structured-data-investigation-on-nontext.pdf NLP Structured Data Investigation on Non-Text]
 +
*[http://docs.huihoo.com/hortonworks/real-time-processing-with-apache-hadoop.pdf Real Time Processing with Hadoop]
 +
*[http://docs.huihoo.com/hortonworks/operational-best-practices-workshop.pdf Operational Best Practices Workshop]
 +
*[http://docs.huihoo.com/hortonworks/spark-and-hadoop-perfect-together.pdf Perfect Together Spark + Hadoop]
  
 
==图集==
 
==图集==
 +
<gallery>
 +
image:GPU-on-YARN.png|GPU on YARN
 +
image:Distributed-Deep-Learning-on-Hadoop.png|基于Hadoop的深度学习
 +
image:machine-learning-applied-to-big-data.jpg|机器学习应用于大数据
 +
image:Baidu-spark-one.png|基于Spark的深度学习
 +
</gallery>
  
 
==链接==
 
==链接==
 +
*[https://zh.hortonworks.com/blog/gpus-support-in-apache-hadoop-3-1-yarn-hdp-3/ First Class GPUs support in Apache Hadoop 3.1, YARN & HDP 3.0]
 +
*[http://blog.cloudera.com/blog/2017/06/deep-learning-on-apache-spark-and-hadoop-with-deeplearning4j/ Deep learning on Apache Spark and Apache Hadoop with Deeplearning4j]
 +
*[http://yahoohadoop.tumblr.com/ Hadoop at Yahoo]
 +
*[http://yahoohadoop.tumblr.com/post/129872361846/large-scale-distributed-deep-learning-on-hadoop Large Scale Distributed Deep Learning on Hadoop Clusters]
 +
*[http://blog.cloudera.com/blog/2017/04/bigdl-on-cdh-and-cloudera-data-science-workbench/ BigDL: Distributed Deep Learning Library for Apache Spark]
  
 +
[[category:machine learning]]
 
[[category:deep learning]]
 
[[category:deep learning]]
 
[[category:hortonworks]]
 
[[category:hortonworks]]
 
[[category:hadoop]]
 
[[category:hadoop]]
[[category:spark]]]
+
[[category:spark]]
 
[[category:huihoo]]
 
[[category:huihoo]]

2018年11月9日 (五) 03:33的最后版本

Machine learning & Deep learning on Apache Hadoop

目录

[编辑] 简介

这里主要在Hortonworks (HDP & HDF & HCP) 上进行机器学习和深度学习。

在 HDP 上开发、部署、运营机器学习 & 深度学习软件基础设施,覆盖 Deep learning on hadoop, Deep learning on spark 等领域。

[编辑] 好处

在HDP(Hadoop)上进行深度学习主要有以下好处:

  • 深度学习直接在Hadoop集群上执行,可以避免数据在Hadoop集群和单独的深度学习集群之间移动;
  • 同Hadoop数据处理和Spark机器学习管道一样,深度学习也可以定义为Apache Oozie工作流中的一个步骤;
  • YARN可以与深度学习很好地协同,深度学习的多个实验可以在单个集群上同时进行。与传统方法相比,这使得深度学习极其高效。

[编辑] 指南

[编辑] 项目

[编辑] 文档

[编辑] 图集

[编辑] 链接

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱