欢迎大家赞助一杯啤酒🍺 我们准备了下酒菜:Formal mathematics/Isabelle/ML, Formal verification/Coq/ACL2/Agda, C++/Lisp/Haskell
Machine learning on Hadoop
来自开放百科 - 灰狐
Machine learning & Deep learning on Apache Hadoop
目录 |
简介
这里主要在Hortonworks (HDP & HDF & HCP) 上进行机器学习和深度学习。
在 HDP 上开发、部署、运营机器学习 & 深度学习软件基础设施,覆盖 Deep learning on hadoop, Deep learning on spark 等领域。
好处
在HDP(Hadoop)上进行深度学习主要有以下好处:
- 深度学习直接在Hadoop集群上执行,可以避免数据在Hadoop集群和单独的深度学习集群之间移动;
- 同Hadoop数据处理和Spark机器学习管道一样,深度学习也可以定义为Apache Oozie工作流中的一个步骤;
- YARN可以与深度学习很好地协同,深度学习的多个实验可以在单个集群上同时进行。与传统方法相比,这使得深度学习极其高效。
指南
项目
- BigDL
- Apache SINGA
- deeplearning4j
- H2O H2O on Hadoop
- Keras
- 雅虎CaffeOnSpark将深度学习带入Hadoop和Spark集群,雅虎如何在Hadoop集群上实现大规模分布式深度学习。
- DMP on HDP
- OpenAds和灰狐推荐
文档
- Deep Learning on HDP
- Machine Learning with Apache Spark
- NLP Structured Data Investigation on Non-Text
- Real Time Processing with Hadoop
- Operational Best Practices Workshop
- Perfect Together Spark + Hadoop
图集
链接
分享您的观点