灰狐数据

来自开放百科 - 灰狐
(版本间的差异)
跳转到: 导航, 搜索
(业务)
(桌面)
(未显示1个用户的35个中间版本)
第4行: 第4行:
 
一切皆数据,数据即洞察。
 
一切皆数据,数据即洞察。
  
灰狐数据是[[灰狐咨询]]的大数据、数据分析业务。
+
灰狐数据是[[灰狐咨询]]的大数据、数据存储、数据分析业务。
  
[[Elasticsearch]]和[[Hortonworks]]是灰狐数据的核心存储支撑,[[Apache Kafka]]核心数据聚合和流数据平台,[[Metabase]]是BI和分析门户。[https://github.com/elastic/elasticsearch-hadoop Elasticsearch Hadoop]
+
我们理解的大数据三剑客:[[Apache Cassandra]]、[[Apache Kafka]] 和 [[Elasticsearch]],我们持续的深度耕耘,帮助客户构建更强大的大数据基础设施。
 +
 
 +
[[Elassandra]] = [[Elasticsearch]] + [[Apache Cassandra]]
 +
 
 +
[[Elasticsearch]] 和 [[Apache Cassandra]] 是灰狐数据的核心存储支撑,[[Apache Kafka]] 核心数据聚合和流数据平台,[[Metabase]]/[https://github.com/apache/incubator-superset Apache Superset]是BI和分析门户。[https://github.com/elastic/elasticsearch-hadoop Elasticsearch Hadoop]
  
 
[https://www.elastic.co/use-cases/networked-insights Solve Hadoop's “Last Mile" Problem with Elasticsearch] Use Elasticsearch to easily search Apache Hadoop data.
 
[https://www.elastic.co/use-cases/networked-insights Solve Hadoop's “Last Mile" Problem with Elasticsearch] Use Elasticsearch to easily search Apache Hadoop data.
  
Huihoo.IO
+
大数据领域的瑞士军刀变迁:[[MongoDB]] -> [[Elasticsearch]] -> [[ClickHouse]]
 +
 
 +
==数据库==
 +
[[D3]] 提供数据库和存储服务
 +
 
 +
[[MariaDB]] & [[Vitess]] 是默认数据库服务。
 +
 
 +
[[PostgreSQL]] 和 [[ClickHouse]] 也是我们长期提供LTS服务的核心数据库。
 +
 
 +
Huihoo Analytics:基于 Analytical DBMS [[ClickHouse]] 构建,打造一套类似 [[Elasticsearch]] Elastic Stack 的解决方案。
 +
 
 +
[https://www.chapterx.cn ChapterX] 提供 πDB数据库、 一体机、服务的发展思路可借鉴。
 +
 
 +
==桌面==
 +
*[[SQuirreL SQL Client]]([[NetBeans]]) 比 [[DBeaver]]([[Eclipse]]) 更加自由开放,没有收费的企业版。
 +
*[[Kettle]]
 +
*[[KNIME]]
  
 
==业务==
 
==业务==
*Data Analytics: Huihoo Analytics based on [[Matomo]].
+
Huihoo [[Data science|Data Science]]  
 +
*Data Analytics
 
*Data Engineering
 
*Data Engineering
 
*[[data mining|数据挖掘]]、[[Statistics|统计工程]]、[[machine learning|机器学习]]
 
*[[data mining|数据挖掘]]、[[Statistics|统计工程]]、[[machine learning|机器学习]]
 
*[[database|数据库]]、[[data warehouse|数据仓库]]
 
*[[database|数据库]]、[[data warehouse|数据仓库]]
 +
*[[Kettle]] 数据集成、ETL
 +
*[[DBeaver]] for [[Eclipse]] 数据库管理
 
*[[M3|增长营销、增长黑客]]
 
*[[M3|增长营销、增长黑客]]
 
*[[OpenAds]]广告业务
 
*[[OpenAds]]广告业务
 
*[[灰狐教育]]、知识图谱、问答系统、智能机器人(灰狐):语言助手、聊天Bot、告警Bot、虚拟助手等等,每一个设备都住着一位Bot。
 
*[[灰狐教育]]、知识图谱、问答系统、智能机器人(灰狐):语言助手、聊天Bot、告警Bot、虚拟助手等等,每一个设备都住着一位Bot。
 +
 +
==DataOps==
 +
* [https://www.ibm.com/cn-zh/analytics/dataops IBM 数据运营 DataOps]
 +
 +
==灰狐分析==
 +
以 [[KNIME]] 分析平台为核心工作台,展开各种[[data science|数据科学]]应用和服务。
 +
 +
[[CHAOSS]] 是灰狐的一项核心服务,我们围绕它建立在开源软件、开源社区的分析和治理能力,Open Distro for [[Elasticsearch]] & [[ClickHouse]] 是基础设施。
 +
 +
[https://bestpractices.coreinfrastructure.org/en CII Best Practices Badge Program] 一个蛮有趣的[https://github.com/coreinfrastructure/best-practices-badge 开源项目] 可关注。
 +
 +
GrimoireLab & [[Eclipse SCAVA|CROSSMINER]] Two different philosophies to measure open source community health
  
 
==项目==
 
==项目==
*Huihoo Analytics:基于[[Metabase]]的商业智能和分析门户
+
*Huihoo Analytics:based on [[ClickHouse]]
 +
*关注 [[ZFS|OpenZFS]], [[Ceph]]
 
*[[Apache Kafka]]核心数据聚合和流数据平台
 
*[[Apache Kafka]]核心数据聚合和流数据平台
 +
*[[RabbitMQ]]消息中间件
 
*[[SMACK堆栈]]
 
*[[SMACK堆栈]]
 
*[[KNIME]]、[[H2O]]
 
*[[KNIME]]、[[H2O]]
 
*[[PostgreSQL]]、[[Apache Cassandra]]
 
*[[PostgreSQL]]、[[Apache Cassandra]]
 
*[[Open data]]
 
*[[Open data]]
*[[D3]]
+
*[https://pydata.org/ PyData] Python for Data
*D3 Analysis Platform(DAP) based on [[Anaconda python|Anaconda]]
+
  
 
==图集==
 
==图集==
第39行: 第75行:
 
*Huihoo.IO
 
*Huihoo.IO
 
*[https://github.com/junneyang/xxhadoop xxhadoop] Data Analysis Using Hadoop/Spark/Storm/ES/ML etc. This is My Learning Notes/Code/Demo. Don't fork, Just star !
 
*[https://github.com/junneyang/xxhadoop xxhadoop] Data Analysis Using Hadoop/Spark/Storm/ES/ML etc. This is My Learning Notes/Code/Demo. Don't fork, Just star !
 +
*[https://tushare.pro/ Tushare金融大数据] 给出了一个思路。
  
 
[[category:big data]]
 
[[category:big data]]
[[category:spark]]
+
[[category:data science]]
 +
[[category:database]]
 +
[[category:storage]]
 
[[category:kafka]]
 
[[category:kafka]]
[[category:akka]]
 
 
[[category:cassandra]]
 
[[category:cassandra]]
[[category:mesos]]
+
[[category:PostgreSQL]]
 +
[[category:ClickHouse]]
 
[[category:huihoo]]
 
[[category:huihoo]]

2021年2月24日 (三) 12:09的版本

灰狐数据

目录

简介

一切皆数据,数据即洞察。

灰狐数据是灰狐咨询的大数据、数据存储、数据分析业务。

我们理解的大数据三剑客:Apache CassandraApache KafkaElasticsearch,我们持续的深度耕耘,帮助客户构建更强大的大数据基础设施。

Elassandra = Elasticsearch + Apache Cassandra

ElasticsearchApache Cassandra 是灰狐数据的核心存储支撑,Apache Kafka 核心数据聚合和流数据平台,Metabase/Apache Superset是BI和分析门户。Elasticsearch Hadoop

Solve Hadoop's “Last Mile" Problem with Elasticsearch Use Elasticsearch to easily search Apache Hadoop data.

大数据领域的瑞士军刀变迁:MongoDB -> Elasticsearch -> ClickHouse

数据库

D3 提供数据库和存储服务

MariaDB & Vitess 是默认数据库服务。

PostgreSQLClickHouse 也是我们长期提供LTS服务的核心数据库。

Huihoo Analytics:基于 Analytical DBMS ClickHouse 构建,打造一套类似 Elasticsearch Elastic Stack 的解决方案。

ChapterX 提供 πDB数据库、 一体机、服务的发展思路可借鉴。

桌面

业务

Huihoo Data Science

DataOps

灰狐分析

KNIME 分析平台为核心工作台,展开各种数据科学应用和服务。

CHAOSS 是灰狐的一项核心服务,我们围绕它建立在开源软件、开源社区的分析和治理能力,Open Distro for Elasticsearch & ClickHouse 是基础设施。

CII Best Practices Badge Program 一个蛮有趣的开源项目 可关注。

GrimoireLab & CROSSMINER Two different philosophies to measure open source community health

项目

图集

链接

  • Huihoo.IO
  • xxhadoop Data Analysis Using Hadoop/Spark/Storm/ES/ML etc. This is My Learning Notes/Code/Demo. Don't fork, Just star !
  • Tushare金融大数据 给出了一个思路。
分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱