欢迎大家赞助一杯啤酒🍺 我们准备了下酒菜:Formal mathematics/Isabelle/ML, Formal verification/Coq/Agda, C++/Erlang/Lisp
灰狐数据
小 (→项目) |
小 (→桌面) |
||
(未显示1个用户的31个中间版本) | |||
第4行: | 第4行: | ||
一切皆数据,数据即洞察。 | 一切皆数据,数据即洞察。 | ||
− | 灰狐数据是[[灰狐咨询]] | + | 灰狐数据是[[灰狐咨询]]的大数据、数据存储、数据分析业务。 |
− | [[Elasticsearch]]和[[ | + | 我们理解的大数据三剑客:[[Apache Cassandra]]、[[Apache Kafka]] 和 [[Elasticsearch]],我们持续的深度耕耘,帮助客户构建更强大的大数据基础设施。 |
+ | |||
+ | [[Elassandra]] = [[Elasticsearch]] + [[Apache Cassandra]] | ||
+ | |||
+ | [[Elasticsearch]] 和 [[Apache Cassandra]] 是灰狐数据的核心存储支撑,[[Apache Kafka]] 核心数据聚合和流数据平台,[[Metabase]]/[https://github.com/apache/incubator-superset Apache Superset]是BI和分析门户。[https://github.com/elastic/elasticsearch-hadoop Elasticsearch Hadoop] | ||
[https://www.elastic.co/use-cases/networked-insights Solve Hadoop's “Last Mile" Problem with Elasticsearch] Use Elasticsearch to easily search Apache Hadoop data. | [https://www.elastic.co/use-cases/networked-insights Solve Hadoop's “Last Mile" Problem with Elasticsearch] Use Elasticsearch to easily search Apache Hadoop data. | ||
− | + | 大数据领域的瑞士军刀变迁:[[MongoDB]] -> [[Elasticsearch]] -> [[ClickHouse]] | |
− | + | ==数据库== | |
+ | [[D3]] 提供数据库和存储服务 | ||
+ | |||
+ | [[MariaDB]] & [[Vitess]] 是默认数据库服务。 | ||
+ | |||
+ | [[PostgreSQL]] 和 [[ClickHouse]] 也是我们长期提供LTS服务的核心数据库。 | ||
+ | |||
+ | Huihoo Analytics:基于 Analytical DBMS [[ClickHouse]] 构建,打造一套类似 [[Elasticsearch]] Elastic Stack 的解决方案。 | ||
+ | |||
+ | [https://www.chapterx.cn ChapterX] 提供 πDB数据库、 一体机、服务的发展思路可借鉴。 | ||
+ | |||
+ | ==桌面== | ||
+ | *[[SQuirreL SQL Client]]([[NetBeans]]) 比 [[DBeaver]]([[Eclipse]]) 更加自由开放,没有收费的企业版。 | ||
+ | *[[Kettle]] | ||
+ | *[[KNIME]] | ||
==业务== | ==业务== | ||
− | + | Huihoo [[Data science|Data Science]] | |
+ | *Data Analytics | ||
*Data Engineering | *Data Engineering | ||
*[[data mining|数据挖掘]]、[[Statistics|统计工程]]、[[machine learning|机器学习]] | *[[data mining|数据挖掘]]、[[Statistics|统计工程]]、[[machine learning|机器学习]] | ||
*[[database|数据库]]、[[data warehouse|数据仓库]] | *[[database|数据库]]、[[data warehouse|数据仓库]] | ||
+ | *[[Kettle]] 数据集成、ETL | ||
+ | *[[DBeaver]] for [[Eclipse]] 数据库管理 | ||
*[[M3|增长营销、增长黑客]] | *[[M3|增长营销、增长黑客]] | ||
*[[OpenAds]]广告业务 | *[[OpenAds]]广告业务 | ||
*[[灰狐教育]]、知识图谱、问答系统、智能机器人(灰狐):语言助手、聊天Bot、告警Bot、虚拟助手等等,每一个设备都住着一位Bot。 | *[[灰狐教育]]、知识图谱、问答系统、智能机器人(灰狐):语言助手、聊天Bot、告警Bot、虚拟助手等等,每一个设备都住着一位Bot。 | ||
+ | |||
+ | ==DataOps== | ||
+ | * [https://www.ibm.com/cn-zh/analytics/dataops IBM 数据运营 DataOps] | ||
+ | |||
+ | ==灰狐分析== | ||
+ | 以 [[KNIME]] 分析平台为核心工作台,展开各种[[data science|数据科学]]应用和服务。 | ||
+ | |||
+ | [[CHAOSS]] 是灰狐的一项核心服务,我们围绕它建立在开源软件、开源社区的分析和治理能力,Open Distro for [[Elasticsearch]] & [[ClickHouse]] 是基础设施。 | ||
+ | |||
+ | [https://bestpractices.coreinfrastructure.org/en CII Best Practices Badge Program] 一个蛮有趣的[https://github.com/coreinfrastructure/best-practices-badge 开源项目] 可关注。 | ||
+ | |||
+ | GrimoireLab & [[Eclipse SCAVA|CROSSMINER]] Two different philosophies to measure open source community health | ||
==项目== | ==项目== | ||
− | *Huihoo | + | *Huihoo Analytics:based on [[ClickHouse]] |
+ | *关注 [[ZFS|OpenZFS]], [[Ceph]] | ||
*[[Apache Kafka]]核心数据聚合和流数据平台 | *[[Apache Kafka]]核心数据聚合和流数据平台 | ||
+ | *[[RabbitMQ]]消息中间件 | ||
*[[SMACK堆栈]] | *[[SMACK堆栈]] | ||
*[[KNIME]]、[[H2O]] | *[[KNIME]]、[[H2O]] | ||
− | *[[PostgreSQL]]、[[Apache Cassandra | + | *[[PostgreSQL]]、[[Apache Cassandra]] |
*[[Open data]] | *[[Open data]] | ||
− | *[ | + | *[https://pydata.org/ PyData] Python for Data |
− | + | ||
==图集== | ==图集== | ||
第41行: | 第75行: | ||
*Huihoo.IO | *Huihoo.IO | ||
*[https://github.com/junneyang/xxhadoop xxhadoop] Data Analysis Using Hadoop/Spark/Storm/ES/ML etc. This is My Learning Notes/Code/Demo. Don't fork, Just star ! | *[https://github.com/junneyang/xxhadoop xxhadoop] Data Analysis Using Hadoop/Spark/Storm/ES/ML etc. This is My Learning Notes/Code/Demo. Don't fork, Just star ! | ||
+ | *[https://tushare.pro/ Tushare金融大数据] 给出了一个思路。 | ||
[[category:big data]] | [[category:big data]] | ||
− | [[category: | + | [[category:data science]] |
+ | [[category:database]] | ||
+ | [[category:storage]] | ||
[[category:kafka]] | [[category:kafka]] | ||
− | |||
[[category:cassandra]] | [[category:cassandra]] | ||
− | [[category: | + | [[category:PostgreSQL]] |
+ | [[category:ClickHouse]] | ||
[[category:huihoo]] | [[category:huihoo]] |
2021年2月24日 (三) 12:09的版本
灰狐数据
目录 |
简介
一切皆数据,数据即洞察。
灰狐数据是灰狐咨询的大数据、数据存储、数据分析业务。
我们理解的大数据三剑客:Apache Cassandra、Apache Kafka 和 Elasticsearch,我们持续的深度耕耘,帮助客户构建更强大的大数据基础设施。
Elassandra = Elasticsearch + Apache Cassandra
Elasticsearch 和 Apache Cassandra 是灰狐数据的核心存储支撑,Apache Kafka 核心数据聚合和流数据平台,Metabase/Apache Superset是BI和分析门户。Elasticsearch Hadoop
Solve Hadoop's “Last Mile" Problem with Elasticsearch Use Elasticsearch to easily search Apache Hadoop data.
大数据领域的瑞士军刀变迁:MongoDB -> Elasticsearch -> ClickHouse
数据库
D3 提供数据库和存储服务
PostgreSQL 和 ClickHouse 也是我们长期提供LTS服务的核心数据库。
Huihoo Analytics:基于 Analytical DBMS ClickHouse 构建,打造一套类似 Elasticsearch Elastic Stack 的解决方案。
ChapterX 提供 πDB数据库、 一体机、服务的发展思路可借鉴。
桌面
业务
Huihoo Data Science
- Data Analytics
- Data Engineering
- 数据挖掘、统计工程、机器学习
- 数据库、数据仓库
- Kettle 数据集成、ETL
- DBeaver for Eclipse 数据库管理
- 增长营销、增长黑客
- OpenAds广告业务
- 灰狐教育、知识图谱、问答系统、智能机器人(灰狐):语言助手、聊天Bot、告警Bot、虚拟助手等等,每一个设备都住着一位Bot。
DataOps
灰狐分析
以 KNIME 分析平台为核心工作台,展开各种数据科学应用和服务。
CHAOSS 是灰狐的一项核心服务,我们围绕它建立在开源软件、开源社区的分析和治理能力,Open Distro for Elasticsearch & ClickHouse 是基础设施。
CII Best Practices Badge Program 一个蛮有趣的开源项目 可关注。
GrimoireLab & CROSSMINER Two different philosophies to measure open source community health
项目
- Huihoo Analytics:based on ClickHouse
- 关注 OpenZFS, Ceph
- Apache Kafka核心数据聚合和流数据平台
- RabbitMQ消息中间件
- SMACK堆栈
- KNIME、H2O
- PostgreSQL、Apache Cassandra
- Open data
- PyData Python for Data
图集
链接
- Huihoo.IO
- xxhadoop Data Analysis Using Hadoop/Spark/Storm/ES/ML etc. This is My Learning Notes/Code/Demo. Don't fork, Just star !
- Tushare金融大数据 给出了一个思路。