欢迎大家赞助一杯啤酒🍺 我们准备了下酒菜:Formal mathematics/Isabelle/ML, Formal verification/Coq/Agda, C++/Erlang/Lisp
灰狐数据
小 (→数据库) |
小 (→桌面) |
||
(未显示1个用户的14个中间版本) | |||
第4行: | 第4行: | ||
一切皆数据,数据即洞察。 | 一切皆数据,数据即洞察。 | ||
− | 灰狐数据是[[灰狐咨询]] | + | 灰狐数据是[[灰狐咨询]]的大数据、数据存储、数据分析业务。 |
我们理解的大数据三剑客:[[Apache Cassandra]]、[[Apache Kafka]] 和 [[Elasticsearch]],我们持续的深度耕耘,帮助客户构建更强大的大数据基础设施。 | 我们理解的大数据三剑客:[[Apache Cassandra]]、[[Apache Kafka]] 和 [[Elasticsearch]],我们持续的深度耕耘,帮助客户构建更强大的大数据基础设施。 | ||
− | |||
− | |||
[[Elassandra]] = [[Elasticsearch]] + [[Apache Cassandra]] | [[Elassandra]] = [[Elasticsearch]] + [[Apache Cassandra]] | ||
第15行: | 第13行: | ||
[https://www.elastic.co/use-cases/networked-insights Solve Hadoop's “Last Mile" Problem with Elasticsearch] Use Elasticsearch to easily search Apache Hadoop data. | [https://www.elastic.co/use-cases/networked-insights Solve Hadoop's “Last Mile" Problem with Elasticsearch] Use Elasticsearch to easily search Apache Hadoop data. | ||
+ | |||
+ | 大数据领域的瑞士军刀变迁:[[MongoDB]] -> [[Elasticsearch]] -> [[ClickHouse]] | ||
==数据库== | ==数据库== | ||
[[D3]] 提供数据库和存储服务 | [[D3]] 提供数据库和存储服务 | ||
− | [[PostgreSQL]] 和 [[ClickHouse]] | + | [[MariaDB]] & [[Vitess]] 是默认数据库服务。 |
+ | |||
+ | [[PostgreSQL]] 和 [[ClickHouse]] 也是我们长期提供LTS服务的核心数据库。 | ||
Huihoo Analytics:基于 Analytical DBMS [[ClickHouse]] 构建,打造一套类似 [[Elasticsearch]] Elastic Stack 的解决方案。 | Huihoo Analytics:基于 Analytical DBMS [[ClickHouse]] 构建,打造一套类似 [[Elasticsearch]] Elastic Stack 的解决方案。 | ||
[https://www.chapterx.cn ChapterX] 提供 πDB数据库、 一体机、服务的发展思路可借鉴。 | [https://www.chapterx.cn ChapterX] 提供 πDB数据库、 一体机、服务的发展思路可借鉴。 | ||
+ | |||
+ | ==桌面== | ||
+ | *[[SQuirreL SQL Client]]([[NetBeans]]) 比 [[DBeaver]]([[Eclipse]]) 更加自由开放,没有收费的企业版。 | ||
+ | *[[Kettle]] | ||
+ | *[[KNIME]] | ||
==业务== | ==业务== | ||
− | Huihoo Data Science | + | Huihoo [[Data science|Data Science]] |
− | *Data Analytics | + | *Data Analytics |
*Data Engineering | *Data Engineering | ||
*[[data mining|数据挖掘]]、[[Statistics|统计工程]]、[[machine learning|机器学习]] | *[[data mining|数据挖掘]]、[[Statistics|统计工程]]、[[machine learning|机器学习]] | ||
*[[database|数据库]]、[[data warehouse|数据仓库]] | *[[database|数据库]]、[[data warehouse|数据仓库]] | ||
+ | *[[Kettle]] 数据集成、ETL | ||
+ | *[[DBeaver]] for [[Eclipse]] 数据库管理 | ||
*[[M3|增长营销、增长黑客]] | *[[M3|增长营销、增长黑客]] | ||
*[[OpenAds]]广告业务 | *[[OpenAds]]广告业务 | ||
第39行: | 第48行: | ||
==灰狐分析== | ==灰狐分析== | ||
− | [[CHAOSS]] 是灰狐的一项核心服务,我们围绕它建立在开源软件、开源社区的分析和治理能力,Open Distro for [[Elasticsearch]] 是基础设施。 | + | 以 [[KNIME]] 分析平台为核心工作台,展开各种[[data science|数据科学]]应用和服务。 |
+ | |||
+ | [[CHAOSS]] 是灰狐的一项核心服务,我们围绕它建立在开源软件、开源社区的分析和治理能力,Open Distro for [[Elasticsearch]] & [[ClickHouse]] 是基础设施。 | ||
[https://bestpractices.coreinfrastructure.org/en CII Best Practices Badge Program] 一个蛮有趣的[https://github.com/coreinfrastructure/best-practices-badge 开源项目] 可关注。 | [https://bestpractices.coreinfrastructure.org/en CII Best Practices Badge Program] 一个蛮有趣的[https://github.com/coreinfrastructure/best-practices-badge 开源项目] 可关注。 | ||
第46行: | 第57行: | ||
==项目== | ==项目== | ||
− | *Huihoo | + | *Huihoo Analytics:based on [[ClickHouse]] |
+ | *关注 [[ZFS|OpenZFS]], [[Ceph]] | ||
*[[Apache Kafka]]核心数据聚合和流数据平台 | *[[Apache Kafka]]核心数据聚合和流数据平台 | ||
*[[RabbitMQ]]消息中间件 | *[[RabbitMQ]]消息中间件 | ||
*[[SMACK堆栈]] | *[[SMACK堆栈]] | ||
*[[KNIME]]、[[H2O]] | *[[KNIME]]、[[H2O]] | ||
− | *[[PostgreSQL]]、[[Apache Cassandra | + | *[[PostgreSQL]]、[[Apache Cassandra]] |
*[[Open data]] | *[[Open data]] | ||
− | |||
− | |||
*[https://pydata.org/ PyData] Python for Data | *[https://pydata.org/ PyData] Python for Data | ||
第68行: | 第78行: | ||
[[category:big data]] | [[category:big data]] | ||
− | [[category: | + | [[category:data science]] |
+ | [[category:database]] | ||
+ | [[category:storage]] | ||
[[category:kafka]] | [[category:kafka]] | ||
− | |||
[[category:cassandra]] | [[category:cassandra]] | ||
− | [[category: | + | [[category:PostgreSQL]] |
+ | [[category:ClickHouse]] | ||
[[category:huihoo]] | [[category:huihoo]] |
2021年2月24日 (三) 12:09的版本
灰狐数据
目录 |
简介
一切皆数据,数据即洞察。
灰狐数据是灰狐咨询的大数据、数据存储、数据分析业务。
我们理解的大数据三剑客:Apache Cassandra、Apache Kafka 和 Elasticsearch,我们持续的深度耕耘,帮助客户构建更强大的大数据基础设施。
Elassandra = Elasticsearch + Apache Cassandra
Elasticsearch 和 Apache Cassandra 是灰狐数据的核心存储支撑,Apache Kafka 核心数据聚合和流数据平台,Metabase/Apache Superset是BI和分析门户。Elasticsearch Hadoop
Solve Hadoop's “Last Mile" Problem with Elasticsearch Use Elasticsearch to easily search Apache Hadoop data.
大数据领域的瑞士军刀变迁:MongoDB -> Elasticsearch -> ClickHouse
数据库
D3 提供数据库和存储服务
PostgreSQL 和 ClickHouse 也是我们长期提供LTS服务的核心数据库。
Huihoo Analytics:基于 Analytical DBMS ClickHouse 构建,打造一套类似 Elasticsearch Elastic Stack 的解决方案。
ChapterX 提供 πDB数据库、 一体机、服务的发展思路可借鉴。
桌面
业务
Huihoo Data Science
- Data Analytics
- Data Engineering
- 数据挖掘、统计工程、机器学习
- 数据库、数据仓库
- Kettle 数据集成、ETL
- DBeaver for Eclipse 数据库管理
- 增长营销、增长黑客
- OpenAds广告业务
- 灰狐教育、知识图谱、问答系统、智能机器人(灰狐):语言助手、聊天Bot、告警Bot、虚拟助手等等,每一个设备都住着一位Bot。
DataOps
灰狐分析
以 KNIME 分析平台为核心工作台,展开各种数据科学应用和服务。
CHAOSS 是灰狐的一项核心服务,我们围绕它建立在开源软件、开源社区的分析和治理能力,Open Distro for Elasticsearch & ClickHouse 是基础设施。
CII Best Practices Badge Program 一个蛮有趣的开源项目 可关注。
GrimoireLab & CROSSMINER Two different philosophies to measure open source community health
项目
- Huihoo Analytics:based on ClickHouse
- 关注 OpenZFS, Ceph
- Apache Kafka核心数据聚合和流数据平台
- RabbitMQ消息中间件
- SMACK堆栈
- KNIME、H2O
- PostgreSQL、Apache Cassandra
- Open data
- PyData Python for Data
图集
链接
- Huihoo.IO
- xxhadoop Data Analysis Using Hadoop/Spark/Storm/ES/ML etc. This is My Learning Notes/Code/Demo. Don't fork, Just star !
- Tushare金融大数据 给出了一个思路。