欢迎大家赞助一杯啤酒🍺 我们准备了下酒菜:Formal mathematics/Isabelle/ML, Formal verification/Coq/ACL2, C++/F#/Lisp
Data science
小 (→文档) |
小 (→图集) |
||
第69行: | 第69行: | ||
image:foundational-methodology-for-data-science.jpg|方法论 | image:foundational-methodology-for-data-science.jpg|方法论 | ||
image:data-science-danger-zone.png|危险地带Danger Zone | image:data-science-danger-zone.png|危险地带Danger Zone | ||
+ | image:data-science-learning-roadmap.jpg|学习路线图 | ||
image:python-basics.png|Python基础 | image:python-basics.png|Python基础 | ||
image:pandas-basics.png|Pandas基础 | image:pandas-basics.png|Pandas基础 |
2017年8月5日 (六) 01:51的版本
您可以在Wikipedia上了解到此条目的英文信息 Data science Thanks, Wikipedia. |
数据科学(Data Science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学,统计,模式识别,机器学习,数据可视化,数据仓库,以及高性能计算。
数据科学通过运用各种相关的数据来帮助非专业人士理解问题。数据科学技术也可以帮助我们如何正确的处理数据并协助我们在生物,社会科学,人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助。
目录 |
职业
与数据科学相关的职业和顾问形式:
- Data Scientist, 受聘 Google ...
- Data Analyst, 受聘 IBM ...
- Data Architect, 受聘 VISA ...
- Data Engineer, 受聘 Facebook ...
- Statistician, 受聘 Linkedin ...
- Database Administrator, 受聘 Twitter...
- Business Analyst, 受聘 Oracle...
- Data and Analytics Manager, 受聘 Coursera...
点击大图,看详解。
数据科学家
数据科学家的定义数据科学(Data Science)是从数据中提取知识的研究,关键是科学。数据科学集成了多种领域的不同元素,包括信号处理,数学,概率模型技术和理论,机器学习,计算机编程,统计学,数据工程,模式识别和学习,可视化,不确定性建模,数据仓库,以及从数据中析取规律和产品的高性能计算。数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。
数据科学的从业者被称为数据科学家。数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。不远的将来,数据科学家们需要精通一门、两门甚至多门学科,同时使用数学,统计学和计算机科学的生产要素展开工作。所以数据科学家就如同一个team。
曾经投资过Facebook,LinkedIn的格雷洛克风险投资公司把数据科学家描述成“能够管理和洞察数据的人”。在IBM的网站上,数据科学家的角色被形容成“一半分析师,一半艺术家”。他们代表了商业或数据分析这个角色的一个进化。
数据科学家需要具备的能力:
- 数据科学家倾向于用探索数据的方式来看待周围的世界。(好奇心)
- 把大量散乱的数据变成结构化的可供分析的数据,还要找出丰富的数据源,整合其他可能不完整的数据源,并清理成结果数据集。(问题分体整理能力)
- 新的竞争环境中,挑战不断地变化,新数据不断地流入,数据科学家需要帮助决策者穿梭于各种分析,从临时数据分析到持续的数据交互分析。(快速学习能力)
- 数据科学家会遇到技术瓶颈,但他们能够找到新颖的解决方案。(问题转化能力)
- 当他们有所发现,便交流他们的发现,建议新的业务方向。(业务精通)
- 他们很有创造力的展示视觉化的信息,也让找到的模式清晰而有说服力。(表现沟通能力)
- 他们会把蕴含在数据中的规律建议给Boss,从而影响产品,流程和决策。(决策力)
来源:知乎
项目
- Top 10 Data Science Resources on Github
- R Project
- Incanter
- Anaconda python
- Apache Spark
- Apache Flink
- Apache Hama
- Weka
- GNU Octave
- Caffe
- Torch
- TensorFlow
- Julia
- Natural Language Toolkit
- data-science-ipython-notebooks
公司
文档
- An Introduction to Data Science
- Java and Data Science in Digital Advertising
- Eclipse and the World of Data Science