29、Julia
编程数据分析领域的新星。Julia 是一个面向科学计算的高性能动态高级程序设计语言,
首先定位是通用编程语言,其次是高性能计算语言。
Julia在分布式并行化、精确数值计算等方面提供了独具特色的支持,并包含大量可扩展的数学函数库。
尤其是在线性代数、随机数生成、信号处理、字符串处理等方面,集成了众多成熟、优秀的基于C和Fortran开发的开源库,有着很高的性能与效率。
另外,Julia有着强大开放的开发者社区,贡献了大量的第三方库,并可通过内置的包(Package)管理器进行方便的安装使用。
30、Scala
Java的衍生语言,用于spark数据分析、大数据开发等。
31、Spark
一个开源集群运算框架,Spark在存储器内执行程序的运算速度能做到比Hadoop MapReduce的运算速度快上100倍,即便是执行程序于硬盘时,Spark也能快上10倍速度。
Spark允许用户将资料加载至集群存储器,并多次对其进行查询,非常适合用于机器学习算法。
32、Java
不用多说,最流行的编程语言。其在数据分析领域的应用主要是搭建大数据框架。
33、Hadoop
最流行的大数据框架,几乎大部分互联网公司都在用,如果你做大数据,肯定离不开它。
简答来说,Hadoop是一款支持数据密集型分布式应用程序,并以Apache 2.0许可协议发布的开源软件框架。它支持在商用硬件构建的大型集群上运行的应用程序。
Hadoop是根据谷歌公司发表的MapReduce和Google文件系统的论文自行实现而成。所有的Hadoop模块都有一个基本假设,即硬件故障是常见情况,应该由框架自动处理。
上一页 1 2 3 下一页关键词: 软件的分类 系统软件 操作系统 数据库管理系统 数据分析软件工具 媒体播放软件 程序设计语言 辅助教学软件 文字处理软件 语言编译程序 信息管理软件