数据科学工具如下:
1、SciPy。
SciPy (pronounced "Sigh Pie") 是一个开源的数学、科学和工程计算包。SciPy使用NumPy,IPython或Pandas等各种软件包为常用的数学和科学编程任务提供库。当你想操纵计算机上的数字并显示或发布结果时,此工具是一个很好的选择,并且它也是免费的。
2、Dask。
Dask 是一个用于分析计算的灵活的并行计算库。同样,通过更改只有几行代码,你可以快速对现有代码进行并行处理,因为它的DataFrame与Pandas库中的相同,它的Array对象的工作方式类似于NumPy能够并行化以纯Python编写。
3、Numba。
此工具是一种开源优化编译器,它使用LLVM编译器基础结构将Python语法编译为机器码。在数据科学应用中使用Numba的主要优势在于它使用NumPy数组来加速应用程序的能力,因为Numba是一个支持NumPy的编译器。就像Scikit-Learn一样,Numba也适用于机器学习应用。