首页 > IT圈内 > 吐血整理,程序员们千万不能错过的python库
2021
09-17

吐血整理,程序员们千万不能错过的python库

Python语言作为现如今一大主流语言,拥有着入门简单,功能强大,语言表达优美,代码开发效率高,是多个大厂开源机器学习框架语言。作为处在互联网时代的我们,不管是想要入IT行业的新手小啰啰、Linux系统运维人员、数据分析师或者是在职想要转python的程序员们都在使用这种语言,可是,你们了解python库吗?你收藏了多少呢?这次将给大家分享我和同事们的压箱宝贝,都是一些非常独特且使用起来的很有趣的python包。

用于数据可视化的Python库

  • Matplotlib-是Python中最流行的数据可视化库,Python 2D 绘图库
  • Seaborn-一个基于matplotlib的绘图库
  • Bokeh-一个面向现代网页浏览器的交互式可视化库
  • plotly – 协同 Python 和 matplotlib 工作的 web 绘图库。

数据清理和操作

  • ftfy:修复mojibake和Unicode文本中的其他故障。
  • janitor:有很多很酷的功能来清理数据。
  • Optimus:另一个数据清理包。
  • Great-experctations:一个检查数据是否符合预期的好工具。

数据探索和建模

  • Pandas-profile:创建一个包含来自pandas Data Frame的统计数据的HTML报告。
  • dabl:允许使用可视化和预处理进行数据探索。
  • pydqc:允许比较两个数据集之间的统计数据。
  • pandas-summary:对panda Data Frames描述功能的扩展。
  • pivottable-js:pands在jupyter notebook的拖放功能。

数据结构

  • Bounter:有效的计数器,使用有限(有界)的数量的内存,无论数据大小。
  • Python -bloomfilter:可扩展的Bloom Filter,使用Python实现。
  • datasketch:提供概率数据结构,如LSH、加权Min Hash、Hyper LogLog等。
  • ranges:Python的连续范围、范围集和范围令数据结构

性能检查和优化

  • Py-spy: Python程序的采样分析器。
  • pyperf:用于运行Python基准测试的工具箱。
  • snakeviz:一个浏览器内的Python配置文件查看器,对jupyter notebook有很大的支持。
  • Cachier: Python函数的持久、无延迟、本地和跨机缓存。
  • Faiss:用于高效的相似性搜索和密集向量聚类的库。

以上就是这次的分享内容,当然这只是我们自己总结出来的比较优秀的,欢迎持续关注编程学习网

扫码芷若 获取免费视频学习资料

编程学习

查 看2019高级编程视频教程免费获取