22. MySQL-connector-python
- 类型:第三方库
- 描述:MySQL官方驱动连接程序
- 推荐度:★★★
23. pymysql
- 类型:第三方库
- 描述:MySQL连接库,支持Python3
- 推荐度:★★★
24. MySQL-python
- 类型:第三方库
- 描述:MySQL连接库
- 推荐度:★★
25. cx_Oracle
- 类型:第三方库
- 描述:Oracle连接库
- 推荐度:★★★
26. psycopg2
- 类型:第三方库
- 描述:Python编程语言中非常受欢迎的PostgreSQL适配器
- 推荐度:★★★
27. Redis
- 类型:Python标准库
- 描述:Redis连接库
- 推荐度:★★★
28. pymongo
- 类型:第三方库
- 描述:MongoDB官方驱动连接程序
- 推荐度:★★★
29. HappyBase
- 类型:第三方库
- 描述:HBase连接库
- 推荐度:★★★
30. py2neo
- 类型:第三方库
- 描述:Neo4j连接库
- 推荐度:★★★
31. cassandra-driver
- 类型:第三方库
- 描述:Cassandra(1.2 )和DataStax Enterprise(3.1 )连接库
- 推荐度:★★★
32. sqlite3
- 类型:Python标准库
- 描述:Python自带的模块,用于操作SQLite数据库
- 推荐度:★★★
33. pysqlite2
- 类型:第三方库
- 描述:SQLite 3.x连接库
- 推荐度:★★
34. bsddb3
- 类型:第三方库
- 描述:Berkeley DB连接库
35. bsddb
- 类型:Python标准库
- 描述:Python自带的模块,提供了一个到Berkeley DB库的接口
- 推荐度:★★
36. dbhash
- 类型:Python标准库
- 描述:Python自带的模块,dbhash模块提供了使用BSD数据库库打开数据库的功能。该模块镜像了提供对DBM样式数据库访问的其他Python数据库模块的接口。bsddb模块需要使用dbhash
- 推荐度:★★
37. adodb
- 类型:第三方库
- 描述:ADOdb是一个数据库抽象库,支持常见的数据和数据库接口并可自行进行数据库扩展,该库可以对不同数据库中的语法进行解析和差异化处理,具有很高的通用性
- 推荐度:★★★
38. SQLObject
- 类型:第三方库
- 描述:SQLObject是一种流行的对象关系管理器,用于向数据库提供对象接口,其中表为类、行为实例、列为属性
- 推荐度:★★
39. SQLAlchemy
- 类型:第三方库
- 描述:SQLAlchemy是Python SQL工具包和对象关系映射器,为应用程序开发人员提供了SQL的全部功能和灵活性控制
- 推荐度:★★
40. ctypes
- 类型:第三方库
- 描述:ctypes是Python的一个外部库,提供和C语言兼容的数据类型,可以很方便地调用C DLL中的函数
- 推荐度:★★★
41. pyodbc
- 类型:第三方库
- 描述:Python通过ODBC访问数据库的接口库
- 推荐度:★★★
42. Jython
- 类型:第三方库
- 描述:Python通过JDBC访问数据库的接口库
- 推荐度:★★★
数据清洗转换主用于数据正式应用之前的预处理工作。
43. frozenset([iterable])
- 类型:Python内置函数
- 描述:返回一个新的frozenset对象,可选择从iterable取得的元素
- 推荐度:★★★
44. int(x)
- 类型:Python内置函数
- 描述:返回x的整数部分
- 推荐度:★★★
45. isinstance(object, classinfo)
- 类型:Python内置函数
- 描述:返回object是否是指定的classinfo实例信息
- 推荐度:★★★
46. len(s)
- 类型:Python内置函数
- 描述:返回对象的长度或项目数量
- 推荐度:★★★
47. long(x)
- 类型:Python内置函数
- 描述:返回由字符串或数字x构造的长整型对象
- 推荐度:★★★
48. max(iterable[, key])
- 类型:Python内置函数
- 描述:返回一个可迭代或最大的两个或多个参数中的最大项
- 推荐度:★★★
49. min(iterable[, key])
- 类型:Python内置函数
- 描述:返回一个可迭代或最大的两个或多个参数中的最小项
- 推荐度:★★★
50. range(start, stop[, step])
- 类型:Python内置函数
- 描述:用于与for循环一起创建循环列表,通过指定start(开始)、stop(结束)和step(步长)控制迭代次数并获取循环值
- 推荐度:★★★
51. raw_input(prompt)
- 类型:Python内置函数
- 描述:捕获用户输入并作为字符串返回(不推荐使用input作为用户输入的捕获函数)
- 推荐度:★★★
52. round(number[, ndigits])
- 类型:Python内置函数
- 描述:返回number小数点后ndigits位的四舍五入的浮点数
- 推荐度:★★★
53. set([iterable])
- 类型:Python内置函数
- 描述:返回一个新的集合对象,可选择从iterable获取的元素
- 推荐度:★★★
54. slice(start, stop[, step])
- 类型:Python内置函数
- 描述:返回表示由范围(start、stop、step)指定的索引集的切片对象
- 推荐度:★★
55. sorted(iterable[, cmp[, key[, reverse]]])
- 类型:Python内置函数
- 描述:从iterable的项中返回一个新的排序列表
- 推荐度:★★★
56. xrange(start, stop[, step])
- 类型:Python内置函数
- 描述:此函数与range()非常相似,但返回一个xrange对象而不是列表
- 推荐度:★★★
57. string
- 类型:Python标准库
- 描述:字符串处理库,可实现字符串查找、分割、组合、替换、去重、大小写转换及其他格式化处理
- 推荐度:★★★
58. re
- 类型:Python标准库
- 描述:正则表达式模块,在文本和字符串处理中经常使用
- 推荐度:★★★
59. random
- 类型:Python标准库
- 描述:该模块为各种分布实现伪随机数生成器,支持数据均匀分布、正态(高斯)分布、对数正态分布、负指数分布、伽马和β分布等
- 推荐度:★★★
60. os
- 类型:Python标准库
- 描述:用于新建、删除、权限修改、切换路径等目录操作,以及调用执行系统命令
- 推荐度:★★★
61. os.path
- 类型:Python标准库
- 描述:针对目录的遍历、组合、分割、判断等操作,常用于数据文件的判断、查找、合并
- 推荐度:★★★
62. prettytable
- 类型:Python标准库
- 描述:格式化表格输出模块
- 推荐度:★★
63. json
- 类型:Python标准库
- 描述:Python对象与json对象的转换
- 推荐度:★★★
64. base64
- 类型:Python标准库
- 描述:将任意二进制字符串编码和解码为文本字符串的Base16,Base32和Base64
- 推荐度:★★★
数据计算和统计分析主要用于数据探查、计算和初步数据分析等工作。
65. numpy
- 类型:第三方库
- 描述:NumPy是Python科学计算的基础工具包,很多Python数据计算工作库都依赖它
- 推荐度:★★★
66. scipy
- 类型:第三方库
- 描述:Scipy是一组专门解决科学和工程计算不同场景的主题工具包
- 推荐度:★★★
67. pandas
- 类型:第三方库
- 描述:Pandas是一个用于Python数据分析的库,它的主要作用是进行数据分析。Pandas提供用于进行结构化数据分析的二维的表格型数据结构DataFrame,类似于R中的数据框,能提供类似于数据库中的切片、切块、聚合、选择子集等精细化操作,为数据分析提供了便捷
- 推荐度:★★★
68. statsmodels
- 类型:第三方库
- 描述:Statsmodels是Python的统计建模和计量经济学工具包,包括一些描述性统计、统计模型估计和统计测试,集成了多种线性回归模型、广义线性回归模型、离散数据分布模型、时间序列分析模型、非参数估计、生存分析、主成分分析、核密度估计以及广泛的统计测试和绘图等功能
- 推荐度:★★★
69. abs(x)
- 类型:Python内置函数
- 描述:返回x的绝对值
- 推荐度:★★★
70. cmp(x, y)
- 类型:Python内置函数
- 描述:比较两个对象x和y,并根据结果返回一个整数。如果x <y,则返回值为负数,如果x == y则为零,如果x> y则返回值为正
- 推荐度:★★
71. float(x)
- 类型:Python内置函数
- 描述:返回从数字或字符串x构造的浮点数
- 推荐度:★★★
72. pow(x, y[, z])
- 类型:Python内置函数
- 描述:返回x的y次幂。如果z存在,则返回x的y次幂,模z
- 推荐度:★★★
73. sum(iterable[, start])
- 类型:Python内置函数
- 描述:从左到右依次迭代,返回总和
- 推荐度:★★★
74. math
- 类型:Python标准库
- 描述:数学函数库,包括正弦、余弦、正切、余切、弧度转换、对数运算、圆周率、绝对值、取整等数学计算方法
- 推荐度:★★★
75. cmath
- 类型:Python标准库
- 描述:与math基本一致,区别是cmath运算的是复数
- 推荐度:★★
76. decimal
- 类型:Python标准库
- 描述:10进制浮点运算
- 推荐度:★★
77. fractions
- 类型:Python标准库
- 描述:分数模块提供对有理数算术的支持
- 推荐度:★★
自然语言处理和文本挖掘库主要用于以自然语言文本为对象的数据处理和建模。
78. nltk
- 类型:第三方库
- 描述:NLTK是一个Python自然语言处理工具,它用于对自然语言进行分类、解析和语义理解。目前已经有超过50种语料库和词汇资源
- 推荐度:★★★
79. pattern
- 类型:第三方库
- 描述:Pattern是一个网络数据挖掘Python工具包,提供了用于网络挖掘(如网络服务、网络爬虫等)、自然语言处理(如词性标注、情感分析等)、机器学习(如向量空间模型、分类模型等)、图形化的网络分析模型
- 推荐度:★★★
80. gensim
- 类型:第三方库
- 描述:Gensim是一个专业的主题模型(发掘文字中隐含主题的一种统计建模方法)Python工具包,用来提供可扩展统计语义、分析纯文本语义结构以及检索语义上相似的文档
- 推荐度:★★★
81. 结巴分词
- 类型:第三方库
- 描述:结巴分词是国内流行的Python文本处理工具包,分词模式分为三种模式:精确模式、全模式和搜索引擎模式,支持繁体分词、自定义词典等,是非常好的Python中文分词解决方案,可以实现分词、词典管理、关键字抽取、词性标注等
- 推荐度:★★★
82. SnowNLP
- 类型:第三方库
- 描述:SnowNLP是一个Python写的类库,可以方便的处理中文文本内容。该库是受到了TextBlob的启发而针对中文处理写的类库,和TextBlob不同的是这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典
- 推荐度:★★
83. smallseg
- 类型:第三方库
- 描述:Smallseg是一个开源的、基于DFA的轻量级的中文分词工具包。可自定义词典、切割后返回登录词列表和未登录词列表、有一定的新词识别能力
- 推荐度:★★
84. spaCy
- 类型:第三方库
- 描述:spaCy是一个Python自然语言处理工具包,它结合Python和Cython使得自然语言处理能力达到了工业强度
- 推荐度:★★★
85. TextBlob
- 类型:第三方库
- 描述:TextBlob 是一个处理文本数据的Python库,可用来做词性标注、情感分析、文本翻译、名词短语抽取、文本分类等
- 推荐度:★★
86. PyNLPI
- 类型:第三方库
- 描述:PyNLPI是一个适合各种自然语言处理任务的集合库,可用于中文文本分词、关键字分析等,尤其重要的是其支持中英文映射,支持UTF-8和GBK编码的字符串等
- 推荐度:★★★
87. synonyms
- 类型:第三方库
- 描述:中文近义词工具包,可用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。
- 推荐度:★★★
图像处理和视频处理主要适用于基于图像的操作、处理、分析和挖掘,如人脸识别、图像识别、目标跟踪、图像理解等。