Python自然语言处理工具包
NLTK(Natural Language Toolkit)自然语言工具包——是一套开源Python模块、数据集和教程,支持自然语言处理的研究和开发。NLTK需要Python版本3.7、3.8、3.9、3.10或3.11。
Label Studio 是 Human Signal(原Heartext)推出的一个开源的数据标注平台,GitHub 上该项目标星近1.4万,可帮助开发人员微调大语言模型、准备训练数据或验证 AI 模型。
开源深度学习平台
UC伯克利研究推出的深度学习框架
LangChain是一个用于开发由语言模型驱动的应用程序的框架,允许开发人员将语言模型连接到其他数据源并与其环境相交互。
Google推出的机器学习和人工智能开源库
Lightning AI是一个构建模型和构建/发布Lightning Apps(ML工作流模板)的平台,由Pytorch Lightning团队推出——一个快速训练、部署和开发人工智能产品的深度学习框架。