AI基础知识

常见的AI深度学习框架

PaddleSeg

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。国内的可以优先选择paddlepaddle,这是因为百度在大力推广该框架,能提供丰富的算力支持和技术支持,且百度开源了众多模型和应用,是人工智能入门的一个好选择,且能在模型上面进行一系列魔改,强烈推荐!

pytorch

是由Facebook人工智能学院提供支持服务的,目前主要在学术研究方向领域处于领先地位,许多学术论文都是用pytorch编写的,因此使用范围更广

常见的标注工具

labelImg

目前还没用过,官方已经不维护,建议用label-studio

label-studio

还没用过,docker安装

labelme

启动有点慢

常用数据集检索网站

优先尝试:

​ ● 百度飞桨开源数据集

​ ● OpenDataLab 引领AI大模型时代的开放数据平台

​ ● kaggle开源数据集

​ ● 谷歌开源数据集

​ ● ModelScope开源数据集

​ ● TIANCHI天池开源数据集

​ ● HuggingFace开源数据集

​ ● 微软开源数据集

​ ● Roboflow Universe: Open Source Computer Vision Community

备选:

​ ● 启智开源数据集

​ ● 和鲸开源数据集

​ ● openimages开源数据集

​ ● GitHub开源数据集

​ ● AWS亚马逊开源数据集

​ ● LUGE千言开源数据集

​ ● UCI开源数据集

​ ● 计算机视觉开源数据集

​ ● Dataju聚数力开源数据集

​ ● Hyper超神经开源数据集

​ ● BAAI开源数据集

​ ● payititi帕衣提提开源数据集

注意事项:

​ 1. 检索关键词

​ 2. 数据集格式