AI基础知识
常见的AI深度学习框架
PaddleSeg
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。国内的可以优先选择paddlepaddle,这是因为百度在大力推广该框架,能提供丰富的算力支持和技术支持,且百度开源了众多模型和应用,是人工智能入门的一个好选择,且能在模型上面进行一系列魔改,强烈推荐!
pytorch
是由Facebook人工智能学院提供支持服务的,目前主要在学术研究方向领域处于领先地位,许多学术论文都是用pytorch编写的,因此使用范围更广
常见的标注工具
labelImg
目前还没用过,官方已经不维护,建议用label-studio
label-studio
还没用过,docker安装
labelme
启动有点慢
常用数据集检索网站
优先尝试:
● 百度飞桨开源数据集
● OpenDataLab 引领AI大模型时代的开放数据平台
● kaggle开源数据集
● 谷歌开源数据集
● ModelScope开源数据集
● TIANCHI天池开源数据集
● HuggingFace开源数据集
● 微软开源数据集
● Roboflow Universe: Open Source Computer Vision Community
备选:
● 启智开源数据集
● 和鲸开源数据集
● openimages开源数据集
● GitHub开源数据集
● AWS亚马逊开源数据集
● LUGE千言开源数据集
● UCI开源数据集
● 计算机视觉开源数据集
● Dataju聚数力开源数据集
● Hyper超神经开源数据集
● BAAI开源数据集
注意事项:
1. 检索关键词
2. 数据集格式