1. 查看账号下所有数据集列表
dataset_name=Client.ds_list(<YOUR_ACCESSKEY>)
2. 获取数据集实例
import dfs
client = dfs.Client(access_token=<YOUR_ACCESSKEY>,dataset_id=<DATASET_ID>)
YOUR_ACCESSKEY
:
Step 1.1 中获得的个人AccessKey
DATASET_ID
:
具体的数据集的 ID:
获取方式一 通过查看数据集获取数据集 ID:
获取方式二 通过编辑框复制数据集 ID:
- 获取方式三 第1步所有数据集列表中就包含该值
3. 给定需要拉取的数据集类型
lmdownloader=LMDataset(client, segment_name='train')
4. 数据集长度
len(lmdownloader)
5. 从数据集中读
# 读取索引0处的值
url, labels = lmdownloader[0]
# 当文件是图片时,可使用以下功能解码
img = decode_img(url,backend="cv2")