快捷方式

OnlineReader

class torchdata.datapipes.iter.OnlineReader(source_datapipe: IterDataPipe[str], *, timeout: Optional[float] = None, skip_on_error: bool = False, **kwargs: Optional[Dict[str, Any]])

获取文件 URL(可以是指向文件的 HTTP URL 或指向 GDrive 文件的 URL),并生成文件 URL 和 IO 流的元组(函数名称:read_from_remote)。

参数:
  • source_datapipe – 包含 URL 的 DataPipe

  • timeout – HTTP 请求的超时时间(秒)

  • skip_on_error – 是否跳过导致问题的 URL,否则会引发异常

  • **kwargs – 一个字典,用于传递请求接受的可选参数。有关完整列表,请查看 https://docs.python-requests.org/en/master/api/

示例

from torchdata.datapipes.iter import IterableWrapper, OnlineReader

file_url = "https://raw.githubusercontent.com/pytorch/data/main/LICENSE"
online_reader_dp = OnlineReader(IterableWrapper([file_url]))
reader_dp = online_reader_dp.readlines()
it = iter(reader_dp)
path, line = next(it)
print((path, line))

输出

('https://raw.githubusercontent.com/pytorch/data/main/LICENSE', b'BSD 3-Clause License')

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并解答您的问题

查看资源