数据输入输出¶
数据输入¶
Fluid支持两种数据输入方式,包括:
1. Python Reader: 纯Python的Reader。用户在Python端定义 fluid.layers.data
层构建网络,并通过
executor.run(feed=...)
的方式读入数据。数据读取和模型训练/预测的过程是同步进行的。
2. PyReader: 高效灵活的C++ Reader接口。PyReader内部维护容量为 capacity
的队列(队列容量由
fluid.layers.py_reader
接口中的 capacity
参数设置),Python端调用队列的 push
方法送入训练/预测数据,C++端的训练/预测程序调用队列的 pop
方法取出Python端送入的数据。PyReader可与
double_buffer
配合使用,实现数据读取和训练/预测的异步执行。
具体使用方法请参考 py_reader。
数据输出¶
Fluid支持在训练/预测阶段获取当前batch的数据。
用户可通过 executor.run(fetch_list=[...], return_numpy=...)
的方式
fetch期望的输出变量,通过设置 return_numpy
参数设置是否将输出数据转为numpy array。
若 return_numpy
为 False
,则返回 LoDTensor
类型数据。
具体使用方式请参考相关API文档 Executor 和 ParallelExecutor。