TFRecord File Format은 Tensorflow의 자체적인 Binary File Format입니다. 대규모 Dataset으로 작업을 할 경우 Binary File로 작업을 한다면 Data Input Pipeline의 효율을 높일 수 있으며, 결과적으로 전체적인 Model의 Training 시간도 향상될 수 있습니다.
Binary Data는 Storage에 공간도 덜 차지할 뿐 아니라, Read / Write시에도 더 효율적입니다. 더욱이, Storage가 Motor를 사용하는 장치라면 더욱 그렇습니다.
단순히 TFReocrd File Format이 Binary여서 성능 향상을 이룬다는 것이 아니라, TFRecord가 Tensorflow에 최적화 되어 있기 때문에 Tensorflow가 제공하는 다양한 Library와 같이 사용될 경우에 그 성능은 최고가 됩니다. TFRecord File Format에 대한 공식 문서는 아래 Link를 참고해 주시기 바랍니다.
TFRecord...
#
AI
#
Learning
#
module
#
num_parallel_calls
#
Pipeline
#
Preparation
#
Protobuf
#
Pytorch
#
SerializeToString
#
Tensorflow
#
tfdata
#
TFRecord
#
TFRecordWriter
#
torch
#
LargeDatasetHandling
#
keras
#
AUTOTUNE
#
Binary
#
CNN
#
Dataset
#
Deep
#
DL
#
EfficientNet
#
Engineering
#
Extraction
#
Feature
#
from_tensor_slices
#
Image
#
JAX
#
Tutorial
원문 링크 : Making TFReocrd File