DataLoaderTensorflow

`jax_dataloader.loaders.tensorflow.DataLoaderTensorflow` ¤

Bases: BaseDataLoader

Tensorflow Dataloader

Source code in jax_dataloader/loaders/tensorflow.py

class DataLoaderTensorflow(BaseDataLoader):
    """Tensorflow Dataloader"""

    @typecheck
    def __init__(
        self, 
        dataset: Union[JAXDataset, TFDataset, HFDataset],
        batch_size: int = 1,  # Batch size
        shuffle: bool = False,  # If true, dataloader shuffles before sampling each batch
        drop_last: bool = False, # Drop last batch or not
        generator: Optional[GeneratorType] = None, # Random seed generator
        **kwargs
    ):
        super().__init__(dataset, batch_size, shuffle, drop_last)
        check_tf_installed()
        # get random seed from generator
        seed = get_seed(generator)

        # Convert to tf dataset
        ds = to_tf_dataset(dataset)
        ds = ds.shuffle(buffer_size=len(dataset), seed=seed) if shuffle else ds
        ds = ds.batch(batch_size, drop_remainder=drop_last)
        ds = ds.prefetch(tf.data.AUTOTUNE)
        self.dataloader = ds

    def __len__(self):
        return len(self.dataloader)

    def __next__(self):
        return next(self.dataloader)

    def __iter__(self):
        return self.dataloader.as_numpy_iterator()

Attributes¤

`dataloader = ds` `instance-attribute` ¤

Functions¤

`init(dataset: Union[JAXDataset, TFDataset, HFDataset], batch_size: int = 1, shuffle: bool = False, drop_last: bool = False, generator: Optional[GeneratorType] = None, **kwargs)` ¤

Source code in jax_dataloader/loaders/tensorflow.py

@typecheck
def __init__(
    self, 
    dataset: Union[JAXDataset, TFDataset, HFDataset],
    batch_size: int = 1,  # Batch size
    shuffle: bool = False,  # If true, dataloader shuffles before sampling each batch
    drop_last: bool = False, # Drop last batch or not
    generator: Optional[GeneratorType] = None, # Random seed generator
    **kwargs
):
    super().__init__(dataset, batch_size, shuffle, drop_last)
    check_tf_installed()
    # get random seed from generator
    seed = get_seed(generator)

    # Convert to tf dataset
    ds = to_tf_dataset(dataset)
    ds = ds.shuffle(buffer_size=len(dataset), seed=seed) if shuffle else ds
    ds = ds.batch(batch_size, drop_remainder=drop_last)
    ds = ds.prefetch(tf.data.AUTOTUNE)
    self.dataloader = ds

`iter()` ¤

Source code in jax_dataloader/loaders/tensorflow.py

def __iter__(self):
    return self.dataloader.as_numpy_iterator()

`len()` ¤

Source code in jax_dataloader/loaders/tensorflow.py

def __len__(self):
    return len(self.dataloader)

`next()` ¤

Source code in jax_dataloader/loaders/tensorflow.py

def __next__(self):
    return next(self.dataloader)

DataLoaderTensorflow

jax_dataloader.loaders.tensorflow.DataLoaderTensorflow ¤

Attributes¤

dataloader = ds instance-attribute ¤

Functions¤

__init__(dataset: Union[JAXDataset, TFDataset, HFDataset], batch_size: int = 1, shuffle: bool = False, drop_last: bool = False, generator: Optional[GeneratorType] = None, **kwargs) ¤

__iter__() ¤

__len__() ¤

__next__() ¤

`jax_dataloader.loaders.tensorflow.DataLoaderTensorflow` ¤

`dataloader = ds` `instance-attribute` ¤

`init(dataset: Union[JAXDataset, TFDataset, HFDataset], batch_size: int = 1, shuffle: bool = False, drop_last: bool = False, generator: Optional[GeneratorType] = None, **kwargs)` ¤

`iter()` ¤

`len()` ¤

`next()` ¤