Datasets.from_pandas pandas Dataframe 형에서 huggingface에서 지원하는 Dataset 형으로 바꿔주는 메소드이다. import pandas as pd from datasets import Dataset df = pd.read_csv('./dataset.csv') dataset = Dataset.from_pandas(df) train과 test로 split하는 방법은 아래와 같다. import pandas as pd from datasets import Dataset df = pd.read_csv('.
/dataset.csv') dataset = Dataset.from_pandas(df).train_test_split(test_size=0.2) train_dataset = dataset['train'] test_dataset = dataset['test'] sklearn과 거의 유사하게 구현되어있는 것 같다. Datasets Join the Hugg...