[database] DuckDB 오류 있는 csv 파일 읽기 / Rejects Table
csv 파일의 경우 휴먼 에러 등을 통해 다양한 오류가 발생할 수 있는데, DuckDB에서 오류가 있는 줄을 건너뛰는 기능을 포함해 오류 메시지와 오류가 있는 줄을 임시 테이블에 저장 해 주는 기능이 있어 기록해 본다. DuckDB의 구조적 오류 지원 부분 CAST - CSV 파일의 열을 예상된 스키마 값으로 캐스팅 할수 없는 경우 오류가 발생한다. MISSING COLUMNS - CSV 파일의 줄이 예상보다 적은 경우 발생 TOO MANY COLUMNS - CSV 파일의 한 줄에 예상보다 많은 열이 있는 경우 발생 UNQUOTED VALUE - CSV의 따옴표로 묶인 값에 따옴표를 중복으로 묶은 경우 발생 LINE SIZE OVER MAXIMUM - CSV 파일이 가질 수 있는 최대 줄 크기 초과 할 경우 발생 (기본 2,097,152바이트로 설정) INVALID UNICODE - UTF-8 문자열만 지원하는데, UTF-8문자가 아닌 다른 문자가 포함된 경우 발생 ignore_er