데이터 커넥터¶
Driverless AI는 외부 데이터 소스 액세스를 위해 다양한 데이터 커넥터를 제공합니다. 기본적으로 다음 데이터 연결 유형이 활성화됩니다.
upload: 표준 업로드 기능file: 로컬 파일 시스템/서버 파일 시스템hdfs: Hadoop 파일 시스템, HDFS 구성 폴더 경로 및 Key tab을 구성해야 함을 잊지 마십시오s3: Amazon S3, 선택적인 비밀 및 액세스 키 구성recipe_file: 사용자 정의 레시피 파일 업로드recipe_url: URL을 통한 사용자 정의 레시피 업로드
또한 enabled_file_systems 구성 옵션(Native 설치) 또는 환경 변수(Docker 이미지 설치)의 수정을 통해 다음 연결 유형의 활성화가 가능합니다.
dtap: Blue Data Tap 파일 시스템, DTap 섹션을 구성하는 것을 기억하십시오gcs: Google Cloud Storage,gcs_path_to_service_account_json을 구성하는 것을 기억하십시오gbq: Google Big Query,gcs_path_to_service_account_json을 구성하는 것을 기억하십시오hive: Hive 커넥터, Hive를 구성하는 것을 기억하십시오minio: Minio Cloud Storage,secret and access key를 구성을 기억하십시오snow: Snowflake Data Warehouse, Snowflake 자격 증명을 구성하는 것을 기억하십시오kdb: KDB+ Time Series 데이터베이스, KDB 자격 증명을 구성하는 것을 기억하십시오azrbs: Azure Blob Storage, Azure 자격 증명을 구성하는 것을 기억하십시오jdbc: JDBC Connector, JDBC를 구성하는 것을 기억하십시오
이러한 데이터 소스는 파일 시스템의 형태로 노출되며 각각의 파일 시스템에는 고유한 접두사가 붙습니다. 예:
S3 데이터 참조는
s3://를 사용하십시오.HDFS 데이터 참조는 접두사
hdfs://를 사용하십시오.Azure Blob Store 데이터 참조는
https://<storage_name>.blob.core.windows.net.을 사용하십시오BlueData Datatap 데이터 참조는
dtap://를 사용하십시오.Google BigQuery 데이터 참조는 Google BigQuery 데이터 세트 및 쿼리할 테이블을 알아야 합니다. 표준 SQL 쿼리를 사용하여 데이터를 수집하십시오.
Google Cloud Storage 데이터 참조는
gs://를 사용하십시오.kdb+ 데이터 참조는 호스트 이름 및 포트
http://<kdb_server>:<port>를 사용하십시오.Minio 데이터 참조는
http://<endpoint_url>를 사용하십시오.Snowflake 데이터 참조는 표준 SQL 쿼리를 사용하여 데이터를 수집하십시오.
JDBC를 통해 SQL 데이터베이스에 액세스하기 위해서는 데이터베이스와 관련된 구문으로 SQL 쿼리를 사용하십시오.
자세한 정보는 다음 섹션을 참조하십시오.