웹 기반 All-in-One 데이터 사이언스 플랫폼
Dataiku
Dataiku(다타이쿠)는 효율적인 데이터 분석 및 머신러닝 프로젝트를 위한 웹 기반 All-in-One 데이터 사이언스 플랫폼입니다.
데이터 전처리 및 시각화, 통계와 머신러닝의 모든 과정을 GUI 기반 Workflow로 구성하여 쉽고 빠르게 프로토타입을 생성하고 예측모델을 실시간으로 운영환경에 배포하여 생산성을 크게 향상시킬 수 있습니다.



주요 특징

01신속한 파일럿 프로젝트 수행 및 검증
  • 클릭만으로 데이터 전처리가 가능한 Visual Recipe 제공
  • 자동화된 피처 엔지니어링을 통한 빠른 머신러닝 모델 생성
  • 내장된 State-of-the-art 머신러닝 라이브러리를 이용한 동시 학습
  • GUI 기반의 간편한 예측 및 분류 모델 생성
02조직 간 유연한 협업을 통한 생산성 증대
  • 이력관리가 가능한 커뮤니케이션 기능으로 빠른 협업
  • 부서 담당자 별 정확한 작업 할당 가능
  • WIKI 페이지 제공으로 체계적인 프로젝트 관리 (자료 공유, 일정 관리 등)
03효과적인 모델 학습 관리로 빠른 업데이트
  • 특정 지표에 대한 다수 모델 평가 기능
  • Explainable AI를 위한 모델별 성능 지표를 한번에 확인
  • 모델별 학습, 속성 순서 이력 제공
04간편하고 빠른 모델 배포 및 관리
  • API Deployer를 통한 머신러닝 모델의 간편한 배포 및 관리
  • 확장 가능한 API Node를 통한 머신러닝 모델 서비스 부하 분산
  • Docker, Kubernetes와의 연동 모듈 제공

주요 기능

다양한 데이터 소스와 연동 기능


ㆍHadoop 포함 30개 이상의 빌트인 커넥터 제공ㆍ커스텀 커넥터를 통한 맞춤형 데이터 저장소 연결


머신러닝 모델 생성 및 관리 기능


ㆍ클릭만으로 머신러닝 모델을 생성, 평가ㆍ머신러닝 모델 개발을 위한 시각적인 단계별 프로세스ㆍGrid Search 기반 최적 모델 선택 및 편리한 모델 업데이트


사용자의 수준에 따른 다양한 전처리 기능


ㆍGUI 기반의 내장 기능(Join, Group, Sort, Pivot, etc.)을 활용하여 코드 개발 없이 클릭만으로 분석ㆍ대표적인 데이터 분석 언어(Python, R, Scala, etc.)로 코드를 작성하여 분석


플러그인을 통한 코드 재사용 기능


ㆍ대표적인 데이터 분석 언어(Python, R, Scala, etc.)로 작성한 코드를 플러그인으로 변환하여 재사용 (전처리 코드, 모델(통계 모델, 머신러닝 모델, 딥러닝 모델 등) 코드)ㆍHTML, JS, CSS 기반의 웹 어플리케이션을 플러그인으로 변환하여 재사용


간편한 데이터 분석 기능


ㆍ전체 데이터에 대한 직관적인 뷰어 제공ㆍDrag&Drop 방식의 통계 분석 및 상관관계 분석 기능ㆍDrag&Drop 방식의 기본 차트 생성 기능


Dataiku Data Science Studio 활용 방안 예시

  • (Case 1) 단발성 데이터 사이언스 프로젝트에서의 활용

    • 다양한 기능을 활용한 신속한 프로젝트 수행
    • 개별적 코드 환경 관리 및 Jupyter notebook 지원으로 분석 편의성 제공
    • 대시보드 및 리포트 기능을 활용하여 프로젝트의 결과 정리 및 공유
  • (Case 2) 자동화 기능 기반으로 데이터 파이프라인 구축에서의 활용

    • 이기종 데이터 소스에서 데이터셋을 구성하는 데이터 파이프라인의 간편한 설계
    • 시나리오 기능을 활용하여 데이터셋 업데이트 및 보고서 생성 자동화
  • (Case 3) 모델 서비스 제공을 목표로 하는 데이터팀에서의 활용

    • 다양한 프로젝트의 신속한 수행으로 효율적인 데이터 분석 업무 수행
    • 간편한 모델 배포를 기반으로 모델 활용 부서에 신속한 서비스 제공
    • Plug-in, Sample Code 등의 기능으로 코드 재사용성 강화

주요 고객

제 품문 의
top