레이피드마이너

From CS Wiki

동명의 회사에서 개발한 데이터 및 통계 분석용 소프트웨어

  • 국내보다는 해외에서 많이 사용

주요 기능[edit | edit source]

  • 데이터 전처리 및 시각화
  • 기계학습, 딥 러닝, 텍스트 마이닝
  • 예측 분석 및 통계 모델링
  • ETL
  • 교육, 연구, 그리고 데이터 처리, 시각화, 모델 평가 그리고 최적화 등을 포함한 기계학습 과정 등을 제공하는 어플리케이션을 개발 및 지원하는 사업과 상업용 어플리케이션에 활용
  • 분석을 위한 다양한 기능과 알고리즘들을 GUI 방식으로 구현
  • 학습 스키마, 모델 및 알고리즘을 제공하며 R 및 Python 스크립트를 사용하여 확장 가능
  • Marketplace를 통해 제공되는 추가 플러그인 적용 가능
  • Drag & Drop만으로 프로그래밍없이 분류와 패턴 발견 등의 복잡한 분석 가능
  • 다른 프로그래밍 언어 프로그램에서 불러오거나 API로 사용 가능
    • Excel이나 CSV, XML, SPSS, SAS 파일 등의 데이터뿐만 아니라 각종 상용 데이터베이스와 연계 가능

가격 및 라이선스 정책[edit | edit source]

  • 무료 버전은 하나의 논리 회로와 1만개의 데이터를 제공(공개 소프트웨어)
  • 상업용 래피드마이너는 2,500$부터 시작

역사[edit | edit source]

래피드마이너는 원래 YALE (Yet Another Learning Environment)라는 이름을 사용했었다. 2001년에 Ralf Klinkenberg와 Ingo Mierswa, Simon Fischer이 도르트먼드 기술대학(Technical University of Dortmund) 인공지능단과대학에서 개발하였다.[1] 2006년 초, Ingo Mierswa와 Ralf Klinkenberg가 설립한 Rapid-I라는 회사에서 개발이 시작되었다.[2] 2007년, 래피드마이너는 YALE이라는 기존의 명칭을 바꿨다. 2013년에는 래피드-I라는 회사는 개명을 하며 래피드마이너라는 이름을 사용하게 되었다.[3]

래피드마이너는 2001년 도르트문트 대학의 인공지능 연구팀의 랄프 클린캔버그(Ralf Klinkenberg), 잉고 미에스와(Ingo Mierswa), 사이몬 피셔(Simon Fischer) 등에 의해 “Yet Another Learning Environment(YALE)”라는 오픈 소스 프로젝트로 시작됐다. 래피드마이너(RapidMiner) 개발팀은 누구나 쉽게 데이터를 분석할 수 있도록 지원할 수 있는 솔루션 개발을 목표로 했다. 래피드마이너는 곧 많은 사람의 관심을 끌었고, 상용화되었다.

구조[edit | edit source]

  • 클라이언트 서버 모델을 직접 구축하여 서버로 사용하며, 공용 클라우드와 개인 클라우드를 운영
  • 래피드마이너는 자바 프로그램 언어를 기반으로 운영된다. 래피드마이너는 분석 방법 설계하고 실행하기 위한 GUI를 제공한다. 이러한 과정을 래피드마이너에서는 "프로세스"라고하며 여러 "연산자"로 구성된다. 각 연산자는 프로세스 내에서 하나의 역할만을 수행하고 각 연산자의 출력은 다음 연산자의 입력을 형성한다.
  • 기본 데이터 분석 업무를 위해 500개 이상의 오퍼레이터를 제공한다. 기본 오퍼레이터 이외에도 웹마이닝(web mining), 텍스트마이닝(text mining), 시계열 데이터 분석(time series analysis) 등 다양한 특화된 오퍼레이터를 제공한다. 또한 래피드마이너는 데이터 시각화를 위한 다양한 방법을 제공한다. 더 나아가 WEKA 데이터마이닝 도구, Python이나 R같은 데이터 분석 프로그램을 래피드마이너와 통합하여 사용할 수 있도록 지원[4]
  • 최근 대규모 데이터를 처리할 수 있도록 획기적으로 데이터 처리 방법을 개선하였다. 빅데이터 처리 프레임워크인 하둡, NoSQL 등과 연계하여 활용할 수 있도록 지원한다. 마지막으로 래피드마이너는 Oracle, IBM DB2, Microsoft SQL Server, MySQL, PostgreSQL, Access 등의 데이터베이스와 CSV, Excel, SPSS 등 다양한 데이터 포맷을 바로 읽어 처리할 수 있도록 지원[4]

성과[edit | edit source]

  • 2017년에 Gartner Research는 래피드마이너를 데이터 과학 플랫폼용 Magic Quadrant의 리더 쿼드런트에 배치[5]
  • 2015년, 2016년에 소프트웨어 설문조사를 실시한 KDnuggets는 소프트웨어 프로그램을 사용하는 응답자 대상으로 한 설문 조사에서 가장 인기있는 데이터 분석 소프트웨어로 래피드마이너를 선정[6][7]
  • 2011 Rexer Analytics Data Miner Survey에서 가장 높은 만족도 기록[8]
  • 유료 고객으로 BMW, Intel, Cisco, GESamsung을 포함하여 25 만 명이 넘는 사용자를 보유

개발자[edit | edit source]

전 세계 약 50명의 개발자가 오픈 소스 래피드마이너 개발에 참여하고 있으며 대부분의 기여자는 래피드마이너의 직원이다. 래피드마이너를 개발한 회사는 기업 금융 회사인 Nokia Growth Partners, Ascent Venture Partners, Longworth Venture Partners, Earlybird Venture Capital 그리고 Open Ocean Capital에서 1600 만 달러의 ‘시리즈 C’ 기금을 지원 받았다.

참조 문헌[edit | edit source]

  • 위키피디아