오픈리파인
(OpenRefine, 以前 이름: 구글 리파인/Google Refine, 프리베이스 그리드웍스/Freebase Gridworks)은
데이터 랭글링
으로 알려진 데이터 整理 및 다른 포맷으로의 變換을 위한 獨立的인 오픈 소스 데스크톱 애플리케이션이다.
[3]
스프레드시트 파일 포맷과 動作한다는 點에서
스프레드시트
애플리케이션과 類似하지만 보다 데이터베이스처럼 動作한다.
컬럼 밑(column)에 셀이 있는 데이터의 로우(row) 上에서 動作하는데, 이는 마치
關係形 데이터베이스
테이블과 매우 비슷하다. 오픈리파인 프로젝트는 하나의 테이플로 構成된다. 使用者는 필터링 基準을 定義하는 페싯(facet)을 利用하여 表出할 로우를 필터링할 수 있다.(예: 特定 컬럼이 비어있지 않은 로우를 標示) 스프레드시트와 달리 오픈리파인의 大部分의 運營은 보이는 모든 로우床에서 處理된다: 한 컬럼 下의 모든 로우의 모든 셀의 變換,
[4]
旣存 컬럼 데이터에 基盤하여 새 컬럼 生成 等. 데이터셋에서 完了되는 모든 動作은 프로젝트에 貯藏되며 다른 데이터셋에서 리플레이가 可能하다.
스프레드시트와 달리 셀에 公式이 貯藏되지 않으나 公式을 使用하여 데이터를 變換할 수 있으며 變換은 한 次例 遂行된다.
[5]
변환식은 GREL(General Refine Expression Language),
[6]
자이썬
(예: 파이썬),
클로저
로 作成된다.
[7]
이 프로그램은
웹 애플리케이션
이다. 그러나 웹(
SaaS
)로 호스팅되지 않으며 로컬 머신에서 다운로드하여 利用이 可能하다. 오픈리파인을 始作할 때
웹 서버
를 機動하며 웹 서버에 依해 支援되는 웹 UI를 열기 위해 브라우저를 始作한다.
가져오기, 내보내기를 위한 支援 포맷
[
編輯
]
가져오기는 다음의 포맷으로 支援한다:
[8]
내보내기는 다음 포맷으로 支援한다:
[10]
네이티브 포맷의 오픈리파인 프로젝트들은
.tar.gz
아카이브로 내보내기가 可能하다.
各州
[
編輯
]
外部 링크
[
編輯
]