Skip to main content

OpenRefine の拡張機能

以下の拡張機能をインストールすると OpenRefine に機能を追加できます。ここに掲載しているからといって動作を保証するものではなく、旧バージョンや独自ディストリビューションでのみ動くものもあります。拡張機能のインストール方法 もご確認ください。

Extension Name説明作者対応バージョン
AI Extension最新の言語モデルと OpenRefine の変換機能を連携させる拡張。Sunil Natraj3.8.7+
Files Extensionローカルファイルの詳細情報を使ってプロジェクトを作成するツール。Sunil Natraj3.8.7+
gdata extensionGoogle Drive / Google Sheets へのインポート&エクスポートを提供。Tom Morris3.9
RDF Transformデータを RDF 形式へ変換する拡張。旧 RDF extension を最新の Java / JavaScript 技術で全面的に書き換えたもの。AtesComp3.8+
Commons extensionWikimedia Commons 既存ファイルから構造化データを抽出する作業を支援。Joey Salazar, Sandra Fauconnier3.6
Refine JS式言語として JavaScript を利用できるようにする拡張。wetneb3.6+
OpenRefine Command Paletteコマンドパレットとキーボードショートカットを追加。Albin Larsson3.7+
OpenRefine Hex Colorsセル内の 16 進カラーコードを検出し表示。Albin Larsson3.7+
GEO Extension地理座標処理の関数を追加。decToGMS() で度分秒へ変換、geoDistance() でハーサイン公式による大円距離を算出。SashankBhamidi3.8+
OSM ExtractorOverpass API を使って OpenStreetMap データを取り込む import オプションと、図形の interior point を得る GREL 関数 interiorPoint() を追加。Labian Gashi3.5.0
GeoJSON ExportGeoJSON 形式でエクスポートする GUI を提供。緯度経度と WKT をサポート。Labian Gashi3.5.0
SNAC extensionOpenRefine から SNAC を編集できるようにする拡張。Joseph Glass, Robbie Hott, Jason Jordan3.4.1
FAIR metadataFAIR Data Point と連携し、FAIR 原則 に沿ったメタデータ管理・出力を支援。旧 FAIRifier の後継。FAIRDataTeam3.4.1
VIB-Bits履歴/ピボット/cross() GUI/散布図などのツールを追加。マニュアル PDFVIB-Bits3.4.1
Named-Entity Recognitionテキストから固有名やリコンシリエーション可能なエンティティを抽出。AlchemyAPI / DBpedia Lookup / Zemanta をサポート。マニュアルRuben Verborgh、Stuart Kenny3.4.1
String-TransformersJython で使える Java 文字列変換関数をまとめた拡張。汎用的なものと植物学・分類学向けのものが含まれます。必要な JAR をダウンロードし 手順 に従ってください。RBGKew3.4.1
RDF extensionRDF Refine。RDF 出力向けに改良されたフォークで、RDF エクスポート用 GUI を追加。stkenny & DRI3.4.1
GOKb Utilities新しい 3 つの機能を追加: 行の先頭に空行を挿入、全セルの前後空白を削除、URL からホスト名を抜き出す extractHost()。GOKb & Owen Stephens3.1
Stats extension for Google Refine 2.5+列データの基本統計を計算。sparkica3.1
CKAN Storage ExtensionCKAN Storage API を使い、CKAN Storage 2.2+ へデータをエクスポート。Ontodia3.1
GeoRefine地理処理向けの GREL 関数を追加。Ryan Baumann2.8
D2Refine臨床研究のメタデータ統合・検証のためのワークベンチ。1) スプレッドシート形式で指定した制約を臨床モデルへ変換し、2) Common Terminology Services 2 (CTS2) を使ったリコンシリエーションを提供。マニュアルDeepak K. Sharma2.7

レガシー拡張

過去に作られた拡張ですが、OpenRefine の活用例として意義があるため載せています。将来引き継いでくれる人が現れることも期待しています。

Extension Name説明作者推奨バージョン
LODRefineRDF・DBpedia・CrowdFlower・Stats などの拡張を統合し、表データから Linked Data への移行を楽にする OpenRefine ベースの配布物。Sparkica
VIB-BITS Diff pluginテキスト値を比較する diff ツールを追加。マニュアル PDFVIB-Bits3.4.1(サイト上では 3.4 向け再配布を検討中とのこと)。
VIB-BITS Save facets pluginファセット設定を保存して後で再適用する機能を追加。マニュアル PDFVIB-Bits不明(diff プラグイン同様 3.4 向けを検討中)。
refine-fuzzymatch-extension曖昧マッチ/リコンシリエーション用拡張。yatszhash2.8
geoXtensionGDAL / Proj / GEOS に依存。導入に時間がかかるため Docker 利用が推奨。giTorto(約 2.6)
extraCTU-pluginテキストからメール・電話・URL・識別番号を抽出。giTorto(約 2.7)
OpentreeOpen Tree of Life の系統樹を表示。マニュアルnickynicolson2.5
BioVeL生物多様性データのクレンジング/クラスタリング機能を提供。ローカル/専用サーバーで実行可能。Botanic Garden and Botanical Museum Berlin-Dahlem2.5
DBpedia extensionDBpedia でリコンシリエーションしたデータに列を追加。DBpedia もしくは DBpedia 型を返す SPARQL エンドポイントでの照合が必要。Zemanta2.5
Stats extension for Google Refine 2.1列データの基本統計を計算。The Chicago Tribune2.1

リコンシリエーションサービス

OpenRefine は複数のリコンシリエーションサービスと連携できます。情報は次をご覧ください。

クライアントライブラリ

既存のライブラリを使うと、OpenRefine API 経由で操作を自動化できます。

言語ライブラリ名
bashorcli
C# / .NETOpenRefine.Net
javarefine-java
pythonopenrefine-client
Rrrefine

旧クライアントライブラリ

OpenRefine 3.3 で CSRF トークン が導入されました。以下のライブラリはまだ対応していません。

言語ライブラリ名対応バージョン
javascriptnode-openrefine3.2
pythonrefine-client-py3.2
pythonrefine-python3.2
rubyrefine-ruby (fork)3.2
rubyrefine-ruby3.2