OpenRefine の拡張機能
以下の拡張機能をインストールすると OpenRefine に機能を追加できます。ここに掲載しているからといって動作を保証するものではなく、旧バージョンや独自ディストリビューションでのみ動くものもあります。拡張機能のインストール方法 もご確認ください。
| Extension Name | 説明 | 作者 | 対応バージョン |
|---|---|---|---|
| AI Extension | 最新の言語モデルと OpenRefine の変換機能を連携させる拡張。 | Sunil Natraj | 3.8.7+ |
| Files Extension | ローカルファイルの詳細情報を使ってプロジェクトを作成するツール。 | Sunil Natraj | 3.8.7+ |
| gdata extension | Google Drive / Google Sheets へのインポート&エクスポートを提供。 | Tom Morris | 3.9 |
| RDF Transform | データを RDF 形式へ変換する拡張。旧 RDF extension を最新の Java / JavaScript 技術で全面的に書き換えたもの。 | AtesComp | 3.8+ |
| Commons extension | Wikimedia Commons 既存ファイルから構造化データを抽出する作業を支援。 | Joey Salazar, Sandra Fauconnier | 3.6 |
| Refine JS | 式言語として JavaScript を利用できるようにする拡張。 | wetneb | 3.6+ |
| OpenRefine Command Palette | コマンドパレットとキーボードショートカットを追加。 | Albin Larsson | 3.7+ |
| OpenRefine Hex Colors | セル内の 16 進カラーコードを検出し表示。 | Albin Larsson | 3.7+ |
| GEO Extension | 地理座標処理の関数を追加。decToGMS() で度分秒へ変換、geoDistance() でハーサイン公式による大円距離を算出。 | SashankBhamidi | 3.8+ |
| OSM Extractor | Overpass API を使って OpenStreetMap データを取り込む import オプションと、図形の interior point を得る GREL 関数 interiorPoint() を追加。 | Labian Gashi | 3.5.0 |
| GeoJSON Export | GeoJSON 形式でエクスポートする GUI を提供。緯度経度と WKT をサポート。 | Labian Gashi | 3.5.0 |
| SNAC extension | OpenRefine から SNAC を編集できるようにする拡張。 | Joseph Glass, Robbie Hott, Jason Jordan | 3.4.1 |
| FAIR metadata | FAIR Data Point と連携し、FAIR 原則 に沿ったメタデータ管理・出力を支援。旧 FAIRifier の後継。 | FAIRDataTeam | 3.4.1 |
| VIB-Bits | 履歴/ピボット/cross() GUI/散布図などのツールを追加。マニュアル PDF | VIB-Bits | 3.4.1 |
| Named-Entity Recognition | テキストから固有名やリコンシリエーション可能なエンティティを抽出。AlchemyAPI / DBpedia Lookup / Zemanta をサポート。マニュアル。 | Ruben Verborgh、Stuart Kenny | 3.4.1 |
| String-Transformers | Jython で使える Java 文字列変換関数をまとめた拡張。汎用的なものと植物学・分類学向けのものが含まれます。必要な JAR をダウンロードし 手順 に従ってください。 | RBGKew | 3.4.1 |
| RDF extension | RDF Refine。RDF 出力向けに改良されたフォークで、RDF エクスポート用 GUI を追加。 | stkenny & DRI | 3.4.1 |
| GOKb Utilities | 新しい 3 つの機能を追加: 行の先頭に空行を挿入、全セルの前後空白を削除、URL からホスト名を抜き出す extractHost()。 | GOKb & Owen Stephens | 3.1 |
| Stats extension for Google Refine 2.5+ | 列データの基本統計を計算。 | sparkica | 3.1 |
| CKAN Storage Extension | CKAN Storage API を使い、CKAN Storage 2.2+ へデータをエクスポート。 | Ontodia | 3.1 |
| GeoRefine | 地理処理向けの GREL 関数を追加。 | Ryan Baumann | 2.8 |
| D2Refine | 臨床研究のメタデータ統合・検証のためのワークベンチ。1) スプレッドシート形式で指定した制約を臨床モデルへ変換し、2) Common Terminology Services 2 (CTS2) を使ったリコンシリエーションを提供。マニュアル。 | Deepak K. Sharma | 2.7 |
レガシー拡張
過去に作られた拡張ですが、OpenRefine の活用例として意義があるため載せています。将来引き継いでくれる人が現れることも期待しています。
| Extension Name | 説明 | 作者 | 推奨バージョン |
|---|---|---|---|
| LODRefine | RDF・DBpedia・CrowdFlower・Stats などの拡張を統合し、表データから Linked Data への移行を楽にする OpenRefine ベースの配布物。 | Sparkica | |
| VIB-BITS Diff plugin | テキスト値を比較する diff ツールを追加。マニュアル PDF。 | VIB-Bits | 3.4.1(サイト上では 3.4 向け再配布を検討中とのこと)。 |
| VIB-BITS Save facets plugin | ファセット設定を保存して後で再適用する機能を追加。マニュアル PDF。 | VIB-Bits | 不明(diff プラグイン同様 3.4 向けを検討中)。 |
| refine-fuzzymatch-extension | 曖昧マッチ/リコンシリエーション用拡張。 | yatszhash | 2.8 |
| geoXtension | GDAL / Proj / GEOS に依存。導入に時間がかかるため Docker 利用が推奨。 | giTorto | (約 2.6) |
| extraCTU-plugin | テキストからメール・電話・URL・識別番号を抽出。 | giTorto | (約 2.7) |
| Opentree | Open Tree of Life の系統樹を表示。マニュアル。 | nickynicolson | 2.5 |
| BioVeL | 生物多様性データのクレンジング/クラスタリング機能を提供。ローカル/専用サーバーで実行可能。 | Botanic Garden and Botanical Museum Berlin-Dahlem | 2.5 |
| DBpedia extension | DBpedia でリコンシリエーションしたデータに列を追加。DBpedia もしくは DBpedia 型を返す SPARQL エンドポイントでの照合が必要。 | Zemanta | 2.5 |
| Stats extension for Google Refine 2.1 | 列データの基本統計を計算。 | The Chicago Tribune | 2.1 |
リコンシリエーションサービス
OpenRefine は複数のリコンシリエーションサービスと連携できます。情報は次をご覧ください。
- Wiki の Reconcilable Data Sources
- Reconciliation API Census の Reconciliation Software
- Reconciliation API testbench の Reconciliation Services(Wikidata の SPARQL クエリ で生成)
クライアントライブラリ
既存のライブラリを使うと、OpenRefine API 経由で操作を自動化できます。
| 言語 | ライブラリ名 |
|---|---|
| bash | orcli |
| C# / .NET | OpenRefine.Net |
| java | refine-java |
| python | openrefine-client |
| R | rrefine |
旧クライアントライブラリ
OpenRefine 3.3 で CSRF トークン が導入されました。以下のライブラリはまだ対応していません。
| 言語 | ライブラリ名 | 対応バージョン |
|---|---|---|
| javascript | node-openrefine | 3.2 |
| python | refine-client-py | 3.2 |
| python | refine-python | 3.2 |
| ruby | refine-ruby (fork) | 3.2 |
| ruby | refine-ruby | 3.2 |