Skip to main content

OpenRefine の起動と終了

起動と終了

OpenRefine は基本機能においてインターネット接続を必要としません。一度ダウンロードしてインストールすると、ローカルに小さなウェブサーバーとして動作し、ブラウザからアクセスします。

OpenRefine を起動するとコマンドラインウィンドウが開きますが、ブラウザで作業している間はそのウィンドウは無視してかまいません。

起動方法にかかわらず、OpenRefine の UI はお使いの OS のデフォルトブラウザで表示されます。別のブラウザを使いたい場合は OpenRefine を起動した後、http://127.0.0.1:3333/ をそのブラウザで開いてください。

OpenRefine は WebKit ベースのブラウザで最適に動作します。たとえば:

Firefox などではレンダリングやパフォーマンスの差が報告されています。Internet Explorer はサポート対象外です。

複数のプロジェクトを同時に扱いたい場合は、複数のタブやウィンドウで OpenRefine を開くだけです。Open Project 画面でプロジェクト名を右クリックすれば別タブ/別ウィンドウで開けます。

openrefine.exe で起動

openrefine.exe をダブルクリックするか、コマンドラインから実行できます。

設定を変更したい場合は openrefine.l4j.ini を編集してください(後述)。

refine.bat で起動

Windows では refine.bat を使って起動することもできます。ダブルクリックするかコマンドラインで呼び出してください。

コマンドラインから refine.bat を起動する場合、起動オプションを付けて実行できます。ショートカットやダブルクリック時の動作を変えたい場合は refine.ini を編集してください。

終了方法

OpenRefine を終了するには、開いているブラウザタブ/ウィンドウをすべて閉じ、コマンドラインウィンドウに戻ります。Control + C を押すと OpenRefine が正常終了し、最後の変更が保存されます。


トラブルシューティング

ブラウザで OpenRefine に接続できない場合は、Wiki のブラウザ/OS 設定ガイド を確認してください。

オプション付き起動

コマンドラインから起動するときには複数の設定を変更できます。

Windows ではスラッシュ形式でオプションを指定します:

C:>refine /i 127.0.0.2 /p 3334

refine /? で利用可能なすべてのコマンドを表示できます。

コマンド用途
/wwebapp へのパスrefine /w /path/to/openrefine
/m最大ヒープサイズ(MB)refine /m 6000M
/pポートrefine /p 3334
/iインターフェース(IP または IP:Portrefine /i 127.0.0.2:3334
/H受信要求に期待する HTTP ホストrefine /H openrefine.internal
/dワークスペースrefine /d /where/you/want/the/workspace
/vログレベル(error→trace)refine /v info
/x追加の Java 設定refine /x refine.autosave=5 など
/debugデバッグを有効化(ポート 8000)refine /debug
/jmxJMX 監視を有効化refine /x

設定ファイル内の変更

Windows では openrefine.exe の動作を openrefine.l4j.ini で、refine.bat の動作を refine.ini で制御できます。

Mac では Info.plist、Linux では refine.ini を編集します。

多くの設定(メモリ割り当てなど)はすでにファイル内に書かれているため、値を変更するだけです。コメントアウトされている行は # を外して有効化してください。

たとえば refine.ini には次のような記述があります:

no_proxy="localhost,127.0.0.1"
#REFINE_PORT=3334
#REFINE_INTERFACE=127.0.0.1
#REFINE_HOST=mymachine.local
#REFINE_WEBAPP=main\webapp

# Memory and max form size allocations
#REFINE_MAX_FORM_CONTENT_SIZE=1048576
REFINE_MEMORY=1400M

# Set initial java heap space (default: 256M) for better performance with large datasets
REFINE_MIN_MEMORY=1400M
...
JVM 設定

さらに細かい JVM 設定を追加することもできます。コマンドラインで利用する key/value とは異なる構文です。

主要なキー(デフォルト値)例:

説明引数
プロキシホスト-Dhttp.proxyHostproxy.example.org
プロキシポート-Dhttp.proxyPort8080
自動保存 間隔(分)-Drefine.autosave5
ワークスペース-Drefine.data_dir/user/data
開発モード-Drefine.developmentfalse
ヘッドレス-Drefine.headlessfalse
IP-Drefine.interface127.0.0.1
ドメイン-Drefine.hostmymachine.local
ポート-Drefine.port3333
アプリフォルダ-Drefine.webappmain/webapp
新バージョン通知-Drefine.display.new.version.noticetrue
Google Data Client ID-Dext.gdata.clientid000...
Google Data Client secret-Dext.gdata.clientsecret****
Google Data API Key-Dext.gdata.apikey***

refine.l4j.ini に次のような行を追加できます:

-Drefine.port=3334
-Drefine.interface=127.0.0.2
-Drefine.host=mymachine.local
-Drefine.webapp=broker/core
-Dhttp.proxyHost=yourproxyhost
-Dhttp.proxyPort=8080

refine.ini では JAVA_OPTIONS= 行にスペース区切りで複数指定します:

JAVA_OPTIONS=-Drefine.data_dir=C:\Users\user\Documents\OpenRefine\ -Drefine.port=3334

ホーム画面

初回起動時に表示される画面には左側に Create ProjectOpen ProjectImport ProjectLanguage Settings が並びます。これが“ホーム画面”で、プロジェクトの管理や設定を行う入口です。

左下には PreferencesHelpAbout があります。

言語設定

ホーム画面左の Language Settings から使用インターフェース言語を選べます。選択内容は変更するまで保持されます。翻訳はコミュニティによるため、一部の言語は未完了で英語にフォールバックします。現在 75% 以上翻訳済みの言語:

  • Cebuano
  • German
  • English (UK)
  • English (US)
  • Spanish
  • Filipino
  • French
  • Hebrew
  • Magyar
  • Italian
  • Japanese (日本語)
  • Portuguese (Brazil)
  • Tagalog
  • Chinese (简体中文)

言語設定画面から離れるには、ダイヤモンドの OpenRefine ロゴをクリックしてください。

翻訳への参加

OpenRefine の翻訳は Weblate を使っており、Weblate のプロジェクトページ で支援状況を確認できます。翻訳に貢献したい場合は、技術リファレンスの翻訳ページ をご覧ください。

Preferences

画面左下の Preferences ではキー/バリュー方式で設定できます。

設定項目キー値の形式デフォルトバージョン
インターフェース言語userLangISO 639-1 2 桁コードenfr
最大ファセット数ui.browsing.listFacet.limit数値20005000
Google Drive 読み込みタイムアウトgoogleReadTimeOutマイクロ秒180000500000
Google Drive 認証タイムアウトgoogleConnectTimeOutマイクロ秒180000500000
Wikibase 編集再試行ラグwikibase.upload.maxLag510
リコンシリエーションプレビュー表示cell-ui.previewMatchedCells真偽値truefalsev3.2
表示行数設定ui.browsing.pageSize数値配列[ 5, 10, 25, 50 ][ 100, 500, 1000 ]v3.5
ファセット/履歴パネル幅ui.browsing.facetsHistoryPanelWidthピクセル300500v3.5
リコンシリエーションの自動マッチui.reconciliation.automatch真偽値truefalsev3.8
クラスタリングの選択上限ui.clustering.choices.limit数値50008000v3.8
次バージョン通知notification.status文字列enableddisabledv3.7

Preferences 画面からはダイヤモンドロゴをクリックして戻ります。

ここに目的の設定がない場合は、コマンドラインや .ini ファイル で変更できるオプションを確認してください。

プロジェクト画面

プロジェクト画面(作業画面)は プロジェクトを開いた後 に最も頻繁に使う画面です。主要な UI パーツを以下で説明します。

プロジェクト画面のスクリーンショット

プロジェクトバー

画面上部のバーには OpenRefine ロゴ、プロジェクト名、右側に操作ボタンが並びます。

ロゴをクリックすればいつでも現在のプロジェクトを閉じてホーム画面に戻れます。ロゴを右クリックして「新しいタブで開く」を選べば別タブで開けます。プロジェクトを閉じると ファセット・ビュー設定 は失いますが、History には操作履歴が残ります。

caution

ブラウザの“戻る”ボタンを押すと現在のプロジェクトが閉じられ、ファセットや表示設定を失うことがあります。

プロジェクト名はいつでも編集可能で、クリックするとテキスト入力に切り替わります。名前は重複しても構いません(内部では一意 ID で管理)。

Permalink を使えば、現在のファセット/フィルター状態をそのまま URL に埋め込めます。クリックすると現在のビューが同じタブで再読み込みされ、右クリックで URL をコピーすると他の場所で同じ状態を再現できます。

Open… ボタンを押すと新しいタブが開き、Create Project 画面に移動します。ここから新規作成や既存プロジェクトの切り替え、設定変更ができます。

Export ドロップダウンではフォーマットを選んでエクスポートできます。多くのオプションは現在表示中の行(ファセット/フィルターで絞った subset)だけを出力し、すべての行ではありません。

Help はこのマニュアルの該当ページを新しいタブで開きます。

グリッドヘッダー

プロジェクトバーの下にあるグリッドヘッダーには、プロジェクトの行数・レコード数が表示され、行モード/レコードモード の状態が確認できます。

フィルターが適用された状態では “67 matching rows (180 total)” のように一致行数が表示されます。

行/レコードボタンの下には表示行数切替オプションがあり、画面右端にはページ送りのナビゲーションがあります。

拡張機能

Extensions ドロップダウンから Wikidata などへのアップロードやスキーマのインポート・エクスポートなどを呼び出せます。詳細は Wikibase セクション をご覧ください。拡張機能によって他の機能がこのメニューに追加されることもあります。

グリッド

データが表示される中央の領域は「グリッド」(またはデータグリッド、プロジェクトグリッド)です。スプレッドシートのような表示で列幅は自動調整され、一部の見出しはマウスオーバーで全体を確認できます。

各列見出しには小さな矢印があり、クリックするとその列固有の操作(探索や変換)を含むドロップダウンメニューが開きます。詳細は Exploring data / Transforming data を参照してください。

すべてのプロジェクトで最初の列は All で、フラグ/スター付けなど列横断の操作を含みます。ここで行番号/レコード番号も表示されます。番号は一時的なソートやファセットの影響を受けず、元の識別子を示します。

グリッドは表示列数・幅・行数に応じてスクロールバーが現れます。Sort and View options で表示を調整できます。

マウスをオーバーすると情報が表示され、...(以下省略)