UTX 変換ツール
|
English |
UTX 変換ツールは、UTX 形式ファイルの変換ツールです。UTX 形式ファイルのフォーマットチェックや、各社翻訳ソフトウェアのユーザー辞書との変換を行うことができます。
UTX 変換ツールは、現在、UTX 1.11 に対応しています。
UTX (Universal Terminology eXchange) 形式とは、用語集形式の標準規格です。規格の詳細は http://www.aamt.info/japanese/utx/ を参照してください。
UTX 変換ツールは、以下の機能を備えています。
各機能の詳細は「機能詳細」をご覧ください。
UTX 変換ツールの対応 OS は以下の通りです。
UTX 変換ツールの変換結果の動作確認を行っている翻訳ソフトウェアは以下の通りです。
翻訳ソフトのユーザー辞書ファイルの形式は稀に変更されますが、ファイル形式が変更されていなければ、上記以外のバージョンでも動作します。
また、クロスランゲージの Transer シリーズでは辞書形式がすべて同じであるため、MED-Transer/PAT-Transer/Legal Transer でも動作します。
zipファイルを解凍すると UtxConverter フォルダが出てきます。
この UtxConverter フォルダを任意の場所に置いてください。
例えば、 C:\Program Files (x86)\UtxConverter とします。
UtxConverter.exe をダブルクリックして実行します。
日本語の Windows では、UTX 変換ツールのユーザーインターフェイスは日本語になります。 英語の Windows では、UTX 変換ツールのユーザーインターフェイスは英語になります。
以下では、メイン画面の各部分について説明します。
画面上部のメニューバーでは、各メニューを表示します。メニューについての詳細はこちらで解説しています。
画面中央の「ファイル一覧」リストボックスでは、処理対象のファイルが一覧表示されます。
「ファイル一覧」リストボックスには[ファイル(F)]-[追加(A)] からファイルを追加することができます。また、処理対象のファイルを「ファイル一覧」リストボックスにドラッグ・アンド・ドロップして追加することもできます。
変換処理の後には、変換が成功したかどうか(1列目)、入力ファイルから読み込まれた項目数(4列目)、出力ファイルに書き込まれた項目数(5列目)、エラーの数(6列目)が表示されます。
「ファイル一覧」リストボックスの右下にある「項目をすべて消去」ボタンは、「ファイル一覧」リストボックスの中身をクリアします。
画面下部の「処理の種類」プルダウンリストでは、処理の種類を選択します。
左側のプルダウンリストでは変換元(「ファイル一覧」に表示されているファイル)のファイル形式を選びます。右側のプルダウンリストでは、変換先の形式を選択します。
画面右下の「実行」ボタンは、「処理の種類」で選択した処理を実行します。
(1) エクスプローラから処理対象のファイルをドラッグ・アンド・ドロップします。
(2) 「処理の種類」の左側のプルダウンリストで、処理対象のファイルの種類を選びます。
(3) 「処理の種類」の右側のプルダウンリストで、変換先のファイルの種類を選びます。変換先のファイルの種類は、処理対象のファイルの種類により異なります。
(4) 「実行」ボタンを押して、変換します。
(5) エラーが出た場合は、エラーログを保存します。
(6) 変換結果を確認します。読み込んだエントリ数と、書き出したエントリ数が正しいかどうかを確認します。また、エラーの個数も確認します。
(7) エラーが出た場合は、エラーログを確認し、エラーを修正して、再度「実行」ボタンを押します。
(8) 変換結果は、元のファイルと同じフォルダに出力されます。
メニュー | 機能 |
---|---|
追加 | 処理対象のファイルを選択して「ファイル一覧」リストボックスに追加します。 |
終了 | プログラムを終了します。 |
メニュー | 機能 |
---|---|
ヘルプ | ヘルプファイルを表示します。 |
バージョン情報 | バージョン情報ダイアログを表示します。 |
ここでは、各変換機能について説明します。
UTX ファイルが UTX の仕様に合っているかどうかをチェックすることができます。
チェック可能なバージョンは以下の通りです。
UTX ファイルから禁止語の抽出を行い、禁止語リストファイルを作成することができます。
禁止語リストファイルは、他のツールで禁止語を一括検索する際に用いることができます。
抽出元 UTX ファイルの例:
#UTX 1.11; en-US/ja-JP; 2015-03-15T19:00:00+09:00; #src <TAB> tgt <TAB> src:pos <TAB> term status mouse <TAB> マウス <TAB> noun <TAB> approved mouse <TAB> ネズミ <TAB> noun <TAB> forbidden window <TAB> ウィンドウ <TAB> noun <TAB> approved window <TAB> ウィンドー <TAB> noun <TAB> forbidden window <TAB> 窓 <TAB> noun <TAB> forbidden
抽出結果の例:
ネズミ <TAB> noun ウィンドー <TAB> noun 窓 <TAB> noun
禁止語リストファイルはタブ区切りのテキストファイルで、タブの左側が禁止語の訳語、右側が品詞となります。
UTX ファイルから非標準語と承認語のペアの抽出を行い、非標準語置換リストファイルを作成することができます。
非標準語置換リストファイルは、他のツールで非標準語を承認語に一括置換する際に用いることができます。
抽出元 UTX ファイルの例:
#UTX 1.11; en-US/ja-JP; 2015-03-15T19:00:00+09:00; #src <TAB> tgt <TAB> src:pos <TAB> term status color <TAB> 色 <TAB> noun <TAB> approved colour <TAB> 色 <TAB> noun <TAB> non-standard drug store <TAB> 薬局 <TAB> noun <TAB> approved pharmacy <TAB> 薬局 <TAB> noun <TAB> non-standard
抽出結果の例:
colour <TAB> color pharmacy <TAB> drug store
非標準語置換リストファイルはタブ区切りのテキストファイルで、タブの左側が非標準語の原語、右側が承認語の原語となります。
UTX ファイルから禁止語と承認語のペアの抽出を行い、禁止語置換リストファイルを作成することができます。
禁止語置換リストファイルは、他のツールで禁止語を承認語に一括置換する際に用いることができます。
抽出元 UTX ファイルの例:
#UTX 1.11; en-US/ja-JP; 2015-03-15T19:00:00+09:00; #src <TAB> tgt <TAB> src:pos <TAB> term status mouse <TAB> マウス <TAB> noun <TAB> approved mouse <TAB> ネズミ <TAB> noun <TAB> forbidden window <TAB> ウィンドウ <TAB> noun <TAB> approved window <TAB> ウィンドー <TAB> noun <TAB> forbidden window <TAB> 窓 <TAB> noun <TAB> forbidden
抽出結果の例:
ネズミ <TAB> マウス ウィンドー <TAB> ウィンドウ 窓 <TAB> ウィンドウ
禁止語置換リストファイルはタブ区切りのテキストファイルで、タブの左側が禁止語の訳語、右側が承認語の訳語となります。
UTX ファイルを ATLAS のユーザー辞書ファイルに変換することができます。また、ATLAS のユーザー辞書ファイルを UTX ファイルに変換することができます。
UTX ファイルから変換可能な ATLAS のユーザー辞書ファイルは、以下の通りです。
UTX ファイルに変換可能な ATLAS のユーザー辞書ファイルは、以下の通りです。
ATLAS の「一括登録形式」のファイルの例は以下の通りです。
英日用の「一括登録形式」ファイルの例:
名詞-名詞 イベントハンドラ event handler 0 3 動詞-動詞 送る dispatch <助詞 を> <文型 他> 形容-形容 現在の current 副詞-副詞 通常は normally
日英用の「一括登録形式」ファイルの例:
名詞-名詞 イベントハンドラ event handler 0 3 動詞-動詞 送る dispatch <助詞 を> <文型 他> 形容-形容 現在の current 副詞-副詞 通常は normally
UTX ファイルを The 翻訳のユーザー辞書ファイルに変換することができます。また、The 翻訳のユーザー辞書ファイルを UTX ファイルに変換することができます。
UTX ファイルから変換可能な The 翻訳のユーザー辞書ファイルは、以下の通りです。
UTX ファイルに変換可能な The 翻訳のユーザー辞書ファイルは、以下の通りです。
英日の「テキスト」形式のファイルの例1(1エントリを複数行で書く場合):
current;adj;(種類 adj)(比較 x); 現在の((日活用 etc)); dispatch;v;(文型 3)(3O n); 送る((日活用 5)(目格詞 を)); event handler;n;(種類 n)(活用語 2)(複数形 s); イベントハンドラ(); normally;adv;(種類 advf)(比較 more); 通常は();
英日の「テキスト」形式のファイルの例2(1エントリを単一行で書く場合):
current;adj;(種類 adj)(比較 x);現在の((日活用 etc)); dispatch;v;(文型 3)(3O n);送る((日活用 5)(目格詞 を)); event handler;n;(種類 n)(活用語 2)(複数形 s);イベントハンドラ(); normally;adv;(種類 advf)(比較 more);通常は();
日英の「テキスト」形式のファイルの例1(1エントリを複数行で書く場合):
イベントハンドラ;名詞;; event handler((英品詞 noun)(活用語 2)(発音 V)(複数形 S)); 現在の;連体詞;; current((英品詞 adjective)(発音 C)(比較 N)(修飾 前置)); 送る;動詞;(登録 独立)(種類 五段)(受身 可)(可能 不可)(意思性 有)(ている 進行形); dispatch((英品詞 verb)(発音 C)(過過分 ED)(三単現 ES)(現在分 ING)); kaku{[を]=obj/[に]=to} 通常は;副詞;(種類 程度); normally((英品詞 adverb)(発音 C)(比較 M));
日英の「テキスト」形式のファイルの例2(1エントリを単一行で書く場合):
イベントハンドラ;名詞;;event handler((英品詞 noun)(活用語 2)(発音 V)(複数形 S)); 現在の;連体詞;;current((英品詞 adjective)(発音 C)(比較 N)(修飾 前置)); 送る;動詞;(登録 独立)(種類 五段)(受身 可)(可能 不可)(意思性 有)(ている 進行形);dispatch((英品詞 verb)(発音 C)(過過分 ED)(三単現 ES)(現在分 ING));kaku{[を]=obj/[に]=to} 通常は;副詞;(種類 程度);normally((英品詞 adverb)(発音 C)(比較 M));
UTX ファイルを以下の Transer シリーズのユーザー辞書ファイルに変換することができます。また、Transer シリーズのユーザー辞書ファイルを UTX ファイルに変換することができます。
UTX ファイルから変換可能な Transer のユーザー辞書ファイルは、以下の通りです。
UTX ファイルに変換可能な Transer のユーザー辞書ファイルは、以下の通りです。
英日の「英日辞書ソースファイル」形式のファイルの例:
event handler(n,*):イベントハンドラ dispatch(v,*):送る (R)::[ON]{を}[P(to)N]{に} current(a,*):現在の (O) normally(adv,*):通常は
日英の「日英辞書ソースファイル」形式のファイルの例:
*イベントハンドラ/N/ + ="event handler"/N/C/ *送る/V/R5/ +1が 2を 3に =1 dispatch/V/ 2 to 3 *通常は/D/ +$/M_S/ =normally/D/jprep/ *現在の/A/OO/ +1が =1 be/V/ current/A/ATTR/PREP/
UTX から MultiTerm 用のインポート用テキストへの変換を行うことができます。
MultiTerm 用のインポート用テキスト形式のファイルの例:
English (United States) <TAB> Japanese (Japan) <TAB> Part of Speech (source) <TAB> term status mouse <TAB> マウス <TAB> noun <TAB> approved mouse <TAB> ネズミ <TAB> noun <TAB> forbidden window <TAB> ウィンドウ <TAB> noun <TAB> approved window <TAB> ウィンドー <TAB> noun <TAB> forbidden window <TAB> 窓 <TAB> noun <TAB> forbidden color <TAB> 色 <TAB> noun <TAB> approved colour <TAB> 色 <TAB> noun <TAB> non-standard drug store <TAB> 薬局 <TAB> noun <TAB> approved pharmacy <TAB> 薬局 <TAB> noun <TAB> non-standard
なお、Glossary Converter を使用すると、テキスト形式でのインポートを経ることなく、UTX と MultiTerm 用語ベースを相互に直接変換できます。
更新履歴はこちらをご覧ください。
このソフトウェアは MIT ライセンスで提供されています。 詳細は LICENSE.txt を参照してください。
参考までに日本語訳へのリンクを示しますが、法的に有効なのは英語版です。
http://sourceforge.jp/projects/opensource/wiki/licenses/MIT_license
UTX 変換ツールは以下のページで配布しています。
http://sourceforge.net/projects/utxconv/files/
ソースコードは以下のページで配布しています。
http://sourceforge.net/p/utxconv/Git/
UTX 変換ツールのバージョン番号は、サポートしている UTX 仕様のバージョンと、UTX 変換ツールのリリース番号から成ります。
Ver.w.x.y.z は、w.x が UTX 仕様のバージョンを示し、y.z が UTX 変換ツールのリリース番号を示します。
例えば、Ver.1.11.0.1 は、先頭の 1.11 が UTX 1.11 仕様に対応していることを示し、末尾の 0.1 が UTX 変換ツールの最初のリリースであることを示しています。
アジア太平洋機械翻訳協会(AAMT)
機械翻訳課題調査委員会 ワーキンググループ 3 (共有化・標準化)
http://www.aamt.info/
こちらからお問い合わせください。