UTX 変換ツール
English
UTX変換ツール マニュアル

■UTX 変換ツールとは?

UTX 変換ツールは、UTX 形式ファイルの変換ツールです。UTX 形式ファイルのフォーマットチェックや、各社翻訳ソフトウェアのユーザー辞書との変換を行うことができます。

UTX 変換ツールは、現在、UTX 1.11 に対応しています。


■UTX とは?

UTX (Universal Terminology eXchange) 形式とは、用語集形式の標準規格です。規格の詳細は http://www.aamt.info/japanese/utx/ を参照してください。


■機能一覧

UTX 変換ツールは、以下の機能を備えています。

  • UTX に関する機能
    • UTX ファイルの形式チェック(UTX 1.11)
    • 禁止語の抽出
    • 禁止語と承認語のペアの抽出
    • 非標準語と承認語のペアの抽出
  • 変換機能
    • UTX と ATLAS(富士通)のユーザー辞書(*.txtファイル)との相互変換
    • UTX と The 翻訳(東芝) のユーザー辞書(*.txtファイル)との相互変換
    • UTX と PC/MED/PAT/Legal Transer(クロスランゲージ)のユーザー辞書(EJ は *.optファイル、JE は *.dicファイル)との相互変換
    • UTX から MultiTerm 用のインポート用テキストへの変換

各機能の詳細は「機能詳細」をご覧ください。


■スクリーンショット

スクリーンショット01


スクリーンショット02

■動作環境

UTX 変換ツールの対応 OS は以下の通りです。

  • Windows 7 (32bit/64bit)
  • Windows 8.1 (32bit/64bit)

UTX 変換ツールの変換結果の動作確認を行っている翻訳ソフトウェアは以下の通りです。

  • ATLAS V14(富士通)
  • The 翻訳 V15(東芝)
  • PC-Transer V21(クロスランゲージ)

翻訳ソフトのユーザー辞書ファイルの形式は稀に変更されますが、ファイル形式が変更されていなければ、上記以外のバージョンでも動作します。

また、クロスランゲージの Transer シリーズでは辞書形式がすべて同じであるため、MED-Transer/PAT-Transer/Legal Transer でも動作します。


■インストール方法

zipファイルを解凍すると UtxConverter フォルダが出てきます。

この UtxConverter フォルダを任意の場所に置いてください。

例えば、 C:\Program Files (x86)\UtxConverter とします。

インストール位置

■実行方法

UtxConverter.exe をダブルクリックして実行します。

UtxConverter.exe

日本語の Windows では、UTX 変換ツールのユーザーインターフェイスは日本語になります。 英語の Windows では、UTX 変換ツールのユーザーインターフェイスは英語になります。


■画面の説明

メイン画面

以下では、メイン画面の各部分について説明します。


□メニューバー

メニューバー

画面上部のメニューバーでは、各メニューを表示します。メニューについての詳細はこちらで解説しています。


□「ファイル一覧」リストボックス

ファイル一覧

画面中央の「ファイル一覧」リストボックスでは、処理対象のファイルが一覧表示されます。

「ファイル一覧」リストボックスには[ファイル(F)]-[追加(A)] からファイルを追加することができます。また、処理対象のファイルを「ファイル一覧」リストボックスにドラッグ・アンド・ドロップして追加することもできます。

変換処理の後には、変換が成功したかどうか(1列目)、入力ファイルから読み込まれた項目数(4列目)、出力ファイルに書き込まれた項目数(5列目)、エラーの数(6列目)が表示されます。


□「項目をすべて消去」ボタン

「項目をすべて消去」ボタン

「ファイル一覧」リストボックスの右下にある「項目をすべて消去」ボタンは、「ファイル一覧」リストボックスの中身をクリアします。


□「処理の種類」プルダウンリスト

「処理の種類」プルダウンリスト

画面下部の「処理の種類」プルダウンリストでは、処理の種類を選択します。

左側のプルダウンリストでは変換元(「ファイル一覧」に表示されているファイル)のファイル形式を選びます。右側のプルダウンリストでは、変換先の形式を選択します。


□「実行」ボタン

「実行」ボタン

画面右下の「実行」ボタンは、「処理の種類」で選択した処理を実行します。


■基本的な使い方

(1) エクスプローラから処理対象のファイルをドラッグ・アンド・ドロップします。

ドラッグ・アンド・ドロップ



(2) 「処理の種類」の左側のプルダウンリストで、処理対象のファイルの種類を選びます。

処理対象のファイルの種類



(3) 「処理の種類」の右側のプルダウンリストで、変換先のファイルの種類を選びます。変換先のファイルの種類は、処理対象のファイルの種類により異なります。

変換先のファイルの種類



(4) 「実行」ボタンを押して、変換します。

「実行」ボタン



(5) エラーが出た場合は、エラーログを保存します。

エラー



(6) 変換結果を確認します。読み込んだエントリ数と、書き出したエントリ数が正しいかどうかを確認します。また、エラーの個数も確認します。

変換結果



(7) エラーが出た場合は、エラーログを確認し、エラーを修正して、再度「実行」ボタンを押します。

エラーログ



(8) 変換結果は、元のファイルと同じフォルダに出力されます。

変換結果

■メニュー


□「ファイル」メニュー

メニュー 機能
追加 処理対象のファイルを選択して「ファイル一覧」リストボックスに追加します。
終了 プログラムを終了します。

□「ヘルプ」メニュー

メニュー 機能
ヘルプ ヘルプファイルを表示します。
バージョン情報 バージョン情報ダイアログを表示します。

■機能詳細

ここでは、各変換機能について説明します。


□UTX ⇒ (検証のみ)

UTX ファイルが UTX の仕様に合っているかどうかをチェックすることができます。

チェック可能なバージョンは以下の通りです。


□UTX ⇒ 禁止語リスト

UTX ファイルから禁止語の抽出を行い、禁止語リストファイルを作成することができます。

禁止語リストファイルは、他のツールで禁止語を一括検索する際に用いることができます。

抽出元 UTX ファイルの例:

#UTX 1.11; en-US/ja-JP; 2015-03-15T19:00:00+09:00;
#src    <TAB> tgt        <TAB> src:pos <TAB> term status
mouse   <TAB> マウス     <TAB> noun    <TAB> approved
mouse   <TAB> ネズミ     <TAB> noun    <TAB> forbidden
window  <TAB> ウィンドウ <TAB> noun    <TAB> approved
window  <TAB> ウィンドー <TAB> noun    <TAB> forbidden
window  <TAB> 窓         <TAB> noun    <TAB> forbidden

抽出結果の例:

ネズミ      <TAB> noun
ウィンドー  <TAB> noun
窓          <TAB> noun

禁止語リストファイルはタブ区切りのテキストファイルで、タブの左側が禁止語の訳語、右側が品詞となります。


□UTX ⇒ 非標準語置換リスト

UTX ファイルから非標準語と承認語のペアの抽出を行い、非標準語置換リストファイルを作成することができます。

非標準語置換リストファイルは、他のツールで非標準語を承認語に一括置換する際に用いることができます。

抽出元 UTX ファイルの例:

#UTX 1.11; en-US/ja-JP; 2015-03-15T19:00:00+09:00;
#src       <TAB> tgt  <TAB> src:pos <TAB> term status
color      <TAB> 色   <TAB> noun    <TAB> approved
colour     <TAB> 色   <TAB> noun    <TAB> non-standard
drug store <TAB> 薬局 <TAB> noun    <TAB> approved
pharmacy   <TAB> 薬局 <TAB> noun    <TAB> non-standard

抽出結果の例:

colour   <TAB> color
pharmacy <TAB> drug store

非標準語置換リストファイルはタブ区切りのテキストファイルで、タブの左側が非標準語の原語、右側が承認語の原語となります。


□UTX ⇒ 禁止語置換リスト

UTX ファイルから禁止語と承認語のペアの抽出を行い、禁止語置換リストファイルを作成することができます。

禁止語置換リストファイルは、他のツールで禁止語を承認語に一括置換する際に用いることができます。

抽出元 UTX ファイルの例:

#UTX 1.11; en-US/ja-JP; 2015-03-15T19:00:00+09:00;
#src    <TAB> tgt        <TAB> src:pos <TAB> term status
mouse   <TAB> マウス     <TAB> noun    <TAB> approved
mouse   <TAB> ネズミ     <TAB> noun    <TAB> forbidden
window  <TAB> ウィンドウ <TAB> noun    <TAB> approved
window  <TAB> ウィンドー <TAB> noun    <TAB> forbidden
window  <TAB> 窓         <TAB> noun    <TAB> forbidden

抽出結果の例:

ネズミ     <TAB> マウス
ウィンドー <TAB> ウィンドウ
窓         <TAB> ウィンドウ

禁止語置換リストファイルはタブ区切りのテキストファイルで、タブの左側が禁止語の訳語、右側が承認語の訳語となります。


□UTX ⇔ ATLAS(富士通)

UTX ファイルを ATLAS のユーザー辞書ファイルに変換することができます。また、ATLAS のユーザー辞書ファイルを UTX ファイルに変換することができます。

UTX ファイルから変換可能な ATLAS のユーザー辞書ファイルは、以下の通りです。

  • ATLAS の「辞書ツール」の「英日:一括登録」で登録可能な「一括登録ファイル」(*.txtファイル)
  • ATLAS の「辞書ツール」の「日英:一括登録」で登録可能な「一括登録ファイル」(*.txtファイル)

UTX ファイルに変換可能な ATLAS のユーザー辞書ファイルは、以下の通りです。

  • ATLAS の「辞書ツール」の「英日:一括抽出」で作成した「一括登録形式」のファイル(*.txtファイル)
  • ATLAS の「辞書ツール」の「日英:一括抽出」で作成した「一括登録形式」のファイル(*.txtファイル)

ATLAS の「一括登録形式」のファイルの例は以下の通りです。

英日用の「一括登録形式」ファイルの例:

名詞-名詞   イベントハンドラ    event handler   0   3
動詞-動詞   送る  dispatch    <助詞  を> <文型  他>
形容-形容   現在の current
副詞-副詞   通常は normally

日英用の「一括登録形式」ファイルの例:

名詞-名詞   イベントハンドラ    event handler   0   3
動詞-動詞   送る  dispatch    <助詞  を> <文型  他>
形容-形容   現在の current
副詞-副詞   通常は normally

□UTX ⇔ The 翻訳(東芝)

UTX ファイルを The 翻訳のユーザー辞書ファイルに変換することができます。また、The 翻訳のユーザー辞書ファイルを UTX ファイルに変換することができます。

UTX ファイルから変換可能な The 翻訳のユーザー辞書ファイルは、以下の通りです。

  • The 翻訳の「辞書編集パレット」の「英日一括登録」で登録可能な「テキスト」形式のファイル(*.txtファイル)
  • The 翻訳の「辞書編集パレット」の「日英一括登録」で登録可能な「テキスト」形式のファイル(*.txtファイル)

UTX ファイルに変換可能な The 翻訳のユーザー辞書ファイルは、以下の通りです。

  • The 翻訳の「辞書編集パレット」の「英日内容出力」で作成した「テキスト」形式のファイル(*.txtファイル)
  • The 翻訳の「辞書編集パレット」の「日英内容出力」で作成した「テキスト」形式のファイル(*.txtファイル)

英日の「テキスト」形式のファイルの例1(1エントリを複数行で書く場合):

current;adj;(種類 adj)(比較 x);
    現在の((日活用 etc));
dispatch;v;(文型 3)(3O n);
    送る((日活用 5)(目格詞 を));
event handler;n;(種類 n)(活用語 2)(複数形 s);
    イベントハンドラ();
normally;adv;(種類 advf)(比較 more);
    通常は();

英日の「テキスト」形式のファイルの例2(1エントリを単一行で書く場合):

current;adj;(種類 adj)(比較 x);現在の((日活用 etc));
dispatch;v;(文型 3)(3O n);送る((日活用 5)(目格詞 を));
event handler;n;(種類 n)(活用語 2)(複数形 s);イベントハンドラ();
normally;adv;(種類 advf)(比較 more);通常は();

日英の「テキスト」形式のファイルの例1(1エントリを複数行で書く場合):

イベントハンドラ;名詞;;
    event handler((英品詞 noun)(活用語 2)(発音 V)(複数形 S));
現在の;連体詞;;
    current((英品詞 adjective)(発音 C)(比較 N)(修飾 前置));
送る;動詞;(登録 独立)(種類 五段)(受身 可)(可能 不可)(意思性 有)(ている 進行形);
    dispatch((英品詞 verb)(発音 C)(過過分 ED)(三単現 ES)(現在分 ING));
    kaku{[を]=obj/[に]=to}
通常は;副詞;(種類 程度);
    normally((英品詞 adverb)(発音 C)(比較 M));

日英の「テキスト」形式のファイルの例2(1エントリを単一行で書く場合):

イベントハンドラ;名詞;;event handler((英品詞 noun)(活用語 2)(発音 V)(複数形 S));
現在の;連体詞;;current((英品詞 adjective)(発音 C)(比較 N)(修飾 前置));
送る;動詞;(登録 独立)(種類 五段)(受身 可)(可能 不可)(意思性 有)(ている 進行形);dispatch((英品詞 verb)(発音 C)(過過分 ED)(三単現 ES)(現在分 ING));kaku{[を]=obj/[に]=to}
通常は;副詞;(種類 程度);normally((英品詞 adverb)(発音 C)(比較 M));

□UTX ⇔ Transer(クロスランゲージ)

UTX ファイルを以下の Transer シリーズのユーザー辞書ファイルに変換することができます。また、Transer シリーズのユーザー辞書ファイルを UTX ファイルに変換することができます。

  • PC-Transer
  • MED-Transer
  • PAT-Transer
  • Legal Transer

UTX ファイルから変換可能な Transer のユーザー辞書ファイルは、以下の通りです。

  • Transer の「翻訳エディタ」の 「一括登録」で登録可能な「英日辞書ソースファイル」(*.optファイル)
  • Transer の「翻訳エディタ」の 「一括登録」で登録可能な「日英辞書ソースファイル」(*.dicファイル)

UTX ファイルに変換可能な Transer のユーザー辞書ファイルは、以下の通りです。

  • Transer の「翻訳エディタ」の 「辞書ソース出力」で作成した「英日辞書ソースファイル」(*.optファイル)
  • Transer の「翻訳エディタ」の 「辞書ソース出力」で作成した「日英辞書ソースファイル」(*.dicファイル)

英日の「英日辞書ソースファイル」形式のファイルの例:

event handler(n,*):イベントハンドラ
dispatch(v,*):送る (R)::[ON]{を}[P(to)N]{に}
current(a,*):現在の (O)
normally(adv,*):通常は

日英の「日英辞書ソースファイル」形式のファイルの例:

*イベントハンドラ/N/ + ="event handler"/N/C/
*送る/V/R5/ +1が 2を 3に =1 dispatch/V/ 2 to 3
*通常は/D/ +$/M_S/ =normally/D/jprep/
*現在の/A/OO/ +1が =1 be/V/ current/A/ATTR/PREP/

□UTX ⇒ MultiTerm(SDL)

UTX から MultiTerm 用のインポート用テキストへの変換を行うことができます。

MultiTerm 用のインポート用テキスト形式のファイルの例:

English (United States) <TAB> Japanese (Japan) <TAB> Part of Speech (source) <TAB> term status
mouse                   <TAB> マウス           <TAB> noun                    <TAB> approved
mouse                   <TAB> ネズミ           <TAB> noun                    <TAB> forbidden
window                  <TAB> ウィンドウ       <TAB> noun                    <TAB> approved
window                  <TAB> ウィンドー       <TAB> noun                    <TAB> forbidden
window                  <TAB> 窓               <TAB> noun                    <TAB> forbidden
color                   <TAB> 色               <TAB> noun                    <TAB> approved
colour                  <TAB> 色               <TAB> noun                    <TAB> non-standard
drug store              <TAB> 薬局             <TAB> noun                    <TAB> approved
pharmacy                <TAB> 薬局             <TAB> noun                    <TAB> non-standard

なお、Glossary Converter を使用すると、テキスト形式でのインポートを経ることなく、UTX と MultiTerm 用語ベースを相互に直接変換できます。


■更新履歴

更新履歴はこちらをご覧ください。


■ライセンス

このソフトウェアは MIT ライセンスで提供されています。 詳細は LICENSE.txt を参照してください。

参考までに日本語訳へのリンクを示しますが、法的に有効なのは英語版です。
http://sourceforge.jp/projects/opensource/wiki/licenses/MIT_license


■ダウンロード

UTX 変換ツールは以下のページで配布しています。
http://sourceforge.net/projects/utxconv/files/

ソースコードは以下のページで配布しています。
http://sourceforge.net/p/utxconv/Git/


■バージョン番号について

UTX 変換ツールのバージョン番号は、サポートしている UTX 仕様のバージョンと、UTX 変換ツールのリリース番号から成ります。

Ver.w.x.y.z は、w.x が UTX 仕様のバージョンを示し、y.z が UTX 変換ツールのリリース番号を示します。

例えば、Ver.1.11.0.1 は、先頭の 1.11 が UTX 1.11 仕様に対応していることを示し、末尾の 0.1 が UTX 変換ツールの最初のリリースであることを示しています。


■作者

アジア太平洋機械翻訳協会(AAMT)
機械翻訳課題調査委員会 ワーキンググループ 3 (共有化・標準化)
http://www.aamt.info/


■連絡先

こちらからお問い合わせください。