2007/5/11 最終更新
IBUKI-TENのページ
自動点字翻訳編集システムIBUKI-TEN
自動点訳システムIBUKI-TENを無償で公開しています。
どうぞご自由にお使いください。
更新情報
-
メールアドレスに関するお知らせ(2006/5/11)
-
ibukiTenC ver0.60を公開しました.(2006/2/13)
- ver 0.56をアップしました.(2006/2/13)
- IbukiTenで2級英語点訳をBASEファイルで保存した時にエラー符が出現する問題を修正しました。
- IbukiTenEditで複数の読みがある単語に対してibkファイルで保存したときに読みの濁点が欠落する問題を修正しました。
- 点字ピンディスプレイの接続先を追加しました。
- 鏡面印刷機能で「の」の点字が「よ」になる不具合を修正しました。
- Σや∫などの点字数学記号を登録しました。
<IBUKI-TENのダウンロードはこちら>
- ver 0.551をアップしました.(2005/6/28)
- IBUKI-TENで作成したBASEファイルがTEditorやWinbesで読み込む際に文字化けする問題を修正しました。
IBUKI-TENに関するお問い合わせのメールアドレスを変更しました。
- ver 0.55をアップしました.(2005/3/10)
- IbukiTenから点字かなファイル(*.kana)をBASEファイル・NABCCファイル・点字プリンタ用ファイルに出力できるようになりました。(ひらがな分かち書き済みテキストはなくなりました)
- 墨字プリンタ印刷に鏡面印刷機能を追加しました。
- IbukiTenEditのメニューから6点入力方式の設定変更ができるようになりました。
- IbukiTenEdit上から辞書登録すると強制終了してしまう問題を修正しました。
- 英文の点訳を行うための英語点訳を追加しました。
- ver 0.54をアップしました.(2004/9/27)
- BASEファイル読み込み時のエラーを修正しました。
":"を読み込むと"−"になるエラー
"ぺ"を読み込むと"ぽ"になるエラー
"ひょ"を読み込むと点訳結果が表示されないエラー
"|"(4,5,6点)を読み込んだ場合の強制終了になるエラー
- 墨字プリンタ印刷に行数印刷の機能を追加しました。
- IbukiTenの出力に"ひらがな分かち書き済みのテキスト"をそのままBASEファイルに出力する機能を追加しました。
- ver 0.53をアップしました.(2004/1/22)
- 日本語文中にでてくるURLとE-mail(@を含むもの)など情報処理用語の表記を修正しました.
- 情報処理用点字表記を用いる場合の囲み符号を付加することが可能になりました.
(情報処理用囲み符号開は”≦記” 情報処理用囲み符号閉は”≧記” と表現しています。)
- 点字プリンタへの出力情報をファイル化することに対応しました.
- 点訳規則の修正を行いました.(主に記号類)
- 点訳用辞書の修正を行いました.
(注:ver0.2xで作成したユーザ辞書を利用するためには、コンバートをする必要があります)
- IBUKI-TENスクウェアの中に専門用語辞書公開ページを設置しました.(2003/10/10)
- IBUKI-TENスクウェアを設置しました.(2003/6/13)
1.はじめに
IBUKI-TENは,岐阜大学工学部応用情報学科池田研究室で開発した自動点字翻訳システムです.岐阜県の財団法人ソフトピアジャパンとの共同研究として開発しました.
IBUKI-TENは,漢字かな混じりで書かれた通常の日本語文章のテキストファイルを入力すると,日本語解析システムIBUKIを用いて文節分かち書きを行い,読み仮名を付与し,さらに点字の規則に則った分かち書き・読みに形を整えて,仮名分かち書きの形で,あるいは点字プリンターやピンディスプレイのコードに変換して出力します.仮名分かち書きの出力に対して校正・編集を行なった上で点字コードに変換することも出来ます.
IBUKI-TENにはIbukiTenとIbukiTenEditという二つのタイプがあります.IbukiTenは校正・編集機能を含まないタイプです.IbukiTenEditは校正・編集機能を含むタイプです.
IBUKIは我々の研究室で開発している日本語解析システムです.なおIBUKIは,岐阜県と滋賀県の県境に聳える名山「伊吹山」から拝借した名前です.
IBUKI-TENは、基本的に“非商業的な研究あるいは福祉の目的に限り”、無償で自由にお使い頂けます.IBUKI-TENは、辞書としてEDR辞書(現在の著作権者は通信総合研究所)の一部を使用していますが、その使用条件も基本的には“非商業的な研究あるいは福祉の目的に限り”となっています.詳細は「ibukiTenとibukiTenEditの利用許諾契約書」および「IbukiDLL.dllの無償利用許諾契約書」としてまとめてありますのでお読み頂き、ご了解の上御使用ください.
2. IBUKI-TENの特徴・動作環境
2.1 動作環境
-
必要なシステム: Windows95/98/MeもしくはWindowsNT4.0/2000/XP日本語版が動作するパソコン
-
CPU: Pentium120MHz以上(PentiumⅡ233MHz以上推奨)
-
メモリ: 64MB以上
-
ハードディスクの空き容量: 25MB以上
-
対応点字プリンタ: NEW ESA721,Juliet,ET,TP32,NABCC(両面印刷のみエベレストで動作確認済み)
-
対応点字ディスプレイ:KGS BrailleNote40A,46C/46D,BrailleMemo16
2.2 IbukiTenの特徴
- 自動点訳
- 漢字かな混じりで書かれた通常のテキストファイルを対象として自動的に点字変換します.
- 英文に関しては[1級英語(日本語)][2級英語]のいずれかで点訳できます.
- 日本語解析
- 自動点訳のためには、入力された日本語分を分かち書きし正しい読みを与える必要があります。IbukiTenは我々の研究室で開発した日本語解析システムIBUKIをベースにしており、高精度の分かち書きを実現しています。
- 多様な出力
- ファイルに出力出来ます。
BASE形式,NABCC形式の点字データおよび,かな表記のテキスト・点字プリンタ用ファイルとして出力することができます.
- 点字プリンタに出力出来ます。
現在のところ対応している点字プリンタは,NEW ESA721,Juliet,ET,TP32,NABCC(両面印刷のみエベレストで動作確認済み)です.
- ピンディスプレイに出力することができます.
対応しているピンディスプレイはKGS BrailleNote40A,46C/46D,BrailleMemo16です.
- 音声出力も可能です。
Windows音声化ソフト(95/2000Reader, PC-Talker等)を使って、視覚障害者の方も簡単に点訳が行えます.
- 独自のユーザ辞書の構築
- 人名その他の未登録語に対して,ユーザが独自の辞書を持つことができるようになっています.
- また,難しい複合語の分かち書きなども,直接区切り情報とともに辞書へ登録することで,正しく点訳が行えるようになります.
2.3
IbukiTenEditの特徴
- 自動点訳に関しては,IbukiTenと同じ機能を備えています.
さらに自動点訳の結果に対して、次のような編集機能を備えています。
- IbukiTenEditのウィンドウには3つの部分があります。
- 原文表示ウィンドウ、点訳結果表示ウィンドウ、点字表示ウィンドウの3つです。
- 点訳結果表示ウィンドウでは,ひらがな表記,点字表記のどちらでも表示可能で、どちらによっても編集出来ます(点字表記の場合は,点字フォントの設定が必要です).
- 原文表示ウィンドウと点訳結果表示ウィンドウでは,対応する部分が反転表示されます.
- 曖昧箇所指摘機能
- 分かち書きが曖昧な個所は,区切り個所を色を変えて表示します.
- 読みが曖昧な箇所は,最も普通の読みを1つ選択し,曖昧であることを色を変えて表示します.その個所でマウスの右ボタンをクリックすると,他の読み候補が表示され,簡単に読みの修正を行えます.
- ユーザーカスタマイズ
- 多様な入出力インターフェイス
- 多彩な編集機能
- 目次作成が可能です.
- ページ単位での文書挿入に対応しました.
- 点訳結果は,あらかじめ設定した1行の文字数,1ページの行数に従って表示され,表示しているままの形で点字コードへ変換し,印刷することができます.
- 編集の途中でも,その状態のまま保存することができます.
2.4
ユーザ辞書
IBUKI-TENの点訳精度は最終的には辞書に依存します.初期辞書は約30万語(見出し語数)を擁していますが,これで点訳が要求されるあらゆる分野に対応できるわけではありません.そこでIBUKI-TENでは,ユーザが独自に,初期辞書上の単語に対して,削除,読み情報の追加/変更をしたり,新たな単語の追加をすることができます.
<お願い>
ver 0.50より点訳用辞書の見直しをおこないました.以前のバージョン・IbukiTenProで作成したユーザ辞書をver0.50で利用するためにはコンバータによる変換が必要です.
変換方法はIbukiTenEditを起動して,[編集] → [辞書登録]からユーザ辞書メンテナンス画面を出し,そこから[ツール] → [辞書のコンバート]でおこないます.
変換元,変換結果の出力先ファイルを指定すると変換がおこなわれます.
[設定] → [自動点訳の設定]から変換後のユーザ辞書ファイルを指定することで以前のバージョンのユーザ辞書の利用が可能となります.
2.5
未登録語抽出
現在のIBUKI-TENには,漢字未登録語を自動的に抽出する機能があります.テキストを点訳後,IbukiTenでは「未登録語」ボタンを,IbukiTenEditでは,メニュー「編集」「未登録語」を選択してください.以下の画面が表示されます.
抽出された単語をユーザ辞書に登録することができます.登録したい単語の点訳表記,品詞を修正してください.点訳表記は,ウインドウの該当箇所を左クリックすることで編集可能です.品詞は,編集したい箇所を選択しメニュー「単語」「編集」を選択してください.
見出しの前のチェックボックスにチェックを入れ,メニュー「単語」「チェックした単語を登録」を選択することで辞書登録されます.
4.
ダウンロード
ダウンロードされる方は、下のリンクからお願いします.
<ダウンロードはこちら>
5. IBUKI-TENスクウェア
IBUKI-TENユーザの交流の場として掲示板を設置いたしました.
IBUKI-TENに対する要望や、ご意見等もお書きください.
また、IBUKI-TENで利用できるユーザ辞書を公開しております。
5.1 掲示板
掲示板を利用される方は、下のリンクからお願いします.
<掲示板はこちら>
5.2 専門用語辞書の公開
IBUKI-TENユーザのご好意によっていただいた、専門(ユーザ)辞書を公開しております。
また専門辞書導入方法についても書かれています。
<専門用語辞書の公開はこちら>
6. IBUKI-TENに関するご意見はこちらまで
IBUKI-TENに関するご意見は、メールで ibukiten_qa@ikd.info.gifu-u.ac.jp までお願いします.
7. 履歴
変更履歴 ×BugFix ◎追加機能 ○改善 I:IbukiTen/IbukiTenEdit
T:IbukiTen E:IbukiTenEdit
- 2006. 2.13 ver 0.56
- T○ 2級英語点訳をBASEファイルで保存した時にエラー符が出現する問題を修正
- E○ 数の読みがある単語に対してibkファイルで保存したときに読みの濁点が欠落するエラーを修正
- I○ 点字ピンディスプレイの接続先を追加
- E○ 鏡面印刷機能で「の」の点字が「よ」になるエラーを修正
- I◎ Σや∫などの点字数学記号を登録
- 2005.6.28 ver 0.551
- 2005.3.10 ver 0.55
- T○ かな表記ファイルからBASEファイル・NABCCファイル・点字プリンタ用ファイルの出力が可能.
- E◎ 墨字印刷の鏡面用出力機能を追加(墨字印刷の設定から変更する).
- I◎ 英文点訳用の点訳モードを追加.
- E◎ 6点入力をエディタから変更できるよう修正.
- E× エディタ上から辞書登録すると強制終了
- 2004.9.27 ver 0.54
- I○ BASEファイル読み込み時のエラーを修正.
- ":"を読み込むと"−"になる
- "ぺ"を読み込むと"ぽ"になる
- "ひょ"を読み込むと点訳結果が表示されない
- "|"(4,5,6点)を読み込んだ場合に強制終了する
- E◎ 墨字プリンタ印刷に行数印刷の機能を追加.
- T◎ 出力に"ひらがな分かち書き済みのテキスト"をそのままBASEファイルに出力する機能を追加.
- 2004.1.22 ver 0.53
- I○ 日本語文中にでてくるURLとE-mailの表記を修正.
- E◎ 情報処理用点字表記を用いる場合の囲み符号を付加することが可能.
(情報処理用囲み符号開は”≦記” 情報処理用囲み符号閉は”≧記” と表現しています。)
- I◎ 点字プリンタへの出力情報をファイル化することに対応.
- I○ 点訳規則の修正.(主に記号類)
- I○ 点訳用辞書の修正.
- 2003.5.30 ver 0.52
- I○ 数値点訳を行うと誤った結果が表示されることがある.
- I○ ユーザ辞書の連続登録に対応.
- I× ヘルプ画面が開けない場合がある.
- 2003. 4.15 ver 0.51
- I◎ 日本点字表記法2001年版の点訳規則に対応.
- E◎ 終了時に未保存のデータがある場合にメッセージを表示.
- E× 点字プリンタへの印刷をおこなうと異常終了する場合がある.
- E× 検索・置換ダイアログで入力文字が乱れる.
- 2002.12.11 ver 0.50
- I◎ 2級英語点訳に対応しました.
- E◎ IbukiTenEditでは,目次作成・文章挿入が可能になりました.
- I○ 点訳用辞書を変更しました.
- 2001. 6.22 ver 0.26
- I◎ 点字プリンタET,TP32,NABCC(エベレストで動作確認済み)に対応
- I× 点訳規則の修正
- 数字の後ろの長音が3・6点(2・5点に修正)
- ひらがなの間の中点が消去される
- 「14日」の前に数符がつかない
- 「〇」(0ではありません)が「数符+0」と点訳される(0.2Xからアップデートした場合は辞書から「〇」を削除してください)
- 外国語引用符の閉じが付与されない場合がある
- I〇 未登録語抽出ウインドウの改良
- 2001. 3.14 ver 0.25
- E〇 再度点訳しないで,6点表示とかな表示の切り替えが可能.
- E◎ ファイルのドラッグ機能のサポート(拡張子: txt, ibk)
- E× 6点表示の際に,マスが削除されている場合がある.(行頭のマスなど)
- 2001. 2.26 ver 0.24
- I× 英文が続く場合でも,外国語引用符が文単位に付かないように修正
- E◎ 点訳結果表示ウインドウの背景への点線表示(行間にも表示,Win95対応)
- E× 数字,英文字を入力した場合,数符・外字符がつかない場合がある
- E× ページ行の下の表示が乱れる
- E× カーソルキーの移動で表示が乱れる
- E× 行の先頭に曖昧な読みの単語があると,動作が不安定になる場合がある
- E× 行数が増減するときに,動作が不安定になる場合がある
- 2001. 2.6 ver 0.23
- E× 長文を点訳した場合,異常終了する
- E× 数字,英文字を入力した場合,数符・外字符がつかない場合がある
- E× 行の先頭にスペースが入力できない場合がある
- 2001. 1.26 ver 0.22
- I○ 辞書:人名接尾語の追加(約120語)
- I○ 辞書:数字を意味する語が含まれる単語の点訳表記を修正(約400語,「三角形」「四捨五入」など)
- I× 単語に数字が含まれる場合,つなぎ符が出力されない(四輪駆動:4りん□くどー→4継りん□くどー)
- I× 点訳規則の修正
- アルファベットの最後が「,」で終わった場合,その後ろに区切りが入らない
- 外国語引用符で囲まれた英文の最後が「.」で終わった場合,「.」が外国語引用符閉じの後についている
- T× 解析中のダイアログ表示で100%を超えてしまう
- E◎ 点字ピンディスプレイへの対応
- E◎ 画面読み上げソフトへの対応(対応する原文の読み上げ機能)
- E◎ 6点入力
- E◎ 6点表示
- E◎ 点訳結果表示ウインドウの背景への点線表示(マス数の確認が容易に)
- E◎ カーソル以降のテキストに対する再点訳機能
- E◎ 次の単語,前の単語への移動機能
- 2000. 12.27 ver 0.21
- I× ユーザ辞書登録の不具合を修正
- T◎ 点字ディスプレイBrailleMemo16へ出力
- E◎ 濁点の表示方法の選択
- 2000. 12.18 ver 0.20
- I○ 点訳エンジンをDLL化
- I○ 辞書中の点訳規則を修正
- I◎ ページ行におけるページ数の位置の指定
- T◎ 点字ディスプレイBrailleNote40Aへ出力
- E◎ キーボードショートカットのユーザ定義
- 2000. 11.27 ver 0.19
- T◎ 点字ディスプレイBrailleNote46C/46Dへ出力
- E○ 原文を変更した場合の対応関係の表示
- 2000. 11.15 ver 0.18
- 2000. 11.9 ver 0.17
- I ◎ 点字プリンターの通信速度の選択
《注意》 通信速度は、プリンタで設定した通信速度にあった速度を選択する必要があります
- I ◎ 数字の位を「せん、まん、おく..」として点訳、の設定を追加
- T○ タブキーで選択した機能を、スペースキーでもエンターキーでも実行できるようにした
- T× 特定の文書でBASEファイルで出力の際、文末が消えてしまう
- E○ 原文と点訳結果表示ウィンドウ間で自動的に対応関係を表示する機能
《注意》 現在のバージョンでは,原文を変更した場合対応関係の表示ができなくなります
- E○ 設定の一部をダイアログボックスから行うように変更
- E○ ファイルへの保存時,前回に選択したファイルの種類を初期状態に設定
- E○ 辞書の読み込みを、起動時から点訳を初めて行う時に変更
- E× つなぎ符がある場合に行移しがうまく行われない
- E× 読みが曖昧な箇所の前後を削除すると表示が乱れる
- E× 読みが曖昧な語の直後に空白を入れたときに空白も曖昧な語として処理される
- E× ステータスバーを表示していないときに点字表示が行えない
- E× 同じ単語でも,外字符やつなぎ符が入る時と入らない時がある場合,読みが曖昧となってしまう
- 2000. 10.23 ver 0.16
- E◎ キーボード操作による原文表示ウィンドウと点訳結果表示ウィンドウ間の対応関係表示機能の追加(F8キー)
- E× カーソル移動・編集を高速化
- E× 読みが複数ある箇所で修正を行った時に表示が乱れる
- E× フォント設定でフォントの大きさを変更した場合に点訳を行わないと反映されない
- 2000. 10.16 ver 0.15
- T× IbukiTen0.14で、結果をベースファイルに保存の際、ワードラップが行われなくなっていた
- T× 段落始めに1つしか空白が入っていなかったのを2つ入るようにした
- T× 句点と閉じ括弧の間が2マス開いてしまっていたのを開かないようにした
- E○ 点字表示の表示方法の変換を可能にした([設定]→[点字表示の設定])
- E◎ 原文から点訳結果への対応付け機能を追加
- E◎ キーボード操作による原文表示ウィンドウと点訳結果表示ウィンドウの移動機能を追加
(F6キーで原文と点訳結果表間のカーソルの移動)
(F7キーでカーソル位置にある文について,別のウィンドウの対応する文へカーソルを移動)
- E× 改行を挿入した後に挿入直後の位置で文字が入力できない
- E× 曖昧な分かち書き表示がある個所を修正し、その後その修正を元に戻した際には曖昧として表示されないようにした
- 2000. 10.10 ver 0.14
- T× 1文字中のアルファベットと仮名の間に第一つなぎ符を挟む
- E◎ 数字符・外字符などの自動入力機能の追加
- E○ 「曖昧だが区切らない」箇所の表現方法変更
- E◎ 印刷プレビュー・墨字プリンタに点字を出力する機能の追加
- 2000. 10.2 ver 0.13
- E◎ カーソル行の点字表示
- E× 行の先頭に文字が入力できない
- I × 記号に関する処理
- I × 複合語処理
- 2000. 9.25 ver 0.12
- T× baseファイルで出力の際、出力ファイル名を入力ファイル名と違うファイル名に変更すると、ファイルが作成されていない
- 2000. 9.20 ver 0.11
- 2000. 9. 8 ver 0.1
8. 謝辞
IBUKI-TENは,池田研究室の歴代のたくさんのメンバーが引き継ぎながら開発を続けてきました。
平成7年度博士後期過程修了・元助手の兵藤安昭君(工博)、平成12年度博士前期課程修了の横平貫志君、早川哲史君、村上裕君、平成15年度博士前期課程修了の岸井謙一君、平成16年度博士前期過程入学の高松大地君、平成16年度卒業の服部剛士君、平成17年入学の水野智美さん達が中心になって進めてくれました。
平成13年度卒の渥美誠君、平成14年度博士前期過程修了の廣間陽君、平成16年度前期課程修了の伊佐治和哉君も大変協力してくれました。
IBUKI-TENの基礎部分は日本語解析システムIBUKIです。IBUKIの開発にはたくさんの学生が関わってきました.
平成10年度博士前期過程修了の若田光敏君、平成13年度博士前期過程修了の辻子純央君、一ノ瀬友紀夫君、平成14年度卒業の高木優紀江さん、平成16年度前期過程修了の伊佐治和哉君、平成16年度博士前期過程入学の石原吉晃君、平成17年度博士前期過程入学の山田佳裕君、そのほかたくさん居て一人一人名前は挙げられません。
IBUKI-TENの開発には池田研究室に在籍したすべての学生が貢献しています。皆さんに感謝します.
IBUKI-TENの開発を始めるにあたっては、岐阜県立盲学校の先生方(桑原先生にはIBUKI-TENを試用して頂いて,いろいろのご意見を頂きました),障害者生活情報センターぎふ(岐阜アソシア)の方々,岐阜大学教育学部池谷尚剛先生(岐阜視覚障害研究会にお誘い頂き,いろいろと教えて頂きました)など多くの方にお世話になりました.
岐阜県の財団法人・ソフトピアジャパンには資金的な援助もいただきました。これらの方々に感謝致します.
(株)日本電子化辞書研究所(現在の著作権者は、独立行政法人通信総合研究所)のご好意で,EDR辞書を含んだ形でIBUKI-TENを公開することが出来ました.厚く感謝致します.
また全国の多くの点訳ボランティアの方々、視覚障害者の方々に使って頂き、たくさんの貴重なご意見を頂きました.有り難うございました.
平成17年6月 (改:平成12年9月、平成14年12月)
岐阜大学工学部応用情報学科・教授 池田尚志