【デジこれ05】平易でわかりやすい説明を

デジタル辞書の現在とこれから」第5回は「平易でわかりやすい説明を」。“辞書の記述は約束だらけ”という話です。

※このブログ連載は、2022年7月の日本電子出版協会(JEPA)セミナー「デジタル辞書の現在とこれから」の内容を、(我ながら呆れるくらい駆け足でしたので)補足しながらまとめなおしたものです。

前の記事【デジこれ04】価値ある情報には適正な対価を


「わかりやすい文章」とか「やさしい日本語」は大前提で、ここでは辞書独特の記述方法、約束事の問題を扱います

上の辞書記述サンプルで、赤色は何かしらの省略記述青色はカッコで指定した言い換えまたは省略可能文字列緑色は記号・約物の類、です。辞書引きのプロ(?)はきちんと凡例を読んでその記述ルールを理解しています。辞書引きにそこそこ慣れている人は、まあ何とか記述ルールを推察できます。でもそれ以外の人は?

見出し語の省略例

書籍版ではページ数とページ内スペースを節約するために、まず見出し語が省略されます。書籍では仕方ないかなとも思いますが、デジタル版ではさしあたりスペース的な“節約”は必要ありません。

語形変化とか

trav・el ed; ・ing; ⦅英⦆led; ・ling
hand・y i・er;i・est

用例とか成句とか

resort to  暴力に訴える
May the F be with you. 理力がきみと共にあらんことを
join [combine]s 〈…と〉力を合わせる,協力するwith〉.
清く正しく━・く生きたい

語義のない派生語とか

ly [副]
ness [名]
さ/が・る

言い換え・省略可能の例

書籍版ではページ数とページ内スペースを節約するために、見出し語や語義(特に対訳)、用例などあらゆる箇所で、複数の文言をまとめて表示するために括弧が使用されます。

省略可能を示す( )とか

arch(a)eology [名]考古学
anhidrosis 〔医〕無(発)(症).

言い換え可能を示す[ ]とか

antifungal 抗真菌薬[物質,因子].
an industrial [a commercial] area 工業[商業]地域
secondary sex [sexual] character [characteristic] n.〔医学〕二次性徴.

その組み合わせとか

acinous 〔植〕小核(果)[(腺)小胞]からなる[を含む]
verist n., adj. ヴェリズモ[現実[真実]主義] (verism) 擁護[主張]者(の)
the deposit of valuables [title deeds] (with [in] a bank) 貴重品[(不動産)権利証書]の(銀行への)預け入れ[保管]

何が問題なのか

まずは何より、わかりづらい。常に余分な脳内変換を強いられているような気がします。慣れてくればこの形式の方が理解しやすい、同一の文字列が(省略されず)何度も繰り返し出現する方が混乱する、という考え方もわかりますので、要は程度の問題なのかなと。

デジタル版では「ページ数の問題は気にしなくていい」という意見はデジタル辞書の黎明期から何度も耳にしてきました。でも、液晶1画面内での情報量という問題もあります。デジタル版の一覧性の弱さも同じ頃から言われてきたことです。書籍版と違って改行が多用されることもあって、1行あたりのスペース的な余裕(わざわざ「~」と省略しなくてもフルスペルで表示できる可能性)は増えたものの、行数が増えて1画面あたりの情報量は減ってしまいスクロールが増加してしまう、一覧性の弱点から全体の構成を見渡すことが難しくなってしまう、という現象が生じています。

現状、書籍版もデジタル版も一長一短、ということですが、ここで問題にしたいのは、見出し語を「~」などと省略した書籍版のデータそのままにデジタル化してはもったいない(もしくは、せっかく原稿段階ではフル表記だったものを組版段階で省略形に完全に置き換えてしまってはもったいない)ということです。

例えば、上記用例の事例で言えば、以下のようにデジタル化することも可能です。

May the <spellout org=”F~”>Force</spellout> be with you.
理力がきみと共にあらんことを
join [combine]<spellout org=”~”>force</spellout>s
〈…と〉力を合わせる,協力するwith〉.
清く正しく<spellout org=”━・く”>美しく</spellout>生きたい

このようにしておけば、

  • 書籍版と同じように省略形で表示することも(このデータを使って再度書籍組版することも)
  • デジタル版ではフル表記で表示することも(書籍版での省略箇所の書体や表示色を変えることも)
  • ユーザの選択で、省略形式とフル表示形式を自由に切り替えることも

できるようになります。

「何が問題なのか」のその2は検索上の不便です。デジタル版では省略形そのままでは検索できないので、フルスペルの、もしくは言い換え/省略可能な全組み合わせの検索キーワードを用意する必要があります。

trav・el ed; ・ing; ⦅英⦆led; ・ling
→ traveld, traveling, travelled, travelling

hand・y i・er;i・est
→ handier, handiest

join [combine]s
→ join forces, combine forces

arch(a)eology
→ archaeology, archeology

secondary sex [sexual] character [characteristic]
secondary sex character, secondary sex characteristicsecondary sexual character, secondary sexual characteristic

(発)(症)
→ 無汗, 無発汗, 無汗症, 無発汗症

抗真菌薬[物質,因子]
→ 抗真菌薬, 抗真菌物質, 抗真菌因子

「何が問題なのか」のその3は機械判読上の問題です。現況では、急速な進歩の途上にあるとはいえ、音声合成・自動読み上げには適していません。約物・記号類を意味あるものとして読み上げるため、見出し語の省略を補うためには、特別かつ高度なプログラム対応が必要になるでしょう。そして自動読み上げでは、標準ではカッコ類の中は読み飛ばされてしまいます。

この問題、思考を逆転させれば、スムーズな自動読み上げを目指せば、すなわち、機械・プログラムにとって理解しやすい文章を指向すれば、それは人間にとってもわかりやすい文章になるはず、と考えることができます。人工知能をはじめとして機械側は恐ろしいスピードで進化を続けていますが、AIばかり理解が進むのも癪。児童・初学者、日本語以外を母語とする学習者、視覚・発達障害者なども視野に入れて、わかりやすい辞書記述について人間側も配慮・試行錯誤を経て、進化すべきだと考えます。


【デジこれ06】もっと用例を